Windows

Big Data 3 Vs - Các khái niệm & mô hình

Big Data In 5 Minutes | What Is Big Data?| Introduction To Big Data |Big Data Explained |Simplilearn

Big Data In 5 Minutes | What Is Big Data?| Introduction To Big Data |Big Data Explained |Simplilearn

Mục lục:

Anonim

Thuật ngữ `dữ liệu` không phải là mới đối với chúng tôi. Đây là một trong những điều chính được dạy khi bạn lựa chọn Công nghệ thông tin và máy tính. Nếu bạn có thể nhớ lại, dữ liệu được coi là dạng thông tin thô. Mặc dù đã có một thập kỷ, thuật ngữ Big Data là một tiếng vang trong những ngày này. Hiển nhiên từ thuật ngữ, tải và tải dữ liệu là Big Data và có thể xử lý theo nhiều cách khác nhau bằng các phương pháp và công cụ khác nhau để thu thập thông tin được yêu cầu. Bài viết này nói về các khái niệm của Big Data, sử dụng 3 V được đề cập bởi Doug Laney, một nhà tiên phong trong lĩnh vực kho dữ liệu được coi là đã khởi xướng lĩnh vực Infonomics (Kinh tế thông tin).

Trước khi tiếp tục, bạn có thể muốn đọc các bài viết của chúng tôi về Thông tin cơ bản về Dữ liệu lớn và Sử dụng dữ liệu lớn để nắm bắt được bản chất.

Dữ liệu lớn 3 Vs

Dữ liệu, ở dạng khổng lồ của nó, được tích lũy thông qua các phương tiện khác nhau đã được nộp đúng trong các cơ sở dữ liệu khác nhau trước đó và đã bị bán phá giá sau một thời gian. Khi khái niệm xuất hiện càng nhiều dữ liệu thì càng dễ tìm ra - thông tin khác nhau và có liên quan - sử dụng đúng công cụ, công ty bắt đầu lưu trữ dữ liệu trong thời gian dài hơn. Điều này giống như thêm thiết bị lưu trữ mới hoặc sử dụng đám mây để lưu trữ dữ liệu dưới dạng dữ liệu được mua: tài liệu, bảng tính, cơ sở dữ liệu và HTML, v.v. Dữ liệu.

LƯU Ý: Phạm vi của Big Data không giới hạn đối với dữ liệu bạn thu thập và lưu trữ trong cơ sở và đám mây của bạn. Nó có thể bao gồm dữ liệu từ các nguồn khác nhau, bao gồm nhưng không giới hạn đối với các mục trong miền công cộng.

Mô hình 3D Dữ liệu lớn dựa trên V sau:

  1. Âm lượng: dùng để quản lý lưu trữ dữ liệu
  2. Vận tốc: đề cập đến tốc độ xử lý dữ liệu
  3. Đa dạng: dùng để chỉ nhóm dữ liệu của các tập dữ liệu khác nhau, dường như không liên quan

Các đoạn sau giải thích mô hình Dữ liệu lớn bằng cách nói về từng chiều (mỗi V) chi tiết.

A] Khối lượng dữ liệu lớn

Nói về Dữ liệu lớn, người ta có thể hiểu khối lượng như một tập hợp lớn thông tin thô. Mặc dù đó là sự thật, nó cũng là về chi phí lưu trữ dữ liệu. Dữ liệu quan trọng có thể được lưu trữ trên cơ sở cũng như trên đám mây, sau này là tùy chọn linh hoạt. Nhưng bạn có cần lưu trữ từng thứ và mọi thứ không?

Theo một tờ báo trắng do Meta Group phát hành, khi khối lượng dữ liệu tăng lên, các phần dữ liệu bắt đầu tìm kiếm không cần thiết. Hơn nữa, nó nói rằng chỉ có khối lượng dữ liệu đó nên được giữ lại mà các doanh nghiệp có ý định sử dụng. Các dữ liệu khác có thể bị loại bỏ hoặc nếu các doanh nghiệp không muốn bỏ "dữ liệu không quan trọng", chúng có thể được bán phá giá trên các thiết bị máy tính chưa sử dụng và thậm chí trên băng để doanh nghiệp không phải trả tiền để lưu trữ dữ liệu đó. > Tôi đã sử dụng "dữ liệu không quan trọng" vì tôi cũng tin rằng dữ liệu của bất kỳ loại nào có thể được yêu cầu bởi bất kỳ doanh nghiệp nào trong tương lai - sớm hay muộn - và do đó nó cần được giữ trong một khoảng thời gian trước khi bạn biết rằng dữ liệu thực sự không quan trọng. Cá nhân, tôi đổ dữ liệu cũ hơn vào đĩa cứng từ năm trước và đôi khi trên đĩa DVD. Các máy tính chính và lưu trữ đám mây chứa dữ liệu mà tôi coi là quan trọng và biết rằng tôi sẽ sử dụng. Trong số các dữ liệu này, có sử dụng một lần loại dữ liệu có thể kết thúc trên một ổ cứng cũ sau vài năm. Ví dụ trên chỉ dành cho sự hiểu biết của bạn. Nó không phù hợp với mô tả của Big Data vì số tiền này ít hơn so với những gì mà các doanh nghiệp coi là Big Data.

B

] Tốc độ trong dữ liệu lớn Tốc độ xử lý dữ liệu là một yếu tố quan trọng khi nói về khái niệm Big Data. Có rất nhiều trang web, đặc biệt là thương mại điện tử. Google đã thừa nhận rằng tốc độ tải trang là điều cần thiết cho thứ hạng tốt hơn. Ngoài các bảng xếp hạng, tốc độ cũng cung cấp sự thoải mái cho người dùng trong khi họ mua sắm. Điều tương tự cũng áp dụng cho dữ liệu được xử lý cho các thông tin khác.

Trong khi nói về vận tốc, nó là điều cần thiết để biết rằng nó vượt ra ngoài băng thông chỉ cao hơn. Nó kết hợp dữ liệu dễ sử dụng với các công cụ phân tích khác nhau. Dữ liệu dễ sử dụng có nghĩa là một số bài tập về nhà để tạo cấu trúc dữ liệu dễ xử lý.

C] Các loại dữ liệu lớn

Khi có tải và tải dữ liệu, điều quan trọng là tổ chức chúng theo cách mà các công cụ phân tích có thể dễ dàng xử lý dữ liệu. Có những công cụ để tổ chức dữ liệu. Khi lưu trữ, dữ liệu có thể không được cấu trúc và dưới bất kỳ hình thức nào. Đó là vào bạn để tìm ra mối quan hệ nó có với các dữ liệu khác với bạn. Khi bạn tìm ra mối quan hệ, bạn có thể chọn các công cụ thích hợp và chuyển đổi dữ liệu sang biểu mẫu mong muốn để lưu trữ có cấu trúc và sắp xếp.

Tóm tắt

Nói cách khác, Mô hình 3D của Big Data dựa trên ba chiều: mà bạn sở hữu; gắn thẻ thích hợp dữ liệu; và xử lý nhanh hơn. Nếu ba dữ liệu này được chăm sóc, dữ liệu của bạn có thể dễ dàng được xử lý hoặc phân tích để tìm ra bất cứ điều gì bạn muốn.

Phần trên giải thích cả hai khái niệm và mô hình 3D của Dữ liệu lớn. Các bài báo được liên kết trong đoạn thứ hai sẽ chứng minh thêm sự hỗ trợ nếu bạn chưa quen với khái niệm này.

Nếu bạn muốn thêm bất cứ điều gì, hãy bình luận.