Trang web

Dữ liệu thu thập dữ liệu rẻ trên

(VTC14)_Tôi đã chiến thắng ung thư phổi như thế nào?

(VTC14)_Tôi đã chiến thắng ung thư phổi như thế nào?
Anonim

đắt tiền, nhưng nhiều doanh nghiệp vẫn sẵn sàng đào sâu, cá cược rằng phân tích sẽ cung cấp những hiểu biết mới về kinh doanh của họ và lợi thế cạnh tranh.

Trong một báo cáo được công bố đầu năm nay, công ty nghiên cứu IDC dự đoán thị trường nền tảng kho dữ liệu sẽ tăng từ 7,9 tỷ USD năm 2009 lên khoảng 10,8 tỷ USD vào năm 2013.

Tin tốt cho các cửa hàng CNTT muốn bắt đầu phân tích, nhưng không có ngân sách ngay bây giờ, là sự xuất hiện gần đây của phần mềm miễn phí Các tùy chọn đóng gói hỏa lực dữ liệu khá nghiêm túc.

Vào tháng 10, Greenplum đã công bố một bản Node duy nhất của cơ sở dữ liệu MPP (xử lý song song). Kiến trúc MPP chia nhỏ khối lượng dữ liệu thành nhiều phần được quản lý độc lập trên một loạt các máy chủ.

Phiên bản Single Node có thể được sử dụng trong chế độ sản xuất trên một máy chủ x86 với tối đa hai ổ cắm CPU và lõi không giới hạn. Nó cũng có thể được triển khai trong một máy ảo duy nhất với tối đa tám lõi ảo. Không có nắp lưu trữ. Single Node Edition cũng có thể được gắn lại vào một thực thi Greenplum rộng hơn.

Cũng trong tháng 10, Calpont phát hành InfiniDB Community Edition, một cơ sở dữ liệu mã nguồn mở, theo định hướng cột. Theo nhà phân tích Curt Monash của Monash Research, phương pháp cột có thể làm giảm đáng kể nhu cầu đĩa I / O so với các hệ thống lưu trữ dữ liệu theo hàng và cũng đạt được mức độ nén cao hơn. Máy chủ đơn, nhưng không có giới hạn về số lượng CPU, số lõi, bộ nhớ, khối lượng dữ liệu hoặc người dùng đồng thời.

Calpont cũng có phiên bản thương mại của InfiniDB, hiện đang ở giai đoạn đầu tiên, cho phép người dùng mở rộng hệ thống cho nhiều máy chủ.

InfiniDB Community Edition theo sau bản phát hành năm ngoái của một nền tảng kho dữ liệu cột mã nguồn mở khác từ Infobright. Sau này có thể có một lợi thế cho bây giờ trên InfiniDB về hỗ trợ cộng đồng; Gần đây, Infobright cho biết phần mềm đã được tải xuống hơn 15.000 lần.

Cuối cùng, các tùy chọn lưu trữ dữ liệu miễn phí này có giới hạn và khả năng sử dụng, theo Monash.

"Nếu bạn có một nhà phân tích hoặc nhỏ nhóm các nhà phân tích thực hiện truy vấn thăm dò sớm đối với một số terabyte dữ liệu hoặc ít hơn, sau đó các sản phẩm này có khả năng thực hiện công việc này, "ông nói.

Các công ty cũng có thể không có ngân sách để mua bất kỳ thứ gì khác hoặc không thể nhận tài trợ mà không cần tiến hành một bằng chứng ban đầu của khái niệm, Monash nói thêm.

"Chắc chắn có khối lượng công việc mà họ không đủ, và bạn sẽ phải trả tiền cho một sản phẩm sẽ thực hiện công việc cho bạn", ông nói. "Nhưng nếu bạn muốn nhận được nhiều giá trị hơn từ dữ liệu của mình, những sản phẩm miễn phí này có thể là một nơi tuyệt vời để bắt đầu."