(VTC14)_Tôi đã chiến thắng ung thư phổi như thế nào?
đắt tiền, nhưng nhiều doanh nghiệp vẫn sẵn sàng đào sâu, cá cược rằng phân tích sẽ cung cấp những hiểu biết mới về kinh doanh của họ và lợi thế cạnh tranh.
Trong một báo cáo được công bố đầu năm nay, công ty nghiên cứu IDC dự đoán thị trường nền tảng kho dữ liệu sẽ tăng từ 7,9 tỷ USD năm 2009 lên khoảng 10,8 tỷ USD vào năm 2013.
Tin tốt cho các cửa hàng CNTT muốn bắt đầu phân tích, nhưng không có ngân sách ngay bây giờ, là sự xuất hiện gần đây của phần mềm miễn phí Các tùy chọn đóng gói hỏa lực dữ liệu khá nghiêm túc.
Vào tháng 10, Greenplum đã công bố một bản Node duy nhất của cơ sở dữ liệu MPP (xử lý song song). Kiến trúc MPP chia nhỏ khối lượng dữ liệu thành nhiều phần được quản lý độc lập trên một loạt các máy chủ.
Phiên bản Single Node có thể được sử dụng trong chế độ sản xuất trên một máy chủ x86 với tối đa hai ổ cắm CPU và lõi không giới hạn. Nó cũng có thể được triển khai trong một máy ảo duy nhất với tối đa tám lõi ảo. Không có nắp lưu trữ. Single Node Edition cũng có thể được gắn lại vào một thực thi Greenplum rộng hơn.
Cũng trong tháng 10, Calpont phát hành InfiniDB Community Edition, một cơ sở dữ liệu mã nguồn mở, theo định hướng cột. Theo nhà phân tích Curt Monash của Monash Research, phương pháp cột có thể làm giảm đáng kể nhu cầu đĩa I / O so với các hệ thống lưu trữ dữ liệu theo hàng và cũng đạt được mức độ nén cao hơn. Máy chủ đơn, nhưng không có giới hạn về số lượng CPU, số lõi, bộ nhớ, khối lượng dữ liệu hoặc người dùng đồng thời.
Calpont cũng có phiên bản thương mại của InfiniDB, hiện đang ở giai đoạn đầu tiên, cho phép người dùng mở rộng hệ thống cho nhiều máy chủ.
InfiniDB Community Edition theo sau bản phát hành năm ngoái của một nền tảng kho dữ liệu cột mã nguồn mở khác từ Infobright. Sau này có thể có một lợi thế cho bây giờ trên InfiniDB về hỗ trợ cộng đồng; Gần đây, Infobright cho biết phần mềm đã được tải xuống hơn 15.000 lần.
Cuối cùng, các tùy chọn lưu trữ dữ liệu miễn phí này có giới hạn và khả năng sử dụng, theo Monash.
"Nếu bạn có một nhà phân tích hoặc nhỏ nhóm các nhà phân tích thực hiện truy vấn thăm dò sớm đối với một số terabyte dữ liệu hoặc ít hơn, sau đó các sản phẩm này có khả năng thực hiện công việc này, "ông nói.
Các công ty cũng có thể không có ngân sách để mua bất kỳ thứ gì khác hoặc không thể nhận tài trợ mà không cần tiến hành một bằng chứng ban đầu của khái niệm, Monash nói thêm.
"Chắc chắn có khối lượng công việc mà họ không đủ, và bạn sẽ phải trả tiền cho một sản phẩm sẽ thực hiện công việc cho bạn", ông nói. "Nhưng nếu bạn muốn nhận được nhiều giá trị hơn từ dữ liệu của mình, những sản phẩm miễn phí này có thể là một nơi tuyệt vời để bắt đầu."
Các quốc gia EU phải thường xuyên thu thập và phân tích các mẫu nước. Vào cuối mùa bơi, dữ liệu được gửi tới EEA. Erasmus sử dụng cơ sở dữ liệu máy chủ SQL của Microsoft để thu thập dữ liệu, có tính năng không gian địa lý có thể lấy dữ liệu từ một khu vực cụ thể và vẽ lên nó một bản đồ, cho biết Ludo de Bock, giám đốc của Microsoft trên toàn thế giới cho EU và NATO (Tổ chức Hiệp ước Bắc Đại Tây Dương).
Tính năng này cũng cho phép dữ liệu mới được đưa vào EEA được tải lên trang web trong thời gian thực, Karadeniz nói. Hy Lạp, Ý, Malta, Hà Lan, Slovenia, Bồ Đào Nha và Slovakia có thể gửi dữ liệu năm 2008.
Một nhà nghiên cứu của Google đã mô tả các điều tra liên tục của công ty về tìm kiếm dữ liệu có cấu trúc trong một cuộc trò chuyện thứ Sáu. tập trung chủ yếu vào việc thu thập văn bản trên các trang web, nhưng Google đang nghiên cứu sâu về cách phân tích và tổ chức dữ liệu có cấu trúc, một nhà khoa học công ty cho biết hôm thứ Sáu. không làm tốt công việc giới thiệu nó cho người dùng của chúng tôi, ”Alon Halevy nói trong một buổi nói chuyện tại hội nghị Ngày Cơ sở dữ liệu New England tại Viện Cô
Halevy đã tham chiếu một phần đến các nguồn" Web sâu " , chẳng hạn như các cơ sở dữ liệu nằm phía sau các trang web định dạng như Cars.com hoặc Realtor.com. Google đã gửi các truy vấn đến các biểu mẫu khác nhau trong một thời gian, truy xuất các trang Web kết quả và đưa chúng vào chỉ mục tìm kiếm nếu thông tin có vẻ hữu ích.
Google đã thu thập dữ liệu cá nhân thông qua các sản phẩm như công cụ tìm kiếm của nó. Dịch vụ e-mail của Gmail, cũng như dịch vụ quảng cáo AdSense của nó. Hệ điều hành Chrome, sẽ được tung ra trên các máy tính netbook vào năm tới, mang lại cho công ty một con đường khác để thu thập và kiếm tiền từ thông tin cá nhân, những người ủng hộ quyền riêng tư cho biết hôm thứ Tư.
"Cạnh tranh trên thị trường OS luôn được chào đón, nhưng Google là trường hợp đặc biệt, "Marc Rotenberg, chủ tịch của Trung tâm thông tin bảo mật điện tử, một nhóm bảo vệ quyền riêng tư cho biết. "Nó đã trở thành ưu thế trên nhiều dịch vụ Internet cần thiết - tìm kiếm, thư, video, ứng dụng trực tuyến và quảng cáo."