Windows

Hadoop tìm kiếm nhiều hơn với MapR, Cloudera phát hành

Lecture 08 - Hadoop - Why Hadoop need vendors like Cloudera, Hortonworks and MAPR ?

Lecture 08 - Hadoop - Why Hadoop need vendors like Cloudera, Hortonworks and MAPR ?
Anonim

Người dùng nền tảng xử lý dữ liệu Hadoop giờ đây có thêm hai công cụ để giúp họ sắp xếp thông qua các ngọn núi thông tin.

Bản phân phối M7 mới của MapR loại bỏ các lớp JVM Hadoop để tăng hiệu suất

Hadoop nhà phân phối MapR đã tích hợp LucidWorks Search vào phân phối riêng của mình. Trong khi đó, Cloudera đã phát hành bản phát hành đầy đủ đầu tiên của công cụ truy vấn SQL Impala SQL cho Hadoop.

[Đọc thêm: Các dịch vụ truyền hình trực tuyến tốt nhất]

“Sử dụng tìm kiếm như giao diện người dùng cho dữ liệu lớn rất thú vị. Tìm kiếm rất phù hợp để tận dụng rất nhiều loại thông tin khác nhau, đặc biệt là thông tin không có cấu trúc, ”Jack Norris, giám đốc tiếp thị của MapR cho biết. "Chúng tôi đang nhìn thấy một số ứng dụng thực sự thú vị với các công cụ tìm kiếm ở cốt lõi của họ, ngay cả khi một người dùng điển hình sẽ không nghĩ chúng là công cụ tìm kiếm."

LucidWorks Search là phiên bản thương mại của mã nguồn mở Apache Lucene / Solr đầy đủ công cụ tìm kiếm văn bản. Với tích hợp MapR mới, LucidWorks Search có thể tìm kiếm thông qua một trong hai dữ liệu trên hệ thống tập tin Hadoop (HDFS) hoặc trên các tập tin trên các hệ thống tập tin khác. cài đặt Lucene / Solr từ đầu.

Công cụ tìm kiếm có thể được sử dụng trong ứng dụng web động để nhanh chóng truy xuất ảnh, quảng cáo, đề xuất sản phẩm và các thông tin khác có thể được sử dụng để phổ biến các trang Web khi đang di chuyển. “Đây không phải là chi phí thay thế thấp hơn cho kho dữ liệu. "Norris nói.

MapR và LucidWorks đã hợp tác với nhau về việc ghép nối các công nghệ của họ kể từ năm 2011, khi họ thành lập một thỏa thuận tiếp thị chung. Đầu năm nay, họ đã phát hành một trình kết nối giúp dễ dàng sử dụng Lucene / Solr với bản phân phối MapR Hadoop.

LucidWords Search hoạt động với bản phân phối M7 mới phát hành của MapR, ở dạng beta. Ngoài việc hỗ trợ LucidWorks Search, phiên bản M7 đã được tái cấu trúc để loại bỏ các phép tính hoặc kiểm tra tính nhất quán nền, tăng tốc hiệu suất.

Cũng trong tuần này, Cloudera phát hành phiên bản 1.0 của Cloudera Impala, một công cụ truy vấn tuân thủ SQL nguồn mở Hadoop. SQL là ngôn ngữ giao diện cơ sở dữ liệu được sử dụng trong các hệ quản trị cơ sở dữ liệu quan hệ (RDMS) và được các quản trị viên cơ sở dữ liệu biết đến.

Impala được thiết kế để thực thi truy vấn nhanh hơn Hoop của Hadoop, vì nó không sử dụng khung công tác MapReduce. kết quả tìm kiếm sẽ được ghi vào đĩa. Thay vào đó, người dùng có thể truy vấn dữ liệu được lưu trữ trong HDFS và HBase trực tiếp. Người dùng có thể truy vấn dữ liệu một cách tương tác hoặc thông qua các quá trình xử lý hàng loạt.

Cloudera lần đầu tiên phát hành phiên bản của công cụ này vào tháng 10 năm ngoái dưới dạng bản beta. Kể từ đó, phần mềm đã được thử nghiệm bởi các công ty như 37signals và Expedia.

Impala là thành phần cốt lõi của gói bổ sung Cloudera Enterprise RTQ (Real-Time Query) cho nền tảng Cloudera Hadoop. Có thể tải xuống Impala miễn phí.

Cập nhật ngày 6 tháng 5 để sửa thông tin về công nghệ Cloudera Impala.