Cuil có danh mục tới 120 tỷ website, nhiều gấp 3 lần so với bất kì trang tìm kiếm nào khác, kể cả với Google.

Từng là “ngôi sao” của Google, các nhân viên cũ của hãng này vừa ra mắt dịch vụ mang tên Cuil nhằm thách thức với công cụ Google nổi tiếng. Tuy nhiên thay đổi thói quen lướt web của người dùng là khó khăn đang đè nặng lên những con người táo bạo này.

Các dịch vụ tìm kiếm web lớn, điển hình là Google phục vụ khách hàng theo vài bước cơ bản: trước hết, dùng các phần mềm được gọi là Googlebot lần lượt quét qua tất cả website trên Internet nhằm tìm kiếm site mới, cập nhật và bổ sung thông tin trên site cũ. Các Googlebot hợp sức tạo nên một danh mục (index) website khổng lồ của toàn bộ mạng Internet, với các hạn chế nhất định:  không thống kê được file flash cũng như các site có nội dung động (web 2.0).

Khi người dùng gõ từ khoá vào ô tìm kiếm, kết quả sẽ được lấy từ index đã lưu trong máy chủ Google thay vì tìm trực tiếp trên Net nhằm tăng tốc độ phục vụ. Kết quả đưa tới tay người dùng được quyết định bởi trên 200 thông số, trong đó quan trọng nhất là xếp hạng site (pagerank). Pagerank được tính bằng số đường dẫn trỏ tới một website và độ quan trọng của các link này (link từ các báo điện tử lớn sẽ được đánh giá cao hơn link từ 1 trang blog cá nhân nằm trên Yahoo! 360).

Trong khi đó, Cuil tuyên bố công nghệ mình sử dụng khác hẳn so với Google, rõ nhất nằm ở bước lập danh  mục site và trả kết quả tìm kiếm về cho người dùng. Trước hết, chi phí cho các bước này của Cuil sẽ cực kì rẻ nếu so với  khoảng 1 tỉ đô la mỗi năm  nhằm duy trì cơ sở hạ tầng bộ máy tìm kiếm  của Google. Tiếp đó, không chỉ đưa lại kết quả dựa vào pagerank, Cuil còn cố gắng nắm bắt mối liên hệ của các từ khoá (ví dụ như Dân trí - Khuyến học - Giáo dục) để phục vụ chính xác hơn. Cách dịch vụ này phân loại và lưu trữ website có thể được coi là hướng tiếp cận tìm kiếm theo ngữ nghĩa (semantic search) cơ bản. Nhờ cách tiếp cận nói trên, khi tìm kiếm trên Cuil, dịch vụ này sẽ đưa ra danh sách website thông thường kèm theo một bảng phân loại nhỏ. Tìm theo từ khoá dogs sẽ ra một loạt kết quả phụ water dogs, crossbreed v.v.., thậm chí một số không hề có chữ dog.  Thử nghiệm trực tiếp cho thấy hệ thống phân loại của Cuil mới chỉ hoạt động tương đối tốt với tiếng Anh, trong khi cung cấp kết quả rất nghèo nàn cho các tìm kiếm bằng tiếng Việt.

Ảnh
Giao diện khá bắt mắt của Cuil

Giao diện của Cuil sặc sỡ hơn hẳn Google khi đưa hình ảnh kèm chữ, cũng như cung cấp kết quả gợi ý qua dãy thẻ phía trên trên màn hình. Hãng cho biết mình không lưu bất cứ thông tin nào về quá trình tìm kiếm, nhằm đảm bảo an ninh tối đa cho khách hàng.

Cuil do một nhóm kỹ sư tiên phong trong lĩnh vực tìm kiếm sáng lập, trong đó có Costello - người xây dựng nên công cụ phân tích web Web Fountain của IBM, cùng vợ của ông, Anna Patterson  - từng là kiến trúc sư trưởng phụ trách  hệ thống danh mục web khổng lồ TeraGoogle của Google. Patterson cũng là  người thiết kế hệ thống tìm kiếm cho công ty lưu trữ tài liệu doanh nghiệp toàn cầu Recall – một bộ phận của tập đoàn Brambles (Úc).  Cuil còn nhận đóng góp từ của vài nhân sự cao cấp trước đây của Google như Russell Power và Louis Monier.

(Theo Dantri)


Bình luận

  • TTCN (6)
Nguyễn Hồng Phúc  301

sao tìm thongtincongnghe.com ra cái gì vậy
http://bit.ly/dhPaMX

Nemo Nguyen  21665

Thử vài kết quả khác, kết quả còn gà hơn Big Grin

http://bit.ly/bqxa2I

Cái SE này chắc chỉ.. demo cho vui quá Big Grin

VNSAcc

Cuil này chưa làm nên trò trống gì mà đã rêu rao, thử tìm vài cái là biết ngay mà.

Nemo Nguyen  21665

May mà nó ko chơi kiểu Monova VN: "lấy luôn kết quả của Google mà dùng" Big Grin

chie

binh luận

woa!giao diện rất đẹp mắt!Cuil sẽ có nhìu hứa hẹn!Mình thấy cuil chuyên nghiệp lắm!

Phạm Lê Minh Định  5533

cái này còn tệ lắm. Chưa thể sáng google đâu.