Cùng với sự lớn mạnh của Google, luôn có một “tập đoàn” tìm cách ăn theo. Vụ Google News và Red Label News chỉ là một trường hợp gần đây.

Red Label News, một trang web mới toanh chưa đủ tháng tuổi, đã khiến Google News một phen muối mặt. Nhờ vào nghệ thuật SEO (tối ưu hóa với công cụ tìm kiếm) thượng thặng, trang web này đã chễm chệ được Google News xếp vào hạng đáng tin cậy.

Sự việc chỉ vỡ lở khi CNET phanh phui sự việc. Vào ngày 3/11 vừa qua, tất cả các truy vấn bằng từ khoá “iTunes” trên bộ máy lọc tin của Google đều có liên kết tới Red Label News.

Điều gì đã xảy ra? Theo phỏng đoán của CNET, ông chủ của Red Label News đã sử dụng một chiến thuật khá thông minh: sưu tập liên kết chứa bài viết mới từ các nguồn báo điện tử uy tín về một chủ đề đang “hot” và nhờ đó, đã đánh lừa được thuật toán tìm kiếm và xếp hạng của Google.

SEO (Search Engine Optimize) là các phương pháp, kĩ thuật tối ưu hóa trang web để giúp nó trở nên thân thiện với công cụ tìm kiếm, đạt được thứ hạng cao trong danh sách tìm kiếm.

Chuyện lần này liên quan tới việc Apple tăng thời gian nghe thử trên iTunes lên thành 90 giây. Như mọi khi, Google News dẫn tin này từ một số nguồn quen thuộc CNET, BetaNews, PC Magazine. Tất cả được gom thành một nhóm nhưng ngay phía dưới nhóm tin nay, chỉ trong giây lát, một nhóm tin mới chỉ dẫn nguồn từ Red Label News xuất hiện với tiêu đề tin không có gì mới, cũng liên quan tới iTunes.

Khi kiểm tra liên kết từ Red Label News, dễ dàng nhận ra trang web này chỉ chứa nội dung rác. Bên cạnh một vài từ khoá được SEO tốt kèm với các link liên quan tới tin tức, Red Label News dành phần lớn nội dung để chèn quảng cáo Google Adsense và trưng bày sản phẩm của Amazon, kêu gọi mọi người mua hàng với mục tiêu nhận tiền chiết khấu.

Thực tế, Red Label News chỉ là một trong 44 tên miền liên quan chuyên đăng tải tin tức do công ty có tên 70 Holdings trụ sở tại Los Angeles sở hữu. Một số trang chưa hoạt động, nhưng đáng chú ý, các trang đang “sống” như ElectronicTechNews.com đều sử dụng chiêu tương tự Red Label News: sử dụng một số keyword tối ưu hoá bộ máy tìm kiếm, một ít nội dung hời hợt giới thiệu sản phẩm và tất nhiên, phần còn lại dành chủ yếu cho quảng cáo và bán hàng ăn hoa hồng. Ngoài ra, hệ thống trang web của 70 Holdings đều có mô hình chung là gắn kèm liên kết nội dung tới các trang web uy tín.

Tranh thủ chớp thời cơ đăng tải thông tin liên quan đến các sự kiện mới nhất chính là chiến lược mà ông chủ của mô hình trang web này đang theo đuổi, nhằm giành được ưu thế trên Google.

Có thể nói, 70 Holdings đã tìm ra được cách “chơi khăm” Google News. Không thể phát hiện được nội dung rác ngay sau khi chúng xuất hiện trên mạng gắn liền với các sự kiện, từ khoá nóng hổi, Google đã “bắt cóc” về trang chủ News mà thiếu kiểm soát. Tất nhiên, với kiểu làm ăn này, công ty có trụ sở ở Los Angeles không có ý định sẽ xây dựng được những trang web tin tức nghiêm chỉnh có thương hiệu.

Google tảng lờ

Ảnh
Google News đã bị Red Lab News xỏ mũi với hàng tiêu đề tin nội dung rác chễm chệ ngự trên trang chủ.

Trong thông cáo của mình, Google không đưa ra bất kì nhận xét nào về các tác giả xuất bản nội dung với tư cách cá nhân có mặt trên Google News: “Chúng tôi đã có những hướng dẫn cụ thể liên quan tới chất lượng của các trang web trên bộ máy lọc tin Google News. Chúng tôi muốn đảm bảo Google mang đến những bài viết chất lượng nhất dành cho người dùng. Đội ngũ nhân viên thường duyệt các nguồn tin, nhất là khi có than phiền từ phía độc giả và sẽ có những biện pháp xử lí thích hợp.”

Google News là hệ thống lấy tin dựa vào thuật toán của Google, nhưng để có mặt ở đây, các nhà xuất bản nội dung phải được nhóm phụ trách chấp nhận. Thuật toán chỉ làm nhiệm vụ xếp hạng nguồn tin từ các nhà xuất bản nội dung đã được đồng ý.

Với hơn 50 ngàn nguồn thông tin đóng góp nội dung cho Google News, thực tế là bộ máy tìm kiếm của Google gặp không ít khó khăn trong việc kiểm duyệt. Theo hướng dẫn từ hãng tìm kiếm, Red Label News và các trang tin của 70 Holdings đã vi phạm quy định như cung cấp nội dung trang web không liên quan tới từ khoá, tạo ra các trang web có nội dung lặp lại. Trong vụ việc vừa qua, Red Label News đã đưa lên 42 tiêu đề liên quan tới iTunes có nội dung không hề khác nhau.

Chuyện các liên kết tới Red Lab News biến mất khỏi Google News là điều dễ hiểu khi người dùng than phiền, nhưng với hơn 40 tên miền 70 Holdings đang nắm giữ (tất nhiên, còn hàng trăm công ty khác thực hiện chiến lược tuơng tự), rõ ràng Google sẽ còn phải đối mặt nhiều lần với tình trạng tương tự..

Khi nhu cầu tin tức nóng hổi tăng cao, Google và các bộ máy lọc tin sẽ phải đối mặt nhiều hơn với những vụ tương tự. Không phải là lần đầu gã khổng lồ gặp phải khó khăn kiểu này, nhưng rõ ràng nếu Google không thể cải thiện thuật toán giúp phát hiện và lọc ra các nội dung rác, chắc chắn người dùng sẽ bỏ cuộc chơi để tìm đến các địa chỉ trang tin độc lập nhưng đáng tin cậy, dựa vào bạn bè trên Facebook hoặc Twitter, mà điều này, tất nhiên, gã khổng lồ tìm kiếm chẳng lấy gì làm vui vẻ.

Theo Tuổi trẻ



Bình luận

  • TTCN (1)
Hải Nam  30903

Những sai sót kiểu này là động lực để Google phát triển thôi. Chứ còn chuyện mấy trang tin mới đã nằm trong Google News hoặc trong trang đầu Google Search là rất bình thường (một số CTV TTCN vì vậy cũng hay bị nhận nhầm, đi dịch bài từ những trang chuyên copy lại hoặc đăng tin vớ vẩn). Google cũng phải để cho các trang đó sống, vì đó cũng là đối tượng bán quảng cáo cho Google, đồng thời Internet càng rộng, càng hỗn loạn thì công cụ tìm kiếm như Google mới có chỗ đứng Big Grin

Vụ này không phải là "chơi khăm", chỉ là muốn... kiếm chác, nhưng hơi quá đà. Trước cũng có vụ Apple article/18131