Trở lại Việt Nam sau 41 năm, ông Lương Vĩnh Tước, Phó Giám đốc cấp cao phụ trách toàn cầu sản phẩm tìm kiếm trên web của Yahoo, khẳng định: “Với tính tự hào dân tộc, khi sản phẩm tìm kiếm tiếng Việt chưa hoàn thiện, tôi còn chưa yên tâm”.
- Xin ông khái quát về chuyến làm việc lần này tại Việt Nam?
- Từ góc độ toàn cầu, tôi thấy Việt Nam là thị trường đầy tiềm năng về Internet. Với dân số khoảng 85 triệu người, hiện tại có 19,5 triệu người sử dụng Internet. Khả năng tăng trưởng vẫn còn rất lớn. Sự tự hào dân tộc là động lực để tôi trở về giúp đỡ và xây dựng công cụ tìm kiếm thành công ở nước mình.
Đối với tìm kiếm tiếng Việt, chúng tôi từ trước đến nay vẫn áp dụng thuật toán toàn cầu. Lần này về Việt Nam, tôi lên những kế hoạch hiệu chỉnh và tối ưu hóa riêng bộ công cụ tìm kiếm cho tiếng Việt. Tôi mới làm việc với Bộ Khoa học Công nghệ và Môi trường, cụ thể là Thứ trưởng Nguyễn Văn Lạng. Chúng tôi muốn tìm kiếm những tài liệu, những kết quả nghiên cứu hướng dẫn, phân tích về ngôn ngữ tiếng Việt.
Cụ thể như cách đánh dấu trong tiếng Việt, những từ ghép đi chung, đi riêng mang nghĩa như thế nào…Những tài liệu đó sẽ giúp chúng tôi “dạy” những con "robot" khi tìm kiếm trên mạng thì phải “đọc” tài liệu tiếng Việt như thế nào cho đúng nhất.
Hiện tại chúng tôi đang làm việc với Bộ KHCN&MT để xem hai bên có thể cùng hợp tác để Yahoo phát triển công cụ tìm kiếm tại Việt Nam hay không. Buổi họp ngày 25/7 với các doanh nghiệp được chỉ định và nhận hỗ trợ từ Bộ KHCN&MT cho thấy những bước tiếp theo chúng tôi sẽ hợp tác như thế nào để cùng nhau nghiên cứu và phát triển.
- Theo ông, vì sao việc phát triển công cụ tìm kiếm tiếng Việt hiện chưa đạt được kết quả khả quan?
- Theo kinh nghiệm của tôi, một công ty nhỏ về tìm kiếm sẽ rất khó lớn lên được vì nguồn lực không đủ. Nhiều công ty khi làm việc ở quy mô nhỏ thì rất tốt, nhưng khi phát triển lớn lên thì họ gặp vấn đề. Nguồn lực đó gồm cả 2 phần: con người và tài chính.
Làm công cụ tìm kiếm đòi hỏi rất nhiều nhà khoa học nghiên cứu chuyên sâu về lĩnh vực này. Việc nhân rộng mô hình sẽ dẫn đến thiếu nhân tài. Thứ hai là việc đầu tư liên quan đến phần cứng. Mỗi search engine cần hàng chục ngàn server để phục vụ. Khi quy mô công ty càng lớn, những vấn đề trên càng phức tạp.
Ở Việt Nam có các nhà khoa học trẻ hiểu rất rõ về ngôn ngữ tiếng Việt, có thuật toán rất tốt để đáp ứng yêu cầu tìm kiếm trong ngôn ngữ tiếng Việt. Các bạn cũng biết tiếng Việt của chúng ra rất phức tạp, nhiều từ đồng âm, hoặc khi đứng một mình mang nghĩa khác so với khi kết hợp với từ đứng trước hoặc sau.
Một nhà nghiên cứu nước ngoài nếu cố gắng hiểu được tiếng Việt thì cũng rất khó. Những nhà khoa học của Việt Nam có được thuật toán thông minh, xử lý ngôn ngữ hiệu quả như vậy nhưng nếu không có tiền đầu tư vào cơ sở hạ tầng thì họ cũng gặp khó khăn.
- Là chuyên gia trong lĩnh vực tìm kiếm, tại sao ông không chọn Google (hãng đang dẫn đầu về dịch vụ tìm kiếm trên web) mà lại là Yahoo?
- Yahoo có nhiều tài sản mà Google không có để xây dựng được hệ thống tìm kiếm thế hệ tiếp theo.
- Vậy thế hệ tiếp theo của công cụ tìm kiếm là gì?
- Hiện tại, các bạn đều thấy là các công cụ tìm kiếm đều hoạt động theo phương thức: đánh vào từ khóa thì trả về kết quả liên quan với từ khóa đó. Thế hệ kế tiếp của máy tìm kiếm sẽ phải thông minh hơn, nó phải hiểu được rằng khi người dùng đánh vào một từ khóa thì họ đang muốn cái gì.
Yahoo có nhiều tài sản khác để hiểu được khách hàng như Mail, Messenger, 360,… chứ không phải chỉ một mình tìm kiếm. Tất cả các dịch vụ đó cho phép Yahoo hiểu được khách hàng của mình muốn cái gì đằng sau mỗi từ khóa họ đánh vào.
Về mặt kỹ thuật, hầu hết các công cụ tìm kiếm hiện tại đều sử dụng kiểu dữ liệu không có cấu trúc (unstructured data) là website để tạo nên kết quả tìm kiếm. Những sản phẩm của Yahoo là nguồn dữ liệu có cấu trúc dựa trên phân tích hoạt động người dùng. Sau khi kết hợp dữ liệu có cấu trúc và không có cấu trúc, kết quả tìm kiếm đạt mức liên quan cao hơn.
- Ông đánh giá mức độ ứng dụng Internet tại các doanh nghiệp Việt Nam hiện nay như thế nào?
- Khi tôi về Việt Nam, Tổng cục Du lịch và Phòng Xúc tiến Thương mại (VCCI) cũng có biết và mời tôi phát biểu tại Vũng Tàu trước những doanh nghiệp vừa và nhỏ kinh doanh lĩnh vực khách sạn và du lịch. Đề tài là về Internet và các công cụ để giúp doanh nghiệp vừa và nhỏ quảng bá được thương hiệu của họ trên Internet.
Theo tài liệu của Tổng cục Du lịch, tôi thấy có khoảng hơn 2 triệu khách du lịch nước ngoài đến Việt Nam trong 6 tháng đầu năm 2008. Tôi đã yêu cầu nhân viên của mình tìm trong cơ sở dữ liệu của Yahoo có bao nhiêu khách hàng đang tìm kiếm thông tin về du lịch Việt Nam. Kết quả cho thấy 6 nước và vùng lãnh thổ có nhiều câu hỏi về du lịch Việt Nam nhất là Nhật Bản, Đài Loan, Trung Quốc, Hàn Quốc, Mỹ và Thái Lan.
Tôi làm tiếp một công việc nữa là hỏi xem có bao nhiêu câu hỏi trong 1 tuần. Tôi thấy Mỹ là nước có số lượng câu hỏi nhiều nhất với trên 27 nghìn câu hỏi. Như vậy mỗi năm có khoảng 1,5 triệu câu hỏi về du lịch Việt Nam từ Mỹ (52 tuần). Những từ khóa phổ biến nhất là “hotel Vung Tau”, “hotel Da Lat”, “the best tour …” (tour du lịch nào tốt nhất… ).
Nhưng khi tôi tìm kiếm “hotel Vung Tau” thì kết quả tìm kiếm không có một quảng cáo nào của doanh nghiệp khách sạn ở Vũng Tàu cả. Thay vào đó là quảng cáo của một công ty Hotel.com – một công ty nước ngoài. Người dùng muốn biết thông tin du lịch Việt Nam lại phải đi qua một công ty nước ngoài. Điều đó có nghĩa các khách sạn ở Vũng Tàu mất đi cơ hội xuất hiện trước 1,5 triệu lượt hỏi của khách hàng Mỹ và hàng triệu khách hàng trên toàn cầu hàng năm.
- Cá nhân ông cảm thấy thế nào khi trở lại Việt Nam sau 41 năm?
- Tôi rời đất nước từ khi rất nhỏ. Tôi đã làm việc trong lĩnh vực phần mềm trong thời gian rất dài ở nước ngoài, đặc biệt là lĩnh vực tìm kiếm. Tôi rất hạnh phúc rằng ngày hôm nay tôi có cơ hội được trở lại và chia sẻ những kinh nghiệm đó với ngành công nghiệp CNTT ở đất nước nơi tôi sinh ra. Bên cạnh đó cũng là cơ hội để tôi nhìn lại, viếng thăm lại đất nước của mình.
- Xin cảm ơn ông.
(Theo Vietnamnet)
Bình luận