Cuối tuần qua “gã khổng lồ tìm kiếm” Google xác nhận đang phát triển một công nghệ tìm kiếm mới có khả năng nhận dạng văn bản trong các bức ảnh hoặc video số. Thực tế Google đã bắt tay vào nghiên cứu công nghệ trên từ khá lâu trước đây. Tháng 6 năm ngoái hãng đã nộp đơn lên Tổ chức sở hữu trí tuệ quốc tế (WIPO) xin cấp bản quyền sở hữu công nghệ này.

Theo nội dung hồ sơ xin cấp bản quyền mới chính thức được công bố rộng rãi ngày 3/1 vừa qua, Google xin cấp bản quyền sở hữu đối với phương pháp, hệ thống và phần mềm máy tính có khả năng nhận dạng văn bản trong ảnh số. Ví dụ, công nghệ này có thể tìm kiếm và lọc ra một số từ khoá trong một đoạn văn bản nào đó và tìm kiếm một bức ảnh có nội dung liên quan đến các từ khoá đó.

Văn bản trong ảnh số được thể hiện rất đa dạng với nhiều kiểu chữ, kích thước và hướng viết khác nhau. Nội dung văn bản lọc ra từ ảnh số - ví dụ bức ảnh quang cảnh đường phố đô thị - có thể cung cấp thông tin về địa điểm được thể hiện trong bức ảnh đó. Ví dụ, bức ảnh quang cảnh đường phố đô thị cho thể cung cấp cho chúng ta thông tin về tên phố, tên toà nhà, địa chỉ...

Hồ sơ của Google cũng nêu bật một số ưu điểm nổi bật của công nghệ tìm kiếm nói trên. “Nhận dạng văn bản trong ảnh số có thể giúp cải thiện chất lượng tìm kiếm hình ảnh, kết hợp lập chỉ mục cùng dữ liệu địa lý (location data) giúp tăng cường hiệu quả tìm kiếm theo vị trí địa lý hoặc đóng vai trò cung cấp nhận dạng vị trí địa lý và tìm kiếm ảnh chụp vị trí đó cho người dùng.

Ví dụ, người dùng yêu cầu tìm kiếm nhà hàng McDonald ở một thành phố hoặc gần một địa chỉ nào đó. Ứng dụng bản đồ số sẽ khởi tạo một bản đồ chỉ đường và hiển thị luôn một bức ảnh chụp nhà hàng đó. Sở dĩ ứng dụng bản đồ có được bức ảnh đó là nhờ nhận dạng nội dung văn bản liên quan đến nhà hàng McDonald cộng thêm các dữ liệu địa lý đi kèm với bức ảnh.

Google còn vẽ ra một viễn cảnh ứng dụng công nghệ tìm kiếm trong ảnh như sau. “Google sẽ phát triển tính năng Street View bằng cách sử dụng một phương tiện có gắn camera và đi khắp các địa điểm trong thành phố và chụp hàng loạt bức ảnh cảnh đường phố, siêu thị, cửa hàng... và cả hỉnh ảnh của các đồ vật bày bán trong các siêu thị cửa hàng đó. Và người dùng sẽ có thể tìm kiếm chi tiết hàng hoá, địa chỉ tên cửa hàng siêu thị bày bán và bản đồ chi tiết chỉ đường tìm đến đúng hàng hoá đó.”

Giới phân tích nhận định cũng giống như các công nghệ khác mà Google đã từng phát triển công nghệ tìm kiếm mới cũng nhắm đến mục đích cuối cùng là giúp hãng này bổ sung thêm giá trị cho lĩnh vực kinh doanh quảng cáo tìm kiếm.

(Theo T.Dũng - TTO)



Bình luận

  • TTCN (1)
Hải Nam  30904

Kĩ thuật này có gì khác OCR nhỉ ? OCR nhận dạng các đoạn văn bản được scan chứ không nhận được văn bản chụp các pano quảng cáo, bảng hiệu... ?

Mục đích cuối cùng Google, như gã khổng lồ này nói, là "tổ chức lại thông tin của nhân loại". Còn quảng cáo chỉ đơn giản là kiếm tiền phục vụ cho mục đích này mà thôi.