Bản cập nhật mới của Gboard mang đến khả năng nhận diện giọng nói ngoại tuyến

Theo Engadget, nhóm AI của Google vừa thông báo rằng họ đã cập nhật trình nhận dạng giọng nói của Gboard để nó có thể nhận ra từng kí tự một khi họ đang nói và hiện được lưu trữ trực tiếp trên thiết bị. Về cơ bản, việc nhập liệu bằng giọng nói của Gboard sẽ nhanh hơn và đáng tin cậy hơn do không cần phải gửi dữ liệu qua internet.

Google đã giải thích trong một bài đăng trên blog rằng họ muốn tạo một trình nhận dạng giọng nói “đủ nhỏ gọn để cư trú trên điện thoại” và sẽ không bị ảnh hưởng bởi mạng Wi-Fi hoặc mạng di động không đáng tin cậy.

Truyền thống nhận dạng giọng nói hoạt động bằng cách chia nhỏ các từ bạn nói thành các phần nhỏ hơn được gọi là âm vị. Trình nhận dạng giọng nói sau đó sẽ phân tích thứ tự, mẫu và ngữ cảnh của các âm vị để tạo ra một câu. Điều này thường sẽ dẫn đến độ trễ khi bạn chờ phần mềm đưa ra dự đoán tốt nhất về những gì bạn đang nói. Nhóm AI của Google đã tuyên bố trong bài đăng rằng mô hình của họ xuất ra từng kí tự một (như bạn nói) với khoảng ngắt quãng khi thích hợp. Nói cách khác, Gboard sẽ nhận ra từng chữ cái của những từ bạn nói thay vì nhận ra âm vị.

Hiện tại, bản cập nhật Gboard chỉ có sẵn bằng tiếng Anh và sử dụng trên điện thoại Pixel. Nhóm AI của Google có thể mở rộng bản cập nhật để bao gồm nhiều ngôn ngữ hơn và nhiều thiết bị hơn trong tương lai.

Theo Thanh Niên.




Bình luận

  • TTCN (0)