Cúp vàng Teckmart Việt Nam năm 2012 cho “Phần mềm dịch tiếng nói hai chiều trên hệ điều hành Android”; Giải Nhì (không có giải Nhất) giải thưởng Nhân tài Đất Việt 2012 với sản phẩm “biến báo điện tử thành báo nói ViNAS”… là các thừa nhận của xã hội cho hơn chục năm theo đuổi công nghệ phần mềm tiếng nói của anh Vũ Tất Thắng.
10 năm cho một chặng đường
Là quãng đường khi chàng sinh viên bách khoa Vũ Tất Thắng đi qua khi anh bắt đầu chính thức dấn thân vào con đường nghiên cứu sâu các vấn đề nhận dạng, tổng hợp tiếng Việt, phát triển các phần mềm dịch tiếng nói từ ngôn ngữ tiếng Việt sang ngôn ngữ khác…
Tốt nghiệp Đại học Bách khoa chuyên ngành điện tử viễn thông, học hỏi và làm việc nhiều nơi nhưng những suy nghĩ về làm sao để có thể san lấp rào cản ngôn ngữ khi giao tiếp giữa người với người, làm sao giúp con người có phương thức giao tiếp với máy tính khác phương thức hiện hành cứ theo đuổi anh mọi lúc mọi nơi. Anh đã bắt tay vào nghiên cứu các vấn đề ngôn ngữ, lập trình ngôn ngữ từ đó…
Năm 2001, khi làm trong 1 phòng nghiên cứu chuyên về nhận dạng công nghệ tri thức của Viện khoa học và công nghệ Việt Nam phụ trách nghiên cứu về ngôn ngữ tiếng việt, đưa nghiên cứu thành các phần mềm nhận dạng ngôn ngữ ra thực tế giúp ích cho người dùng, ánh lửa “dịch tiếng nói” đã bắt đầu cháy trong anh. Khoảng 2008, là thành viên cộng đồng nghiên cứu công nghệ dịch tự động U - STAR do Viện nghiên cứu phát triển công nghệ cao Nhật Bản khởi xướng, Vũ Tất Thắng có thêm nhiều điều kiện để tiếp bước con đường mình đang bước đi.
Sau 2 năm làm nghiên cứu sinh tại Nhật, chuyên ngành ngôn ngữ. Trở về Việt Nam, kinh nghiệm có được từ trước cộng với trăn trở muốn tập trung vào làm tốt hơn 1 cặp ngôn ngữ Việt- Anh, Anh –Việt và đưa nó thành dạng phần mềm riêng đã thúc đẩy anh bắt tay vào thực hiện sản phẩm “Phần mềm dịch tiếng nói hai chiều trên hệ điều hành Android”. Trên đà đó, anh cộng tác với nhiều nhóm nghiên cứu tiếp tục triển khai một số phần mềm giúp ích cho cộng đồng lần lượt được ứng dụng: công trình phối hợp nghiên cứu với Bộ Thông tin và Truyền thông trong phát triển phần mềm đọc tiếng Việt VieTalk4JAWS nhằm miễn phí cho người dùng khiếm thị sử dụng máy tính dễ dàng thông qua nghe âm thanh gõ phím thay vì phải đọc trên màn hình. Hay như “hô biến” các bản tin trên báo mạng thành các bản tin dưới dạng phát thanh bởi phần mềm “Hệ thống biến báo điện tử thành báo nói ViNas” và đây cũng là phần mềm giành giải nhì (không có giải nhất) của giải thưởng Nhân tài đất Việt 2012…
Đọc báo bằng… tai
Miệt mài nghiên cứu trong một lĩnh vực khá mới mẻ tại Việt Nam sau gần chục năm, cuối cùng những “đứa con tinh thần” đã lần lượt “trình diện xã hội và được mọi người đón nhận là niềm vui cũng như sự hãnh diện của tôi và các thành viên trong nhóm nghiên cứu iSolar. Tuy sẽ còn có nhiều khó khăn cũng như những lỗi cần khắc phục ở thực tế nhưng những gì chúng tôi có được đã cho chúng tôi thấy con đường đưa công nghệ xử lí tiếng nói hướng tới việc giúp con người và máy móc giao tiếp trở nên gần gũi hơn bằng tiếng nói là hoàn toàn có ích”, anh Thắng chia sẻ. “Phần mềm dịch tiếng nói hai chiều trên hệ điều hành Android” cho phép hai người dùng thuộc hai quốc gia khác nhau có thể nói chuyện với nhau bằng ngôn ngữ riêng của mỗi người thông qua thiết bị di động chạy hệ điều hành android. Hiện nay phần mềm này đã được cung cấp miễn phí tới người dùng trên Google Play và đã có một số người dùng thử. Tôi đang nghiên cứu và bước đầu thử nghiệm phiên bản dành cho iOS, hi vọng trong thời gian không xa sẽ giới thiệu tới người dùng”, anh Thắng hồ hới cho biết thêm.
“Thực tế thiết bị điện thoại, máy tính bảng đã và đang được nhiều người dùng sử dụng để truy cập tin tức. Tuy nhiên nếu như thay vì “căng mắt” đọc các chữ nhỏ thì bạn được nghe bằng tai với 8 giọng đọc khác nhau thì sẽ tốt hơn”, anh Thắng chia sẻ về quá trình nghĩ ra ý tưởng làm sản phẩm“biến báo điện tử thành báo nói ViNAS”.
ViNAS hoạt động dưới dạng một phần mềm cài đặt, liên kết với một số trang báo mạng Việt Nam (dantri, vnexpress, vietnamnet…). Có nghĩa là, khi mở ứng dụng nói trên (tại máy tính PC hoặc các thiết bị di động), người dùng có thể chọn nghe tin tức từ các trang tin ở tất cả các mục với 2 giọng đọc của nam và nữ.
Sau 6 tháng triển khai (từ tháng 2 đến tháng 8/2012), sản phẩm hoàn thành được chia thành 2 hướng tiếp cận riêng biệt: Hướng tiếp cận là doanh nghiệp (thương mại hóa) và hướng tiếp cận là người sử dụng (miễn phí) với các ứng dụng dành cho PC và mobile.
Với hướng tiếp cận doanh nghiệp, hệ thống cung cấp một bản web demo và một ứng dụng thương mại trên PC. Ứng dụng này cho phép doanh nghiệp lấy nội dung bài báo qua một URL, chuẩn hóa văn bản và cuối cùng là tạo file âm thanh chuẩn và có khả năng lưu trữ. Đồng thời, doanh nghiệp có thể trực triếp chỉnh sửa lại văn bản sau khi đã qua bước chuẩn hóa, nhằm tạo nên một văn bản hoàn chỉnh và làm đầu vào chuẩn cho quá trình tạo file âm thanh. Mục đích chính của sản phẩm thương mại này là giúp cho doanh nghiệp tự tạo file âm thanh cho từng bài báo của mình.
Với hướng tiếp cận là người dùng, hệ thống dược xây dựng thành hai ứng dụng, một dành cho PC và một dành cho mobile. Cả hai ứng dụng này đều được cung cấp hoàn toàn miễn phí.
“Tuy sản phẩm vẫn còn có một số tồn tại như chưa thể chuẩn hóa được cách đọc với những từ khó, đa nghĩa. Việc chuẩn hóa không thể đạt được độ chính xác tuyệt đối mà vẫn cần có sự can thiệp của con người… Nhưng chúng tôi sẽ cố gắng khắc phục trong thời gian tới”, anh Thắng chia sẻ thêm về những dự tính trong tương lai với hi vọng sản phẩm ngày càng hoàn thiện và phục vụ tốt hơn cho các doanh nghiệp cũng như người đọc báo.
Theo TGS
Bình luận
vn mình còn rất nhiều người tài giỏi ,mình cũng muốn làm nhưng ko có khả năng, chúc mừng anh