Dịch vụ trực tuyến miễn phí này sẽ giúp bạn chuyển văn bản tiếng Việt trong một file ảnh thành file doc hay text một cách chính xác hơn nhờ hỗ trợ nhiều ngôn ngữ khác nhau, trong đó có tiếng Việt.
Có không ít phần mềm cũng như dịch vụ trực tuyến giúp bạn trích xuất text từ ảnh, nhưng tìm một công cụ có hỗ trợ tiếng Việt thì không phải dễ. Free Online OCR là một trong số ít dịch vụ nhận dạng ký tự có hỗ trợ tiếng Việt cùng với 28 ngôn ngữ khác như Anh, Pháp, Hà Lan, Đức, Nga, Ý, Tây Ban Nha, Thụy Điển...Free Online OCR hỗ trợ trích xuất text các file ảnh có định dạng jpeg, png, gif, bmp and tiff và file pdf một cách nhanh chóng và hiệu quả. Vẫn còn một chút hạn chế đối với các file ảnh: dung lượng cho mỗi file không được quá 1 MB, nhưng file pdf thì có thể lên đến 10 MB. Kết quả sau khi xuất ra sẽ được lưu thành 2 file doc và txt để bạn lựa chọn tải về.
Để sử dụng dịch vụ, trước tiên bạn truy cập vào trang chủ tại địa chỉ NewOCR.com (không cần đăng ký thành viên), bấm chọn Choose File hoặc Browse (tùy theo trình duyệt web) và chỉ đường dẫn đến file cần trích xuất. Tiếp theo, chọn ngôn ngữ cần trích xuất cho file ở mục Language of the document.
Để có kết quả tốt, nên chọn ngôn ngữ cùng với file gốc. Nếu muốn thay đổi kích cỡ, bạn định phần trăm tỷ lệ ở mục Resize. Riêng mục Rotate có 4 tùy chọn là No Change (giữ nguyên không thay đổi), Counterclockwise 900 (xoay ngược chiều kim đồng hồ 900), Clockwise 900 (xoay theo chiều kim đồng hồ 900) và 1800 (xoay 1800). Sau cùng, bấm Send File để website tiến hành upload và chuyển đổi.
Tốc độ làm việc của dịch vụ rất nhanh, và file sau khi được trích xuất cho kết quả rất tốt. Nội dung được trích xuất ra gần như là không bị lỗi về vấn đề font. Chú ý ở khung bên phải phía dưới dòng GET FILE sẽ là 2 biểu tượng của định dạng doc (trang văn bản có hình) và txt (trang văn bản không hình), bạn lựa chọn định dạng phù hợp và bấm vào đó để tải về.
Nếu muốn làm việc tiếp với file khác, bấm chọn Upload New File và thực hiện các bước tương tự như trên. Ngoài ra bạn có thể sử dụng các dịch vụ ở mục Share this để chia sẻ file với mọi người.
(Theo TuoiTreOnline)
Bình luận
cảm ơn
Tôi đã dùng thử dịch vụ này với file PDF chuyển sang DOC rất tốt.
Xin cám ơn tác giả Trần Đức Minh đã giới thiệu
Số hoá tài liệu tiếng Việt, nhận dạng ký tự tiếng Việt
Số hoá tài liệu tiếng Việt, nhận dạng ký tự tiếng Việt, chuyển đổi từ ảnh quét sang văn bản text. Hỗ trợ hơn 200 ngôn ngữ từ tiếng Việt đến Anh, Trung, Hàn, Nhật, Nga, Đức, Tây Ban Nha, Ả rập, …. Chính xác trên 99%, giải pháp chuyên nghiệp hàng đầu thế giới, sản phẩm và công nghệ của Mỹ. Giữ nguyên chính xác cấu trúc, style, bảng biểu, đồ thị, hình ảnh… của tài liệu gốc, không phải dàn trang căn chỉnh lại. Hỗ trợ mọi loại ảnh đầu vào phổ biến (màu, đen trắng, xám): TIFF, BMP, JPEG, PDF, PNG. Kết xuất đầu ra đa dạng: PDF, WORD, RTF, EXCEL, TXT, CSV, XML, HTML…
Liên hệ: 0985938585
(Tag: Nhận dạng ký tự, Nhận dạng ký tự tiếng Việt, Ảnh thành văn bản, Nhận dạng ký tự tiếng Trung, Nhận dạng ký tự tiếng Hàn, Nhận dạng ký tự tiếng Đức, Nhận dạng ký tự tiếng Nga, Nhận dạng ký tự tiếng Nhật, Số hoá tài liệu, Nhận dạng chữ viết, Nhận dạng ảnh quét)