Tesseract.js mang đến hình ảnh dịch OCR cho trình duyệt

Bản dịch OCR vẫn chưa hoàn hảo nhưng nó đã được cải thiện đáng kể trong vài năm qua. Dẫn đầu là Tesseract công cụ dịch thuật hiện đang mở nguồn C++.

Mặc dù đây là một thư viện đáng kinh ngạc, tuy nhiên, nó bị hạn chế đối với phần mềm. Rất may, ai đó đã tạo một cổng Tesseract thành JavaScript có tên là Tesseract.js. Nó hỗ trợ tới 60 ngôn ngữ và trong khi nó chắc chắn không hoàn hảo, nó làm rất tốt.

Cài đặt và thiết lập là một cách dễ dàng, nơi bạn có thể nhắm mục tiêu bất kỳ yếu tố hình ảnh trên trang và chạy Tesseract.recrecize () chức năng. Điều này có thể lấy bất kỳ loại hình ảnh và nó sẽ tự động nén và dịch ngay trong trình duyệt.

Bạn có thể phức tạp hơn rất nhiều nhưng vẻ đẹp là làm thế nào bạn có thể chạy OCR với một dòng mã.

Kiểm tra trang đích Tesseract.js nếu bạn muốn xem bản demo trực tiếp. Điều này hoạt động ngay trong trình duyệt nơi bạn có thể kéo và thả bất kỳ hình ảnh văn bản được quét nào để có bản dịch OCR tự động.

Bạn cũng có thể tải xuống ví dụ này cục bộ thông qua trang GitHub hoặc bạn có thể xây dựng ứng dụng của riêng mình bằng cách bao gồm tập lệnh Tesseract.js ngay từ CDN.

Ví dụ mã đơn giản nhất trông giống như sau hình ảnh của tôi là một tham chiếu trực tiếp đến một yếu tố hình ảnh HTML:

 Tesseract.recognize (myImage) .then (function (result) console.log (result));

Dù bằng cách nào, thư viện này rất hữu ích để di chuyển với OCR trên web. Nó không hoàn hảo nhưng nó cũng là tài nguyên tốt nhất cho các nhà phát triển web muốn có chức năng OCR động trong trang.

Để tìm hiểu thêm, hãy truy cập trang GessHub của Tesseract.js nơi bạn có thể xem bản demo trực tiếp và duyệt qua các tài liệu trực tuyến.