Топ 10: Open-source программы распознавания текста
Обновлено: 10.10.2024 |
Примеры open-source OCR систем - представлены ниже.
Пользователи, которые искали Open-source OCR, потом также интересовались следующими продуктами:
См. также: Топ 10: OCR программы
Пользователи, которые искали Open-source OCR, потом также интересовались следующими продуктами:
См. также: Топ 10: OCR программы
2021. EasyOCR - open-source альтернатива FineReader
Конечно, EasyOCR - это не простая и удобная программа как Abbyy Finereader. Фактически это python-движок без пользовательского интерфейса, которые еще надо суметь запустить. Зато он бесплатный, кроссплатформенный и с открытым кодом. Поддерживает 80 языков, включая русский. Работает EasyOCR медленно, но при наличии графического ускорителя с поддержкой CUDA время работы должно сократиться, однако, подобные требования делают использование EasyOCR на стандартном офисном «железе» практически невозможным для большинства задач. Однако, качество распознавания символов EasyOCR может посоревноваться с FineReader. Для использования EasyOCR нужно установить torch и torchvision, установить EasyOCR, загрузить из Python модель нужного языка и использовать.
2006. Google купил у HP open-source OCR систему Tesseract
Tesseract - свободная программа для распознавания текстов, разрабатывавшаяся Hewlett-Packard с середины 1980-х по середину 1990-х. Затем ее разработка была заморожена на 10 лет. Теперь Google купил её и открыл исходные тексты под лицензией Apache 2.0 для продолжения разработки. Для корректной работы tesseract необходим пакет leptonica - ПО с открытым исходным кодом, необходимое для приложений, работающих и анализирующих изображения. Для tesseract имеется графический интерфейс tesseract-gui, который тоже надо собирать из исходного кода. У меня он запустился, но распознавать текст почему-то не захотел. Еще есть система OCRopus, которая может использовать движок tesseract. Собственно поэтому я ее отдельно рассматривать не стал.