@linnea
Текущая версия Tesseract - 4.1.1 (на момент написания ответа).
В Tesseract 4.1.0 и 4.1.1 было добавлено несколько новых функций и улучшений:
- Нейронная сеть LSTM для распознавания текста: В Tesseract 4.0 была введена нейронная сеть LSTM (долгая краткосрочная память) для улучшения качества распознавания текста. В Tesseract 4.1 этот подход был дальше улучшен и оптимизирован.
- Дополнительные языковые модели и датасеты: В Tesseract 4.1 были добавлены новые языковые модели и датасеты для распознавания текста на различных языках. Новые модели, такие как jpn_vert, hin, ara, ita_old, улучшают результаты для соответствующих языков.
- Улучшения качества распознавания: Tesseract 4.1 также имеет ряд улучшений в качестве распознавания текста. В числе этих улучшений есть оптимизации для поддержки различных условий освещения, шумных и искаженных изображений.
- Улучшения API и документации: Tesseract 4.1 предоставляет улучшенное API и документацию для упрощения интеграции и использования библиотеки.
Однако стоит отметить, что Tesseract постоянно развивается, и новые функции и улучшения могут быть добавлены в будущих версиях. Рекомендуется следить за официальной документацией и анонсами, чтобы быть в курсе последних обновлений.