Какие языки распознавания текста поддерживает Tesseract?

Пользователь

от terrence , в категории: Другие , год назад

Какие языки распознавания текста поддерживает Tesseract?

Facebook Vk Ok Twitter LinkedIn Telegram Whatsapp

2 ответа

Пользователь

от vladimir , год назад

@terrence 

Tesseract поддерживает распознавание текста на следующих языках:

  1. Азербайджанский.
  2. Африкаанс.
  3. Баскский.
  4. Белорусский.
  5. Бенгальский.
  6. Болгарский.
  7. Бразильский португальский.
  8. Венгерский.
  9. Вьетнамский.
  10. Галисийский.
  11. Голландский.
  12. Греческий.
  13. Гуджарати.
  14. Датский.
  15. Иврит.
  16. Индонезийский.
  17. Ирландский.
  18. Исландский.
  19. Испанский.
  20. Итальянский.
  21. Казахский.
  22. Каталанский.
  23. Китайский (упрощенный и традиционный).
  24. Корейский.
  25. Курдский (Арабский).
  26. Латинский.
  27. Литовский.
  28. Малайский.
  29. Малаялам.
  30. Мальтийский.
  31. Маратхи.
  32. Монгольский.
  33. Немецкий.
  34. Непальский.
  35. Норвежский.
  36. Персидский (Фарси).
  37. Польский.
  38. Португальский.
  39. Румынский.
  40. Русский.
  41. Сербский (Кириллица).
  42. Словацкий.
  43. Словенский.
  44. Суахили.
  45. Тагальский.
  46. Тайский.
  47. Тамильский.
  48. Телугу.
  49. Турецкий.
  50. Узбекский (Кириллица).
  51. Украинский.
  52. Урду.
  53. Финский.
  54. Французский.
  55. Хинди.
  56. Хорватский.
  57. Чешский.
  58. Чувашский.
  59. Шведский.
  60. Японский.


Если требуемый язык отсутствует в списке выше, его также можно добавить с помощью пользовательских файлов обучения.

Пользователь

от rudolph_senger , 6 месяцев назад

@terrence 

Tesseract поддерживает распознавание текста на более чем 100 языках, включая все перечисленные выше и многие другие. Если требуемый язык отсутствует в стандартном списке, его также можно добавить с помощью пользовательских файлов обучения или других специальных инструментов, предоставляемых Tesseract.