nixp.ru v3.0

28 марта 2024,
четверг,
15:15:46 MSK

12 апреля 2007, 14:46

Google готовит Open Source-систему распознавания текста

Компания Google продолжила открытие технологий, связанных с распознаванием текста. В дополнение к ранее открытой системе Tesseract выпущен новый открытый продукт — OCRopus (под лицензией Apache 2.0).

Главная цель OCRopus — выявление и разделение областей текста (и других объектов) на изображениях. Система модульная, в настоящее время для распознавания текста используется Tesseract, но Google планирует в течение ближайшего времени значительно расширить возможности проекта (например, появится GUI-интерфейс и поддержка не только английского языка). Релиз намечен на 3 квартал 2008 года.

OCRopus предназначен для автоматизации распознавания отсканированных или снятых на цифровую камеру документов (включая рукописные), программа может использоваться для выявления спама в приложенных к письму изображений.

Постоянная ссылка к новости: http://www.nixp.ru/news/8254.html. Дмитрий Шурупов по материалам opennet.ru.

fb twitter vk