Google готовит Open Source-систему распознавания текста
Компания Google продолжила открытие технологий, связанных с распознаванием текста. В дополнение к ранее открытой системе Tesseract выпущен новый открытый продукт — OCRopus (под лицензией Apache 2.0).
Главная цель OCRopus — выявление и разделение областей текста (и других объектов) на изображениях. Система модульная, в настоящее время для распознавания текста используется Tesseract, но Google планирует в течение ближайшего времени значительно расширить возможности проекта (например, появится GUI-интерфейс и поддержка не только английского языка). Релиз намечен на 3 квартал 2008 года.
OCRopus предназначен для автоматизации распознавания отсканированных или снятых на цифровую камеру документов (включая рукописные), программа может использоваться для выявления спама в приложенных к письму изображений.
Постоянная ссылка к новости: http://www.nixp.ru/news/8254.html. Дмитрий Шурупов по материалам opennet.ru.
Spinnaker 1.0 — Open Source-платформа Google для DevOps с поддержкой CI/CD в разных облаках
Google запустила новый сайт со своими Open Source-проектами и связанной документацией
Google выпустила инструмент OSS-Fuzz для постоянного fuzz-тестирования Open Source-проектов
1
«Добрый» Google: в браузере Chromium обнаружили нерегламентированную загрузку проприетарного модуля 9 5
Хостинг Open Source-проектов Google Code закрывается 6 9
KDE призывает школьников к работе над проектами в рамках Google Code-in 2014 3 2
Последние комментарии
-
fhunter, 29 ноября в 2:09 → Проблема с NO_PUBKEY: как получить GPG-ключ и добавить его в базу apt? 6
-
DimitriuS, 6 сентября в 10:37 → Перекличка 14
-
Иванн, 9 апреля 2022 года в 8:31 → Ассоциация РАСПО провела первое учредительное собрание 1
-
Kiri11.ADV1, 7 марта 2021 года в 12:01 → Логи catalina.out в TomCat 9 в формате JSON 1
-
fhunter, 26 февраля 2021 года в 20:45 → A, MX, PTR — Настройка и проверка извне. Как ? 2
