WatchOCR — LiveCD Linux для распознавания текста в PDF
2
Иллюстрация с сайта Watchocr.Com
Неизвестный читатель Slashdot представил общественности обнаруженный им проект LiveCD Linux-дистрибутива WatchOCR, предназначенного для быстрого и простого распознавания текста в PDF-файлах.
WatchOCR позиционируется как «свободный OCR-сервер для PDF». Он основан на LiveCD-дистрибутиве Knoppix и использует Open Source-средства CuneiForm и ExactImage для выполнения работы по распознаванию текста. В WatchOCR доступен простой веб-интерфейс, позволяющий удаленно настроить слежение за каталогом на факт поступления новых отсканированных PDF-файлов. При появлении таких файлов (PDF с изображениями) WatchOCR преобразует их в PDF с распознанным текстом.
Подробности о WatchOCR, статьи по его установке и настройке, а также форум доступны на сайте проекта.
Постоянная ссылка к новости: http://www.nixp.ru/news/10581.html. Дмитрий Шурупов по материалам Linux.Slashdot.org.
Linux-дистрибутивы Ubuntu*Pack (OEMPack) обновились до версии 20.04
Вышел CentOS Linux 8.2 — он основан на RHEL 8.2
2 2
Бен Коттон из Red Hat предложил маркировать и удалять пакеты-пенсионеры при обновлении Fedora
1 3
KNOPPIX 7.4.0 — новая версия LiveCD Linux-дистрибутива на основе Debian 2 4
Открывается исходный код OCR-системы CuneiForm
KNOPPIX 4.0.2: на LiveCD и LiveDVD
Последние комментарии
-
fhunter, 21 января в 9:23 → Математика в школе 17
-
fhunter, 21 января в 9:22 → Как настроить чтоб работало две сетевые платы — две сети 3
-
fhunter, 21 января в 9:22 → посоветуйте!!Как ой велосипед приобрести девушке? 10
-
rgo, 11 января в 10:28 → Как «замокать» файл для юниттеста в Python? 1
-
ilyas490, 8 декабря в 13:27 → Книги по Bash? 13

Проект полезный, но почему бы его наработками не воспользоваться в других дистрибутивах? А то запускать отдельную систему для распознавания… как-то странноватенько.
Как говорит один известный подкастер «Блеск и нищета OpenSource»
Хорошая фраза :) Что за подкастер такой?
Да почему не использовать-то? ExactImage не знаю, а CuneiForm не так давно дошел до релиза и сейчас включается в разные дистрибутивы. Например у нас, в Федоре он на ревью, то есть скоро появится для пользователей в репозиториях. Более того, сборку из исходников никто никому никогда не запрещал, уж если на то пошло. А дистрибутив создали, как часто бывает, именно чтобы «загрузился и посмотрел». Не слышал чтобы кто-то всерьез работал на стандартных, некастомизированных Лайв-дистрибутивах.
/>/>