11.1 YAGF — программа для распознавания текста.

YAGF — графический интерфейс для консольных программ распознавания текстов: CuneiForm и Tesseract. YAGF позволяет управлять сканированием изображений, их предварительной обработкой и распознаванием. Программа поддерживает все основные растровые графические форматы (JPEG, PNG, BMP, TIFF, GIF, PNM, PPM, PBM и другие).
Для установки оболочки YAGF и дополнительных языковых пакетов словарей выполните команду с правами пользователя root:

yum install yagf aspell-ru aspell-en

В настройках программы выберите язык распознаваемого текста.

На вкладке «Обработка изображений» снимите галочку с пункта «Обрезать изображение при загрузке», чтобы не возникало проблем с отображением загруженного в программу документа.

Программа позволяет открыть для распознавания файлы, сохраненные на жестком диске, или сканировать новое изображение. Для того чтобы загрузить изображение, перейдите в меню Файл > Открыть и в диалоговом окне выберите один или несколько файлов. Кроме этого, имеется возможность перетаскивать графические файлы мышью на темную полосу в левой части главного окна программы.

В YAGF можно получать изображения со сканера с помощью программы XSane. Если XSane не установлена, то установите эту программу командой от пользователя root:

yum install xsane

Чтобы получить изображение перейдите в меню Файл > Сканировать. Будет запущена программа XSane. При необходимости настройте параметры сканирования в XSane и нажмите кнопку «Сканировать». После завершения сканирования в окне просмотра изображений YAGF появится сканированное изображение.
YAGF предоставляет простые операции подготовки сканированного изображения, такие как выделение блока текста для распознавания и поворот. Если изображение ориентировано неправильно, его можно повернуть на 90 градусов по часовой или против часовой стрелки, а также на 180 градусов. Делается это с помощью кнопок на панели быстрого доступа в окне просмотра изображений.
Если необходимо распознать не весь текст на изображении, а отдельную его часть, то для этого выделите мышью один или несколько фрагментов в окне просмотра изображений.
Для распознавания текста на изображении, перейдите в меню Файл > Распознать или воспользуйтесь комбинацией клавиш Ctrl+R.

Для сохранения текста в меню Файл и выберете пункт «Сохранить весь текст» или «Сохранить текст на текущей странице». Также можно скопировать текст в буфер обмена с помощью правой кнопки мыши.

Если вы нашли ошибку, выделите текст и нажмите Ctrl+Enter.

Print Friendly, PDF & Email