3.8.5.4.1 Распознавание текста с помощью YAGF
Скачать документ Окружение
- Версия РЕД ОС: 8
- Конфигурация: Рабочая станция
- Версия ПО: yagf-0.9.5-17
YAGF — графический интерфейс для консольных программ распознавания текстов: CuneiForm и Tesseract. YAGF позволяет управлять сканированием изображений, их предварительной обработкой и распознаванием. Программа поддерживает все основные растровые графические форматы (JPEG, PNG, BMP, TIFF, GIF, PNM, PPM, PBM и другие).
Вы можете подробнее ознакомиться с работой в программах для распознавания текста, просмотрев наши обучающие видео:
на RuTube — Распознавание текста;
в Яндекс.Дзен — Распознавание текста;
в VK Видео — Распознавание текста.
На наших каналах вы также сможете найти много другой полезной информации.
Для установки оболочки YAGF и дополнительных языковых пакетов словарей выполните команду с правами пользователя root:
dnf install yagf aspell-ru aspell-en
После установки программа будет доступна из «Главного меню» — «Офис» — «YAGF».
В настройках программы выберите язык распознаваемого текста.
На вкладке «Обработка изображений» снимите галочку с пункта «Обрезать изображение при загрузке», чтобы не возникало проблем с отображением загруженного в программу документа.
Программа позволяет открыть для распознавания файлы, сохраненные на жестком диске, или сканировать новое изображение. Для того чтобы загрузить изображение, перейдите в меню Файл > Открыть и в диалоговом окне выберите один или несколько файлов. Кроме этого имеется возможность перетаскивать графические файлы мышью на темную полосу в левой части главного окна программы.
В YAGF можно получать изображения со сканера с помощью программы XSane. Если XSane не установлена, то установите эту программу командой от пользователя root:
dnf install xsane
Чтобы получить изображение перейдите в меню Файл > Сканировать. Будет запущена программа XSane. При необходимости настройте параметры сканирования в XSane и нажмите кнопку «Сканировать». После завершения сканирования в окне просмотра изображений YAGF появится сканированное изображение.
YAGF предоставляет простые операции подготовки сканированного изображения, такие как выделение блока текста для распознавания и поворот. Если изображение ориентировано неправильно, его можно повернуть на 90 градусов по часовой или против часовой стрелки, а также на 180 градусов. Делается это с помощью кнопок на панели быстрого доступа в окне просмотра изображений.
Если необходимо распознать не весь текст на изображении, а отдельную его часть, то для этого выделите мышью один или несколько фрагментов в окне просмотра изображений.
Для распознавания текста на изображении, перейдите в меню Файл > Распознать или воспользуйтесь комбинацией клавиш Ctrl+R.
Для сохранения текста в меню Файл и выберете пункт «Сохранить весь текст» или «Сохранить текст на текущей странице». Также можно скопировать текст в буфер обмена с помощью правой кнопки мыши.
Для распознавания текста на английском языке с помощью Tesseract в программе YAGF необходимо указать стандартный путь расположения файлов - «Настройки» - «Распознавание» - «Расположение данных Tesseract» - /usr/share/tesseract/tessdata/.
После сохранения пути выберите язык в настройках.
Дата последнего изменения: 30.09.2024
Если вы нашли ошибку, пожалуйста, выделите текст и нажмите Ctrl+Enter.