2.8.5.4.2 Распознавание текста с помощью gImageReader
Скачать документ Окружение
- Версия РЕД ОС: 7.3
- Конфигурация: Рабочая станция
- Версия ПО: gimagereader 3.3.1-4
gimagereader - программа, предназначенная для распознавания текста (GUI Tesseract).
gimagereader поддерживает автоматическое определение макета страницы, при этом пользователь может вручную определить и настроить регионы распознавания. Приложение позволяет импортировать изображения с диска, сканирующих устройств, буфера обмена и скриншотов.
gimagereaderтакже поддерживает многостраничные документы PDF.
Особенности gimagereader:
поддержка следующих форматов изображений: jpeg, png, tiff, gif, pnm, pcx, bmp;
поддержка формата электронных документов PDF. Возможность выбрать отдельные страницы и диапазон страниц для распознавания;
автоматическое обнаружение расположения страницы;
выделение области с текстом для распознавания;
получение изображения напрямую со сканера. Настройка разрешения, сохранение в формат png;
проверка орфографии.
Установка программы в РЕД ОС производится командой:
dnf install gimagereader-gtk tesseract-langpack-rus
После установки команда будет доступна в «Главном меню» - «Графика» - «gImageReader».
Для проверки загрузите в программу картинку с любым текстом.
Выберите язык и нажмите на кнопку «Распознать все» (так программа распознает весь текст на картинке).
Как видно из примера, не весь текст распознан правильно, скорее всего это связано с плохим изображением (неровные линии текста, разное освещение), поэтому возьмем другой текст и проверим работоспособность программы на нем.
С другого изображения весь текст распознан корректно.
Для распознавания определенного отрывка текста необходимо выделить нужную область, после чего нажать на кнопку «Распознать выделенное».
Текст успешно распознан.
Дата последнего изменения: 09.09.2024
Если вы нашли ошибку, пожалуйста, выделите текст и нажмите Ctrl+Enter.