2.8.8 gImageReader - программа для распознавания текста
Окружение
- Версия РЕД ОС: 7.3.1
- Конфигурация: Рабочая станция
- Версия ПО: gimagereader 3.3.1-4
gimagereader - программа, предназначенная для распознавания текста (GUI Tesseract).
gimagereader поддерживает автоматическое определение макета страницы, при этом пользователь может вручную определить и настроить регионы распознавания. Приложение позволяет импортировать изображения с диска, сканирующих устройств, буфера обмена и скриншотов.
gimagereaderтакже поддерживает многостраничные документы PDF.
Особенности gimagereader:
поддержка следующих форматов изображений: jpeg, png, tiff, gif, pnm, pcx, bmp;
поддержка формата электронных документов PDF. Возможность выбрать отдельные страницы и диапазон страниц для распознавания;
автоматическое обнаружение расположения страницы;
выделение области с текстом для распознавания;
получение изображения напрямую со сканера. Настройка разрешения, сохранение в формат png;
проверка орфографии.
Установка программы в РЕД ОС 7.3 производится командой:
dnf install gimagereader-gtk
После установки команда будет доступна в «Главном меню» - «Графика» - «gImageReader».
Для проверки загрузите в программу картинку с любым текстом.
Выберите язык и нажмите на кнопку «Распознать все» (так программа распознает весь текст на картинке).
Как видно из примера, не весь текст распознан правильно, скорее всего это связано с плохим изображением (неровные линии текста, разное освещение), поэтому возьмем другой текст и проверим работоспособность программы на нем.
С другого изображения весь текст распознан корректно.
Для распознавания определенного отрывка текста необходимо выделить нужную область, после чего нажать на кнопку «Распознать выделенное».
Текст успешно распознан.
Если вы нашли ошибку, пожалуйста, выделите текст и нажмите Ctrl+Enter.