Оптическое распознавание текста в PDF документах

Оптическое распознавание текста позволяет преобразовывать изображения текста PDF документа в редактируемый текстовый формат, который поддерживает возможность поиска текста в документе, его копирование и редактирование. Распознавание текста будет осуществляться только в том случае, если в PDF документе не установлен запрет на редактирование.

Для включения оптического распознавания текста выберите в главном меню Документ > Распознавание текста. В диалоговом окне укажите следующие параметры:

Настройки ОРС

  • Диапазон страниц  Укажите диапазон страниц, на которых необходимо произвести распознавание текста.
  • Языки  Укажите язык/языки распознаваемого текста. Желательно выбирать минимальное количество вариантов. Это улучшит качество распознавания текста.

Если распознавание текста используется первый раз, данный список будет пустым. Для добавления языков нажмите кнопку Установить языки.

  • Установить языки  Установите маркеры, чтобы выбрать необходимые варианты. В диалоговом окне перечислены языки, для которых поддерживается распознавание текста в Master PDF Editor.

Настройки языка ОРС

  • Шрифт Выберите вариант шрифта, который будет использоваться в документе после распознавания текста. При выборе Автоматически программа сама подберет шрифт наиболее подходящий для данного документа.
  • Текст с возможностью поиска При выборе данной опции после завершения процедуры распознавания текст будет доступен для поиска и копирования. Распознанный текст вставится в документ как невидимый под своим изображением.
  • Редактируемый текст При выборе данной опции после завершения процедуры распознавания текст будет доступен для редактирования. Распознанный текст вставится поверх изображения с данным текстом. Само изображение при этом затирается фоном.

В нижней части окна Распознавание текста находятся дополнительные настройки.

Дополнительные настройки ОРС

  • Исправить перекос При выборе данной опции автоматически выпрямляется и выравнивается всё содержимое документа. Кроме того, у содержимого отсканированного документа также можно исправить перекос.
  • Минимальный уровень уверенности Числовое значение, указывающее степень уверенности механизма в том, что он правильно распознал компонент.
  • Вручную редактировать весь распознанный текст При выборе данной опции во время процедуры распознавания текста открывается диалоговое окно, в котором будет отображаться:

Редактирование распознанного текста

  • Оригинал Фрагмент изображения с текстом
  • Текст Соответствующий изображению автоматически распознанный текст.

В диалоговом окне поочередно будет отображаться каждый фрагмент изображения PDF документа с соответствующим ему распознанным текстом. Здесь можно редактировать распознанный текст перед вставкой в документ.

  • Да Автоматически распознанный/редактированный текст запишется в документ. В диалоговом окне отобразится следующее изображение и текст к нему.
  • Да для всех Все изображения будут распознаны автоматически и записаны в документ. Данное диалоговое окно больше не появится
  • Не текст Текущий распознанный текст не является текстовым фрагментом. Отменяет вставку текста в текущем фрагменте.
  • Отмена Отмена распознавания текста