Оптическое распознавание текста в PDF документах
Оптическое распознавание текста позволяет преобразовывать изображения текста PDF документа в редактируемый текстовый формат, который поддерживает возможность поиска текста в документе, его копирование и редактирование. Распознавание текста будет осуществляться только в том случае, если в PDF документе не установлен запрет на редактирование.
Для включения оптического распознавания текста выберите в главном меню Документ > Распознавание текста. В диалоговом окне укажите следующие параметры:
- Диапазон страниц Укажите диапазон страниц, на которых необходимо произвести распознавание текста.
- Языки Укажите язык/языки распознаваемого текста. Желательно выбирать минимальное количество вариантов. Это улучшит качество распознавания текста.
Если распознавание текста используется первый раз, данный список будет пустым. Для добавления языков нажмите кнопку Установить языки.
- Установить языки Установите маркеры, чтобы выбрать необходимые варианты. В диалоговом окне перечислены языки, для которых поддерживается распознавание текста в Master PDF Editor.
- Шрифт Выберите вариант шрифта, который будет использоваться в документе после распознавания текста. При выборе Автоматически программа сама подберет шрифт наиболее подходящий для данного документа.
- Текст с возможностью поиска При выборе данной опции после завершения процедуры распознавания текст будет доступен для поиска и копирования. Распознанный текст вставится в документ как невидимый под своим изображением.
- Редактируемый текст При выборе данной опции после завершения процедуры распознавания текст будет доступен для редактирования. Распознанный текст вставится поверх изображения с данным текстом. Само изображение при этом затирается фоном.
В нижней части окна Распознавание текста находятся дополнительные настройки.
- Исправить перекос При выборе данной опции автоматически выпрямляется и выравнивается всё содержимое документа. Кроме того, у содержимого отсканированного документа также можно исправить перекос.
- Минимальный уровень уверенности Числовое значение, указывающее степень уверенности механизма в том, что он правильно распознал компонент.
- Вручную редактировать весь распознанный текст При выборе данной опции во время процедуры распознавания текста открывается диалоговое окно, в котором будет отображаться:
- Оригинал Фрагмент изображения с текстом
- Текст Соответствующий изображению автоматически распознанный текст.
В диалоговом окне поочередно будет отображаться каждый фрагмент изображения PDF документа с соответствующим ему распознанным текстом. Здесь можно редактировать распознанный текст перед вставкой в документ.
- Да Автоматически распознанный/редактированный текст запишется в документ. В диалоговом окне отобразится следующее изображение и текст к нему.
- Да для всех Все изображения будут распознаны автоматически и записаны в документ. Данное диалоговое окно больше не появится
- Не текст Текущий распознанный текст не является текстовым фрагментом. Отменяет вставку текста в текущем фрагменте.
- Отмена Отмена распознавания текста