Из данной статьи вы узнаете, как на компьютере отредактировать текст отсканированного документа. Программа для преобразования отсканированного текста, который представляет собой картинку, в текст, который можно редактировать, называется программой для оптического распознавания символов (OCR-программой). Можно воспользоваться онлайн-сервисом New OCR, чтобы преобразовать текст без сохранения его форматирования, или сервисом Online OCR, если вы работаете с более сложными PDF-документами.
Шаги
-
Отсканируйте документ в PDF-файл . Это важно, потому что многие OCR-программы лучше распознают текст, сохраненный как PDF-документ, а не как изображение.
- Если можно, отсканируйте документ в режиме черно-белого, а не цветного сканирования. Так OCR-программе будет проще распознать текст.
-
Откройте сайт сервиса New OCR. Перейдите на страницу http://www.newocr.com/ в браузере. На этом сервисе отсканированный документ можно превратить в обычный текстовый документ.
-
Нажмите Обзор . Это серая кнопка в верхней части страницы. Откроется окно Проводника (Windows) или Finder (Mac).
-
Выберите отсканированный PDF-документ. Для этого нажмите на нужный PDF-файл.
- Чтобы перейти в папку с файлом, щелкните по ней в левой части окна.
-
Нажмите Открыть . Эта кнопка находится в нижнем правом углу окна. PDF-файл будет загружен на сайт.
-
Нажмите Upload+OCR (Загрузить и распознать). Эта кнопка находится в нижней части страницы. Загруженный PDF-документ будет преобразован в текстовый файл.
-
Прокрутите вниз и нажмите Download (Скачать). Эта кнопка находится в левой части страницы. Откроется выпадающее меню.
-
Щелкните по Microsoft Word (DOC) . Эта опция находится в выпадающем меню. PDF-документ скачается на компьютер в виде документа Word.
- Если на компьютере нет программы Microsoft Word, скачайте PDF-документ в формате TXT; для этого в меню выберите «Plain text (TXT)». TXT-файл можно редактировать в Блокноте (Windows) или в TextEdit (Mac).
-
Отредактируйте скачанный документ Word. Дважды щелкните по скачанному документу, чтобы открыть его в Microsoft Word, а затем отредактируйте текст документа.
- Имейте в виду, что текст документа будет содержать ошибки.
- Возможно, вам придется нажать «Включить редактирование» в верхней части окна Word.
-
Сохраните отредактированный документ Word в формате PDF. Для этого: [1] X Надежный источник Microsoft Support Перейти к источнику
- Windows : нажмите «Файл» > «Сохранить как», откройте меню «Word», выберите в нем «PDF», а затем нажмите «Сохранить»;
- Mac : нажмите «Файл» > «Сохранить как», введите имя файла, а затем нажмите «Формат» > «PDF» > «Сохранить».
Реклама
-
Отсканируйте документ в PDF-файл . Это важно, потому что многие OCR-программы лучше распознают текст, сохраненный как PDF-документ, а не как изображение.
- Если можно, отсканируйте документ в режиме черно-белого, а не цветного сканирования. Так OCR-программе будет проще распознать текст.
-
Откройте сайт сервиса Online OCR. Перейдите на страницу https://www.onlineocr.net/ в браузере. На этом сайте отсканированный документ можно преобразовать в текст с сохранением его форматирования. Имейте в виду, что этот сервис позволяет распознать не более 50 страниц.
-
Щелкните по SIGN UP (Зарегистрироваться). Эта кнопка находится в верхней правой части страницы. Откроется страница создания учетной записи.
-
Создайте аккаунт. Это можно сделать бесплатно; учетная запись позволит вам распознать сразу несколько страниц PDF-документа. Чтобы создать аккаунт, введите следующую информацию:
- Username (Имя пользователя): в этой строке введите имя пользователя;
- Password (Пароль): в этой строке введите пароль, а затем еще раз введите его в строке «Confirm password» (Подтвердить пароль);
- Email (Адрес электронной почты): в этой строке введите свой адрес электронной почты;
- Enter Captcha code (Введите капчу): в этой строке введите капчу (символьный код).
-
Нажмите Sign Up (Зарегистрироваться). Это зеленая кнопка в нижней части страницы. Будет создан аккаунт Online OCR.
-
Войдите в учетную запись. Нажмите «Login» (Вход) в верхнем правом углу страницы, введите имя пользователя и пароль, а затем нажмите зеленую кнопку «Log In» (Войти). Откроется страница конвертера PDF-файлов.
-
Выберите язык. Щелкните по языку PDF-документа в левой части страницы.
- Например, если PDF-документ набран на русском языке, нажмите «Russian» (Русский язык) в левой части страницы.
-
Установите флажок у опции «Microsoft Word». Она находится посередине страницы.
-
Установите флажок у опции «All pages» (Все страницы). Вы найдете ее справа от опции «Microsoft Word».
-
Нажмите Select file (Выбрать файл). Это голубая кнопка посередине страницы. Откроется окно.
-
Выберите отсканированный PDF-документ. Для этого нажмите на нужный PDF-файл.
- Чтобы перейти в папку с файлом, щелкните по ней в левой части окна.
-
Нажмите Открыть . Эта кнопка находится в нижнем правом углу окна. PDF-файл будет загружен на сайт. Как только индикатор прогресса, который расположен справа от кнопки «Выбрать файл», достигнет 100%, перейдите к следующему шагу.
-
Щелкните по CONVERT (Конвертировать). Эта кнопка находится в нижней части страницы. PDF-документ будет преобразован в документ Word, который можно редактировать.
-
Нажмите на имя документа. Оно отобразится в виде синей ссылки в нижней части страницы. Документ Word скачается на компьютер.
-
Отредактируйте скачанный документ Word. Дважды щелкните по скачанному документу, чтобы открыть его в Microsoft Word, а затем отредактируйте текст документа.
- Имейте в виду, что текст документа будет содержать ошибки.
- Возможно, вам придется нажать «Включить редактирование» в верхней части окна Word.
-
Сохраните отредактированный документ Word в формате PDF. Для этого:
- Windows : нажмите «Файл» > «Сохранить как», откройте меню «Word», выберите в нем «PDF», а затем нажмите «Сохранить»;
- Mac : нажмите «Файл» > «Сохранить как», введите имя файла, а затем нажмите «Формат» > «PDF» > «Сохранить».
Реклама
Советы
- Как правило, отсканированные документы сохраняются в формате PDF; если отсканированный документ сохранился в графическом формате TIFF, такую картинку можно преобразовать в PDF-файл .
Реклама
Предупреждения
- Технология оптического распознавания символов (OCR) не идеальна. Скорее всего, в любом распознанном PDF-документе будут ошибки.
Реклама
Источники
Реклама