PDF download Загрузить PDF PDF download Загрузить PDF

Оптическое распознавание символов (OCR) — это процесс, при котором программа распознает текстовые символы на изображении и извлекает его для последующего редактирования. Каждый сканер, как правило, имеет собственное программное обеспечение для оптического распознавания символов, но используются они по-разному. С другой стороны, Microsoft OneNote теперь доступен как для Mac, так и для Windows. Он способен распознавать и извлекать текст и может быть бесплатно установлен на современные ПК, планшеты и смартфоны, что делает процесс извлечения текста из изображений более простым и предсказуемым. Распознавать текст могут все настольные и мобильные версии OneNote, включая бесплатные версии, но извлекать текст из изображения можно только с помощью настольной версии OneNote. [1]

Метод 1
Метод 1 из 2:

Извлечение отсканированного текста

PDF download Загрузить PDF
  1. На Mac или Windows процесс будет немного отличаться в зависимости от версии и настроек операционной системы. Саму программу можно скачать с Office.com, но в целом OneNote для Mac очень похож на OneNote для Windows. Обе версии программы практически ничем не отличаются. [2]
  2. В верхней части окна OneNote по умолчанию расположена лента с вкладками, а иконка «Рисунки» (или «Рисунок» на Mac) находится в левой части вкладки «Вставка». На Mac выберите «Рисунок» из меню «Вставка» в верхней части экрана. Когда вы щелкнете по иконке, на экране появится окно «Вставка рисунка» (или окно «Выберите рисунок» на Mac). [3]
    • Если вы не видите вкладки или иконки, нажмите на кнопку «Параметры отображения ленты» слева от кнопки «Свернуть» в правом верхнем углу окна приложения и выберите «Показать вкладки и команды». На Mac можно просто использовать меню в верхней части экрана, поэтому вкладки не нужны.
    • Наведите курсор мыши на кнопки, чтобы увидеть их названия.
  3. Перейдите к изображению и выберите то, которое хотите отсканировать. После этого нажмите «Открыть» («Вставить» на Mac). Файл изображения появится в OneNote там, где находится курсор. [4]
    • Чтобы извлечь текст из распечатки документа, вместо опции «Рисунок» выберите «Распечатка». [5]
    • Как вариант, нажмите кнопку PrtScr на клавиатуре, чтобы сделать снимок экрана, а затем вставьте его в документ, используя сочетание клавиш Ctrl + V (или Cmd + V на Mac).
    • Для успешного распознавания текст в сканируемом изображении должен быть печатным. [6]
  4. Щелкните правой кнопкой мыши по изображению и выберите «Копировать текст из рисунка». Текст на изображении будет скопирован в буфер обмена компьютера.
    • В Windows, если вместо рисунка во втором шаге вы выберете «Распечатка», щелчок правой кнопкой мыши по странице распечатки даст вам две альтернативные опции: «Копировать текст с этой страницы распечатки» и «Копировать текст со всех страниц распечатки». Выберите ту, которая вам подходит.
  5. Вставьте текст обратно в OneNote, используя сочетание клавиш Ctrl + V (или Cmd + V на Mac), и при желании отредактируйте его в приложении. Изображение также можно вставить в другую программу.
    • Выделите текст курсором мыши и нажмите Ctrl + C (или Cmd + C на Mac). Или щелкните правой кнопкой мыши (или Ctrl +щелчок на Mac) по тексту и выберите «Копировать».
    • Если вы сохранили извлеченный текст и решили открыть его не в настольной версии OneNote, то инструкции по копированию и вставке будут значительно различаться. В Android, к примеру, нужно выделить нужную часть текста зажатием кнопки мыши, использовать появившиеся маркеры с обеих сторон, чтобы выделить весь текст, а затем нажать кнопку «Копировать» или «Вырезать» (две наложенные друг на друга страницы и ножницы, соответственно).
  6. Одними из самых популярных являются Microsoft Word и Google Документы. Просто откройте новый или существующий документ в одном из них и нажмите Ctrl + V (или Cmd + V на Mac). Вставленный текст, скорее всего, будет иметь не самый опрятный вид.
    • Возможно, вам стоит сохранить документ непосредственно перед редактированием, чтобы потом иметь возможность вернуться к исходному, неотредактированному тексту.
  7. С точки зрения форматирования вы ограничены только программой, в которую был вставлен текст. Например, последняя версия Microsoft Word имеет гораздо больше возможностей и дает гораздо больший контроль, чем, например, Microsoft Notepad или даже Google Документы.
    Реклама
Метод 2
Метод 2 из 2:

Использование других программ для распознавания текста

PDF download Загрузить PDF
  1. Какую бы программу вы ни выбрали, процесс распознавания текста включает в себя открытие изображения, извлечение текста, а затем копирование его в документ для редактирования. Существуют различные типы приложений и служб для распознавания текста:
    • Программное обеспечение, поставляемое со сканером . Если у вас есть сканер и программное обеспечение, которое к нему прилагалось, то оно, скорее всего, содержит функции по распознаванию текста. Если вы потеряли инструкции, которые шли вместе со сканером, не переживайте — инструкции для современного сканера можно найти в интернете.
    • Бесплатные сайты . Эти финансируемые рекламой, но функциональные сайты обычно поддерживают TIF, GIF, PDF, JPG, BMP, PNG и другие форматы. Они часто имеют ограничения на размер загружаемых файлов (например, до 5 МБ). Одни сайты бесплатно отправляют документ Word или другой файл, содержащий извлеченный текст, по электронной почте, другие же просто предоставляют текст для копирования. Вот некоторые из них:
      • Free-ocr.com [7]
      • Onlineocr.net [8]
    • Дорогие программы для оптического распознавания текста . Цена некоторых из этих программы достигает 500 долларов. Рассматривайте их покупку только в том случае, если вам нужны максимально точные результаты распознавания. Некоторые из наиболее популярных программ можно найти на TopTenReviews.com или аналогичных сайтах. К ведущим из них относятся такие программы, как: [9]
      • Omni Page Standard
      • Adobe Acrobat
      • ABBYY Fine Reader
    • Бесплатные программы . Многие из них не только не поддерживают большие изображения, но и не сканируют дальше первой страницы PDF-файла:
      • FreeOCR [10]
      • Simple OCR [11]
      • Free OCR To Word [12]
  2. Извлеченный текст можно сохранить в виде обычного текста, в формате Word .doc или в расширенном текстовом формате (RTF). Формат RTF был предшественником .doc и, подобно ему, позволяет сохранять форматирование текста, полей, изображений и прочего в одном переносном и передаваемом файле. RTF-файлы куда больше весят, чем файлы .doc, а поскольку .doc может открыть практически кто угодно (в MS Word есть бесплатная программа для просмотра), лучше все же выбрать .doc. [13]
  3. Скопируйте и вставьте полученный текст в выбранный инструмент редактирования. Текст, вероятно, будет иметь беспорядочное форматирование, поэтому вам придется убрать много пробелов или разделить слова без интервала. Уровень сложности форматирования во многом зависит от того, насколько чистым было изображение, из которого извлекался текст.
  4. С точки зрения форматирования вы ограничены только программой, в которую был вставлен текст. Например, последняя версия Microsoft Word имеет гораздо больше возможностей и дает гораздо больший контроль, чем, например, Microsoft Notepad или даже Google Документы.
    Реклама

Об этой статье

Эту страницу просматривали 7659 раз.

Была ли эта статья полезной?

Реклама