Сайт не работает без javascript. Включите поддержку javascript в настройках браузера!
🔴 Кассовые разрывы: как отследить, предотвратить и управлять ликвидностью →
Бухгалтерские программы
10 способов, как скопировать текст из ПДФ документов

10 способов, как скопировать текст из ПДФ документов

Нужно извлечь текст из PDF, а он не копируется? Защищен паролем или отсканирован? Подготовили 10 инструкций по OCR распознаванию счетов, актов и договор с тех.обременением и без них.

PDF легко открыть в браузере, но извлечь реквизиты или текст простым копированием не получится. Все упирается в особенности формата. В статье разберем, с чем связана проблема и как скопировать текст из ПДФ разными способами.

Почему иногда нельзя извлечь текст из ПДФ

PDF-формат предназначен для сохранения макета, а не редактирования, поэтому работа с содержимым без специальных программ затруднена. Могут быть дополнительные причины: 

  • Перед вами скан или фотография оригинального документа: буквы и цифры на листе — это просто картинка, их нельзя выделять, извлекать и вставлять в другие файлы.

  • ПДФ защищен паролем: владелец ограничил возможность копирования и редактирования.

  • Повреждена файловая структура. Иногда при конвертации из форматов Microsoft Word или Excel или скачивании происходит сбой. Когда вы пытаетесь выделить и скопировать содержимое, программа обращается к нарушенной структуре, и данные оказываются невыбираемыми.

Как скопировать текст из ПДФ-файла без обременений 

Когда файл создан в офисных программах или PDF-редакторе, сложностей нет. В этом разделе покажем, как вытащить текст из PDF с помощью различного ПО, и дадим пошаговые инструкции для каждого варианта. 

PDF Commander

Российская программа с понятным интерфейсом. Подходит для просмотра, редактирования PDF-документов, установки пароля, подписания с помощью ЭЦП, распознавания текста (OCR). Также софт можно использовать как конвертер файлов, чтобы экспортировать ПДФ в DOC, XLS, RTF, изображения JPG, TIFF, PNG и обратно. PDF Commander работает на Windows, также поддерживает отечественные ОС Linux, поэтому его стоит рассмотреть как ПО для бизнеса. 

Покажем, как можно «вытащить» данные из договора в PDF-формате.

1. Откройте редактор. Перетащите файл из проводника или воспользуйтесь кнопкой.

10 способов, как скопировать текст из ПДФ документов

2. Найдите раздел, который хотите скопировать, и кликните по выделенной кнопке на верхней панели.

10 способов, как скопировать текст из ПДФ документов

3. Выделите мышью нужные строки. Используйте сочетание клавиш «Ctrl+C» для копирования данных. Теперь можно открыть другой ПДФ-документ или добавить скопированные данные в текстовом редакторе или блокноте — достаточно указать курсором место вставки и нажать комбинацию «Ctrl + V».

10 способов, как скопировать текст из ПДФ документов

Adobe Acrobat Pro

Одно из самых известных приложений для работы с PDF: сам формат был создан корпорацией Adobe. Несмотря на то, что компания ушла с российского рынка, многие продолжают пользоваться Acrobat.

Алгоритм, как в ПДФ скопировать текст, состоит всего из четырех шагов.

1. Выберите в окне приветствия источник загрузки. Укажите папку и импортируйте ПДФ в редактор.

10 способов, как скопировать текст из ПДФ документов

2. Перейдите в режим редактирования.

10 способов, как скопировать текст из ПДФ документов

3. Выберите область и щелкните правой кнопкой мыши, чтобы появился список команд. Скопируйте фрагмент как обычный текст или с сохранением форматирования: стиля и размера шрифта, структурной разметки.

10 способов, как скопировать текст из ПДФ документов

ONLYOFFICE

Иногда можно обойтись без специализированного редактора. Например, используйте ONLYOFFICE — бесплатный аналог офисных решений от Microsoft, который позволяет конвертировать PDF в TXT, DOCX или XLSX или работать с файлами напрямую, без преобразования. По возможностям он уступает профильному софту, но для базовых задач подходит.

Инструкция по работе довольно простая.

1. Запустите приложение. Выберите ПДФ-файл на ПК или воспользуйтесь функцией перетаскивания.

10 способов, как скопировать текст из ПДФ документов

2. На панели сверху нажмите на «Редактировать PDF».

10 способов, как скопировать текст из ПДФ документов

3. Выделите мышкой блок, который хотите выбрать для переноса, и вызовите правым кликом мыши меню. Нажмите на значок копирования.

10 способов, как скопировать текст из ПДФ документов

Google Drive

В экстренных случаях, когда под рукой нет установленных программ, можно извлечь данные онлайн. Для этого подойдут облачные сервисы от Google. 

Просто создайте учетную запись — для этого достаточно зарегистрировать почтовый адрес Gmail. А дальше действуйте по инструкции.

1. Откройте Google Диск.

10 способов, как скопировать текст из ПДФ документов

2. Щелкните на «Создать».

10 способов, как скопировать текст из ПДФ документов

3. Загрузите PDF-файл с жесткого диска.

10 способов, как скопировать текст из ПДФ документов

4. Наведите курсор на строчку с названием. Кликните клавишей мыши. Выберите «Открыть с помощью» → «Google Документы»

10 способов, как скопировать текст из ПДФ документов

5. Теперь данные копируются как в обычном редакторе.

10 способов, как скопировать текст из ПДФ документов

Как вытащить текст из ПДФ, если он не копируется

Бывает, что PDF-файл открывается без ограничений, но при попытке совершить любые действия с содержимым появляется предупреждение: операция запрещена. Это означает, что владелец установил ограничения на редактирование и извлечение данных.

Попытки взломать пароль с помощью сторонних программ могут являться нарушением законодательства о защите авторских прав, коммерческой тайны или конфиденциальности персональных данных. Не пытайтесь разблокировать защиту самостоятельно. Если известен владелец, обратитесь к нему с просьбой предоставить вам код доступа.

Когда вы получите пароль, проблема, как скопировать текст из ПДФ файла с паролем, легко решается в любом специализированном редакторе. Покажем, как это сделать на примере уже знакомой вам программы PDF Commander.

1. На стартовой странице выберите «Редактировать документ» и загрузите ваш PDF.

10 способов, как скопировать текст из ПДФ документов

2. В окошке с уведомлением об установленной защите введите пароль и кликните «Ок».

10 способов, как скопировать текст из ПДФ документов

3. Теперь файл открыт для копирования.

10 способов, как скопировать текст из ПДФ документов

Практически все ПДФ-редакторы позволяют разблокировать пароли с разным уровнем защиты по схожему алгоритму. Покажем еще один вариант, как сделать файл доступным для копирования в популярной программе Foxit PDF Editor.

1. Откройте приложение. Выберите путь загрузки и импортируйте ПДФ-файл.

10 способов, как скопировать текст из ПДФ документов

2. На панели с предупреждением об ограничениях кликните на «Включить редактирование»

10 способов, как скопировать текст из ПДФ документов

3. Вставьте пароль.

10 способов, как скопировать текст из ПДФ документов

4. Разверните вкладку «Изменить» на панели с инструментами. Нажмите на кнопку «Т», чтобы выбрать текст.

10 способов, как скопировать текст из ПДФ документов

5. Выделите фрагмент, предназначенный для копирования.

10 способов, как скопировать текст из ПДФ документов

Как скопировать текст из отсканированного PDF-файла

Бухгалтерам, кадровикам и юристам часто приходится работать со скан-копиями. Чтобы данные в таких файлах стали доступными для поиска, правок и копирования, нужно преобразовать картинку в редактируемый текст. Для этого используют функцию оптического распознавания символов (OCR).

Дополнительная сложность — качество исходника. Скан может быть нечетким, с искажениями или помехами, что снижает точность распознавания. В таких случаях важно, чтобы в PDF-редакторе были инструменты для улучшения изображения: повышение контрастности, удаление шумов, выравнивание.

Если в ПДФ-документе есть таблицы или сложная верстка, при распознавании строки и столбцы могут сместиться. Поэтому для таких задач лучше выбирать ПО с поддержкой функции сегментирования — она нужна, чтобы сохранить неизменной табличную структуру.

В PDF Commander есть все необходимые инструменты, позволяющие преобразовывать изображения в редактируемый вид и вытащить текст из ПДФ.

попробуйте бесплатно

В PDF Commander есть все необходимые инструменты

1. Загрузите отсканированный документ: поддерживаются форматы PDF, JPG и PNG.

10 способов, как скопировать текст из ПДФ документов

2. Кликните на «Улучшить изображение» и перейдите во встроенный редактор.

10 способов, как скопировать текст из ПДФ документов

3. Примените автоматические улучшения: система самостоятельно определит перекосы и исправит их, обрежет лишние поля и настроит цветопередачу.

10 способов, как скопировать текст из ПДФ документов

4. Если автоматической коррекции оказалось недостаточно, воспользуйтесь дополнительными инструментами. Увеличьте четкость, а если картинка слишком «шумная», удалите фон, чтобы символы стали более контрастными и лучше считывались. Сохраните изменения.

10 способов, как скопировать текст из ПДФ документов

5. В основном рабочем окне перейдите на вкладку «Распознавание». На нашем скане есть таблицы: чтобы сохранить их структуру, примените инструмент «Определить область».

10 способов, как скопировать текст из ПДФ документов

6. Настройте диапазон страниц, укажите, какие структурные блоки нужно выделять.

10 способов, как скопировать текст из ПДФ документов

7. После того как сегментирование завершится, выберите способ OCR-распознавания. Есть два режима: стандартный и на основе нейросетевых технологий. Если шрифт слишком мелкий, плохо читается или перед вами скан рукописи, используйте распознавание с ИИ.

10 способов, как скопировать текст из ПДФ документов

8. Выполните настройку: выберите страницы, укажите язык. В разделе «Модуль распознавания» установите «Интеллектуальный» — обработка займет больше времени, но результат будет точнее, чем если использовать «Быстрый». Также выберите, что делать после распознавания с полученными данными: извлечь содержимое в отдельный файл, наложить невидимые символы поверх картинки или заменить изображение текстовым слоем.

10 способов, как скопировать текст из ПДФ документов

9. Дождитесь завершения обработки. Теперь строки выделяются и копируются.

10 способов, как скопировать текст из ПДФ документов

Еще один инструмент, позволяющий быстро превратить скан в редактируемый документ — PDFelement. В нем сделан упор на ИИ-технологии, поэтому OCR-распознавание сразу выполняется с помощью нейросети. Также софт располагает дополнительными функциями, ускоряющими работу: можно извлекать не отдельные графы, а целые таблицы. 

Покажем, как это выглядит на практике.

1. Запустите программу. Откройте файл или, если скан был сохранен в графическом формате, выберите «Создать PDF».

 

10 способов, как скопировать текст из ПДФ документов

2. Когда программа определит, что предстоит работать с оцифрованным изображением, кликните на «Улучшить сканирование» и выберите, какие параметры нужно скорректировать. 

10 способов, как скопировать текст из ПДФ документов

3. Затем запустите распознавание. На панели настроек укажите, в каком виде сохранить выходные данные, установите язык.

10 способов, как скопировать текст из ПДФ документов

4. Теперь у вас появилась возможность поиска по ключевым словам и копирования информации. Но если вы хотите перенести в другой отчет все данные, на левой панели кликните на «Инструменты». В списке найдите «Распознавание таблиц».

10 способов, как скопировать текст из ПДФ документов

5. Когда программа выделит содержимое столбцов, вы можете скопировать выбранную таблицу, и перенести ее из PDF в Word.

10 способов, как скопировать текст из ПДФ документов

Как скопировать текст из ПДФ онлайн

Если под рукой нет специализированных программ, задачу можно решить прямо в браузере. В этом помогают онлайн-редакторы, например PDF Maestro.

Сервис объединяет более 30 инструментов для работы с ПДФ-документами. Здесь можно снять установленный пароль, восстановить частично поврежденный файл, выбрать данные со страницы скана.

Покажем решение комплексной задачи: как в PDF скопировать текст, если вам прислали запароленный скан.

1. Откройте бесплатный онлайн-редактор в любом браузере. Разверните список инструментов. В разделе «Безопасность» выберите «Удалить пароль».

10 способов, как скопировать текст из ПДФ документов

2. Загрузите файл с вашего компьютера и впишите пароль, который вы получили от владельца.

10 способов, как скопировать текст из ПДФ документов

3. Скачайте разблокированный PDF-документ и вернитесь к начальной странице. Выберите инструмент «OCR-распознавание». Щелкните по кнопке «Начать редактирование», чтобы загрузить скан.

10 способов, как скопировать текст из ПДФ документов

4. Выберите нужные настройки.

10 способов, как скопировать текст из ПДФ документов

5. Экспортируйте архив. Он содержит оригинальный скан и TXT-файл, получившийся после преобразования PDF в текст.

10 способов, как скопировать текст из ПДФ документов

6. Распакуйте ZIP-файл и откройте текстовый документ. Содержимое теперь доступно для копирования и вставки.

10 способов, как скопировать текст из ПДФ документов

Подведем итоги 

С отдельными задачами можно справиться с помощью офисных приложений или онлайн-сервисов. Но самый удобный вариант — использовать PDF-редактор. Такой софт решает любые задачи: от разблокировки пароля до преобразования скана в редактируемый формат. Также ПО оснащено инструментами, которые позволяют сразу продолжить работать с документом: в одном окне, без промежуточных скачиваний и переключения между сервисами.

Реклама: ИП Мелешников Алексей Алевтинович, ИНН 760403875115, erid: 2W5zFK2ffsP

Информации об авторе

Контакты

Начать дискуссию

ГлавнаяПодписка