Добавление OCR-слоя и другие преобразования PDF

Джерело:
Хабрахабр / Захабренные / Тематические / Посты

Дата публікації:
24/08/2025 21:07

Постійна адреса новини:
http://www.vsinovyny.com/12218404

Добавление OCR-слоя и другие преобразования PDF

 

24/08/2025 21:07 // Хабрахабр / Захабренные / Тематические / Посты

При сканировании и сохранении в формате PDF зачастую документы сохраняются в виде графических изображений. Это неудобно, потому что делает невозможным полнотекстовый поиск по содержанию. Утилита OCRmyPDF решает эту проблему: она одной командой из консоли добавляет к PDF-документу слой OCR с распознанным текстом.

Ниже упомянуты ещё несколько полезных инструментов для парсинга PDF, в том числе для преобразования сложных математических PDF-документов в текстовый формат Markdown.

Читать далее

 

» Читати повністю

 

« Наступна новина з архіву
В Киеве ограничат движение из-за визита иностранных делегаций
  Попередня новина з архіву
Y Combinator files brief supporting Epic Games
»

 

 
© 2025 www.vsinovyny.com