Добавление OCR-слоя и другие преобразования PDF

Джерело:
Хабрахабр:

Дата публікації:
24/08/2025 21:07

Постійна адреса новини:
http://www.vsinovyny.com/12218408

Добавление OCR-слоя и другие преобразования PDF

 

24/08/2025 21:07 // Хабрахабр:

При сканировании и сохранении в формате PDF зачастую документы сохраняются в виде графических изображений. Это неудобно, потому что делает невозможным полнотекстовый поиск по содержанию. Утилита OCRmyPDF решает эту проблему: она одной командой из консоли добавляет к PDF-документу слой OCR с распознанным текстом.

Ниже упомянуты ещё несколько полезных инструментов для парсинга PDF, в том числе для преобразования сложных математических PDF-документов в текстовый формат Markdown.

Читать далее

 

» Читати повністю

 

« Наступна новина з архіву
Украинский вратарь в матче Ла Лиги пропустил 4 гола меньше чем за 30 минут
  Попередня новина з архіву
У Києві обмежать рух через візит іноземних делегацій
»

 

 
© 2025 www.vsinovyny.com