Джерело:
Хабрахабр:
Дата публікації:
25/11/2021 10:29
Постійна адреса новини:
http://www.vsinovyny.com/8467225
25/11/2021 10:29 // Хабрахабр:
В процессе своей профессиональной деятельности мне приходится достаточно много работать с текстовыми документами, подготавливаемыми другими лицами. Одной из задач проверки качества документов является определение степени уникальности текста. Конечно, можно проверять каждый документ в сервисе проверки заимствований (к, примеру в «Антиплагиат-ВУЗ», к которому есть официальный безлимитный доступ), а для автоматизации этого процесса можно использовать API. Однако, на этапе предварительной проверки, это немного избыточно.
Цель статьи: показать один из способов реализации автоматического выявления наличия «подозрительных» символов, форматирования и иного вмешательства в документ формата docx.
В рамках разработки СДО, о которой можно прочитать здесь, был создан функционал, позволяющий предварительно проверять загружаемые пользователями документы перед их загрузкой в «Антиплагиат-ВУЗ» (и не только), а также проверки содержания.
Читать далее| « |
Наступна новина з архіву Как собеседовать разработчиков и что нужно знать кандидатам: опыт GigAnt |
Попередня новина з архіву [Перевод] Действительно ли автомобили спасли города от лошадей? |
» | |
|
|
||||