Заполните форму — и мы свяжемся с вами
Заполните форму — и мы свяжемся с вами

Сложная разработка на Python по автоматизации распознавания и обработки бумажных документов

Python
(основной язык)
Tesseract
(распознавание текста)
Машинное обучение
(machine learning)
Компьютерное зрение (computer vision)
Векторный анализ (определение типа документов)

Задача

Один из клиентов kt.team, крупная логистическая компания, ежедневно обрабатывает тысячи отгрузок. Это сложный бизнес-процесс, который включает работу с многостраничными пакетами бумажных документов, их оцифровку и отправку в несколько информационных систем, используемых компанией.

Нам нужно было разработать такое решение, которое позволит автоматизировать обработку бумажной документации и будет интегрировано во все бизнес-процессы клиента и избавит от ручных операций в работе.

Решение

Систему автоматизированной проверки пакетов документов было решено разработать на Python, с возможностью реализации технологий машинного обучения и компьютерного зрения.
У наших клиентов был целый отдел (около 50 человек), который вручную обрабатывал пакеты документов.

Главная задача — автоматизировать процессы и снять с персонала более половины нагрузки по обработке бумажных и оцифрованных документов.

В рамках проекта была разработана iCdocs — интеллектуальная система автоматизированной проверки и сортировки пакетов документов, разработанная на Python.
Интеграция с PIM-системой

На что смотрит iCdocs

Возможности iCdocs

Оцифровка бумажных документов

Оператор загружает пакет документов в сканирующее устройство. iCdocs запускает цикл сканирования.

Перевод изображений в текст

Переводит отсканированные изображения в текст, определяет тип документов и количество страниц.

Верификация документов

У оператора есть возможность оценить правильность распознавания данных на документах и отметить поля, которые не соответствуют действительности.

Формирование пакета документов

Считывает название юридического лица, распознает номер заказа, отгрузки. Получает информацию о контрагентах, сделках, поставках из бухгалтерских программ. Проверяет наличие нумерации страниц и количество страниц в документе, объединяет все страницы документа. Объединяет документы с единым признаком (номер накладной, номер поездки, контрагент) в один пакет.

Отправка во внешние программы

При желании iCdocs можно интегрировать в любую систему документооборота компании и отправлять пакеты документов в бухгалтерские программы и хранилища как российские, так и международные.

Хранение документов

iCdocs хранит в себе резервные копии документов, которые обрабатывались в нём, с возможностью просмотреть историю изменений и кто их вносил.

Результаты разработки

Система автоматизированной проверки пакетов документов может работать над несколькими пакетами документов одновременно. В начале разработки мы смогли приблизиться к 80% распознаванию.

Работы над проектом ещё продолжаются и мы планируем усовершенствовать алгоритмы распознавания максимально приблизившись к 100%.
Интеграция с PIM-системой

iCdocs будет полезен, если у вас:

Много бумажных документов
Много заказов ежедневно
Несколько юрлиц
Несколько договоров
Много поставщиков
Вы работаете с сотнями, тысячами контрагентов. По каждому контрагенту нужно проверять большой пакет документов.
Много поставщиков
Каждый заказ сопровождается пакетом документов. Необходимо оперативно проверять входящие пакеты на корректность и проверять, сортировать их и передавать в дальнейшую работу.
Много заказов ежедневно
С партнёрами заключено несколько договоров на разные юрлица, нужно проверять комплектность пакетов по каждому договору и корректность заполнения по каждому документу (юрлицо, печать, подпись соответствуют указанным в договоре).
Несколько юрлиц
С каждым из партнёров заключено несколько договоров, в которых варьируются особенности сотрудничества (разные доставщики, разные способы или подходы к оплате и пр.)
Несколько договоров
С разными контрагентами практикуется ЭДО и бумажный документооборот. Нужно свести всё в единую систему, чтобы легче контролировать.
Много бумажных документов

iCdocs разработан на Python

Интеграция с PIM-системой
Преимущество проектов, разработанных на Python в возможности реализации машинного обучения (machine learning) и компьютерного зрения (computer vision).

Python — универсальный, объектно-ориентированный язык программирования.

ЦЕНООБРАЗОВАНИЕ

Проекты оцениваются
индивидуально, потому что для наших клиентов типовых задач не бывает.
rus: kt.team Ценообразование
Error get alias
Получить консультацию