Интеллектуальная обработка документов в Правительстве Тюменской области
в 2 раза
быстрее обработка документов
70%
точность распознавания вопроса в обращениях граждан
87%
правильность автоматического заполнения реквизитов
Предпосылки проекта
Ежедневно в Правительство Тюменской области приходит много документов, их можно разделить на 2 основных потока: обращения граждан и входящие письма. Если они поступают через межведомственный ЭДО, Платформу обратной связи, из регионального портала услуг или других систем, которые интегрированы с Directum RX, то система автоматически обрабатывает документы. Ответственному специалисту нужно лишь отправить их в работу.
Сложности возникали, когда документы приходили в бумажном виде или по email, поскольку сотрудникам приходилось регистрировать их вручную. Обращения граждан нужно было вычитать и систематизировать по Общероссийскому тематическому классификатору, выбрав подходящий вопрос из более 1200 возможных. На это уходило много времени. Регистрация входящих писем также требовала больших трудозатрат, потому что ответственный специалист вручную вносил реквизиты. Обработку и заполнение карточек осложняло и то, что в справочнике «Организации» встречались дубли компаний. Для решения проблем внедрили сервисы искусственного интеллекта Directum.
Цели и задачи
Основной целью стала цифровизация обработки и классификации документов с применением ИИ-инструментов. Для этого нужно было:
- настроить автоматическую систематизацию входящих документов и классификацию вопросов в обращениях граждан по Общероссийскому тематическому классификатору;
- обучить алгоритмы извлекать факты из входящих писем и заполнять на их основе реквизиты карточек в системе;
- оптимизировать поиск и удаление дублирующихся записей в справочнике «Организации».
Решения
Обработка документов с ИИ-инструментами
Команда внедрения обучила ИИ-сервисы сначала классифицировать документы как «входящее письмо» или «обращение гражданина». Искусственный интеллект распознает текст, извлекает из него факты и на их основе определяет вид документа. Для входящих писем настроили автоматическое занесение реквизитов в карточку. Чтобы повысить качество заполнения, специально для этого проекта одну из моделей ИИ дообучили на документах, которые чаще всего используются в госорганах.
Отдельно занимались вопросом судебных повесток по форме 30-СДП. Они отличаются от привычных входящих, поэтому для них подготовили специальную модель, распознающую конкретные факты.
Для обработки обращений внедрили multi-label classification — классификацию по многим меткам — для 69 категорий. Вместо одного она определяет в тексте до трех вопросов, которые подходят по Общероссийскому тематическому классификатору и заносятся затем в карточку обращения.
Важно отметить, что обрабатываются не только вложения, но и содержание электронного письма. При этом настроен специальный механизм, который исключает служебный текст, чтобы избежать ошибок и попадания лишних данных в систему.
Команда внедрения доработала задачу на верификацию, чтобы делопроизводителю были доступны все нужные действия:
- одновременно просматривать карточку документа и его образ;
- проверять точность извлеченной информации с помощью цветового выделения;
- перекомплектовывать перечень документов, удалять лишние, менять их тип и т.д.
После верификации сотруднику требуется только отправить документы в работу.

По такой схеме обрабатываются все входящие письма и обращения граждан,
поступающие по email или в бумажном виде
Автоматическое удаление дублей в справочнике «Организации»
В ходе проекта команда подготовила интеллектуальный механизм, который самостоятельно ищет возможные повторы организаций с помощью сравнения по названию, номерам ИНН и КПП, способу обмена. Инструмент основан на технологии нечеткого поиска, поэтому он находит совпадения, даже если запрос содержит опечатки, незначительные вариации или ошибки.
В результате присваивается один из трех возможных статусов: «Оригинал», «Дубль», «Возможно дубль». Если не получилось точно определить повтор, ответственному сотруднику приходит задача на ручную сверку. Он обрабатывает данные и сам устанавливает нужный статус.
Компании с пометкой «Дубль» автоматически удаляются системой. Актуальные ссылки на организации в фоновом режиме добавляются в справочники и карточки документов. Если к повтору были прикреплены контактные лица, они переносятся в оригиналы.
Итоги проекта
В результате внедрения инструментов искусственного интеллекта Directum в Правительстве Тюменской области:
- Вид документов, которые поступают по email или в бумажной форме, определяется автоматически, заполнение карточек не требует участия сотрудника. В результате на обработку писем и обращений теперь уходит на 50% меньше времени.
- Реквизиты заносятся в карточку на основе содержания вложений и сопроводительного текста. Корректность достигает 87%.
- Точность определения вопроса в обращениях граждан составляет 70% благодаря обучению классификаторов на основе multi-label classification. Для подобных проектов ее использовали впервые.
- Дубли в справочнике «Организации» удаляются в фоновом режиме за счет специально разработанного механизма.
- Документы для обучения классификаторов не нужно добавлять в систему вручную, для них настроена автоматическая выгрузка.
Планы по развитию
Правительство Тюменской области продолжит интеграцию интеллектуальных сервисов Directum в рабочие процессы. В будущем планируется:
- внедрить ИИ-инструменты в органы государственной власти и местного самоуправления региона;
- наладить процесс самообучения классификаторов;
- использовать генеративный ИИ, чтобы не тратить время сотрудников на подготовку аннотаций, проектов писем, резолюций вручную.
Также региональные власти собираются настроить интеллектуальные сервисы для создания черновиков резолюций и назначения ответственных. Это повысит эффективность работ руководства и снизит временные затраты.