Архитектура Directum Ario

Directum Ario — это система сервисов, выполняющих обработку документов и текстовой информации в интеллектуальных решениях Directum RX и Directum Ario One. Преимущество такой архитектуры в том, что в систему можно постепенно добавлять новые интеллектуальные инструменты, улучшая скорость и качество обработки корпоративного контента.

Информационная система передаёт документ сервисам Directum Ario.
При работе с Directum RX или Directum Ario One документ можно захватить из папки на компьютере или с выделенной электронной почты.
С помощью нейросети определяет ориентацию страниц относительно расположенного на них текста. При необходимости корректирует положение на 90, 180 и 270 градусов.
Проводит предобработку изображения: стабилизирует яркость, контраст, выравнивает текст, поворачивая изображение на небольшие углы (до 5 градусов). Извлекает текст документа с применением компьютерного зрения и нейросетей.
Использует модели машинного обучения и инструменты обработки естественного языка. На основании созданных моделей разметки определяет и возвращает необходимые реквизиты документа.
Управляющий сервис
Отвечает за подключение к внешним системам через API. Собирает статистику запросов. Проверяет действительность лицензионного ключа.
Сервис
Классификации изображений
С помощью нейросети определяет ориентацию страниц относительно расположенного на них текста. При необходимости корректирует положение на 90, 180 и 270 градусов.
Сервис
Поиска объектов
Находит все подписи и печати в документе, возвращает их количество и координаты на странице.
Сервис
Извлечения текста
Проводит предобработку изображения: стабилизирует яркость, контраст, выравнивает текст, поворачивая изображение на небольшие углы (до 5 градусов). Извлекает текст документа с применением компьютерного зрения и нейросетей.
Сервис
Классификации текста
Классифицирует документ и любую текстовую информацию, определяет вид документа, ответственного исполнителя, группу номенклатурных позиций. Выполняет другие разрезы классификации с помощью моделей машинного обучения.
Сервис
Извлечения фактов
Использует модели машинного обучения и инструменты обработки естественного языка. На основании созданных моделей разметки определяет и возвращает необходимые реквизиты документа.
Отвечает за подключение к внешним системам через API. Собирает статистику запросов. Проверяет действительность лицензионного ключа.
Находит все подписи и печати в документе, возвращает их количество и координаты на странице.
Классифицирует документ и любую текстовую информацию, определяет вид документа, ответственного исполнителя, группу номенклатурных позиций. Выполняет другие разрезы классификации с помощью моделей машинного обучения.
После того как сервисы завершают обработку, в целевую внешнюю систему возвращаются разделенные документы, которые содержались в исходном файле, а также их метаданные с указанием вида, реквизитов, подписей и печатей.

Обучение моделей

Обучение моделей извлечения фактов, подписей, печатей штампов и любых других элементов документа реализовано с помощью первоначальной визуальной разметки документа.

У Directum Ario One простой и удобный интерфейс, поэтому любой пользователь сможет выполнить разметку реквизитов документа и передать созданную модель для обучения разработчикам. Такой подход значительно экономит ресурсы при подготовке новых моделей извлечения фактов и одновременно с этим гарантирует качественный результат.

Как начать работу по-новому

Узнайте больше о возможностях интеллектуальных сервисов Directum Ario One.

0
Связаться
с нами

Оставьте свои контактные данные и мы свяжемся с вами