Интервью с Игорем Беляком, Directum
Рынок искусственного интеллекта в нашей стране переживает самый настоящий Ренессанс. Наблюдается активный рост по всем направлениям. Увеличилась господдержка ИИ-инициатив, выросло число AI-стартапов, появилась самая большая российская мультимодальная модель генерации картинок по тексту (Kandinsky), принят Кодекс этики в сфере искусственного интеллекта. Под последним подписалась и компания Directum.
Игорь Беляк, директор направления по искусственному интеллекту компании Directum, рассказал, как высоко он оценивает позиции ИИ в России, что понимает под «искусственным интеллектом» и почему считает, что ИТ-продукт должен дообучаться прямо в процессе своей работы.
— Игорь, что сейчас происходит с рынком интеллектуального ПО в России?
Лучше всего на этот вопрос ответят цифры. По данным отчета AI Report, в 2021 году рынок искусственного интеллекта в нашей стране составлял 550 млрд руб. Причем основной сегмент рынка — это анализ данных, NLP и цифровые помощники. По сравнению с 2020-м рынок ИИ вырос на 28%. По прогнозам того же AI Report, в 2023-2024 годах рост сохранится.
Приведу в пример еще одно авторитетное исследование. В 2019 году Министерство цифровизации РФ выпустило дорожную карту развития «сквозной» цифровой технологии «Нейротехнологии и искусственный интеллект», в рамках которой также спрогнозировало рост рынка ИИ — до 107,2 млрд руб. в 2023 году и до 160,1 млрд руб. в 2024-м.
При развитии интеллектуального ПО мы в компании Directum ориентируемся в том числе на эту дорожную карту. Могу сделать вывод, что потенциальный объем и емкость рынка для продукта Directum RX Intelligence составит 32,8% или 180 млрд руб.
— Какую роль играет компания Directum в развитии технологий искусственного интеллекта в России?
Хочется верить, что сейчас мы в числе пионеров развития ИИ в сфере обработки корпоративного контента. В далеком 2018 году мы и несколько других компаний были первопроходцами в освоении ИИ. Сегодня Directum RX — официально первая российская интеллектуальная система в классе СЭД в классах «06.12 Программное обеспечение средств электронного документооборота» и «04.08 Интегрированные платформы для создания приложений».
— Есть официальная трактовка того, что считать искусственным интеллектом. Согласно дорожной карте развития технологии «Нейротехнологии и искусственный интеллект» ИИ — это комплекс технологических решений, имитирующий когнитивные функции человека и позволяющий при выполнении задач достигать результаты, как минимум сопоставимые с результатами интеллектуальной деятельности человека. Насколько искусственный интеллект в составе Directum RX соответствует этому определению?
Периодически возникают споры на тему того, что ИИ не существует, а те продукты, которые сейчас есть на рынке, якобы просто нейросеть под маркетинговым соусом. Хочу раз и навсегда развеять этот миф.
В ГОСТ Р 59277-2020. Классификация систем искусственного интеллекта дается четкое определение, что такое ИИ:
ИИ в составе Directum RX Intelligence полностью соответствует этому определению, и вот доказательства:
И еще одна важная ремарка. В гостовском определении не говорится о том, что искусственный интеллект должен полностью повторять когнитивные функции человека. Его задача — только и м и т и р о в а т ь человеческие зрение, слух, понимание, анализ данных, принятие решений. С этой точки зрения наша система соответствует термину государственных стандартов, действующих в Российской Федерации.
— Хорошо, с вопросом ИИ-идентификации разобрались. А что скажете по поводу уникальных характеристик — обладает ли Directum RX особой функциональностью, которая отличает его от подобных продуктов на рынке РФ?
Еще раз замечу, что кроме Directum RX Intelligence, в России сейчас нет других систем для управления корпоративным контентом и бизнес-процессами, в состав которых так глубоко встроен искусственный интеллект.
Наша команда планирует реализовать функциональность дообучения интеллектуальных механизмов на исторических данных непосредственно в процессе работы. Уже разработана модель извлечения фактов — ансамбль однофактовых моделей, которая уберет технологические ограничения для автоматического дообучения. Что это даст нашим клиентам?
А вишенка на торте для наших клиентов — дополнительные налоговые льготы от государства при внедрении продуктов с использованием искусственного интеллекта.
— Расскажите подробнее об ансамбле однофактовых моделей. В чем ее уникальность?
Это такой подход в извлечении фактов, который исключает этап верификации авторазмеченных документов. В случае, если в документе мы не нашли необходимый факт, то он просто не попадет в выборку, но может быть использован для обучения моделей других фактов, которые механизм авторазметки в нем нашел. Таким образом, мы делаем возможным автоматическое дообучение моделей ОИФ (обучаемое извлечение фактов). Дополнительное преимущество заключается в том, что для добавления возможности извлечения дополнительного факта к существующей модели нам необходимо в новых документах разметить только этот факт, так как модели других фактов не будут дообучаться на этих документах.
— Насколько дорого клиенту обойдется дообучение моделей?
По-разному. Весомое преимущество нашего подхода — это возможность дообучения на обычных серверных мощностях (минимальные требования: 4 ядра CPU, 20 Gb оперативной памяти). Получается, клиенту не нужно вкладываться материально.
Чаще всего решения по распознаванию и извлечению фактов из документов реализованы на сложных нейросетевых моделях, для обучения которых требуются большие вычислительные ресурсы и специальные устройства (GPU, TPU). Это либо усложняет, либо делает невозможным реализацию дообучения моделей в контуре клиента, либо существенно удорожает стоимость владения продуктом.
— Какие технологии дообучения наиболее перспективны и почему? Какие из них используете в Directum RX Intelligence?
В рамках задачи по извлечению фактов из документов мы используем три подхода, доказавших свою эффективность и применимость в продуктивной среде:
Но дообучение ИИ-механизмов невозможно без информации о работе пользователя в системе: что он поменял, что исправил, какие документы занес и т.д. В отдельных сервисах для распознавания и извлечения фактов эти данные не хранятся, они находятся именно в корпоративной системе, в которой сотрудники работают каждый день.
Directum RX Intelligence хранит всю историю запросов пользователей и выполненных операций с документами. Благодаря глубокой интеграции системы с интеллектуальными механизмами у последних есть постоянный доступ к новым данным. За счет этого и возможно дообучение ИИ. Даже после завершения проекта внедрения система продолжает совершенствоваться и становиться умнее.
Источник: ecm-journal.ru
Узнайте, чем будут полезны решения Directum для вашей компании! Оставьте заявку, и мы свяжемся с вами в течение рабочего дня — определим ваши интересы и подготовим индивидуальную презентацию.