Курс 242. Настройка правил извлечения фактов

Аннотация

Курс дает знания и навыки, необходимые для настройки правил извлечения фактов, которые используются в интеллектуальных сервисах в составе DIRECTUM. Подробнее см. www.directum.ru/ario.

Формат обучения

Самостоятельный с консультациями преподавателя. Обучение проходит на портале обучения edu.directum.ru.

Слушатели получают учебные материалы, доступ к стенду для выполнения лабораторной и практических работ. Преподаватель организует обучение, общается со слушателями, консультирует их по вопросам, проверяет/рецензирует практические задания.

Предварительная подготовка к курсу

За неделю до обучения слушателям выдается лабораторная работа «Directum Ario. Интеграция с сервисами DIRECTUM Ario» для освоения инструмента и подготовки своего стенда к обучению. В процессе выполнения ЛР слушатель разворачивает сервисы Ario и настраивает заполнение фактов в карточки документов и РКК в DIRECTUM. Длительность: 5 рабочих дней по 4-5 часов в день.

Длительность

Длительность лабораторной работы: 5 рабочих дней по 4-5 часов в день.

Длительность курса: 5 рабочих дней по 4-5 часов в день.

Содержание курса

Каждое занятие курса включает один или несколько обучающих видеороликов по соответствующей теме, а также ссылки на соответствующие статьи справки, практическую работу и вопросы для проверки.

  1. Общие сведения:
    • Архитектура сервисов Ario;
    • Термины, понятия и синтаксис томита-парсера.
  2. Общие принципы создания новых правил:
    • Общий порядок настройки правил;
    • Отладка правил с помощью VS Code;
    • Принципы работы томита-парсера.
  3. Извлечение фактов из текста документов:
    • Типы фактов. Наследование;
    • Интерпретация;
    • Леммы, операторы;
    • Пометы ограничения;
    • Регулярные выражения;
    • Грамматические характеристики;
    • Словари;
    • Согласование в правилах;
    • Аббревиатуры;
    • Отладка правил с помощью расширения ArioRules-Editor.
  4. Перенос правил на сервер. Отладка в Postman.
  5. Базовые типы фактов и нетерминалы Ario.
  6. Извлечение фактов из таблиц документов:
    • Структура таблиц;
    • Одиночные факты;
    • Повторяющиеся факты.
  7. Постобработка фактов:
    • Использование базовых форматеров;
    • Принципы разработки новых форматеров.
  8. Настройка расчета вероятности для извлечения фактов.
  9. Рекомендации по настройке правил

Слушатели

Курс ориентирован на специалистов, планирующих заниматься развитием системы — разработчиков..

Уровень подготовленности слушателей

Для прохождения курса слушателям необходимо иметь следующие знания и навыки:

  • пониманием принципов объектно-ориентированного проектирования;
  • знанием синтаксиса Pyton (желательно).

Выполнение лабораторной работы «Directum Ario. Интеграция с сервисами DIRECTUM Ario» опирается на знания, полученные в курсе 234 «Модификация системы DIRECTUM».


Вернуться к списку курсов обучения



Связаться
с нами

Оставьте свои контактные данные и мы свяжемся с вами