Оформите запрос на демонстрацию системы

Мы свяжемся с вами в течение одного рабочего дня, чтобы определить ваши потребности и удобный формат демонстрации системы DIRECTUM:

Заказать демонстрацию

По вопросам выбора и приобретения:
present@directum.ru
+7 (341) 272-11-00

Вверх
@DIRECTUMCompany:   Пожалуйста, подождите, загружаем данные из twitter...

Организация поддержки и непрерывного развития ECM-системы на крупном предприятии

Система DIRECTUM и реализуемые в ней бизнес-процессы играют стратегическую роль для компании. Требования к доступности и надежности выставлены самые жесткие – система должна функционировать в режиме 24/7.

Как ведется мониторинг работоспособности и обеспечивается информационная безопасность, рассказывают ведущий инженер-программист ОАО «Сургутнефтегаз» и специалист компании DIRECTUM.

Крупные компании предъявляют особые требования к поддержке внедренной информационной системы. Рассмотрим задачи и особенности организации процесса на практическом примере ОАО «Сургутнефтегаз».

Стоит обратить внимание на жизненный цикл информационной системы. Для любой системы формируются требования, на основе которых в последующем выполняются проектирование и разработка информационной системы. Эти этапы можно объединить в один блок – внедрение. Он составляет небольшую часть проекта в самом начале.

Жизненный цикл информационной системы

Наиболее длительный этап – это промышленная эксплуатация, в рамках которой для дальнейшей поддержки информационной системы необходимо определить целевые показатели доступности, безопасности, производительности и надежности. Именно на этом этапе до 80% всех работ ложится на плечи команды поддержки и развития заказчика – от работы с пользователями до поддержки инфраструктуры и сетей. Вендор также участвует, но в меньшем объеме по сравнению с этапом внедрения. Для получения качественных результатов (например, доступности системы 24х7) важно обеспечивать тесную интеграцию групп поддержки заказчика, вендора информационной системы, операционных систем, сетей и всего оборудования, необходимого для функционирования информационной системы.

Рассмотрим детальнее организацию работы команды поддержки и развития заказчика.

Требования, по которым система была спроектирована, необходимо анализировать на всем протяжении работы системы. Поэтому первое, на что следует распределить ресурсы и время, – это организация процесса мониторинга.

Поскольку система и бизнес-процессы для Сургутнефтегаза являются критичными, то и требования к доступности и надежности выставлены самые жесткие – система должна функционировать в режиме 24х7.

Для контроля и обеспечения данного требования, помимо технических решений в части резервирования узлов системы и применения катастрофоустойчивых конфигураций оборудования, выполняется круглосуточный мониторинг более 100 показателей работоспособности системы. Вместе с организационными решениями это позволяет быстро реагировать на внештатные ситуации. На это отводится не более 5 минут.

Помимо мониторинга работоспособности ECM важными задачами являются мониторинг и обеспечение информационной безопасности системы.

Здесь применяется специализированное промышленное оборудование для шифрования передаваемых по сети данных, ограничения доступа и т.д., но кроме этого также выполняются:

Анализ операций в СУД

  1. Контроль работы сторонних инженеров: в реальном времени отслеживаются работы вендора. При этом все действия записываются и при необходимости могут быть воспроизведены.
  2. Автоматизированный мониторинг доступа к файлам в файловом хранилище: применяются возможности SCOM и Windows по политикам доступа. Любое открытие, копирование, изменение документа с сервера файлового хранилища, например, администратором сервера, автоматически инициирует рассылку всем ответственным специалистам.
  3. Мониторинг доступа к файлам в системе DIRECTUM: проверяются все факты открытия документов службой поддержки на правомочность, например, наличие обращений от пользователя в системе управления инцидентами или по электронной почте.

Помимо производительности системы в целом большое внимание мы уделяем и производительности конкретных операций у конкретных пользователей. С этой целью реализован уникальный инструмент для опережающего выявления проблем. Он анализирует длительность всех пользовательских операций и показывает отклонения от заданных норм. Для разных видов операций определены свои нормы по длительности, однако любая операция не должна выполняться более 3 секунд. Если 10% операций выполняются дольше заданных норм, то такой факт расценивается как инцидент.

Следующий процесс, который заслуживает внимания – это управление изменениями.

Особенно важным и критичным он становится, когда в системе выполняется большое число изменений. Классикой жанра является 3-уровневый ландшафт. Но мы пошли дальше и реализовали 4-уровневый, добавив предпродуктивную систему – это полная копия продуктивной системы, которая позволяет тестировать изменения на максимально приближенных к «боевой» системе конфигурациях и данных. Такое решение дает на выходе качественное и оптимизированное ПО для работы в системе при реальной нагрузке.

Сам процесс управления изменениями мы тоже скорректировали и добавили в него шаги по анализу пересечений и уведомлению пользователей о выполненных изменениях.

Управление изменениями в СУД

За время опытной эксплуатации от пользователей поступает большой объем пожеланий. Так вышло, что новые заявки поступали к нам быстрее, чем мы успевали реализовать существующие, и на определенном этапе очередь из пожеланий превысила 900 штук. Основным фактором малого количества устраняемых замечаний (в среднем всего по 5 в неделю) было то, что мы не учитывали пересечение компонентов разработки. Далее мы реализовали функционал, при помощи которого еще на стадии планирования в автоматизированном режиме появилась возможность выстраивать очередь устранения замечаний с учетом пересечений на месяц и более вперед. После использования данного решения среднее число еженедельно выполняемых пожеланий выросло более чем в 3 раза – до 20-30 пожеланий в неделю без изменения численности программистов и проектировщиков.  

Большой объем изменений, выполняемых за короткий период, вызвал резкое увеличение числа заявок на обслуживание от пользователей. Функционал системы прирастал большими порциями изменений. Не обходилось без курьезов: например, даже простое всплывающее информационное окно некоторые пользователи воспринимали как ошибку. Решение было очень простым – после каждого импорта мы стали рассылать перечень выполненных изменений. В результате объем обращений в службу поддержки сократился на порядок.

И здесь мы затронули следующий важный процесс – управление знаниями.

DIRECTUM мы используем как платформу для управления документами, и уже сегодня на ее базе построено несколько ИТ-решений. Каждое решение имеет свои особенности, и для того чтобы пользователям о них рассказать, было разработано более 300 интерактивных видеоинструкций. Мы реализовали механизм контекстно-зависимой помощи. Например, при работе с поручениями отображаются только инструкции, связанные с поручениями. Такой подход позволяет пользователям легко ориентироваться в большом объеме обучающего материала.

Помимо обучающих инструкций мы еженедельно освещаем наиболее важные и актуальные моменты по работе системы в «Совете недели». Таким образом, мы значительно сэкономили на очном обучении 20 000 наших пользователей. Они получили инструмент и материалы для быстрого самостоятельного освоения системы и успешно ими пользуются.

Еще один важный процесс – управление доступом к системе. Его цель – обеспечить безопасность данных и максимально упростить для конечного пользователя вопрос прав доступа и подключения к системе.

Вы уже знаете, что в ОАО «Сургутнефтегаз» используется централизованная система управления полномочиями SAP IdM. При проектировании СУД мы встроились в общую концепцию управления полномочиями по ролевому принципу (например, в зависимости от должности). Сейчас пользователь добавляется в определенную группу и с учетом организационной принадлежности моментально становится пользователем системы, получает доступ ко всем необходимым функциям и объектам. Такой подход позволил сократить нагрузку и расходы на службу сопровождения пользователей. Нового пользователя не нужно создавать вручную, загружать его сертификат электронной подписи, назначать права на объекты системы. Все это делается автоматически, менее чем за 10 минут.

Работа с обращениями пользователей и инцидентами

Мы разными способами уменьшаем число обращений пользователей в группу поддержки, тем самым сокращая нагрузку и затраты на сопровождение. Для новой, постоянно развивающейся системы на 20 000 пользователей, нам удалось добиться значительных результатов – всего 1000 обращений в месяц. В масштабах года на 1 пользователя системы приходится менее 1 обращения.

 Сам процесс поддержки построен по принципу 3-х линий и реализован на базе системы SAP Service Desk.

Поддержка пользователей СУД

На первой линии поддержки у нас располагаются специалисты высокой квалификации, которые решают более 80% поступающих от пользователей обращений. Отмечу, что прием заявок от пользователей выполняется только через учетную систему, время первой реакции регламентировано и не должно превышать 30 минут. Есть и исключения из правил – так называемые VIP-пользователи, от них обращения принимаются по звонку и обрабатываются в срочном порядке. Вторая линия – наши программисты и проектировщики, они решают 19% переданных с 1 линии обращений, и только 1% оставшихся обращений передается на 3 линию поддержки – специалистам вендора.

К вендору в среднем поступает от 5 до 15 обращений в месяц. Есть локальные пики, когда количество инцидентов превышает среднее значение, на них мы обращаем особое внимание и разбираем отдельно.

Обратим внимание на качественные характеристики этих инцидентов. Почти все из них – срочные и критичные, влияющие на всех или почти всех пользователей. Инциденты, обычно сложные и нетривиальные, не удалось решить команде поддержки заказчика. Они могут относиться как к заказной разработке, так и к стандартной версии системы и даже к платформе. Нередко команда сопровождения ОАО «Сургутнефтегаз» передает нам задачи по оптимизации быстродействия отдельных операций.

 Указанные характеристики инцидентов задают высокие требования к нашим сервисам по поддержке системы. В первую очередь это скорость реакции и продолжительность решения инцидентов. Условия стандартной поддержки не подходят, поэтому разработан отдельный пакет услуг – приоритетная техническая поддержка.

Дополнительно к стандартной поддержке предложен пакет сервисов:

  • приоритетная инцидентная поддержка;
  • управление событиями и проблемами;
  • аудит производительности.

Поддержка вендором

За счет приоритетной инцидентной поддержки мы обеспечиваем высокий уровень SLA (Service Level Agreement) – время реакции составляет минуты, время решения – часы. Такие высокие показатели достигаются за счет выделенной команды экспертов и отдельной очереди обращений. Обращения от ОАО «Сургутнефтегаз» не попадают в общую очередь, а адресуются непосредственно команде экспертов. Они знают заказную разработку и особенности архитектуры системы, поэтому на погружение в инцидент необходим минимум времени, также эксперты хорошо знают команду поддержки от заказчика. За счет этого мы сокращаем время решения инцидента, так как обычно много времени требуется на взаимодействие, здесь мы этот фактор исключаем.

Сервис по управлению событиями и проблемами способствует сокращению общего числа новых инцидентов и потенциальных проблем с доступностью и стабильностью системы.

Несколько раз в год проводится аудит производительности, в рамках которого контролируются здоровье и производительность системы. Обычно аудит выполняется после каких-либо значительных изменений, например, после запуска нового решения. Выявляются потенциальные узкие места в оборудовании, настройках серверов, прикладной разработке, которые позволяют исключить проблемы с производительностью в будущем.

Существует отдельная процедура работы по очень критичным инцидентам. В таких случаях формируются кризисные команды от ОАО «Сургутнефтегаз» и DIRECTUM. Со стороны ОАО «Сургутнефтегаз» в команде участвуют эксперты по системе, СУБД, ОС и «железу». Часть команды DIRECTUM выезжает в Сургут для координации работ и оперативного взаимодействия с экспертами на месте. Другая часть команды остается в офисе в Ижевске для взаимодействия с необходимыми экспертами (специалисты платформы, СУБД и другие эксперты) и ведения доработок.

За счет такой организации работ даже особо критичные инциденты решаются в короткие сроки и практически не влияют на доступность системы в целом. Мы постоянно работаем над тем, чтобы исключить подобные ситуации, в том числе за счет управления событиями и проблемами.

Немного теории, чтобы все одинаково понимали, о чем говорится.

Под событиями мы понимаем любое нетипичное поведение системы – будь то инцидент, скачок в нагрузке процессора или в сети, снижение скорости работы системы у ряда пользователей и другое. Анализируя события, мы выявляем потенциальные проблемы в стабильности и производительности системы. Например, скачки в нагрузке на процессор системных служб нам позволили предугадать и заранее исключить проблемы со скоростью доставки документов до адресатов. Под проблемами мы понимаем причины возникновения инцидентов.

Возвращаясь к примеру, в данном случае инцидент – снижение скорости доставки документов, а проблема – высокая нагрузка на процессор. Поэтому важно управлять событиями и проблемами. При отсутствии этих работ мы на входе получили бы сотни инцидентов, связанных со скоростью доставки документов.

В рамках приоритетной поддержки мы также управляем событиями через анализ логов и контроль здоровья системы. В логах системы можно выявить предупреждения и ошибки, не выходящие на пользователей, но которые могут влиять на стабильность работы системы. Зная о потенциальных проблемах, мы можем заранее их устранить. Регулярный контроль здоровья системы по счетчикам ОС и СУБД выдает оперативную информацию об изменениях в производительности системы и позволяет спрогнозировать дальнейшие потенциальные узкие места или выявить текущие проблемы.

Как было отмечено выше, случаются скачки в количестве инцидентов. Мы анализируем все инциденты, выявляем похожие и анализируем возможные причины их возникновения. Выявив проблему и устранив ее, мы нередко наблюдаем спад количества инцидентов до среднего уровня или даже ниже среднего.

Много информации по инцидентам, событиям и проблемам накапливается как в ОАО «Сургутнефтегаз», так и в DIRECTUM. Для эффективного использования всей имеющейся информации мы регулярно проводим совместные собрания по обмену информацией и управлением текущими работами. За счет этого мы исключаем потерю информации и скорость устранения инцидентов и проблем.

Все указанные работы в большей степени направлены на снижение числа инцидентов, возникающих у пользователей. Для контроля и повышения стабильности работы системы мы несколько раз в год проводим аудит производительности. По сути это глубокий анализ всех частей системы – от работы процессора сервера СУБД до скорости выполнения операций на отдельно взятой рабочей станции пользователя. По результатам выполнения работ формируется срез производительности отдельных подсистем с указанием их состояния. При наличии каких-либо отклонений от нормы в отчете фиксируются рекомендации по исключению либо снижению рисков стабильности и производительности системы.

Комплекс из выстроенных процессов и регламентов, а также слаженная работа команд Сургутнефтегаза и компании DIRECTUM помогли нам построить систему, которая идеально влилась в единую информационную систему компании, имеет задел на дальнейшее развитие и с функциональной точки зрения, и с точки зрения вовлечения в работу новых пользователей, соответствует всем требованиям и доступна для любого пользователя в режиме 24х7. А коэффициент доступности системы составляет 99,9% с учетом профилактических работ.

Авторы:

Павел Абашев, ведущий инженер-программист отдела разработки и внедрения информационных технологий в документообороте управления делами
ОАО «Сургутнефтегаз», менеджер системы управления документами

Алексей Корепанов, руководитель проектов внедрения DIRECTUM от исполнителя

Кнопка
связи