На вопросы журнала отвечает Владимир Рождественский, генеральный директор компании DATAREON. Часть ответов вошла в материал «Данные — это актив, актив — это стратегия», опубликованный в itWeek №5 (948) за 2019 год.
1. У концепции Data Governance много формально правильных и при этом весьма емких определений. Вместе с тем на практике часто бывает более целесообразно сравнить данную концепцию с теми методами и приемами менеджмента данных, с которыми отечественный пользователь уже неплохо знаком. Можно ли в этом смысле сопоставить DG с такими технологиями как, например, Data Management, Master Data Management, Data Quality Management, Information Lifecycle Management и, возможно, другими?
Если не вдаваться в дебри терминологии и истории появления этих понятий, концепция Data Governance включает в себя не только все выше перечисленное, но и, например, механизмы управления доступа к данным (data security management), механизмы конвертации и выгрузки/загрузки данных (extract, transform, and load) и многое другое.
2. Когда и у каких предприятий может возникнуть потребность во внедрении DG? Есть ли некий “порог вхождения” в эту технология в отношении масштаба бизнеса, его структуры, принципиальной зависимости от ИТ, зрелости информационной поддержки и культуры использования ИТ, квалификации персонала?
Любое предприятие, даже если оно не автоматизировано, в той или иной мере управляет данными, основной вопрос здесь в степени погружения. В начале развития компании нужно просто хранить данные, потом передавать их между системами, далее уже встает вопрос выделения мастер-данных и так далее. Другими словами, как такового «порога вхождения» нет, управление данными нужно всем. Главное понять какие механизмы нужны сейчас.
3. Известно, что Data Governance в большей степени может быть связана со стратегическими целями компании. К достижению каких целей DG может подготовить российские компании в сегодняшней бизнес-среде? Связано ли это больше с возможностью эффективно приспосабливаться к изменению законодательства и регулирующих актов? Может ли DG эффективно способствовать политике слияний и поглощений, открытию новых направлений в бизнесе, трансформации имеющихся, выходу на зарубежные рынки и пр.?
В наше время уже очевидно, что данные, в общем смысле этого слова, являются одним из самых ценных активов организации. Следовательно, эффективное управление этим активом оказывает существенное влияние на все аспекты жизнедеятельности компании, будь то работа с клиентами (Customer Data Integration, CDI), позволяющая строить нестандартные связи и зависимости (например, по сотрудникам клиента — учитывать родственные связи, интересы, послужной список и так далее), или управление данными о продуктах (Product Information Master).
4. Что можно сказать о кадровом обеспечении внедрения концепции Data Governance? В частности:
— задействованы ли во внедрении и дальнейшем использовании данной концепции ИТ-специалисты, традиционно занимавшиеся вопросами управления данными на предприятиях — администраторы ИТ-систем и баз данных, ИБ-офицеры, контент-менеджеры и пр.?
— необходимо ли прямое задействование специалистов “новой автоматизации” (Data Scientists, Data Engineers, Data Architects, Chief Data или Digital Officers и пр.), если таковые уже работают на предприятии, решая задачи обработки больших данных, машинного обучения и т. д.?
— какие бизнес-должности/роли тут необходимо вводить? За что эти люди должны отвечать? Это совершенно новые позиции или те, которые можно трансформировать из уже введенных на предприятии должностей или ролей?
— существуют ли абсолютно специфические для Data Governance бизнес- или ИТ-позиции?
В идеальном случае, конечно, выделение специфических ролей повышает качество работы с данными, но в реальности все наталкивается на отсутствие готовых специалистов на рынке, неготовность руководства организации вкладываться в это направление и т.д. Поэтому обязанности по управлению данными обычно ложатся на уже существующие роли. Единственная, на мой взгляд, должность, которую трудно совместить с уже существующими – это Архитектор данных (Data Architects). Данный сотрудник должен видеть все предприятие «сверху», видеть использование данных в каждом отделе и подразделении. Аналогов в стандартном штатном расписании у этой роли нет.
5. Что можно сказать об информационной поддержке внедрения концепции DG? Необходимы ли для этого специализированные продукты? Можно ли хотя бы частично/временно скомпоновать ее на основе имеющихся традиционных систем? Какие принципиально важные функции работы с данными (например, проверка, аудит, обновление, согласование и некоторые другие) в случае внедрения DG в большей степени нуждаются в специфической ИТ-поддержке?
Все зависит от потребностей предприятия на данном этапе его развития. Есть примеры, когда задачи DG решались простым регламентированием работ с данными. Это, конечно же, касается небольших компаний с несколькими или, вообще, с одной автоматизированной системой. Но если мы говорим о крупном бизнесе, особенно о холдинговых структурах или корпорациях, где десятки систем и высокие требования к качеству и скорости работы с данными, без специализированных систем управления данными не обойтись. Современные MDM-системы позволяют проводить валидацию, дедубликацию и обогащение в автоматическом или полуавтоматическом режиме. Традиционные производственные системы таким развитым функционалом похвастаться не могут.
6. Какова методическая основа внедрения технологий DG? Насколько она опирается на специфические именно для нее правила, политики, ограничения и т. д.? Целесообразно ли “подключать” к DG уже имеющиеся наработки в области Data-, Document-, Content Management или иных ИТ-направлений? Всегда ли целесообразно внедрять ее целиком или допустимо развертывание отдельных ее компонентов? Трансформируются, сохраняют свое значение или приобретают новое звучание такие важные и универсальные понятия, как полнота, доступность качество данных и некоторые другие? Может быть, спектр базовых понятий, характеризующих корпоративные данные, расширяется?
Внедрение технологий DG требует большой вовлеченности в процесс функциональных подразделений, их знания бизнес-процессов и особенностей работы с данными критичны для успешного достижения поставленных целей. Причем, так как данная тема многогранна, обширна и до сих пор не очень четко сформулирована научным сообществом, поставить конечные цели полномасштабного внедрения не представляется возможным. Работа должна идти итерационно. Например, сначала можно сконцентрироваться на ETL процессах, потом добавить MDM и т.д. Двигаться от простейшего хаба внешних ссылок до полнофункционального хранилища мастер-данных, которое способно поддерживать все бизнес-процессы, выключая обработку транзакций в реальном времени.