Прошли те времена, когда управление мастер-данными считалось простой вспомогательной услугой, которая рассматривалась как пустая трата денег, времени и терпения.

Я уверен, что специалисты по MDM справедливо не согласятся с тем, что MDM — тривиальное занятие для предприятий. MDM больше не просто продукт или часть программного обеспечения. Это проект. На самом деле вы можете вычеркнуть это, это программа. MDM играет решающую роль в обеспечении того, чтобы данные клиентов всегда оставались чистыми, надежными, полными и готовыми к анализу.

Это чрезвычайно важная дисциплина, в которой бизнес и ИТ работают вместе, чтобы обеспечить единообразие, точность, управление, семантическую согласованность и подотчетность официальных общих активов основных данных предприятия.

С каждым днем ​​внедрение MDM набирает силу как ключевой элемент пути цифровой трансформации предприятий, и очевидно, что организации полностью осознают ту роль, которую управление мастер-данными играет в их эволюции.

Я говорю это без тени сомнения, исходя из моего недавнего опыта участия в саммите MDM и управления данными в Лондоне в июне 2019 года. Ключевые мировые лидеры в области MDM обсуждали соответствие, Customer 360, системную интеграцию и слияния и поглощения, которые являются ключевыми факторами для мастер-данных. Управление. Тем не менее, важный момент, который был поднят во время саммита, также касался того, как MDM должен развиваться вместе с новой волной в мире цифровой трансформации, чтобы добиться роста.

Проработав в этой области большую часть своей карьеры, вот мои два цента о том, как эта область будет развиваться в ближайшие годы. Основываясь на своем опыте и взаимодействии с лидерами мнений в этой области, я твердо верю, что важнейшими движущими силами для управления мастер-данными в будущем будет использование возможностей больших данных, машинного обучения и искусственного интеллекта.

По моему мнению, подкрепленному исследованиями, 3 основные возможности для бизнеса, которые повысят эффективность MDM:

Управление данными для озер данных

Традиционные хранилища данных уйдут в прошлое, а вместе с ними и функция Schema-on-Write. Излишне говорить, что озера данных станут новым и усовершенствованным средством хранения данных в будущем.

Озеро данных содержит огромное количество необработанных неструктурированных данных в собственном формате с гораздо большей гибкостью и масштабируемостью.

Но проектирование и внедрение Data Lake — непростое испытание. Без какого-либо преобразования загрузка данных из устаревших систем в такие системы, как Hadoop, может привести к хаосу. Использование правильной стратегии подачи данных в озера данных может помочь избежать создания болот данных, которые вскоре могут превратиться в еще одно хранилище.

Таким образом, чтобы использовать истинную ценность аналитики больших данных, управление метаданными и управление данными должны быть эффективными и устойчивыми.

Также с технологической точки зрения необходима надежная интеграция с системами больших данных для поддержки новых структур, возникающих каждый день. Таким образом, озера данных в конечном итоге потребуют принятия точной стратегии MDM.

Интерактивная дедупликация с использованием активного обучения

Ни один инструмент MDM не может быть полным без функций сопоставления и слияния для дедупликации.

Традиционно эти решения принимаются на основе набора вручную созданных правил и политик сопоставления. Наборы правил, необходимые для достижения хороших результатов, часто бывают большими и сложными, и может быть очень сложно понять все последствия изменения или добавления правил в такие большие наборы данных.

Однако таких проблем можно избежать, используя модели машинного обучения. Обучение модели для установления отношений между записями с метками «Истина» или «Ложь» для меньшего подмножества, а затем подталкивание вашей модели ML к выполнению тяжелой работы для вас для большего набора данных.

Модели не только обучены предсказывать, совпадают или не совпадают какие-либо две записи в таблице данных, но они также могут помочь в оптимизации политик сопоставления.

Автоматизированное управление данными с помощью машинного обучения

За последнее десятилетие произошел переход от информационных систем, «осведомленных о данных», к информационным системам, «осведомленным о процессах», таким как системы управления рабочими процессами. Управление данными и рабочие процессы обеспечивают отличную поддержку для маршрутизации и распределения рабочих элементов среди людей. Руководители.

К сожалению, эти рабочие процессы утомительны и не оптимизированы на основе реальных сроков выполнения.

Например. Утверждение одного нового продукта в MDM может занять несколько недель с учетом заинтересованных сторон, интеграций и бюрократических процедур, которые могут повлиять на цикл продаж и доход.

Только представьте себе ажиотаж в пиковые сезоны, такие как День Благодарения или Рождество, когда распорядители данных тратят большую часть своего времени, что легко может выполнять обученная машина !!

Благодаря возможностям машинного обучения эти длительные рабочие процессы управления данными можно легко обучить и оптимизировать, чтобы меньше времени тратилось на повышение эффективности процессов с минимальным вмешательством в MDM или без него, а больше усилий можно было направить на выполнение продуктивных задач в периоды пиковой нагрузки. сезон.

Работая в TIBCO, я имею честь разрабатывать передовые решения с использованием продуктов, лидерство в отрасли которых было признано несколькими крупными экспертами в области отраслевой аналитики, такими как Gartner и Форрестер. Компания TIBCO названа лидером магического квадранта Gartner по управлению мастер-данными третий год подряд и подтверждена Forrester для быть сильным исполнителем и технологическим лидером в области управления мастер-данными.