Жесткая конкуренция в современном мире вынуждает компании искать все новые способы, позволяющие развивать бизнес в условиях усиливающихся трендов на повсеместную информатизацию и цифровизацию. Что такое Data-driven подход и как с его помощью можно монетизировать данные и использовать их как драйвер для развития компаний и повышения информационной безопасности.
- Введение
- Почему необходимо становиться Data-driven компанией?
- Что такое Machine Learning?
- Как применить технологии Machine Learning в бизнесе?
- Практические примеры успешных проектов
- Выводы
Введение
Одной из основных целей бизнеса является увеличение прибыли. Для достижения этой цели компании ставят перед собой различные задачи: для одной компании это увеличение среднего размера продажи в расчете на клиента, для другой — увеличение общего количества клиентов, а для третьей — повышение количества повторных покупок одним и тем же клиентом. Выполнение поставленных задач может позволить компании выйти на новый уровень бизнеса, однако встает главный вопрос — как решать подобные задачи в условиях жесткой конкуренции и повсеместной информатизации и цифровизации?
Одним из наиболее эффективных подходов к развитию бизнеса в указанных условиях является ориентированность компании на работу с данными — так называемый Data-driven подход, подразумевающий использование технологий машинного обучения (Machine Learning). В данной статье мы рассмотрим Data-driven подход, разберемся, что значит быть Data-driven компанией, дадим определение понятию Machine Learning и рассмотрим практический опыт и пользу, которую могут принести ориентированность на данные и машинное обучение практически в любой сфере бизнеса.
Рисунок 1. Этапы монетизации данных
Почему необходимо становиться Data-driven компанией?
Чтобы понять, почему необходимо становится Data-driven компанией, необходимо дать ответ на вопрос: «Что значит быть Data-driven компанией?» Руководство большинства компаний считает, что если их компания создает и использует в своей работе различные отчеты, то она является Data-driven компанией. Однако если взглянуть на работу с данными более комплексно, то в современном цифровом мире недостаточно обладать хорошо структурированными отчетами, содержащими полезную информацию. Зачастую подобные отчеты способны предоставить информацию о том, что на предыдущей неделе произошло снижение продаж, но при этом они не могут дать ответ на самые главные вопросы: «Почему это произошло, и какие меры необходимо предпринять?» Помимо этого, данный отчет, возможно, не достигнет своего адресата из-за недостаточно выстроенных бизнес-процессов и отсутствия конвейеров по сбору и обработке данных. Аналогичная ситуация наблюдается в большинстве компаний в отношении разрабатываемых KPI (Key Performance Indicators), представленных на дашбордах, основывающихся только на статистических данных.
Основное отличие Data-driven компании от любой другой — это умение использовать существующие данные для реализации предиктивной аналитики — аналитики, которая использует текущие данные для получения преимуществ в будущем. Data-driven компания способна реализовать аналитику, нацеленную на будущее, и регулярно давать ответы на такие вопросы, как: «Какие причины привели к данному событию?», «Какие меры необходимо предпринять для решения возникшей проблемы?», «Какой прогноз мы можем построить на основе имеющихся данных?» Таким образом, только дата-ориентированные организации способны монетизировать данные — извлекать и повышать прибыль бизнеса за счет применения практик по анализу данных. За счет этого данные становятся не просто отчетами и визуализациями, а реальным инструментом по построению системы поддержки принятия решений и увеличения прибыли компании.
Что такое Machine Learning?
Для внедрения в компании Data-driven подхода необходимо во многом изменить существующие процессы, а также разобраться в основных технологиях такого подхода. Machine Learning является ключевой технологией, внедрение которой позволяет существенно ускорить выстраивание процессов, присущих Data-driven компании. В связи с этим необходимо понять, чем же в конечном итоге является Machine Learning. Machine Learning — это достаточно объемный подраздел науки о данных, который занимается изучением техник и методов построения математических алгоритмов, решающих задачи предиктивной аналитики. В машинном обучении выделяют три основных типа указанных задач:
- Задача регрессии: тип задач машинного обучения, результатом которой является некоторое действительное число или числовой вектор.
- Задача классификации: тип задач машинного обучения, результатом которой является метка класса из некоторого конечного множества допустимых ответов. Частный случай подобной задачи — это задача бинарной классификации, где множество допустимых ответов состоит из двух меток классов.
- Задача кластеризации: тип задач машинного обучения, результатом которой является группировка объектов в кластеры, используя данные о попарном сходстве объектов.
Как применить технологии Machine Learning в бизнесе?
Разобравшись с идеологией подхода Data-driven и определением понятия Machine Learning, необходимо понять, как выстроить процессы, направленные на дата-ориентированность, и интегрировать методы и технологии Machine Learning. Ключевым и самым важным моментом является наличие самих данных. Современная компания должна уметь находить необходимые данные, осуществлять правильный сбор, обработку и их анализ. Отсюда вытекает главная задача, которая стоит перед потенциальной Data-driven-компанией, — данные необходимо собирать на постоянной основе, обеспечивать к ним соответствующий доступ и использовать их для предиктивной аналитики и real-time-мониторинга. Помимо этого, используемые данные должны обладать свойствами взаимосвязанности, доступности, полноты и точности, и это далеко не полный список.
Рисунок 2. Схема сбора, обработки и анализа данных
Указанная выше задача порождает перед компанией следующий барьер — отсутствие профильных специалистов, которые бы занимались работой с данными, начиная их сбором и заканчивая построением высокоуровневой аналитики. Команда специалистов по работе с данными в базовом варианте имеет следующий состав: Data Engineer, занимающийся сбором и обработкой данных, Data Scientist, отвечающий за создание математических моделей, использующих методы Machine Learning, и Business Analyst, решающий задачи по непосредственному анализу подготовленных данных с доменными знаниями в определенной области. Кроме этого, команде нужен Data Lead, который может организовать необходимые процессы по работе с данными и выстроить культуру, основная идея которой — это высочайшая ценность данных как ресурса развития компании и достижения ее стратегических целей.
Рисунок 3. Основные роли в команде специалистов по работе с данными
Практические примеры успешных проектов
В теории все, что связанно с машинным обучением и работой с данными, выглядит очень многообещающе, но как обстоят дела на практике? Рассмотрим ряд успешно реализованных дата-ориентированных бизнес-кейсов в крупных компаниях в информационной безопасности и не только.
Российская крупная площадка по бронированию отелей реализовала успешный кейс, который заключался в «умной» сортировке отелей. У отелей есть большое количество характеристик, на основе которых клиент делает свой выбор: цена, рейтинг, количество положительных отзывов и так далее. Используя данные показатели и внутреннюю финансовую отчетность, удалось провести продвинутую сортировку отелей по пользователям, которые ранее были сегментированы. По итогам проекта был зафиксирован рост выручки, конверсии и значения среднего чека.
Международная розничная сеть супермаркетов реализовала бизнес-кейс по определению подозрительных случаев при отмене и уменьшении суммы чека. Персонал магазина при наличной оплате может отменить позицию в чеке, провести свою бонусную карту, отменить чек и забрать денежные средства себе. С камер наблюдения распознаются деньги при передаче их кассиру, после чего анализируются паттерны с целью поиска подозрительных случаев. После этого ответственным сотрудникам приходит отчет по всем подозрительным ситуациям. В результате это позволило полностью искоренить подобный вид мошенничества.
В российской розничной сети супермаркетов в течение трех лет количество розничных точек продаж практически удвоилось. После внедрения геоинформационной системы компания стала открывать новые точки продаж существенно чаще и эффективнее. Для разработки этой системы организация закупила базы данных по домохозяйствам (количество жителей конкретных населенных пунктов, их доходы, проходимость торговых точек), наличию конкурирующих магазинов, собрала информацию по всем объектам недвижимости, которые она когда-либо оценивала, а также учла расходы и доходы собственных магазинов. Все это в совокупности позволило оптимизировать операционную деятельность и существенно повысить эффективность вновь открываемых точек продаж.
Крупный зарубежный банк успешно реализовал кейс в сфере информационной безопасности, который заключался в продвинутом детектировании DGA-доменов, распространяющих вредоносный код и сгенерированных с помощью специального алгоритма. Для решения кейса была сформулирована задача классификации доменов на легитимные и зловредные. Была сформирована выборка, в которой присутствовали легитимные и зловредные домены, а также сопутствующая информация о них. После этого выборка была разбита на обучающую и тестовую, с последующим построением множества N-грамм, являющихся подстрокой соответствующего домена. Далее каждой N-грамме был присвоен свой коэффициент, соответствующий степени легитимности N-граммы. Решение задачи позволило успешно детектировать атаки, использующие DGA-домены, и повысить общую защищенность организации.
Выводы
В современном мире, где потоки данных возрастают с каждым днем, любой компании необходимо не просто научиться их обрабатывать и хранить, но извлекать из них реальную пользу.
Становление Data-driven компании — сложный и комплексный процесс, требующий вовлеченности всех сотрудников компании и выстраивания культуры ценности данных. Грамотное бизнес-ориентированное использование данных позволяет компании повышать свои финансовые показатели и достигать комплексных долгосрочных стратегических целей. В конечном счете, дата-ориентированный подход становится мощным инструментом по монетизации данных и извлечению из них реальной выгоды.