Какая бывает аналитика: предиктивная, описательная и еще 2 вида аналитики больших данных

Автор Категория , , , ,
Какая бывает аналитика: предиктивная, описательная и еще 2 вида аналитики больших данных

В этой статье мы разберем одно из ключевых понятий цифровизации: что такое предиктивная аналитика и чем она отличается от дескриптивной. Также рассмотрим на практических примерах, какие виды аналитики больших данных (Big Data) еще бывают и где они используются. Читайте в нашем сегодняшнем материале, как машинное обучение (Machine Learning) и другая аналитика Big Data помогают руководителям получать целостную картинку всех аспектов бизнеса и принимать эффективные управленческие решения.

4 вида аналитики данных для эффективного управления на практическом IIoT-примере

Начнем с практического определения: аналитика данных – это процесс поиска системных закономерностей в массивах информации и интерпретации найденных фактов с целью получения важных для бизнеса сведений (инсайтов, insights), которые позволят оптимизировать деятельность: увеличить доход, сократить затраты или достичь других важных результатов [1].

Принято выделять 4 вида аналитики данных, отличающихся уровнем сложности работы с информацией и степенью человеческого участия [2]:

  • Описательная (дескриптивная), которая отвечает на вопрос «Что случилось?», создавая сводку исторических данных для их дальнейшего анализа. Например, непрерывный сбор информации с производственного оборудования с помощью smart-датчиков и других IoT/IIoT-устройств позволит точно идентифицировать момент сбоя в технологическом процессе.
  • Диагностическая, которая анализирует информацию, чтобы ответить на вопрос «Почему это случилось?». Здесь используются статистические методы анализа данных с целью их кластеризации, классификации, детализации и обнаружения корреляции, чтобы выявить основные факторы влияния на результаты. В рассмотренном выше примере с промышленным интернетом вещей (Industrial Internet of Things, IIoT) диагностическая аналитика покажет, что авария случилась по причине выхода из строя модуля приемки сырья.
  • Предиктивная (прогнозная, предсказательная), которая прогнозирует неизвестные события в будущем, отвечая на вопрос «Что может случиться?» на основе анализа накопленной информации. Здесь используется множество методов: математическая статистика, моделирование, машинное обучение и другие области Data Science, а также интеллектуальный анализ данных (Data Mining). К примеру, предиктивная аналитика текущих и прошлых показателей работы производственного оборудования заблаговременно определит время его профилактического ремонта, чтобы избежать поломки дорогостоящей техники. Как это работает на практике в нефтегазовой отрасли, мы рассказывали в этой статье.
  • Предписывающая (предписательная), которая отвечает на, пожалуй, главный управленческий вопрос «Что делать?». Здесь машинное обучение и другие методы искусственного интеллекта анализируют все накопленные и обработанные данные, чтобы найти наилучшие решения для конкретной ситуации. В рассматриваемом примере модуль предписывающей аналитики подскажет, какая именно деталь производственного оборудования больше всего износилась и как это исправить наиболее оптимальным с точки зрения экономики образом: заменить на новую или отремонтировать.
предиктивная аналитика, описательная аналитика, диагностическая аналитика, предписывающая аналитика
Аналитическая пирамида: от описательной к предписывающей аналитики данных

Где еще используются системы аналитики Big Data и как их внедрить

Отметим области деятельности с наиболее высоким спросом на аналитику данных, как дескриптивную, так и предписывающую [3]:

  • медицина – постановка диагноза на основании симптомов болезни, выявление факторов, провоцирующих заболевание, определение склонности к заболеванию в будущем, формирование рекомендаций и выписка лекарств для лечения и профилактики болезней. Впрочем, некорректная настройка модуля Machine Learning в этом случае может привести к трагическим последствиям, о чем мы рассказывали здесь.
  • реклама и маркетинг – определение эффективности промо кампаний, выявление наиболее результативных каналов и форм подачи информации (персонализированный таргетинг), построение рекомендательных систем, формирование спроса на основе интересов пользователя и его поведения в сети, прогнозирование и предупреждение оттока клиентов (Churn Rate), оптимизация ценообразования.
  • страхование и кредитование – точное определение суммы возмещения или кредита, скоринговая оценка клиента. Например, сегодня это уже реализовано в совместном проекте российских банков с компанией Яндекс, когда банки оценивают платежеспособность потенциального заемщика по истории его запросов в поисковой системе. Подробнее об этом мы писали здесь.
  • промышленность – выявление ключевых факторов, влияющих на качество продукции и выполнение производственных процессов, предсказание отказов оборудования, составление графика профилактических проверок и ремонта техники, прогнозирование спроса на продукцию, оптимизация загрузки производственных мощностей и предупреждения о будущих внештатных ситуациях. Реальные примеры промышленного использования Big Data систем предиктивной и предписывающей аналитики на базе IoT/IIoT и Machine Learning читайте тут.
  • финансы и безопасность – выявление и предупреждение случаев мошеннических операций (антифрод-системы), распознавание вредоносных программ и случаев утечки данных, о чем мы рассказывали здесь.
  • управление человеческими ресурсами (HR) – выявление ключевых факторов, влияющих на компетентность сотрудников, составление модели профессиональных компетенций, прогнозирование увольнений, предупреждение профессионального выгорания и рабочих конфликтов [4]. Подробнее об этом мы расскажем в следующей статье.

Внедрение аналитических Big Data систем – это комплексный поэтапный проект, который часто выполняется в рамках цифровизации бизнеса. Предписывающая аналитика находится на вершине пирамиды и опирается на предыдущие уровни: предиктивную, диагностическую и описательную [2]. Поэтому для формирования оптимальных управленческих решений на основе данных необходимо, прежде всего, накопить релевантный объем этой информации, достаточный для корректного обучения алгоритмов Machine Learning. Некоторые аналитические задачи решаются с помощью современных BI-инструментов, например, коммерческих платформ типа Oracle Data Mining, SAP BusinessObjects Predictive Analysis, SAP Predictive Maintenance and Service, IBM Predictive Insights или open-source решений (KNIME, Orange, RapidMiner) [3]. На практике многие предприятия, вступившие на путь цифровой трансформации, создают собственные системы аналитики больших данных. При этом используются разнообразные технологии Big Data, например, Apache Hadoop – для хранения информации (в HDFS или HBase), Kafka – для сбора данных из различных источников, а Spark или Storm – для быстрой аналитической обработки потоковой информации. В частности, именно так реализована рекомендательная система стримингового сервиса Spotify, о которой мы рассказывали здесь. Таким образом, организация предиктивной и, тем более, предписывающей аналитики данных – это одна из ключевых задач цифровизации бизнеса.

Дескриптивная Диагностическая Предиктивная и Предписывающая аналитика данных
Виды аналитики данных и вопросы, на которые они отвечают

Как внедрить систему аналитики больших данных и запустить цифровую трансформацию своего предприятия, вы узнаете, пройдя обучение на наших образовательных курсах в лицензированном учебном центре обучения и повышения квалификации руководителей и ИТ-специалистов (менеджеров, архитекторов, инженеров, администраторов, Data Scientist’ов и аналитиков Big Data) в Москве:

Источники

  1. https://www.oracle.com/ru/business-analytics/what-is-analytics.html
  2. https://iot.ru/promyshlennost/kakaya-analitika-nuzhna-vashey-kompanii
  3. http://www.tadviser.ru/index.php/Статья:Предикативная_аналитика_(предиктивная,_прогнозная,_прогностическая)_Predictive_analytics
  4. https://finassessment.net/blog/predictiv-analitika-hr