Все курсы

Курс Аналитика больших данных для руководителей

Новая версия курса «Аналитика Big Data для руководителей и менеджеров»

Ближайшая дата курса
05 декабря 2022
01 февраля 2023
26 апреля 2023
Стоимость обучения 60 000 руб. Регистрация
Длительность обучения 24 ак.часов
Код курса BDAM

Все, что нужно знать для успешной работы с большими данными: методы аналитики и машинного обучения, основы и функционал компонентов экосистемы Hadoop, безопасность озера данных, цифровизация бизнеса и GDPR.

Что такое аналитика больших данных и зачем менеджеру разбираться в этом

Сегодня информация — это основа любого бизнеса, инструмент эффективного управления и оптимизации рабочих процессов. Аналитика больших данных (Big Data) вашего бизнеса поможет своевременно выявить и даже предупредить множество проблем, от оттока клиентов до утечки персональных данных. Чтобы понимать возможности современных технологий и выбирать  среди них наилучшее соотношение «стоимость/результат», менеджеру необходимо разбираться в базовых понятиях и прикладных решениях.

Теоретический курс «Аналитика больших данных для руководителей» ориентирован на руководство государственных предприятий и частных компаний, менеджеров и специалистов, которые хотят получить расширенные знания по инструментам и методам анализа больших данных для участия в проектах Big Data и цифровизации бизнеса в условиях импортозамещения.

Итак, если вам необходимо:

  • разбираться в основных  понятиях Больших Данных, Машинного обучения (Machine Learning), Искусственного интеллекта (Artificial Intelligence)
  • понимать назначение компонентов экосистемы Hadoop, Spark, Kafka или терминов Data Lake, Delta Lake
  • знать, в чем отличие Apache Hadoop, Arenadata, NoSQL, MPP  или Greenplum
  • выявить нюансы облачных решений, контейнеризации и применимости к вашей отрасли бизнеса
  • уяснить, что такое стандарт GDPR и как он влияет на ваш бизнес, риски и ограничения, и что такое политики Data Governance
  • узнать особенности применение методологий для реализации процессов аналитики больших данных на примере CRISP-DM

 

 

Как организован курс Big Data для руководителей

Продолжительность: 3 дня, 24 академических часа.

Уровень подготовки: предварительный опыт не требуется.

Документ об окончании курса: сертификат учебного центра.

Курс «Аналитика больших данных для менеджеров» построен таким образом, чтобы всего за 3 дня даже самый занятой руководитель мог эффективно освоить теорию и практику современных технологий Big Data в контексте их бизнес-применения. Обучение включает все необходимые знания для успешного участия в проектах по анализу больших данных. Программа обучения содержит информацию о фазах жизненного цикла аналитических процессов при цифровизации бизнеса и переходе к использованию Big Data. Вы узнаете базовые и расширенные методы аналитики, в т.ч. техники поиска и извлечения знаний  из больших массивов разнородных данных. Также рассматриваются различные версии дистрибутивов платформы Hadoop, облачные сервисы для хранения и аналитики больших данных, «opensource» и коммерческие инструменты.

Подробно изучаются сценарии применения технологий работы с Большими Данными в организациях государственного сектора и различных отраслях бизнеса: банки и финансовые учреждения, промышленность, торговля, транспорт и др.

На сквозных примерах вы узнаете все особенности процессов инициации проектов цифровой трансформации, от сбора данных до формирования команды. Также детально познакомитесь с каждой фазой жизненного цикла работы с Big Data: подготовка данных, выбор модели, пилотное развертывание и тестирование  прототипа, промышленная эксплуатация.

В нашем 3-дневном тренинге вы получите ответы на актуальные вопросы работы с персональными данными и обеспечения безопасности при работе с Big Data. Материалы содержат много реальных примеров (use cases) монетизации больших данных в российском и мировом бизнесе.  Особое внимание уделено  условиям импортозамещения, а также возможным сложностям и специфике использования при работе с большими данными для различных секторов экономики в России.

Окончив курс Big Data для руководителей в нашем лицензированном учебном центре «Школа Больших Данных», вы получите сертификат или удостоверение установленного образца, которые могут засчитываться в качестве свидетельств о повышении квалификации.

 

 

Учебная программа курса «Большие данные для руководителей»

  1. Введение в Big Data (Большие данные)
    • Большие данные и цифровизация бизнеса
    • Базовые принципы и отличия от классических подходов к работе с данными
    • Обзор методологии CRISP DM — модели жизненного цикла аналитики данных: получение данных, подготовка данных, планирование модели, построение модели, проверка результатов, внедрение
    • Отраслевая специфика аналитики больших данных. Общий разбор отраслевых сценариев (cases)
    • Тенденции в подходах Big Data и что актуально на сегодняшний день
    • Технологии Big Data в условиях импортозамещения
  1. Понимание Бизнеса (Business Understanding)
    • Определение бизнес целей для проекта Big Data
    • Отраслевая специфика аналитики больших данных. Общий разбор отраслевых сценариев (cases)
    • Инициация проекта — критические факторы успеха. Основные проблемы
    • Оценка ситуации: риски, ROI, доступные ресурсы, оценка зрелости компании
    • Приоритизация задач: Что делаем, а что нет
    • Высокоуровневый план проекта
    • Начинаем формировать команду проекта: специалисты и их компетенции, роли
  1. Понимание данных (Data Understanding)
    • Определение источников данных
    • Специфика работы с потоковыми данными и batch в Big Data
    • Принципы формирования Data Lake: выбор платформы
    • Первичный сбор и анализ данных: инструментарий и доступные методы
    • Описание данных и сбор метаданных
    • Data management и Data Governance
    • Оценка качества данных Data Quality
    • Основные трудности и проблемы, критические факторы успеха, роли и навыки
    • Разбор сценариев (cases) для фазы Data Understanding
  1. Подготовка данных (Data Preparation)
    • Подготовка данных – подходы Data Science: нормализация, очистка, выборки, enrichment, форматирование данных
    • Подготовка данных  – как процесс формирования Data Pipeline:
      • Процессы ETL и ELT
      • Зонирование Data Lake и сегментирование данных.
      • Назначение и сравнительная характеристика компонент экосистемы Apache Hadoop, NoSQL, DWH, платформ потоковой обработки для хранения и обработки Big Data на примерах (отраслевые сценарии)
      • Инструменты оркестрирования и автоматизации (Data Flow)
    • И снова о Метаданных: Data Lineage, Data Provenance, Data Governance, …
    • Безопасность больших данных
    • Основные трудности и проблемы, критические факторы успеха
    • Специалисты и их компетенции на данной стадии
  1. Выбор и построение моделей (Modeling)
    • Классы аналитических задач и подходы к их решению
    • Обзор техник моделирования
    • Построение моделей и оценка моделей
    • Что нужно для успешного моделирования
    • Инструментарий для решения аналитических задач этапа моделирования
    • Оценка моделей и среда тестирования моделей: технические метрики оценки качества проведенного моделирования
    • А также песочницы, Machine & Deep learning, AI, Нейронные сети и многое другое
    • Команда Data Science и их компетенции
    • Основные трудности и проблемы фазы моделирования, критические факторы успеха
    • Облачные платформы для быстрой разработки
    • Место DevOps, MLOps для организации процессов разработки
    • Рассмотрение фазы моделирования на сквозных сценариях (cases): место, участники, взаимодействие с другими фазами и процессами
  1.  Оценка результатов ( Evaluation)
    • Про бизнес-метрики оценки качества моделирования
    • Что делать если все плохо ? – возвращаемся на предыдущие фазы
    • Рассматриваем данную стадию в рамках наших сценариев (cases)
    • Отличия среды разработки и эксплуатации
    • Особенности этапа оценки
  1. Развертывание  (Deployment)
    • Планирование развертывания модели
    • Мониторинг и обслуживание модели
    • Методологии автоматизации и вывода продуктов в промышленную эксплуатацию – DevOps и  MLOps
    • Задачи финального обеспечения фаз жизненного цикла Data Science: цикличность reviews, обновления и вывод из эксплуатации
  1. Финальная переоценка проекта
    • Постанализ рисков и BIA, ROI и генерация ценности
    • Допущенные просчеты и методы их решения
    • Оценка процессов и оценка зрелости компании
    • Типичные ошибки применения CRISP DM
    • Альтернативные подходы и расширения CRISP DM (Domino, TDSP, SEMMA)
Скачать программу курса «Аналитика больших данных для руководителей» в формате pdf

Отправить ссылку на:

Если у Вас остались вопросы Вы можете позвонить к нам по телефону +7 (495) 414-11-21  или заполнить форму обратной связи на сайте.
Я даю свое согласие на обработку персональных данных и соглашаюсь с политикой конфиденциальности.

Поиск по сайту