PYML: Practical Python Machine Learning

Курс: «Practical Python Machine Learning»

Ближайшая дата курса 20,27 июня (1 день в неделю)
   
Стоимость обучения    72.000 рублей

Курс по машинному обучению с использованием Python

В ходе курса слушатели не только познакомятся с основными концепциями и лучшими практиками в машинном обучении, но и научатся решать следующие задачи:

  1. Кластеризация пользователей с целью создания уникального предложения для каждой группы пользователей.
  2. Прогноз оттока (Churn rate) пользователей.
  3. Скоринг клиентов на возврат займа.

Особенности курса:

  1. Упор идет не на теорию, а на практику и применимость в реальном бизнесе.
  2. Вся теория подкреплена реальными данными из бизнеса.
  3. В конце каждой темы задания на проверку материала. Каждый слушатель получает индивидуальный фидбек от преподавателя.
  4. Курс включает самостоятельную работу с заданиями и проводится  1 раз в неделю

Аудитория

Продуктовые и бизнес-аналитики, руководители, инженеры данных.

Предварительный уровень подготовки

  • Понимание основ статистики, высшей математики
  • Опыт работы с Python

Продолжительность: 4 дня, 32 академических часа

Методические материалы: учебное пособие на русском языке

 

Программа курса 

Неделя 1: Python Machine Learning  для анализа данных.

  • Что такое Jupyter и Anaconda.
  • Основные структуры данных в Python.
  • Операторы и управляющие конструкции.
  • Функции и классы.
  • Библиотека pandas для анализа данных.
  • Визуализация данных в Python.
  • Домашнее задание: exploratory data analysis на реальном датасете.

Неделя 2: Основные концепции в машинном обучении на Python.

  • Какие бывают задачи машинного обучения.
  • Как оценивать качество алгоритма: разбор метрик качества в задачах классификации и регрессии, их связь и решение бизнес-задачи.
  • Что такое валидация, какие бывают типы валидации.
  • Что такое регуляризация.
  • Работа с категориальными и пропущенными признаками.
  • Градиентный спуск – краеугольный камень всего машинного обучения.
  • Тест на понимание концепций.

Неделя 3: Основные алгоритмы Python Machine Learning.

  • Линейная регрессия, L1/L2 регуляризация.
  • Обобщения линейной регрессии: квантильная регрессия, полиномиальная регрессия, логистическая регрессия.
  • Метод k-ближайших соседей
  • Деревья принятия решений, регуляризация деревьев, модификации деревьев: bagging, random forests, boosting.
  • Реализуем каждый из алгоритмов на реальном датасете, сравниваем их предсказательную силу.
  • Домашнее задание: самостоятельно произвести сравнение всех пройденных алгоритмов на других данных.

Неделя 4: Обучение без учителя, продвинутые подходы к работе с признаками, финальный проект.

  • Алгоритмы кластеризации, их оценка и область применения в реальном бизнесе.
  • Обзор подходов к feature engineering/feature selection.
  • Использование генетических алгоритмов для создания новых признаков.
  • Продвинутые подходы к mean target encoding.
  • Создание композиций алгоритмов: blending, stacking.
  • Объединяем полученные знания для построения production-ready модели скоринга.
  • Домашнее задание: реализация полного цикла data science проекта: EDA; формализация задачи; выбор метода валидации и метрики качества; генерация, оценка и отбор признаков; оценка и выбор модели, эксперименты с композициями моделей.

Скоринговые модели и машинное обучение на Python

Скачать программу курса «Практический курс Машинного обучения с использованием Python»