Курс Машинное обучение в R

Курсы машинного обучения в Москве, www.bigdataschool.ru

Практический курс машинного обучения в R

Ближайшая дата курса Машинное обучение в R 12-16 октября
   
   
Стоимость обучения 90.000 рублей
 Код курса  DSML

РегистрацияИнтенсивный курс для статистиков, аналитиков, разработчиков Big Data, руководителей и специалистов по работе с большими данными, которые хотят освоить современные методы машинного обучения с их практической реализацией на языке R для решения прикладных бизнес-задач. 

Что такое машинное обучение, R и RStudio

Машинное обучение (Machine Learning) — это раздел искусственного интеллекта, который включает математические, статистические и вычислительные методы для разработки алгоритмов, способных обучаться и решать задачи через поиск закономерностей в разнообразных входных данных. Решение вычисляется не по заранее заданным правилам, а адаптивно выстраивается на основе выявленной зависимости результатов от конкретного набора входных признаков и их значений. Можно сказать, что Machine Learning — это один из разделов науки о данных (Data Science), который активно использует методы интеллектуального анализа данных (Data Mining).

На практике машинное обучение широко применяется в различных исследовательских и прикладных задачах:

  • прогнозирование будущих событий и ситуационный анализ, например, отток клиентов в ритейле или вероятные поломки промышленного оборудования;
  • распознавание образов (рукописного текста, лиц на видеозаписях, голоса в аудио и т.д.);
  • классификация образцов, например, автоматическая постановка диагноза по анализу рентгеновских снимков;
  • выявление случаев мошенничества в банковских и биржевых операциях.

R — это мультипарадигмальный интерпретируемый язык программирования для статистической обработки данных и работы с графикой. Еще так называется свободная программная среда вычислений с открытым исходным кодом для работы с этим языком. R поддерживает множество статистических и численных методов, а также постоянно дополняется и расширяется за счет пакетов – библиотек для работы специфических функций или отдельных прикладных областей. На практике R широко используется для статистического анализа данных в различных сферах деятельности, от нефтедобычи до фармацевтики, являясь стандартом де-факто для статистических программ.

RStudio — это свободная среда разработки программного обеспечения с открытым исходным кодом для языка программирования R. RStudio доступна в виде десктопной версии, когда программа выполняется на локальной машине как обычное приложение, и серверного продукта (RStudio Server), где через браузер предоставляется доступ к среде, установленной на удаленном Linux-сервере.

Как эффективно использовать R и RStudio для решения задач Machine Learning в рамках конкретных бизнес-кейсов, вы узнаете на нашем образовательном курсе «Машинное обучение в R».

Программа курса

Кому нужны курсы по Machine Learning и R

Практический курс Машинное обучение в R предназначен для аналитиков, разработчиков программного обеспечения, руководителей и специалистов по работе с большими данными, которые хотят получить расширенную  практическую и теоретическую подготовку по Data Science и Data Mining для участия в проектах анализа Big Data и Machine Learning.

В результате обучения вы получите следующие знания и навыки:

  • разберетесь с базовыми положениями Data Science, Data Mining, основами статистики и кейсами практического применения этих исследовательских методов в бизнесе;
  • поймете, что такое нейросети, машинное обучение, искусственный интеллект и Deep Learning;
  • освоите принципы построения алгоритмов регрессии, классификации и кластерного анализа;
  • разберете математические основы нейронных сетей;
  • сможете самостоятельно обрабатывать датасеты для подготовки к моделированию;
  • научитесь строить собственные модели машинного обучения;
  • поймете, как корректно интерпретировать результаты моделирования;
  • получите базовые навыки программирования на языке R и работы в среде RStudio.

Предварительный уровень подготовки

По окончании курса «Машинное обучение в R» в нашем лицензированном учебном центре «Школа Больших Данных» вы получите сертификат о повышении квалификации государственного образца.

Узнать подробности

Как построен курс машинного обучения в R

Продолжительность: 5 дней, 40 академических часов

Методические материалы: учебное пособие на русском языке

Данный практический курс машинного обучения включает теоретические основы современных методов Machine Learning и их практическую реализацию в виде алгоритмов на языке R. Рассматриваются основные понятия Data Science и Data Mining, проблемы измерения производительности и уменьшения размерности, регрессионные модели, байессовские алгоритмы, машина опорных векторов (SVM) и ассоциативные правила для интеллектуального анализа больших данных. Успешно освоив материалы данного курса, вы будете понимать принципы функционирования алгоритмов машинного обучения и применять их для эффективной обработки больших данных в задачах реального бизнеса.

Регистрация

Программа курса «Машинное обучение в R»

  1. Основы статистики и простая линейная регрессия

    • Что такое ваши данные?
    • Статистические выводы
    • Введение в машинное обучение
    • Простая линейная регрессия
    • Диагностика и трансформация
    • Коэффициент определенности
    • Методы оценки моделей и производительности
  2. Базовое программирование с R (опционально)

    • Введение в R
    • Что такое R?
    • RStudio, пакеты и рабочая область
    • Основные элементы языка R
    • Типы объектов данных
    • Введение функций и управляющих операторов
    • Функции
    • Программирование функций
    • Подключение библиотек в RStudio
  3. Подготовка данных (опционально)

    • Принципы формирование Dataset (набор данных)
    • Локальный импорт / экспорт данных
    • Работа с отсутствующими данными (NA)
    • Категориальные данные
    • Формирование обучающего и тестового набора данных
    • Вопросы масштабирования и автоматизации
    • Препроцессинг данных
  4. Линейная регрессия и обобщенная линейная модель 

    • P-value — ошибки первого рода
    • Допущения и диагностика
    • Оценка максимального правдоподобия
    • Интерпретация модели
    • Оценка соответствия модели
    • Обобщенные линейные модели:
      • Простая линейная регрессия
      • Множественная линейная регрессия
      • Логистическая регрессия
      • Полиномиальная регрессия
    • Метод опорных векторов (SVR) и деревья решений
    • Деревья решений
    • Bagging
    • Случайные леса
    • Boosting
    • Важность переменной
    • Сортировка полей и поддержка векторного классификатора
    • Метод опорных векторов
    • Оценка производительности регрессионной модели
    • Коэффициенты линейной регрессии
  5. Алгоритмы классификации

    • Логистическая регрессия
    • Алгоритм ближайших соседей
    • Алгоритм K-ближайших соседей. Выбор К и меры расстояния
    • Наивный байессовский анализ и «проклятие размерности»
      • Условная вероятность: теорема Байеса
      • Оценка Лапласа
      • Уменьшение размерности
      • Процедура PCA
      • Ridge и регрессия Лассо
      • Перекрестная проверка.
    • Классификация с помощью деревьев решений
    • Классификация методом случайных деревьев
    • Оценка производительности классификационной модели
  6. Кластерный анализ

    • Кластерный анализ
    • K-means кластеризация
      • Выбор количества кластеров
      • Типовые ошибки при кластеризации
    • Иерархическая кластеризация. Принципы построения дендрограмм
  7. Ассоциативные правила

    • Правила Априори алгоритма
    • Основные принципы построения моделей в R
  8. Машинные алгоритмы с переобучением (Reinforcement learning)

    • Верхняя граница достоверности (UCB — Upper Confidence Bound)
    • Примеры по Томпсону
    • Сравнение алгоритмов
    • Реализация алгоритмов в R
  9. NLP алгоритмы (Алгоритмы текстовой обработки)

    • Основы Natural Language Proccesing
  10. Глубокое Обучение (Deep Learning)

    • Отличие машинного обучение (Machine Learning) от глубокого обучения (Deep Learning)
    • Искусственные Нейронные Сети (Artificial Neural Networks) :
      • План атаки
      • Нейроны
      • Активация нейронов
      • Как работают нейронные сети и персептроны
      • Сигмоидные нейроны
      • Сетевая топология и скрытые функции
      • Метод обратного распространения ошибки с градиентным спуском

РегистрацияСкачать программу курса Машинного обучения в R в формате pdf