
Практический курс машинного обучения в R
Ближайшая дата курса Машинное обучение в R | В архиве |
Стоимость обучения | 90.000 рублей |
Код курса | DSML |
РегистрацияИнтенсивный курс для статистиков, аналитиков, разработчиков Big Data, руководителей и специалистов по работе с большими данными, которые хотят освоить современные методы машинного обучения с их практической реализацией на языке R для решения прикладных бизнес-задач.
Что такое машинное обучение, R и RStudio
Машинное обучение (Machine Learning) — это раздел искусственного интеллекта, который включает математические, статистические и вычислительные методы для разработки алгоритмов, способных обучаться и решать задачи через поиск закономерностей в разнообразных входных данных. Решение вычисляется не по заранее заданным правилам, а адаптивно выстраивается на основе выявленной зависимости результатов от конкретного набора входных признаков и их значений. Можно сказать, что Machine Learning — это один из разделов науки о данных (Data Science), который активно использует методы интеллектуального анализа данных (Data Mining).
На практике машинное обучение широко применяется в различных исследовательских и прикладных задачах:
- прогнозирование будущих событий и ситуационный анализ, например, отток клиентов в ритейле или вероятные поломки промышленного оборудования;
- распознавание образов (рукописного текста, лиц на видеозаписях, голоса в аудио и т.д.);
- классификация образцов, например, автоматическая постановка диагноза по анализу рентгеновских снимков;
- выявление случаев мошенничества в банковских и биржевых операциях.
R — это мультипарадигмальный интерпретируемый язык программирования для статистической обработки данных и работы с графикой. Еще так называется свободная программная среда вычислений с открытым исходным кодом для работы с этим языком. R поддерживает множество статистических и численных методов, а также постоянно дополняется и расширяется за счет пакетов – библиотек для работы специфических функций или отдельных прикладных областей. На практике R широко используется для статистического анализа данных в различных сферах деятельности, от нефтедобычи до фармацевтики, являясь стандартом де-факто для статистических программ.
RStudio — это свободная среда разработки программного обеспечения с открытым исходным кодом для языка программирования R. RStudio доступна в виде десктопной версии, когда программа выполняется на локальной машине как обычное приложение, и серверного продукта (RStudio Server), где через браузер предоставляется доступ к среде, установленной на удаленном Linux-сервере.
Как эффективно использовать R и RStudio для решения задач Machine Learning в рамках конкретных бизнес-кейсов, вы узнаете на нашем образовательном курсе «Машинное обучение в R».
Кому нужны курсы по Machine Learning и R
Практический курс Машинное обучение в R предназначен для аналитиков, разработчиков программного обеспечения, руководителей и специалистов по работе с большими данными, которые хотят получить расширенную практическую и теоретическую подготовку по Data Science и Data Mining для участия в проектах анализа Big Data и Machine Learning.
В результате обучения вы получите следующие знания и навыки:
- разберетесь с базовыми положениями Data Science, Data Mining, основами статистики и кейсами практического применения этих исследовательских методов в бизнесе;
- поймете, что такое нейросети, машинное обучение, искусственный интеллект и Deep Learning;
- освоите принципы построения алгоритмов регрессии, классификации и кластерного анализа;
- разберете математические основы нейронных сетей;
- сможете самостоятельно обрабатывать датасеты для подготовки к моделированию;
- научитесь строить собственные модели машинного обучения;
- поймете, как корректно интерпретировать результаты моделирования;
- получите базовые навыки программирования на языке R и работы в среде RStudio.
Предварительный уровень подготовки
- Понимание основ статистики
- Практический опыт работы c R-Studio или знания в рамках курса DSAV-Data Science: Аналитика и визуализация больших данных в R
По окончании курса «Машинное обучение в R» в нашем лицензированном учебном центре «Школа Больших Данных», вы получите сертификат или удостоверение установленного образца, которые могут засчитываться в качестве свидетельств о повышении квалификации.
Как построен курс машинного обучения в R
Продолжительность: 5 дней, 40 академических часов
Методические материалы: учебное пособие на русском языке
Данный практический курс машинного обучения включает теоретические основы современных методов Machine Learning и их практическую реализацию в виде алгоритмов на языке R. Рассматриваются основные понятия Data Science и Data Mining, проблемы измерения производительности и уменьшения размерности, регрессионные модели, байессовские алгоритмы, машина опорных векторов (SVM) и ассоциативные правила для интеллектуального анализа больших данных. Успешно освоив материалы данного курса, вы будете понимать принципы функционирования алгоритмов машинного обучения и применять их для эффективной обработки больших данных в задачах реального бизнеса.
Программа курса «Машинное обучение в R»
-
Основы статистики и простая линейная регрессия
- Что такое ваши данные?
- Статистические выводы
- Введение в машинное обучение
- Простая линейная регрессия
- Диагностика и трансформация
- Коэффициент определенности
- Методы оценки моделей и производительности
-
Базовое программирование с R (опционально)
- Введение в R
- Что такое R?
- RStudio, пакеты и рабочая область
- Основные элементы языка R
- Типы объектов данных
- Введение функций и управляющих операторов
- Функции
- Программирование функций
- Подключение библиотек в RStudio
-
Подготовка данных (опционально)
- Принципы формирование Dataset (набор данных)
- Локальный импорт / экспорт данных
- Работа с отсутствующими данными (NA)
- Категориальные данные
- Формирование обучающего и тестового набора данных
- Вопросы масштабирования и автоматизации
- Препроцессинг данных
-
Линейная регрессия и обобщенная линейная модель
- P-value — ошибки первого рода
- Допущения и диагностика
- Оценка максимального правдоподобия
- Интерпретация модели
- Оценка соответствия модели
- Обобщенные линейные модели:
- Простая линейная регрессия
- Множественная линейная регрессия
- Логистическая регрессия
- Полиномиальная регрессия
- Метод опорных векторов (SVR) и деревья решений
- Деревья решений
- Bagging
- Случайные леса
- Boosting
- Важность переменной
- Сортировка полей и поддержка векторного классификатора
- Метод опорных векторов
- Оценка производительности регрессионной модели
- Коэффициенты линейной регрессии
-
Алгоритмы классификации
- Логистическая регрессия
- Алгоритм ближайших соседей
- Алгоритм K-ближайших соседей. Выбор К и меры расстояния
- Наивный байессовский анализ и «проклятие размерности»
- Условная вероятность: теорема Байеса
- Оценка Лапласа
- Уменьшение размерности
- Процедура PCA
- Ridge и регрессия Лассо
- Перекрестная проверка.
- Классификация с помощью деревьев решений
- Классификация методом случайных деревьев
- Оценка производительности классификационной модели
-
Кластерный анализ
- Кластерный анализ
- K-means кластеризация
- Выбор количества кластеров
- Типовые ошибки при кластеризации
- Иерархическая кластеризация. Принципы построения дендрограмм
-
Ассоциативные правила
- Правила Априори алгоритма
- Основные принципы построения моделей в R
-
Машинные алгоритмы с переобучением (Reinforcement learning)
- Верхняя граница достоверности (UCB — Upper Confidence Bound)
- Примеры по Томпсону
- Сравнение алгоритмов
- Реализация алгоритмов в R
-
NLP алгоритмы (Алгоритмы текстовой обработки)
- Основы Natural Language Proccesing
-
Глубокое Обучение (Deep Learning)
- Отличие машинного обучение (Machine Learning) от глубокого обучения (Deep Learning)
- Искусственные Нейронные Сети (Artificial Neural Networks) :
- План атаки
- Нейроны
- Активация нейронов
- Как работают нейронные сети и персептроны
- Сигмоидные нейроны
- Сетевая топология и скрытые функции
- Метод обратного распространения ошибки с градиентным спуском
РегистрацияСкачать программу курса Машинного обучения в R в формате pdf