Курс Анализ данных и визуализация в R

обучение Data Mining и визуализации данных с использованием R-Studio

Анализ данных и визуализация в R: 5ти-дневный практический курс для специалистов, аналитиков и руководителей

Ближайшая дата курса 31 августа — 04 сентября
   
   
Стоимость обучения 90.000 рублей
 Код курса  DSAV

курсы обучения Hadoop и машинного обучения

Интенсивный курс обучения аналитиков, статистиков и руководителей по методам Data Mining и визуализации больших данных с использованием RStudio. Манипуляции с Big Data в R, средства статистической аналитики Big Data, подготовка данных и пакеты по работе с графикой ggplot, plotly.

Что такое R и RStudio

R — это мультипарадигмальный интерпретируемый язык программирования для статистической обработки данных и работы с графикой. Также называется свободная программная среда вычислений с открытым исходным кодом для работы с этим языком. R поддерживает множество статистических и численных методов, которые постоянно дополняются с помощью пакетов – библиотек для работы специфических функций или отдельных прикладных областей. На практике R стал стандартом де-факто для статистического анализа больших данных в нефтегазовой промышленности, медицине, ритейле и других различных сферах деятельности.

RStudio — это свободная среда разработки программного обеспечения с открытым исходным кодом для языка программирования R. Она доступна в десктопном и серверном вариантах. Среда поддерживает множество возможностей для визуализации данных: круговые и ящичные диаграммы, матрицы рассеивания, двумерные и трехмерные зависимости, графики интегральных функций распределения и прочие способы наглядного представления информации. Благодаря широкому набору встроенных математических функций и средств их реализации можно изобразить любую взаимосвязь различных переменных, например:

  • статистика эффективности работы командной работы;
  • динамика квартальных продаж группы продуктов по филиалам компании;
  • котировки фондовой биржи;
  • вероятности снижения и повышения спроса на ваши услуги при появлении новых конкурентов.

Как эффективно использовать R и RStudio для эффективной работы с большими данными в рамках конкретных бизнес-кейсов, вы узнаете на нашем образовательном курсе «Анализ данных и визуализация в R».

Программа практического тренинга основы R, Анализ данных и визуализация в R

Кому нужны курсы по аналитике больших данных и R

Практический курс Анализ данных и визуализация в R предназначен для статистиков, аналитиков, руководителей, специалистов по работе с большими данными и ученых (Data Scientist), которые хотят получить расширенную  практическую и теоретическую подготовку по использованию RStudio в проектах анализа Big Data.

В результате обучения вы получите следующие знания и навыки:

  • разберетесь с базовыми положениями науки о данных (Data Science), интеллектуального анализа данных (Data Mining), основами статистики и кейсами практического применения этих исследовательских методов в бизнесе;
  • поймете, что такое машинное обучение (Machine Learning) и искусственный интеллект;
  • освоите принципы построения алгоритмов регрессии, классификации и кластерного анализа;
  • сможете самостоятельно обрабатывать датасеты для подготовки к анализу;
  • научитесь наглядно представлять результаты анализа больших данных с помощью средств визуализации RStudio;
  • поймете, как корректно интерпретировать результаты анализа и моделирования;
  • получите базовые навыки программирования на языке R и работы в среде RStudio.

Предварительный уровень подготовки

  • Понимание основ статистики;
  • Базовый опыт работы с языками программирования или скриптами.

По окончании курса «Анализ данных и визуализация в R» в нашем лицензированном учебном центре «Школа Больших Данных» вы получите сертификат о повышении квалификации государственного образца.

Курсы по Data Science и Machine Learning

Как построен курс Анализ данных и визуализация в R

Продолжительность: 5 дней, 40 академических часов

Методические материалы: учебное пособие на русском языке

Данный практический курс Курс Анализ данных и визуализация в R научит вас эффективно выполнять статистическую аналитику больших объемов информации с помощью языка R и среды RStudio.

В процессе обучения вы:

  • освоите теоретические основы аналитики больших данных;
  • узнаете, как загружать, сохранять и преобразовывать данные;
  • научитесь писать функции, создавать графики и сопоставлять базовые статистические модели с данными;
  • овладеете навыками создания отчетов и документирования кода.

Дополнительно к теоретическим основам, курс Анализ данных и визуализация в R сфокусирован на практических инструментах, необходимых для эффективной аналитики и визуализации больших данных. Вы поработаете с многоразмерными данными и освоите средства интерактивной визуализации.

курсы обучения Hadoop и машинного обучения

Программа курса «Анализ данных и визуализация в R»

  1. Основы статистики и простая линейная регрессия
    • Что такое ваши данные
    • Статистические выводы
    • Введение в машинное обучение
    • Простая линейная регрессия
    • Диагностика и трансформация
    • Коэффициент определенности
  2. Базовое программирование с R
    • Введение в R. Что такое R?
    • R-Studio, пакеты и рабочая область
    • Основные элементы языка R
    • Типы объектов данных. Локальный импорт/экспорт данных
    • Введение функций и управляющих операторов
    • Углубленное изучение объектов данных
    • Функции. Программирование функций
  3.  Базовые элементы данных
    • Преобразование данных (Reshape, Split, Combine)
    • Символы. Обработка строк. Даты и временные метки
    • Сбор Веб-данных
    • API источники данных
    • Подключение к внешней базе данных
  4. Манипулирование данными с помощью «dplyr»
    • Подмножество, преобразование и переупорядочение наборов данных
    • Объединение наборов данных
    • Групповые операции над наборами данных
  5. Графика данных и визуализация данных
    • Основные подходы к визуализации данных и графики данных. Base, Grid, Lattice, ggplot2
    • Построение графиков больших данных с ggplot2
  6. Расширенная визуализация в R
    • Настраиваемая графика с помощью ggplot2
    • Титулы, системы координат, масштабы, темы, метки, легенда scatterplot с многоразмерными данными, визуализация временной последовательности, карты
    • Интерактивная визуализация в R.

курсы обучения Hadoop и машинного обучения

Скачать программу курса «Анализ и визуализация больших данных с R» в формате pdf