Курс «Apache Spark Администратор»

Когда:
Декабрь 11, 2019 – Декабрь 13, 2019 весь день
2019-12-11T00:00:00+03:00
2019-12-14T00:00:00+03:00
Где:
«Школа Больших Данных»
Илимская ул.
5 корпус 2, Москва, Россия
127576
Стоимость:
54000
Контакт:
Ольга Бурых
+7(915) 307-00-74

3-дневный практический курс администрирования кластера Apache Spark, использование SparkSQL, организация потоковой обработки Spark Streaming, библиотеки машинного обучения SparkML, построение графов Spark GraphX 

Аудитория: Специалисты, желающие научиться приемам администрирования кластера Apache Spark с использованием практических примеров реализации методов Потоковой обработки данных с использованием Spark Streaming, применения встроенных библиотек Машинного обучения Spark MLlib, работа с графами и доступ к данным с Spark SQL.

Предварительный уровень подготовки:

  • Начальный опыт работы в Unix

Продолжительность: 3 дня, 24 академических часа.

Стоимость обучения: 54.000 рублей

3-дневный интенсивный практический тренинг по знакомству с платформой для распределенной  обработки больших данных Apache Spark. В ходе лекций и лабораторных работы вы научитесь:

  • настраивать кластер Apache Spark для запуска задач на Scala и R при обработке больших массивов неструктурированных данных, применяя алгоритмы машинного обучения встроенных библиотек Spark MLLib;
  • понимать разницу использования различных форматов хранения данных и использования RDDdataframes и datasets;
  • обращаться к данным с использование Spark SQL или Hive QL;
  • настраивать и анализировать данные в потоке Spark Streaming;
  • интегрировать компоненты Apache Spark с другими компонентами экосистем Hadoop.

Программа курса «Администрирование кластера Apache Spark»

Скачать программу курса «Администрирование кластера Apache Spark» в формате pdf