Курс «Hadoop для инженеров данных»

Hadoop для инженеров данных- организация потоков данных для формирования Data Lake
Когда:
Июнь 24, 2019 – Июнь 28, 2019 весь день Europe/Moscow Часовой пояс
2019-06-24T00:00:00+03:00
2019-06-29T00:00:00+03:00
Где:
Учебный Центр "Школа Больших Данных"
Илимская ул.
5 корпус 2, Москва, Россия
127576
Стоимость:
90,000 рублей
Контакт:
Ольга Бурых
+7(915) 307-00-74
Курс «Hadoop для инженеров данных» @ Учебный Центр "Школа Больших Данных" | Москва | Россия

5-дневный практический тренинг по настройке batch/streaming потоков данных средствами Apache SparkFlumeKafkasqoopHive для организации озера данных (Data Lake) на кластере Hadoop и процессов ETL/ELT.

Аудитория: Специалисты по работе с большими данными, ответственные за настройку и сопровождение ввода данных в Data Lake, а также желающие получить теоретические знания и практические навыки по подготовке больших данных, специфике использования процессов ETL/ELT в кластерах Hadoop, и организации pipelines в Hadoop, Batchstream и realtime процессинга больших данных с использованием компонентов экосистемы Hadoop.

Предварительный уровень подготовки:

  • Начальный опыт работы в Unix
  • Начальный опыт работы с SQL

Продолжительность: 5 дней, 40 академических часа.

Данный курс  направлен на формирование практических и теоретических  навыков планирования, формирования и сопровождения Data Lake (озеро данных). Рассматриваются примеры интеграции, настройки и обслуживания “pipelines” – традиционных источников поступления данных (корпоративные базы данных, web-логи, файловые системы, интернет данные, транзакции)  для последующего анализа больших данных. Практические занятия выполняются в  AWS и локальной кластерной системе с использованием дистрибутивов  Cloudera Hadoop и HortonWorks Data Platform.

Соотношение теории к практике 40/60

Продолжительность5 дней, 40 академических часов.

Стоимость обучения: 90.000 рублей 

Скачать программу курса «Hadoop для инженеров данных» в формате pdf