Курс Cloudera Impala Data Analytics

обучение Cloudera Impala, курсы Cloudera Impalaкурсы Клаудера Импала,

Практический курс Cloudera Impala Data Analytics

Ближайшая дата курса  
   
Стоимость обучения   18.000 рублей
Код курса  IMPA

курсы обучения Hadoop и машинного обучения

1-дневный практический курс по Cloudera Impala для специалистов, инженеров данных и аналитиков, работающих с SQL-on-Hadoop.

 

Что такое Cloudera Imapala и где это используется

Cloudera Impala – это коммерческий продукт от компании Cloudera, массово-параллельный механизм интерактивного выполнения SQL-запросов к данным, хранящимся в Apache Hadoop (HDFS и HBase). Он написан на написанный на языке С++ и распространяется по лицензии Apache 2.0. Импала также называют MPP-движком (Massively Parallel Processing), распределенной СУБД и даже базой данных стека SQL-on-Hadoop.

Cloudera Impala используется для быстрой аналитики больших данных, хранящихся в Apache Hadoop (HDFS и HBase). Например, когда требуется оперативно ответить на сложный логический запрос, при поиске оптимального авиамаршрута или другой подобной задачи с непростой логистикой. Импала автоматически транслирует SQL-запрос в исполнительный код, позволяя работать с данными, хранящимися в HBase или HDFS, как с реляционными таблицами, формируя различные выборки и условные фильтрации, а также изменяя значение данных.

Как реализовать это на практике, расскажет краткосрочное обучение Cloudera Impala от лицензированного учебного центра «Школа Больших Данных«.

Программа курса обучения

Кому нужно обучение Cloudera Imapala

Обучающие курсы Cloudera Impala предназначены для специалистов по SQL, инженеров данных и аналитиков, которые имеют опыт работы реляционными базами данных и хотят применить его к организации хранения, настройке импорта и экспорта данных с использованием Cloudera Impala в кластере Hadoop.

Предварительная подготовка

  • Опыт работы в Unix
  • Опыт написания запросов SQL
  • Знание основ Hadoop

Успешно окончив обучение Cloudera Impala в нашем лицензированном учебном центре, вы получите сертификат о повышении квалификации государственного образца.

курсы обучения Hadoop и машинного обучения

Как построены курсы Cloudera Impala в Школе Больших Данных

Длительность: 1 день, 8 академических часов

Соотношение теории к практике: 50/50

Практическое обучение Cloudera Impala для администраторов, инженеров и аналитиков данных, использующих Cloudera Impala, организовано в виде однодневного тренинга. Всего за 1 рабочий день вы изучите методы доступа к данным с использованием синтаксиса SQL для выполнения OLAP-запросов в распределенной среде в режиме near-realtime. Также за 8 академических часов вы освоите, как эффективно сделать загрузку и выгрузку данных с использованием метаданных в Hive Metastore.

Наши курсы Cloudera Impala включают сценарии интеграции Импала c Hive, Hbase, а также особенности исполнения запросов и JOIN операций. Практические занятия выполняются в Amazon Web Services (AWS) и локальной кластерной системе с использованием дистрибутивов Cloudera Hadoop.

Программа курса Cloudera Impala, обучение Cloudera Impala

Программа курса Cloudera Impala Data Analytics

  1. Введение в Cloudera Impala

  • Введение в Cloudera Impala: архитектура и компоненты.
  • Impala синтаксис, типы данных, написание запросов, загрузка данных, использование Hive Metastore.
  • Лабораторная работа.
  1. Интеграция Cloudera Impala

  • Загрузка данных в таблицы Запросы через HBase.
  • Оптимизации производительности с использование Partition, Buckets.
  • Форматы файлов для Cloudera Impala (Parquet, ORC).
  1. Оптимизация Impala запросов

  • Сравнение JOIN операций для исполнения инструментами экосистемы Hadoop.
  • Map JOIN. Comon JOIN. Skewed JOIN. Collocated JOIN.
  • Оптимизация запросов.
  1. Сценарии применения Impala

Для регистрации на курсы «IMPA: Cloudera Impala Data Analytics»  заполните форму по ссылке ниже 

курсы обучения Apache AirFlow

Скачать программу курса «IMPA: Cloudera Impala Data Analytics» в формате pdf