IMPA: Cloudera Impala Data Analytics

IMPA: Cloudera Impala Data Analytics

Курс: Cloudera Impala Data Analytics

Ближайшая дата курса  
   
   
Стоимость обучения    18.000 рублей

курсы обучения Hadoop и машинного обучения

1-дневный практический курс по Cloudera Impala разработан для специалистов, инженеров данных и аналитиков, работающих с Cloudera Impala.

Длительность: 8 ак. часов

О курсе

Практический курс для администраторов и аналитиков, использующих компонент Cloudera Impala. Рассматриваются методы доступа к данным с использованием синтаксиса SQL для выполнения OLAP-запросов в распределенной среде в режиме near-realtime, загрузка и выгрузка данных с использованием метаданных в Hive Metastore. Сценарии интеграции Cloudera Impala c Hive, Hbase, особенности исполнения запросов и JOIN операций. Практические занятия выполняются в AWS и локальной кластерной системе с использованием дистрибутивов Cloudera Hadoop.

Аудитория

Специалисты SQL, имеющие и желающие применить опыт работы с реляционными базами данных для организации хранения, настройки импорта и экспорта данных с использованием Cloudera Impala в кластере Hadoop.

Предварительная подготовка

  • Опыт работы в Unix
  • Опыт написания запросов SQL
  • Знание основ Hadoop

Программа курса IMPA: Cloudera Impala Data Analytics

  1. Введение в Cloudera Impala
  • Введение в Cloudera Impala: архитектура и компоненты.
  • Impala синтаксис, типы данных, написание запросов, загрузка данных, использование Hive Metastore.
  • Лабораторная работа.
  1. Интеграция Cloudera Impala
  • Загрузка данных в таблицы Запросы через HBase.
  • Оптимизации производительности с использование Partition, Buckets.
  • Форматы файлов для Cloudera Impala (Parquet, ORC).
  1. Оптимизация Impala запросов.
  • Сравнение JOIN операций для исполнения инструментами экосистемы Hadoop.
  • Map JOIN. Comon JOIN. Skewed JOIN. Collocated JOIN.
  • Оптимизация запросов.
  1. Сценарии применения Impala

Для регистрации на курсы «IMPA: Cloudera Impala Data Analytics»  заполните форму по ссылке ниже или позвоните по телефону +7 (915) 307-00-74

курсы обучения Apache AirFlow

Скачать программу курса «IMPA: Cloudera Impala Data Analytics» в формате pdf