ADBR: Arenadata DB для разработчиков

Курс «Arenadata DB для разработчиков»

Ближайшая дата курса Arenadata DB для разработчиков 6-9 октября
  24-27 ноября
Стоимость обучения 144.000 рублей
Стоимость сертификационного экзамена  9.000 рублей

Регистрация

Что представляет собой курс «Arenadata DB для разработчиков»

Интенсивный 4-дневный курс, который даёт необходимые знания для эффективной и безопасной эксплуатации ADB в продуктовых средах, развертывания схем и таблиц, написания процедур,  постройки витрин, дает знания о загрузке, обработке и выгрузке данных, настройках безопасности и дополнительных расширениях, позволяет решать проблемы с производительностью и другие часто возникающие ошибки.

Аудитория курса

«Arenadata DB для разработчиков» будет полезен разработчикам, планирующим использовать или уже применяющим в работе ADB, или тем, в чьих задачах стоит миграция на ADB. Акцент при проведении курса будет сделан на разборе практических примеров. 

Для того, чтобы успешно пройти курс «Arenadata DB для разработчиков», потребуется предварительная подготовка: 

  • Базовые знания по работе с командной строкой Linux;
  • Понимание основ работы реляционных баз данных;
  • Базовые знания T-SQL (опыт написания запросов из нескольких таблиц);
  • Знакомство с ETL/ELT процессами

Как проходит курс

Обучение на курсах Arenadata сделано максимально удобным для заказчиков и включает различные форматы. Занятия могут проходить на их территории, в учебных классах Arenadata или нашего партнёра — «Школы Больших Данных». Также мы проводим лекции дистанционно в онлайн-формате.  

Наши лекторы читают курсы для двух форматов групп:

  • Корпоративные (заказчик записывает на курс команду от десяти человек);
  • Открытые (смешанные группы, которые набираются представителями нескольких компаний). 

Сертификация

Прохождение курса «Arenadata DB для разработчиков» подтверждается именным сертификатом. Чтобы получить его, слушателям необходимо успешно сдать экзамен. Пройти его можно и без предварительного обучения при условии уже имеющихся знаний по разработке в Arenadata Databese. 

Программа курса:

День 1:

Обзор архитектуры ADB

  • Концепция MPP и её имплементация в ADB. Терминология и архитектура СУБД. Интерконнект. Выполнение запросов. Отказоустойчивость.

Основные отличия от других СУБД

  • Основные отличия ADB от Hadoop, ADQM, Oracle, Postgres.

Подключение к БД

  • Реквизиты. Доступы. psql.
  • Лабораторная работа

Устройство БД

  • Шаблоны БД. Логическая схема данных. Обзор дефолтных схем. Основные объекты для работы с БД.
  • Лабораторная работа

Пользователи и группы

  • Роль и пользователь, группы. Доступы. Создание пользователей, управление. Интеграция с LDAP.
  • Лабораторная работа

Создание таблицы в БД

  • Основные правила создания таблиц. Типы данных. Распределение таблицы. Skew. Констрейнты. Тип хранения данных. Компрессия.
  • Лабораторная работа

День 2:

Выполнение запросов

  • Получение плана. Оптимизаторы. Статистика выполнения. Разбор плана запроса. Redistribute и Broadcast. Поиск узких мест.
  • Лабораторная работа

Партиционирование таблицы

  • Создание партиционированных таблиц. Ключ партиционирования. Разные типы хранения. Файлспейсы и тейблспейсы. Мульти-партиционирование. Удаление. Разбиение. Обмен партиций. Внешние таблицы. Загрузка в партиционированные таблицы.
  • Лабораторная работа

Индексы

  • Применимость индексов. Типы. Best practices. Управление индексами. Основные параметры управления индексами в запросе.
  • Лабораторная работа

Транзакции

  • Обзор. Уровни изоляции. CAP-теорема. 
  • Лабораторная работа

MVCC

  • Цели. Реализация. Bloat. VACUUM. VACUUM FULL. Пример. Регламенты.
  • Лабораторная работа

Блокировки

  • Синтаксис. Пример.
  • Лабораторная работа

Статистика

  • Цели. Сбор статистики.
  • Лабораторная работа

Ресурсные группы

  • Обзор. Ограничиваемые ресурсы. Сценарии использования. GUCs.
  • Лабораторная работа

День 3:

Внешние таблицы.

  • Обычные внешние таблицы. Web-внешние таблицы.

GPFDIST

  • Сценарии. Сервер gpfdist. Создание внешних таблиц. Опции LOCATION. Достижение лучшей производительности. Параметры GUC. Примеры.
  • Лабораторная работа

GPLOAD

  • Использование утилиты
  • Лабораторная работа

PXF

  • Архитектура. Директории сервиса. Конфигурационные файлы. Логи. Управление сервисом. HDFS. HBASE. Hive. JDBC. Pushdown. Batching. Pooling. User impersonation.
  • Лабораторная работа

COPY

  • Синтаксис. Пример.
  • Лабораторная работа

UDF

  • Цели. PL/SQL. PL/python. C-функции. PLContainer. Волатильность функций. Доверенность функций. 
  • Лабораторная работа

Продвинутые запросы

  • Описание языка запросов. Особенности использования. Встроенные функции и операторы. Оконные функции. Common Table Expressions. Работа с JSON и XML данными. Обработка запросов разными оптимизаторами. Особенности работы с партиционированными таблицами.
  • Лабораторная работа

Дополнительные модули и библиотеки

  • Встроенная аналитика на основе MADLib. Работа с географическими данными и объектами с помощью PostGis. Дополнительные модули, поддерживаемые в GP.
  • Лабораторная работа

День 4:

Принципы работы, синтаксис запросов и функций, процедур. Миграция СУБД

  • Синтаксис запросов/функций в ADB. Соответствие типов DDL. Конструкции SQL. Конструкции PL/SQL. Примеры миграции Oracle -> Greenplum. Блокеры
  • Лабораторная работа

ETL vs ELT подходы

Интеграция источников данных и ADB

  • Batch-загрузка. PXF. Примеры загрузки данных по JDBC из СУБД Oracle
  • Лабораторная работа

Реализация DWH на базе ADB

  • Загрузка данных в ODS/DDS слои. Загрузка справочников SCD1/SCD2. Загрузка фактовых таблиц.
  • Лабораторная работа

Создание витрины данных

  • Примеры распределения данных и оптимизация для построения витрины (ELT)
  • Лабораторная работа

Экзамен

Регистрация