Все курсы
Авторский курс Greenplum для инженеров данных и аналитиков данных
Код курса | Даты начала курса | Стоимость обучения | Длительность обучения | Формат обучения |
---|---|---|---|---|
GPDE | 08 апреля 2024 24 июня 2024 09 сентября 2024 |
72 000 руб. | 24 ак.часов | Дистанционный |
Регистрация |
3 дня практического обучения аналитиков, дата-инженеров и администраторов баз данных: анализ Big Data, организация ETL/ELT-процессов, построение корпоративных озер и хранилищ данных с масштабируемой отказоустойчивой open-source СУБД Greenplum Database.
Что такое Greenplum
Greenplum – это массивно-параллельная (Massive Parallel Processing, MPP) реляционная СУБД с открытым исходным кодом для хранилищ данных с гибкой горизонтальной масштабируемостью и столбцовым хранением данных на основе PostgreSQL. Несколько взаимосвязанных экземпляров базы данных PostgreSQL объединены в кластер Greenplum без разделения ресурсов (Shared Nothing). Каждый узел кластера взаимодействует с другими для выполнения вычислительных операций, но имеет собственные ресурсы: оперативную память, операционную систему и жесткие диски. Благодаря особенностям MPP-архитектуры и мощному оптимизатору запросов, эта NoSQL-СУБД отличается надежностью и высокой скоростью обработки SQL-запросов над большими объемами данных.
Эта MPP-СУБД широко применяется для аналитики больших данных в промышленных масштабах. Она обеспечивает надежное безопасное хранение и аналитическую обработку сотен терабайт структурированных и слабоструктурированных данных для решения различных бизнес-задач. Например, построение систем предиктивной аналитики, корпоративных озер и хранилищ данных, организации регулярной отчетности и анализа оттока клиентов. Поэтому Greenplum широко применяется в ритейле, банках, телекоммуникационных компаниях, государственных предприятиях и других секторах экономики для организации витрин данных и быстрой аналитики Big Data с генерацией сложных отчетов в режиме практически реального времени.
Именно на базе Greenplum разработана отечественная MPP-СУБД Arenadata DB (ADB), адаптированная для корпоративного использования и зарегистрированная в Едином реестре российских программ. Поэтому Arenadata DB полностью соответствует политике импортозамещения и активно используется множеством государственных организаций и частных компаний России в качестве надежного средства построения многоуровневых озер и хранилищ данных в рамках комплексной цифровизации предприятий.
Кому нужны курсы по Greenplum
Авторский курс по Greenplum в Школе Больших Данных ориентирован на следующие категории ИТ-специалистов:
- инженер данных (Data Engineer);
- аналитик больших данных (Data Analyst);
- администратор больших данных (Big Data Administrator);
- администратор баз данных (Database Administrator).
Практические курсы по Greenplum предназначены для дата-инженеров, администраторов, системных архитекторов, аналитиков и разработчиков, которые хотят получить практические навыки по эффективной организации ETL/ELT-процессов, а также построению корпоративных озер и хранилищ данных на базе MPP-СУБД Greenplum.
О курсе
Обучающий курс «Greenplum для дата-инженеров» предназначен для инженеров и аналитиков данных, разработчиков и специалистов по ETL/ELT-процессам, архитекторов корпоративных озер и хранилищ данных, а также администраторов баз данных. Курс даёт необходимые знания по эффективной и безопасной эксплуатации GreenPlum в качестве средства быстрой аналитики больших данных, а также основы многоуровневых Data Lake и КХД. Освоение каждой практической темы подкрепляется лабораторной работой. Выполнять лабораторные работы предлагаем на базе дистрибутива native Greenplum или Arenadata DB — выбор по желанию Слушателя.
Аудитория
Инженеры данных, аналитики Big Data, системные архитекторы и разработчики, администраторы баз данных, желающие получить практические навыки по эксплуатации кластера Greenplum.
Соотношение теории к практике 50/50
Предварительная подготовка
- Знание базовых команд Linux(опыт работы с командной строкой, файловой системой, POSIX, текстовыми редакторами vi, nano)
- Опыт работы с SQL
По завершении курса вы получите сертификат нашего учебного центра «Школа Больших Данных».
Программа курса GreenPlum для инженеров данных
Часть 1. Основы Greenplum: Greenplum как реляционная MPP СУБД
- Введение в Greenplum
- Архитектура Greenplum
- Партиционирование таблиц, индексы
- Транзакции и блокировки
- Оптимизация и планы запросов
- Лабораторная работа
Часть 2. Внешние данные и код: Greenplum как агрегатор данных и исполнитель кода
- Механизм внешних таблиц, протоколы, PXF
- Загрузка данных в Greenplum
- Механизм UDF
- Работа с JSON, XML
- Экосистема и дополнительные библиотеки
- Лабораторная работа
Часть 3. Greenplum в современных хранилищах данных
- Архитектура озера данных
- ETL, ELT и подготовка данных
- GPSS и интеграция Greenplum с Kafka и Nifi
- Обработка данных из Greenplum с помощью Spark
- Построение многоуровневого хранилища на Greenplum
- Лабораторная работа
Программа курса «GPDE: GreenPlum для инженеров данных и аналитиков данных»
Укажите e-mail, на который будет оправлена ссылка для скачивания файла:
Кто проводит курс
Королев Михаил
МГУ им. М.В. Ломоносова (Москва, 1992)
Профессиональные компетенции:
- Сертифицированный разработчик Spark и Hadoop (CCA Cloudera)
- Сертифицированный разработчик (Cloudera Certified Professional Data Engineer)
- Построение корпоративных хранилищ и озер данных (Cloudera CDH, Hadoop)
- Организация ETL-конвейеров (ApacheAirflow, Spark, Apache Livy)
- Поддержка инфраструктуры больших данных (Apache Hive,HBase, Kafka,Elasticsearch)
- Руководитель проектов с корпоративными данными
- Ведущий Data Engineer АО “Альфастрахование”, Москва
Отзывы наших клиентов о курсе
Заур Тарчоков ПАО «Промсвязьбанк»
Светлана Спирина БанкиРу
Павел Акулин ПАО КБ Центр-инвест
География наших клиентов
- Москва
- Санкт-Петербург
- Нижний Новгород
- Екатеринбург
- Казань
- Краснодар
- Красноярск
- Перьм
- Челябинск
- Новосибирск
- Томск
- Тверь
- Саратов
- Самара
- Ростов-на-Дону
- Хабаровск
- Волгоград
- Калуга
- Якутск
- Севастополь
- Тольяти
- Владивоссток
- Тюмень
- Южно-Сахалинск
- Уфа
- Ставрополь
- Минск
- Алматы
- Астана
- Ташкент
- Душанбе
- Бешкек