GreenPlum для инженеров данных и аналитиков данных

5 дней практического обучения аналитиков, дата-инженеров и администраторов баз данных: анализ Big Data, организация ETL/ELT-процессов, построение корпоративных озер и хранилищ данных с масштабируемой отказоустойчивой open-source СУБД Greenplum Database.

Код курса Даты начала курса Стоимость обучения Длительность обучения Формат обучения
GPDE
08 декабря 2025
16 февраля 2026
18 мая 2026
72 000 руб. 24 ак.часов
Количество дней: 5
Дистанционный
Регистрация

О продукте

Greenplum – это массивно-параллельная (Massive Parallel Processing, MPP) реляционная СУБД с открытым исходным кодом для хранилищ данных с гибкой горизонтальной масштабируемостью и столбцовым хранением данных на основе PostgreSQL. Несколько взаимосвязанных экземпляров базы данных PostgreSQL объединены в кластер Greenplum без разделения ресурсов (Shared Nothing). Каждый узел кластера взаимодействует с другими для выполнения вычислительных операций, но имеет собственные ресурсы: оперативную память, операционную систему и жесткие диски. Благодаря особенностям MPP-архитектуры и мощному оптимизатору запросов, эта NoSQL-СУБД отличается надежностью и высокой скоростью обработки SQL-запросов над большими объемами данных.

Эта MPP-СУБД широко применяется для аналитики больших данных в промышленных масштабах. Она обеспечивает надежное безопасное хранение и аналитическую обработку сотен терабайт, структурированных и слабоструктурированных данных для решения различных бизнес-задач. Например, построение систем предиктивной аналитики, корпоративных озер и хранилищ данных, организации регулярной отчетности и анализа оттока клиентов. Поэтому Greenplum широко применяется в ритейле, банках, телекоммуникационных компаниях, государственных предприятиях и других секторах экономики для организации витрин данных и быстрой аналитики Big Data с генерацией сложных отчетов в режиме практически реального времени.

Именно на базе Greenplum разработана отечественная MPP-СУБД Arenadata DB (ADB), адаптированная для корпоративного использования и зарегистрированная в Едином реестре российских программ. Поэтому Arenadata DB полностью соответствует политике импортозамещения и активно используется множеством государственных организаций и частных компаний России в качестве надежного средства построения многоуровневых озер и хранилищ данных в рамках комплексной цифровизации предприятий.

О курсе

Курс даёт необходимые знания по эффективной и безопасной эксплуатации GreenPlum в качестве средства быстрой аналитики больших данных, а также основы многоуровневых Data Lake и КХД. Освоение каждой практической темы подкрепляется лабораторной работой. Выполнять лабораторные работы предлагаем на базе дистрибутива native Greenplum или Arenadata DB — выбор по желанию Слушателя.

Аудитория

Авторский курс по Greenplum в Школе Больших Данных ориентирован на следующие категории ИТ-специалистов:

  • инженер данных (Data Engineer);
  • аналитик больших данных (Data Analyst);
  • администратор больших данных (Big Data Administrator);
  • администратор баз данных (Database Administrator).

Практические курсы по Greenplum предназначены для дата-инженеров, администраторов, системных архитекторов, аналитиков и разработчиков, которые хотят получить практические навыки по эффективной организации ETL/ELT-процессов, а также построению корпоративных озер и хранилищ данных на базе MPP-СУБД Greenplum.

Предварительная подготовка

  • Знание базовых команд Linux (опыт работы с командной строкой, файловой системой, POSIX, текстовыми редакторами vi, nano)
  • Опыт работы с SQL

Программа курса «GreenPlum для инженеров данных»

1. Основы Greenplum: Greenplum как реляционная MPP СУБД

    • Введение в Greenplum
    • Архитектура Greenplum
    • Партиционирование таблиц, индексы
    • Транзакции и блокировки
    • Оптимизация и планы запросов
    • Лабораторная работа

2. Внешние данные и код: Greenplum как агрегатор данных и исполнитель кода

    • Механизм внешних таблиц, протоколы, PXF
    • Загрузка данных в Greenplum
    • Механизм UDF
    • Работа с JSON, XML
    • Экосистема и дополнительные библиотеки
    • Лабораторная работа

3. Greenplum в современных хранилищах данных

    • Архитектура озера данных
    • ETL, ELT и подготовка данных
    • GPSS и интеграция Greenplum с Kafka и Nifi
    • Обработка данных из Greenplum с помощью Spark
    • Построение многоуровневого хранилища на Greenplum
    • Лабораторная работа

Программа курса «GPDE: GreenPlum для инженеров данных и аналитиков данных»

Скачать программу курса «Greenplum для инженеров данных»

Укажите e-mail, на который будет оправлена ссылка для скачивания файла:

Что Вы получите

Успешно окончив курс «GreenPlum для инженеров данных и аналитиков данных» в нашем лицензированном учебном центре «Школа Больших Данных», вы получите удостоверение о повышении квалификации установленного образца.

Кто проводит курс

Королев Михаил
МГУ им. М.В. Ломоносова (Москва, 1988)

Отзывы слушателей курса

GPDE: Greenplum для инженеров данных и аналитиков данных
Анна Семина из компании Ростелеком
Курс очень интересный! Большой объем материал (и теоретическая часть, и практическая) подан увлекательно и легко усваивается благодаря хорошо продуманным лабораторным работам. Отдельно хочу отметить высокий профессионализм, энтузиазм и вовлеченность преподавателя - Михаил Королева!
GPDE: Greenplum для инженеров данных и аналитиков данных
Елена Русина из компании МКБ
Курс пролетел незаметно, в живой, интерактивной обстановке. Лекции были познавательны, интересны и не скучны. Материал подготовлен очень тщательно, в том числе задания в виде лабораторных работ.
GPDE: Greenplum для инженеров данных и аналитиков данных
Светлана Спирина из компании БанкиРу
Все знания, ранее разбросанные, получили структуру и дополнились ценными деталями.
GPDE: Greenplum для инженеров данных и аналитиков данных
Заур Тарчоков из компании ПАО «Промсвязьбанк»
Три дня обучения были наполнены практическими занятиями, которые позволили нам углубиться в мир больших данных, организации ETL и ELT процессов, построения корпоративных озер и хранилищ с использованием отказоустойчивой и масштабируемой MPP СУБД Greenplum. В процессе обучения мы получили доступ к актуальным и полезным материалам, а также возможность задавать вопросы и получать обратную связь от преподавателя. Все это позволило нам приобрести новые навыки и знания, которые обязательно пригодятся в нашей профессиональной деятельности. Курс был организован на высоком уровне, и я хотел бы выразить свою благодарность организаторам и преподавателю за их профессионализм и внимание к каждому участнику. Я уверен, что полученные знания и навыки станут важным шагом в моей карьере и помогут мне стать еще более успешным специалистом в своей области.
GPDE: Greenplum для инженеров данных и аналитиков данных
Высокий уровень организации учебного процесса дружным и доброжелательным коллективом ШБД и профессионализм преподавателя Михаила Королева сделали мое прохождение курса GPDE приятным и полезным.
Оставить отзыв

Чтобы записаться на курс GPDE: GreenPlum для инженеров данных и аналитиков данных позвоните нам по телефону +7 (495) 414-11-21 или заполните форму регистрации ниже.

    Изменение базового тарифа с 1 января 2026 года Подробнее