Все курсы
Авторский учебный курс «Администрирование базы данных Greenplum / Arenadata DB»
Код курса | Даты начала курса | Стоимость обучения | Длительность обучения | Формат обучения |
---|---|---|---|---|
GRAD | 13 мая 2024 02 сентября 2024 |
120 000 руб. | 40 ак.часов | Дистанционный |
Регистрация |
Что такое Greenplum и Arenadata DB
Greenplum — это основанная на PostgreSQL реляционная СУБД с открытым исходным кодом. Она ориентирована на аналитику больших данных, т.е. аналитические сценарии (OLAP) чтения больших массивов информации и поддерживает колоночный способ хранения данных. Ее массивно-параллельная архитектура (MPP, Massively Parallel Processing) без разделения ресурсов отлично подходит для OLAP-сценариев, поскольку аналитические СУБД работают с огромными объёмами данных, которые постоянно растут. Скорость вычислений в MPP-системе прямо пропорциональна числу узлов в кластере. Также MPP-архитектура обеспечивает высокую отказоустойчивость: кластер БД отвечает на запросы даже при отказе некоторых узлов.
Будучи реляционной СУБД, Greenplum поддерживает ACID-требования к транзакциям и ANSI SQL, а также отлично обрабатывает локальные и распределенные запросы с JOIN-операторами. Поэтому Greenplum хорошо работает в аналитических сценариях, включая предиктивную аналитику, прогнозирование и скоринг событий, а также предоставление данных для BI-дэшбордов.
Greenplum представляет собой несколько экземпляров PostgreSQL, работающих как единая СУБД благодаря мастер-хосту, на котором развёрнут мастер-сегмент — главный экземпляр PostgreSQL. Именно к мастер-сегменту подключаются пользователи и отправляют на него все SQL-запросы. Мастер-сегмент не содержит данных, а только принимает входящие подключения, собирает и систематизирует запросы, чтобы маршрутизировать их по сегментам, которые содержат фактические данные и выполняют запросы.
Программа курса «Администрирование базы данных Greenplum / Arenadata DB»
- Введение в СУБД Greenplum / Arenadata DB
- Архитектура Greenplum / Arenadata DB / MPP
- Greenplum Мастера и Сегменты
- Greenplum Interconnect
- Отказоустойчивость
- Выбор дистрибутива
- Установка и настройка Greenplum / Arenadata DB
- Требования по установке.
- Планирование и масштабирование.
- Установка с использованием ADCM. Ручная установка.
- Настройка Data Layout и параметров окружения.
- Управление сервисами Greenlum / Arenadata DB
- Клиентское подключение к БД. Клиентские приложения и утилиты.
- Greenplum / Arenadata DB в облаке
- Практическая работа: Установка и настройка Arenadata DB с использованием ADCM
- Практическая работа: Установка и настройка Greenplum DB
- Терминология и основные концепции Greenplum /Arenadata DB
- Распределенная БД и политики распределения
- PQE — Parallel Query Execution
- MPP — Massive Parallel Processing
- MVCC — MultiVersion Concurrency Control
- PXF – Platform Extension Framework
- Схемы и объекты СУБД Greenplum /Arenadata DB
- Логическая и физическая структура БД
- Установка по умолчанию: схемы и шаблоны
- Табличные пространства в Greenplum / Arenadata DB
- Внешние таблицы
- Создание и обслуживание индексов
- Создание и управление представлениями (views)
- Практическая работа: Предварительная настройка кластера Greenplum DB
- Операции обслуживания СУБД Greenplum / Arenadata DB
- Управление ресурсами кластера- ресурсные группы
- Управление данными в Greenplum /Arenadata DB
- Вставка, обновление и удаление строк
- Очистка (Vacuum) базы данных
- Масштабирование (Расширение) кластера
- Планы запросов
- Управление файлами логов БД
- Реиндексация
- Задачи операций обслуживания
- Практическая работа: Настройка и использование ресурсных групп на кластере Greenplum
- Практическая работа: Операции обслуживания базы данных Greenplum
- Практическая работа: Масштабирование кластера Greenplum добавлением узлов сегментных хостов
- Загрузка и выгрузка данных в Greenplum / Arenadata DB
- Механизмы загрузки и выгрузки данных
- Использование внешних таблиц
- Сценарии загрузки данных в БД
- Интеграции с другими источниками: Kafka, Hadoop, NiFi, S3
- Практическая работа: Настройка доступа Greenplum к внешним данным и работа с внешними таблицами
- Практическая работа: Настройка сервиса PXF для кластера Greenplum
- Партиционирование таблиц
- Создание партиционированных таблиц
- Ключ партиционирования
- Разные типы хранения
- Tablespace
- Мульти-партиционирование
- Удаление, разбиение, обмен партиций
- Внешние таблицы (обычные и web-внешние)
- Практическая работа: Загрузка в партиционированные таблицы
- Отказоустойчивость в Greenplum / Arenadata DB
- Опции отказоустойчивости для Greenplum / Arenadata DB
- Зеркалирование сегментов в Greenplum
- Отказоустойчивость Сегментов и восстановление в Greenplum
- Зеркалирование Мастеров в Greenplum
- Восстановление сегмента. Восстановление мастера
- Практическая работа:Обеспечение отказоусточивости кластера Greenplum с помощью зеркалирования сегментов
- Практическая работа: Обеспечение отказоусточивости кластера с помощью зеркалирования Мастера
- Практическая работа: Восстановление после сбоя зеркал сегментов и мастера
- Резервное копирование и восстановление БД
- Основные принципы операций восстановления и резервного копирования
- Backup утилиты Greenplum / Arenadata DB
- Процедура резервного копирования
- Процедура восстановления БД
- Практическая работа: Резервное копирование и восстановление кластера Greenplum DB
- Мониторинг и troubleshooting СУБД
- Мониторинг и анализ состояния системы (System state)
- Инструменты мониторинга Arenadata DB / ADCM
- Основные причины проблем производительности
- Собираемые метрики и сбор статистики
- Управление нагрузкой и оповещениями
- Мониторинг журналов: анализ сообщений об ошибках и идентификация проблемных запросов
- Оптимизация параметров БД и дизайна БД
- Best Practices
- Практическая работа: Настройка мониторинга кластера Greenplum DB
- Безопасность в Greenplum / Arenadata DB
- Контроль доступа и обеспечение безопасности
- RBAC в СУБД Greenplum / Arenadata DB
- Поддержка шифрования и аутентификации с использованием SSL
- Интеграция с LDAP
- Практическая работа: Настройка LDAP аутентификации для Greenplum
Примечание: лабораторные работы в курсе проводятся с использованием лабораторного стенда в облаке AWS или Яндекс/VKcloud на community версии дистрибутива Greenplum / Arenadata DB 6.XX
Программа курса «GRAD: Администрирование Greenplum / Arenadata DB»
Укажите e-mail, на который будет оправлена ссылка для скачивания файла:
О курсе «Администрирование базы данных Greenplum / Arenadata DB»
5-дневный обучающий курс «Администрирование базы данных Greenplum / Arenadata DB» предназначен для подготовки администраторов и специалистов, отвечающих за установку и обслуживание базы данных Greenplum / Arenadata DB, включая предварительную подготовку и планирование систем для установки Greenplum, настройку конфигурации сервисов, табличного пространства, безопасности и клиентского доступа, а также операций мониторинга и решения проблем с эксплуатацией Greenplum / Arenadata DB. Курс предоставляет необходимые знания и навыки по сопровождению и поддержке базы данных Greenplum / Arenadata DB при эксплуатации в облачной инфраструктуре и дата центре. Подробно рассматриваются вопросы загрузки/выгрузки данных, средства резервного копирования и восстановления системы, настройки безопасности и интеграция.
Соотношение теории к практике: 50/50
Аудитория:
Администраторы и специалисты желающие получить практические навыки по установке, конфигурированию, обслуживанию и управлению кластером Greenplum / Arenadata DB.
Предварительная подготовка:
- Знание базовых команд Linux (опыт работы с командной строкой, файловой системой , POSIX, текстовыми редакторами vi, nano)
- Основы работы с базами данных
- Опыт работы с PSQL/ SQL
Кто проводит курс
Комиссаренко Николай
Томский Политехнический Институт (Томск, 1994)
Профессиональные компетенции:
- Сертифицированный тренер Arenadata (2019)
- Построение Data Lake и аналитика больших данных на решениях Arenadata, Cloudera, HortonWorks, EMC (Hadoop, Isilon), Pivotal, облачные решения, cистемы хранения данных уровня enterprise, информационная безопасность
- EMC Certified Instructor (2007)
- Dell EMC Specialist – Cloud Architect (2006)
- Dell EMC XtremeIO, Isilon – Storage Aministrator, Data Science Specialist (2006)
- IT Service Manager (2006)
- Certified Information System Security Professional (CISSP) (2006 -2010)
- Certified Information Security Manager (CISM)
Отзывы наших клиентов о курсе
География наших клиентов
- Москва
- Санкт-Петербург
- Нижний Новгород
- Екатеринбург
- Казань
- Краснодар
- Красноярск
- Перьм
- Челябинск
- Новосибирск
- Томск
- Тверь
- Саратов
- Самара
- Ростов-на-Дону
- Хабаровск
- Волгоград
- Калуга
- Якутск
- Севастополь
- Тольяти
- Владивоссток
- Тюмень
- Южно-Сахалинск
- Уфа
- Ставрополь
- Минск
- Алматы
- Астана
- Ташкент
- Душанбе
- Бешкек