
Курсы администрирования СУБД> Курсы эксплуатации Arenadata DB в учебном центре «Школы Больших Данных»
Ближайшая дата курса по эксплуатации Arenadata DB | 16 — 19 февраля |
Стоимость обучения | 144.000 рублей |
Стоимость сертификационного экзамена | 9.000 рублей |
Регистрация 4 дня авторизованного практического обучения администрированию и эксплуатации отечественной корпоративной платформы обработки и хранения больших данных на базе масштабируемой отказоустойчивой СУБД с открытым исходным кодом Greenplum Database.
Что такое Arenadata DB
Arenadata DB (ADB) – это российский Big Data продукт, распределенная масштабируемая отказоустойчивая СУБД на базе аналитической массивно-параллельной системы с открытым исходным кодом Greenplum, адаптированная для корпоративного использования и зарегистрированная в государственном реестре РФ программ для ЭВМ.
Arenadata DB обеспечивает надежное безопасное хранение и аналитическую обработку больших объемов (до сотен терабайт) структурированных и слабоструктурированных данных для решения различных бизнес-задач, от предиктивной аналитики, регулярной отчетности и анализа оттока клиентов до построения корпоративных хранилищ данных.
На практике Arenadata DB используется в ритейле, телекоммуникационных компаниях, государственных предприятиях и других секторах экономики для организации витрин данных и быстрой аналитики Big Data с генерацией сложных отчетов в режиме near real-time.
Arenadata DB зарегистрирована в Едином реестре российских программ, соответствует политике импортозамещения и может использоваться в проектах цифровизации государственных организаций и частных компаний России.
Кому нужны курсы по Arenadata DB
Авторизованные курсы Arenadata в Школе Больших Данных по Arenadata DB ориентированы на следующие категории ИТ-специалистов:
- инженер данных (Data Engineer);
- администратор больших данных (Big Data Administrator);
- администратор баз данных (Database Administrator);
- аналитик больших данных (Data Analyst).
Практические курсы по Arenadata DB предназначены для системных администраторов, системных архитекторов и разработчиков, которые хотят получить практические навыки по установке, конфигурированию, обслуживанию и управлению кластером Arenadata DB.
Необходимая предварительная подготовка
- Знание базовых команд Linux (опыт работы с командной строкой, файловой системой , POSIX, текстовыми редакторами vi, nano)
- Опыт работы с SQL
О курсе по эксплуатации Arenadata DB
Обучающий курс «Эксплуатация Arenadata DB» предназначен для системных администраторов, архитекторов, разработчиков, аналитиков, использующих ADB. Курс даёт необходимые знания для эффективной и безопасной эксплуатации ADB в продуктовых средах, загрузке, обработке и выгрузке данных, настройках безопасности и дополнительных расширениях. Освоение каждой практической темы подкрепляется лабораторной работой.
Курс проводится очно. Длительность курса составляет 4 дня. По окончанию курса проводится экзамен, по результатам сдачи которого выдаётся сертификат вендора.
Соотношение теории к практике 40/60
По завершении курса и сертификационного тестирования вы получите следующие документы:
-
сертификат компании Arenadata, подтверждающий знание программных продуктов Arenadata в соответствии с требованиями вендора;
-
сертификат нашего учебного центра «Школа Больших Данных».
Программа курса ADB: Эксплуатация Arenadata DB
- Введение в СУБД Arenadata DB
- Обзор архитектуры ADB
- Концепция MPP и её имплементация в ADB
- Терминология и архитектура СУБД
- Интерконнект
- Выполнение запросов
- Отказоустойчивость
- Настройка и управление СУБД
- Окружение. Основные директории. Логи. Конфигурационные файлы. Файлы данных
- Переменные окружения. Процессы СУБД.
- Управление БД: запуск, остановка, проверка статуса
- Подключение к БД. Реквизиты. Доступы. PSQL
- Управление параметрами СУБД
- Устройство БД.
- Шаблоны БД. Логическая схема данных. Обзор дефолтных схем
- Основные объекты для работы с БД
- Создание таблицы в БД. Основные правила создания таблиц
- Типы данных. Распределение таблицы. Skew
- Констрейнты. Тип хранения данных. Компрессия
- Отказоустойчивость
- Принципы безотказного функционирования БД
- Спилл-файлы
- Восстановление сегмента. Восстановление мастера
- Работа с SQL-запросами
- Выполнение запросов
- Получение плана. Оптимизаторы. Статистика выполнения. Разбор плана запроса
- Redistribute и Broadcast.
- Поиск узких мест
- Партиционирование таблиц
- Создание партиционированных таблиц
- Ключ партиционирования
- Разные типы хранения
- Файлспейсы и тейблспейсы
- Мульти-партиционирование
- Удаление, разбиение, обмен партиций
- Внешние таблицы (обычные и web-внешние)
- Загрузка в партиционированные таблицы
- Индексы
- Определение и назначение
- Применимость индексов
- Типы индексов
- Best practices
- Управление индексами
- Основные параметры управления индексами в запросе
- Управление параллельным доступом с помощью многоверсионности (MVCC – MultiVersion Concurrency Control)
- Цели и реализации
- VACUUM. VACUUM FULL.
- Примеры и регламенты
- Транзакции
- Обзор
- Уровни изоляции
- CAP-теорема
- Статистика
- Цели.
- Сбор статистики
- Работа с командами и ресурсными группами
- COPY: синтаксис и примеры
- Обзор ресурсных групп
- Ограничиваемые ресурсы
- Сценарии использования. GUCs
- Утилиты и службы
- GPFDIST (служба распространения файлов для внешних таблиц): сценарии, сервер gpfdist, примеры
- Создание внешних таблиц
- Опции LOCATION
- Достижение лучшей производительности.
- Параметры GUC
- GPLOAD (утилита запуска задачи по загрузке данных, указанной в управляемом YAML-файле): определение, назначение, использование
- PXF – сервис взаимодействия ADB с внешними источниками данных
- Архитектура
- Директории
- Конфигурационные файлы и логи
- Управление сервисом
- HDFS, HBASE, Hive, JDBC
- Batching. Pooling. User impersonation
- Пользовательские функции (UDF, User-Defined Functions)
- Цели
- Реализация на PL/SQL, PL/python, C.
- PLContainer
- Волатильность и доверенность функций
- Обзор расширений
- Apache Madlib
- PostGIS – 10
- Примеры использования
- Пользователи и группы
- Роли и группы пользователей.
- Доступы.
- Создание пользователей, управление.
- Интеграция с LDAP.
- Резервное копирование (бэкап)
- Принципы бэкапов
- Команды gp_dump/gp_restore. gpbackup/gprestore
- Директории и файлы
- Сжатие бэкапов
- Перенос бэкапов между разными кластерами
- Внешние таблицы
- Мониторинг СУБД
- Архитектура
- Средства мониторинг Diamond, Carbon, Graphite, Grafana.
- Директории
- Собираемые метрики
- Best practices по анализу данных мониторинга
- Алерты
- Администрирование СУБД
- Встроенный монитор активности gpperfmon: архитектура, каталог, полезные таблицы
- Консоль администратора Zeppelin: архитектура, директории, конфигурационные файлы, управление. Обзор ноутбуков. Подсчёт skew на основе ФС.
- Обновление СУБД
- Процесс минорного обновления
- Обзор утилит, входящих в поставку СУБД
Примерный список практических занятий курса по экcплуатации Arenadata DB:
- Запуск, остановка, проверка статуса СУБД
- Подключение к БД. Настройка реквизитов и доступов
- Управление параметрами СУБД
- Работа с шаблонами и дефолтными схемами БД
- Восстановление сегмента и мастера
- Создание, распределение и компрессия таблиц
- Выполнение запросов и поиск узких мест
- Партиционирование таблиц
- Работа с индексами
- Управление параллельным доступом с помощью многоверсионности (MVCC)
- Проведение транзакций
- Сбор статистики
- Работа с командой COPY
- Работа с ресурсными группами
- Работа с утилитами GPFDIST и GPLOAD
- Настройка взаимодействия ADB с внешними источниками данных с помощью сервиса PXF
- Создание пользовательских функций (UDF, User-Defined Functions)
- Работа с расширениями Apache Madlib и PostGIS
- Создание и управление пользователями (группы, роли, интеграция с LDAP)
- Создание, сжатие и перенос бэкапов между кластерами
- Работа со средствами мониторинга СУБД
- Работа с монитором активности gpperfmon и консолью администратора Zeppelin
- Обновление СУБД
Для регистрации на курсы «ADB: Эксплуатация Arenadata DB» заполните форму по ссылке внизу или позвоните по телефону +7 (995) 100-45-63
РегистрацияСкачать программу курса «ADB: Эксплуатация Arenadata DB » в формате pdf