HBASE: Курс Администрирование кластера HBase

Практические курсы администрирования кластера HBase

Ближайшая дата курса
14 июня 2022
31 октября 2022
Стоимость обучения 80 000 руб. Регистрация
Длительность обучения 32 ак.часов
Код курса HBASE

4-дневный практический курс по администрированию HBase разработан для специалистов, отвечающих за администрирование, настройку и сопровождение кластера Apache HBase

Что такое Apache HBase и где это используется

Apache HBase – это нереляционная (NoSQL) колоночная (column-oriented) база данных. Она использует распределенную файловую систему Apache Hadoop (HDFS) и эффективно обеспечивает динамическое партиционирование данных, распределение нагрузки, кэширование и доступ в реальном времени. Главными достоинствами Apache HBase считаются следующие:

  • высокая производительность и быстрота работы, в т.ч. в режиме реального времени, за счет кэширования в памяти и обработки данных на стороне сервера через фильтры и сопроцессоры;
  • высокая доступность и отказоустойчивость, обеспечиваемые с помощью репликации в HDFS, поддержку транзакционности операций на уровне строк, а также автоматическое распределение нагрузки и балансировку таблиц;
  • масштабируемость – HBase эффективно работает даже при увеличении кластера до сотен узлов для работы с миллиардами строк и миллионами столбцов;
  • наличие инструментов расширяемости (REST и другие API-интерфейсы Java и шлюзов) и внешних SQL-решений (Apache Phoenix, Drill, Hive и Cloudera Impala), чтобы работать с данными в HBase, как с реляционными таблицами.

Благодаря этим преимуществам Apache HBase широко применяется для аналитики больших данных в реальном времени (OLTP) и работы с таблицами пользовательских приложений. Например, эта NoSQL-СУБД активно используется в Facebook, Adobe, Yahoo, Twitter, NGDATA и множестве других компаний по всему миру. Все лучшие практики (best practices) такого прикладного использования рассматриваются в рамках нашего практического курса обучения администраторов Big Data по работе с кластером HBase.

 

 

Кому нужны обучающие курсы по Apache HBase

Наши авторские курсы администрирования кластера HBase ориентированы на специалистов по администрированию и сопровождению кластеров, системных администраторов, архитекторов, разработчиков Big Data систем и DevOps-инженеров, которые хотят получить следующие знания и навыки:

  • понять, что такое Apache HBase;
  • научиться устанавливать, настраивать и поддерживать кластера HBase и Zookeeper;
  • освоить методы администрирования кластера  HBase;
  • изучить настройки безопасности для Apache HBase;
  • настраивать мониторинг и оптимизацию NoSQL-СУБД с использованием эффективных инструментов администратора Big Data NoSQL  кластера;
  • интегрировать HBase с другими Big Data компонентами (Apache Pig, Hive, Sqoop, Impala) и внешними системами.

Предварительный уровень подготовки:

  • Знание базовых команд Linux (опыт работы с командной строкой, файловой системой , POSIX, текстовыми редакторами vi, nano)
  • Начальный опыт работы с Hadoop
  • Базовые навыки программирования Java

 

 

Как построен образовательный курс администрирования HBase

Продолжительность: 4 дня, 32 академических часа.

Соотношение теории к практике 40/60

Практическое обучение администраторов Big Data “Школе Больших Данных” включает теоретический минимум, необходимый для прикладной работы и эффективному администрированию HBase. Подробно рассматриваются проектирования схемы HBase и обеспечения высокой доступности кластера. Особое внимание уделено вопросам интеграции этой NoSQL-СУБД с другими Big Data средствами хранения и обработки больших данных: Apache Pig, Hive, Sqoop, Impala. Анализируются различные форматы файлов Big Data (ORC, Parquet) и параметры их сжатия. Также преподаватель детально объяснит специфику установки, конфигурирования и мониторинга системных служб HBase и Apache Zookeeper, чтобы вы могли эффективно и безопасно управлять своими кластерами в рабочей среде.

На практике вы самостоятельно развернете и настроите кластер HBase, проделав все операции установки и конфигурирования, включая безопасную аутентификацию, авторизацию, реплицирование, резервное копирование и восстановление данных. Также обучение HBase в “Школе Больших Данных” поможет вам освоить инструменты мониторинга и эксплуатации кластера для анализа, своевременной диагностики и решения проблем с хранением больших данных.

Успешно окончив курсы администрирования Apache HBase в нашем лицензированном учебном центре «Школа Больших Данных»вы получите сертификат или удостоверение установленного образца, которые могут засчитываться в качестве свидетельств о повышении квалификации.

Программа курса “Администрирование кластера HBase”

  1. Введение в HBase
    • Немного о Hadoop и NoSQL. Hive и HBase. NoSQL
    • Архитектура HBase.  Модель данных HBase: Column family, timestamp, версионность
    • Сервисы и операторы HBase. Концепция CRUD: базовые операции с таблицами
    • Сценарии использования HBase
  2. Импорт данных и интеграция с HBase
    • Импорт данных с использованием importTSV
    • Взаимодействие компонент Hadoop и HBase: HDFS, PIG, Hive, sqoop, Impala
    • Хранение файлов в HDFS. Форматы файлов для HDFS: параметры сжатия, ORC, Parquet
    • Использование Java API для работы с HBase
  3. Установка и настройка HBase
    • Требования  по установке HBase
    • Дизайн схемы HBase для эффективного хранения данных и HA
    • Установка Apache HBase
    • Команды и интерфейс командной строки HBase: HBaseAdmin
    • Ручная установка кластера HBase.  Настройка кластера Zookeeper
  4. Управление кластером HBase
    • Высокая доступность (High Availability) кластера HBase.  Настройка Snapshots. Настройка репликации кластера
    • Безопасность HBase. Настройка аутентификации и авторизации при доступе к данным в таблицах HBase
    • Резервное копирование и восстановление HBase
  5. Advanced HBase
    • Мониторинг Apache HBase. Анализ лог файлов HBase
    • Операции обслуживания. Compactions и flushes
    • Оптимизация параметров HBase: Hfile, WAL, Memstores, Bloom фильтр
    • Диагностика и разрешение проблем (troubleshooting). Мониторинг и оптимизация JVM. Garbage Collection
    • Region splitting

 

 

Программа курса «Администрирование кластера Apache HBase»

Скачать программу курса «Администрирование кластера Apache HBase» в формате pdf

Отправить ссылку на: