Безопасность озера данных Hadoop (HortonWorks HDP)

Курс по администрированию безопасности озера данных Hadoop в Москве
Ближайшая дата курса  14-16 ноября 2018
   20-22 марта 2019
Стоимость обучения    54.000 рублей

курсы обучения Hadoop и машинного обучения

3 дня практического обучения по установке и конфигурированию интегрированной безопасности кластера Hadoop с использованием протоколов безопасности Kerberos, настройки аутентификации Active Directory с поддержкой механизмов авторизации и аудита событий безопасности Apache Ranger. Рассматривается вопрос настройки защищенного периметра сети с поддержкой Single-Sign-On средствами Apache Knox Gateway. Политики ограничения доступа Apache Ranger на уровне строк, колонок и  значений  с использованием Apache Atlas.  Поддержка резервного копирования, репликации и восстановления.  Создание и сопровождение защищенного озера данных (Data Lake)  с использованием Apache Metron. Защищенное взаимодействие с компонентами экосистемы Hadoop: Spark, Hive, HBaseKafkaHDFS, MapReduce. В рассмотрении курса используются дистрибутив Horton Works Hadoop Data Platform

Аудитория: Системные администраторы, системные архитекторы, разработчики Hadoop желающие получить практические навыки по установке, конфигурированию, обслуживанию и управлению защищенной средой кластера Hadoop с использованием дистрибутива HortonWorks Hadoop Data Platform

Предварительный уровень подготовки:

Продолжительность: 3 дня, 24 академических часов.

Курс построен на сквозных практических примерах развертывания и администрирования защищенной архитектуры кластера Hadoop вместе с протоколами безопасности  Kerberos, SSL; настройки интегрированной безопасности компонент экосистемы Hadoop для унифицированного входа с использованием Single-Sign-On, шлюза безопасности Apache Knox Gateway и политик разграничения доступа Apache Ranger. Практические занятия выполняются на локальных рабочих станциях и в  кластерной среде Amazone Web Services с использованием дистрибутива HortonWorks Hadoop Data Platform.

Соотношение теории к практике 30/70

Программа курса

  1. Cybersecurity для больших данных в Hadoop
    • Особенности реализации информационной безопасности (далее ИБ) в озере данных Hadoop
    • Специфические угрозы ИБ существующие в озере данных
    • Организационные меры по ИБ для озера данных
  1. Обзор подсистем безопасности озера данных
    • Автоматизация
    • Аутентификация и защита периметра
    • Авторизация
    • Аудит
    • Защита данных:
      • шифрование данных
      • антивирусная защита данных
      • snapshots
      • репликация данных
      • резервное копирование и восстановление данных
    • Hardening security для базовых компонент:
      • операционные системы
      • базы данных
      • веб сервисы
  1. Построение безопасности озера данных на базе компонентов HortonWorks Hadoop Data Platform
    • Особенности дистрибутива HortonWorks HDP и базовая безопасность(по умолчанию)
    • Администрирование Apache Ambari для аутентификации с Kerberos
    • Настройка протокола Kerberos для аутентификации с Active Directory (FreeIPA)
    • Настройка безопасности периметра с Apache Knox Gateway
    • Настройка Apache Knoх SingleSignOn
    • Best Practices для аутентификации данных и защиты периметра
  1. Настройка авторизации в озере данных Hadoop
    • Установка Apache Ranger с помощью Apache Ambari
    • Настройка мапирования групп Ldap для Hadoop аутенитификации
    • Настройка Ranger плагинов для авторизации компонент экосистемы Hadoop с использованием протокола Kerberos
    • Настройка политик Rangers для разграниения полномочий доступа:
      • RBAC — ролевые политики для разграничения доступа
      • ResourceBAC — ресурсные политики разграничения доступа
      • Строковая фильтрация для разграничения доступа
      • Фильтр на колонки для разграничения доступа
      • Политки разграничения на основании меток (tags) Apache Atlas
      • Best Practices для политик разграничения полномочий
  1. Защита данных HDFS
    • Шифрование данных при передаче (Data @ Wire encryption):
      • SSL шифрование для подключения к Web UI компонент экосистемы Hadoop
      • Протокол SPNEGO
      • Best Practices для шифрования трафика
    • Шифрование данных на хранении (DARE):
      • Настройка Ranger KMS
      • HDFS шифрование
      • Best Practices для шифрования данных файловой системы
    • Управление доступом к HDFS
    • Posix и ACL для HDFS
    • Best Practices для управления списками доступа для файловой системы
    • Антивирусная защита в озере данных
  1. Настройка политик аудита в Hadoop
    • Использование Apache Solr для аудита событий
    • Включение аудита для Ambari кластера
    • Использование аудита для управления в Ranger
    • Best Practices для политик аудита
  1. Hardening Security для узлов кластера
    • Конфигурация узлов для nonroot установки
    • Endpoint security подход
    • Best Practices для защиты конечных узлов
  1. Организационные меры информационной безопасности данных в озере данных
    • Best Practices для построения защищенного озера данных
    • Рекомендации по использованию ПО верхнего уровня для защиты озера данных
    • Технологии Machine Learning для построения защищенного озера данных
    • Использование Apache Metron для создания защищенной инфраструктуры озера данных

Примерный список практических занятий:

Примечание:
• Доступ к лабораторному стенду на Amazon Web Services предоставляется на время учебных курсов с 8:30 до 18:30 (возможно продление времени по запросу)
• Практические занятия с меткой (опционально) выполняются по желанию и при наличии свободного времени у слушателей

курсы обучения Hadoop и машинного обучения

Скачать программу курса «Администрирование безопасности озера данных на платформе Hadoop HortonWorks HDP» в формате pdf

Скачать программу курса «Администрирование безопасности озера данных на платформе Hadoop Cloudera» в формате pdf