ARMG: Курс Архитектура Данных

Теоретический курс Архитектура данных

Ближайшая дата курса
15 ноября 2021
14 февраля 2022
Стоимость обучения 54.000 руб. Регистрация
Код курса ARMG

Курс для ИТ-архитекторов и специалистов по проектированию и разработке архитектуры данных (Big Data), планированию инфраструктуры озер данных (Data Lakes) и проектов Big Data в компаниях.

Что такое архитектура данных

Сегодня любое предприятие управляется данными. Многие компании создают и активно используют корпоративные хранилища данных (КХД, DWH – Data WareHouse), куда стекается информация из множества источников: интернет, внутренние и внешние информационные системы, технологическое оборудование и т.д. Традиционные принципы проектирования таких озер данных не справляются с требованиями современного бизнеса: огромные объемы разноформатных файлов, высокая скорость доступа к информации, облачная инфраструктура, гибкие настройки многопользовательского доступа. Архитектурное проектирование системы, включая построение модели данных – это фундамент, без подготовки которого невозможно построение надежного озера данных, традиционного хранилища или аналитической системы. 

Технологии Big Data ориентированы на эффективное, безопасное и непротиворечивое управление данными в масштабе всего предприятия. Большинство бизнесов в качестве одного из ключевых направлений своего развития называют Data Centric (дата-центричность). Ожидается, что разработка и внедрение проектов BigData, таких как озера данных (Data Lake), расширят возможности “традиционных ” DWH. Однако, всегда ли эти ожидания оправдываются? Все ли зависит от выбранного технологического стека? Что можно сделать, чтобы избежать фиаско Big Data-проекта? Как внедрить технологии Big Data в production, не разрушая существующие КХД, а дополняя их новыми функциональными возможностями? Ответить на эти вопросы поможет наш курс “Архитектура данных”.

 

 

Кому нужны курсы по архитектуре Big Data

Теоретический курс Архитектура данных предназначен для ИТ-архитекторов, системных аналитиков и разработчиков, которым интересна тема проектирования моделей данных систем аналитического класса (озера и хранилища данных). Курс может быть также полезен руководителям Big Data-проектов и команд в области аналитики, а также специалистам направления Data Governance, ИТ-менеджерам и руководителям проектов по цифровизации.

Как построено обучение

Теоретический курс Архитектура моделей данных содержит теоретический минимум, необходимый для эффективной прикладной работы с архитектурными моделями корпоративных репозиториев и их различными реализациями в виде реляционных хранилищ и NoSQL-сред на базе Hadoop и других технологий Big Data.

В результате обучения вы получите следующие знания и навыки:

  • поймете базовые задачи Data Governance;
  • разберетесь с основными положениями теории построения корпоративных хранилищ данных с учетом современных принципов и технологий Big Data;
  • узнаете особенности процессов построения, внедрения и эксплуатации озер данных;
  • получите базовые навыки обеспечения качества данных и эффективной эксплуатации корпоративных репозиториев.

Продолжительность: 3 дня, 24 академических часа

По окончании курса «Архитектура данных» в нашем лицензированном учебном центре «Школа Больших Данных», вы получите сертификат или удостоверение установленного образца, которые могут засчитываться в качестве свидетельств о повышении квалификации.

 

 

Программа курса Архитектура Данных

День 1

Архитектура данных как часть реализации стратегии Data Centric на уровне предприятия.
Роль и задачи архитектора данных. Data Governance.

  1. Data Driven подход. Успехи. Проблемы. Эволюция. Внедрение Data Lake: что может пойти не так?
  2. Application Centric vs Data Centric. Когда, внедряя Big Data мы приближаемся к Data Centric, а когда отдаляемся?
  3. Какие проблемы мы не можем решить на уровне Data Lake/DWH. Задачи Data Governance.
  4. Корпоративная модель данных (EDM) как часть Data Governance
  5. Архитектор данных. Роли и задачи. 
  6. Стандартизация работы с данными предприятия. 
  7. Внедрение практик культуры работы с данными. Задачи. Процессы. Сложности.
День 2

Основные подходы к проектированию моделей данных ключевых компонентов Big Data-решений.

  1. Обобщенная схема архитектур -решений. Требования к компонентам и моделям данных.
  2. Понятие модели данных. Виды моделей данных. Их назначение и особенности.
  3. Реляционная модель данных. Нормализация и денормализация.
  4. Классическая концептуальная модель “сущность-связь” и ее расширения.
  5. Нотации и инструменты моделирования данных. Концептуальная, логическая и физическая модели данных.
  6. Ключевое отличие к построению моделей данных аналитических систем – работа со временем. Поддержка истории изменений.
  7. BEAM (Business Event Activity Modeling) – подход к проектированию моделей для аналитических задач
  8. Design-паттерны проектирования моделей данных
  9. Моделирования ядра. Подход Data Vault. Его преимущества и ограничения. Развитие подхода.
День 3

Основные подходы к проектированию моделей данных ключевых компонентов Big Data-решений. Метаданные. Эффективная загрузка данных.

  1. Итеративное развитие модели данных ядра
  2. Моделирование аналитических витрин. Подход Р. Кимбалла и его развитие.
  3. Отраслевые примеры моделей данных.
  4. Виды метаданных для аналитических систем.
  5. Эффективное обновление данных. Управление загрузкой.

 

 

Программа курса «Архитектура Данных»

Скачать программу курса «Архитектура Данных» в формате pdf

Отправить ссылку на указанный адрес: