ARMG: Курс Архитектура Данных

Теоретический курс Архитектура данных

Ближайшая дата курса
01 августа 2022
31 октября 2022
Стоимость обучения 60 000 руб. Регистрация
Длительность обучения 24 ак.часов
Код курса ARMG

Курс для ИТ-архитекторов и специалистов по проектированию и разработке архитектуры данных (Big Data), планированию инфраструктуры озер данных (Data Lakes) и проектов Big Data в компаниях.

Что такое архитектура данных

Сегодня любое предприятие управляется данными. Многие компании создают и активно используют корпоративные хранилища данных (КХД, DWH – Data WareHouse), куда стекается информация из множества источников: интернет, внутренние и внешние информационные системы, технологическое оборудование и т.д. Традиционные принципы проектирования таких озер данных не справляются с требованиями современного бизнеса: огромные объемы разноформатных файлов, высокая скорость доступа к информации, облачная инфраструктура, гибкие настройки многопользовательского доступа. Архитектурное проектирование системы, включая построение модели данных – это фундамент, без подготовки которого невозможно построение надежного озера данных, традиционного хранилища или аналитической системы. 

Технологии Big Data ориентированы на эффективное, безопасное и непротиворечивое управление данными в масштабе всего предприятия. Большинство бизнесов в качестве одного из ключевых направлений своего развития называют Data Centric (дата-центричность). Ожидается, что разработка и внедрение проектов BigData, таких как озера данных (Data Lake), расширят возможности “традиционных ” DWH. Однако, всегда ли эти ожидания оправдываются? Все ли зависит от выбранного технологического стека? Что можно сделать, чтобы избежать фиаско Big Data-проекта? Как внедрить технологии Big Data в production, не разрушая существующие КХД, а дополняя их новыми функциональными возможностями? Ответить на эти вопросы поможет наш курс “Архитектура данных”.

 

 

Кому нужны курсы по архитектуре Big Data

Теоретический курс Архитектура данных предназначен для ИТ-архитекторов, системных аналитиков и разработчиков, которым интересна тема проектирования моделей данных систем аналитического класса (озера и хранилища данных). Курс может быть также полезен руководителям Big Data-проектов и команд в области аналитики, а также специалистам направления Data Governance, ИТ-менеджерам и руководителям проектов по цифровизации.

Как построено обучение

Теоретический курс Архитектура моделей данных содержит теоретический минимум, необходимый для эффективной прикладной работы с архитектурными моделями корпоративных репозиториев и их различными реализациями в виде реляционных хранилищ и NoSQL-сред на базе Hadoop и других технологий Big Data.

В результате обучения вы получите следующие знания и навыки:

  • поймете базовые задачи Data Governance;
  • разберетесь с основными положениями теории построения корпоративных хранилищ данных с учетом современных принципов и технологий Big Data;
  • узнаете особенности процессов построения, внедрения и эксплуатации озер данных;
  • получите базовые навыки обеспечения качества данных и эффективной эксплуатации корпоративных репозиториев.

Продолжительность: 6 дней, 24 академических часа

По окончании курса «Архитектура данных» в нашем лицензированном учебном центре «Школа Больших Данных», вы получите сертификат или удостоверение установленного образца, которые могут засчитываться в качестве свидетельств о повышении квалификации.

 

 

Программа курса Архитектура Данных

День 1-2

Архитектура данных как часть реализации стратегии Data Centric на уровне предприятия.
Роль и задачи архитектора данных. Data Governance.

  1. Data Driven подход. Успехи. Проблемы. Эволюция. Внедрение Data Lake: что может пойти не так?
  2. Application Centric vs Data Centric. Когда, внедряя Big Data мы приближаемся к Data Centric, а когда отдаляемся?
  3. Какие проблемы мы не можем решить на уровне Data Lake/DWH. Задачи Data Governance.
  4. Корпоративная модель данных (EDM) как часть Data Governance
  5. Архитектор данных. Роли и задачи. 
  6. Стандартизация работы с данными предприятия. 
  7. Внедрение практик культуры работы с данными. Задачи. Процессы. Сложности.
День 3-4

Основные подходы к проектированию моделей данных ключевых компонентов Big Data-решений.

  1. Обобщенная схема архитектур -решений. Требования к компонентам и моделям данных.
  2. Понятие модели данных. Виды моделей данных. Их назначение и особенности.
  3. Реляционная модель данных. Нормализация и денормализация.
  4. Классическая концептуальная модель “сущность-связь” и ее расширения.
  5. Нотации и инструменты моделирования данных. Концептуальная, логическая и физическая модели данных.
  6. Ключевое отличие к построению моделей данных аналитических систем – работа со временем. Поддержка истории изменений.
  7. BEAM (Business Event Activity Modeling) – подход к проектированию моделей для аналитических задач
  8. Design-паттерны проектирования моделей данных
  9. Моделирования ядра. Подход Data Vault. Его преимущества и ограничения. Развитие подхода.
День 5-6

Основные подходы к проектированию моделей данных ключевых компонентов Big Data-решений. Метаданные. Эффективная загрузка данных.

  1. Итеративное развитие модели данных ядра
  2. Моделирование аналитических витрин. Подход Р. Кимбалла и его развитие.
  3. Отраслевые примеры моделей данных.
  4. Виды метаданных для аналитических систем.
  5. Эффективное обновление данных. Управление загрузкой.

 

 

Программа курса «Архитектура Данных»

Скачать программу курса «Архитектура Данных» в формате pdf

Отправить ссылку на указанный адрес: