Курс Архитектура Данных

Теоретический курс Архитектура данных

Теоретический курс Архитектура данных

Ближайшая дата курса по архитектуре Big Data 26-28 ноября
   
Стоимость обучения 54.000 рублей
Код курса ARMG

Курс для ИТ-архитекторов и специалистов по проектированию и разработке архитектуры данных (Big Data), планированию инфраструктуры озер данных (Data Lakes) и проектов Big Data в компаниях.

Что такое архитектура данных

Сегодня любое предприятие управляется данными. Многие компании создают и активно используют корпоративные хранилища данных (КХД, DWH — Data WareHouse), куда стекается информация из множества источников: интернет, внутренние и внешние информационные системы, технологическое оборудование и т.д. Традиционные принципы проектирования таких озер данных не справляются с требованиями современного бизнеса: огромные объемы разноформатных файлов, высокая скорость доступа к информации, облачная инфраструктура, гибкие настройки многопользовательского доступа. Архитектурное проектирование системы, включая построение модели данных — это фундамент, без подготовки которого невозможно построение надежного озера данных, традиционного хранилища или аналитической системы. 

Технологии Big Data ориентированы на эффективное, безопасное и непротиворечивое управление данными в масштабе всего предприятия. Большинство бизнесов в качестве одного из ключевых направлений своего развития называют Data Centric (дата-центричность). Ожидается, что разработка и внедрение проектов Big Data, таких как озера данных (Data Lake), расширят возможности «традиционных » DWH. Однако, всегда ли эти ожидания оправдываются? Все ли зависит от выбранного технологического стека? Что можно сделать, чтобы избежать фиаско Big Data-проекта? Как внедрить технологии Big Data в production, не разрушая существующие КХД, а дополняя их новыми функциональными возможностями? Ответить на эти вопросы поможет наш курс «Архитектура данных».

Кому нужны курсы по архитектуре Big Data

Теоретический курс Архитектура данных предназначен для ИТ-архитекторов, системных аналитиков и разработчиков, которым интересна тема проектирования моделей данных систем аналитического класса (озера и хранилища данных). Курс может быть также полезен руководителям Big Data-проектов и команд в области аналитики, а также специалистам направления Data Governance, ИТ-менеджерам и руководителям проектов по цифровизации.

Как построено обучение по архитектуре данных

Теоретический курс Архитектура моделей данных содержит теоретический минимум, необходимый для эффективной прикладной работы с архитектурными моделями корпоративных репозиториев и их различными реализациями в виде реляционных хранилищ и NoSQL-сред на базе Hadoop и других технологий Big Data.

В результате обучения вы получите следующие знания и навыки:

  • поймете базовые задачи Data Governance;
  • разберетесь с основными положениями теории построения корпоративных хранилищ данных с учетом современных принципов и технологий Big Data;
  • узнаете особенности процессов построения, внедрения и эксплуатации озер данных;
  • получите базовые навыки обеспечения качества данных и эффективной эксплуатации корпоративных репозиториев.

Продолжительность: 3 дня, 24 академических часа

По окончании курса «Архитектура данных» в нашем лицензированном учебном центре «Школа Больших Данных», вы получите сертификат или удостоверение установленного образца, которые могут засчитываться в качестве свидетельств о повышении квалификации.

Программа курса Архитектура Данных

День 1

Архитектура данных как часть реализации стратегии Data Centric на уровне предприятия.

Роль и задачи архитектора данных. Data Governance.

  1. Data Driven подход. Успехи. Проблемы. Эволюция. Внедрение Data Lake: что может пойти не так?
  1. Application Centric vs Data Centric. Когда, внедряя Big Data мы приближаемся к Data Centric, а когда отдаляемся?
  1. Какие проблемы мы не можем решить на уровне Data Lake/DWH. Задачи Data Governance.
  1. Корпоративная модель данных (EDM) как часть Data Governance
  2. Архитектор данных. Роли и задачи. 
  3. Стандартизация работы с данными предприятия. 
  4. Внедрение практик культуры работы с данными. Задачи. Процессы. Сложности.

День 2

Основные подходы к проектированию моделей данных ключевых компонентов Big Data-решений.

  1. Обобщенная схема архитектур -решений. Требования к компонентам и моделям данных.
  2. Понятие модели данных. Виды моделей данных. Их назначение и особенности.
  3. Реляционная модель данных. Нормализация и денормализация.
  4. Классическая концептуальная модель «сущность-связь» и ее расширения.
  5. Нотации и инструменты моделирования данных. Концептуальная, логическая и физическая модели данных.
  1. Ключевое отличие к построению моделей данных аналитических систем — работа со временем. Поддержка истории изменений.
  2. BEAM (Business Event Activity Modeling) — подход к проектированию моделей для аналитических задач
  3. Design-паттерны проектирования моделей данных
  4. Моделирования ядра. Подход Data Vault. Его преимущества и ограничения. Развитие подхода.

День 3

Основные подходы к проектированию моделей данных ключевых компонентов Big Data-решений. Метаданные. Эффективная загрузка данных.

  1. Итеративное развитие модели данных ядра
  2. Моделирование аналитических витрин. Подход Р.Кимбалла и его развитие.
  3. Отраслевые примеры моделей данных.
  4. Виды метаданных для аналитических систем.
  5. Эффективное обновление данных. Управление загрузкой.

Программа курса «Архитектура Данных»

Скачать программу курса «Архитектура Данных» в формате pdf

Отправить ссылку на указанный адрес: