Главная » Курсы для инженеров Big Data Science
Курсы для инженеров данных
Практические курсы по организации ETL/ELT-процессов с большими данными для дата-инженеров и разработчиков: Apache Hadoop, Kafka, Spark, AirFlow, NiFi, Greenplum.
Пакеты и потоки, межсистемные интеграции, DWH и Data Lake
+7 (495) 41-41-121
КТО ТАКОЙ ДАТА-ИНЖЕНЕР
Дата-инженер – это специалист, который отвечает за сбор из различных источников и доставку данных конечным потребителям: аналитикам и ученым по данным (Data Scientist’ам). Именно он работает с ETL/ELT-процессами, обеспечивает загрузку данных в корпоративные хранилища и озера, помогает ИТ-архитектору выстраивать эффективные системы аналитики больших данных, организуя конвейеры доставки и преобразования нужной информации из множества разных СУБД и файлов различных форматов.
Основные задачи дата-инженера - это построение конвейеров сбора данных из различных источников, организация ETL/ELT-процессов, преобразование форматов данных, загрузка данных в корпоративные хранилища и озера, доставка данных получателям (пользователям и сервисам) в нужное время и в нужном виде. Data Engineer работает согласно концепции DataOps, своевременно обеспечивая стейкхолдерам доступ к необходимой информации. Без дата-инженера аналитики не получат важные бизнес-метрики на BI-дэшбордах, а разработчики ML-систем не смогут обучить свои модели и запустить их на реальных данных. Разработка и тестирование архитектуры данных тоже является частью профессии data engineer.
Актуальность и независимость прикладных решений. Инженеры данных строят универсальные решения и могут без потери данных и скорости вычислений быстро перевести конвейеры их обработки на другие платформы. Дата-инженер знает, как обеспечить импортозамещение зарубежных BI-систем и legacy-платформ российскими альтернативами или open-source проектами, и умеет реализовать это без остановки бизнеса и производственных процессов.
Кому и где нужны дата-инженеры?
Инженер данных - один из самых высокооплачиваемых профессий ИТ-специалистов в области Big Data. Средняя зарплата дата-инженера в России на 2024 год составляет около 5-х тысяч долларов. А в целом data engineer зарабатывает больше, чем аналитик данных и Data Scientist. Причем не только в России и странах бывшего СНГ, но и на рынках Европы, а также США и Канады.
В России чаще всего дата-инженеры требуются в Яндекс, ВК, Сбербанк, ВТБ, ФНС, Северсталь, X5 Retail Group, Ozon, Wildberries и множество других data-driven компаний: ИТ, ритейл, государственные организации, крупные агентства веб-аналитики и онлайн-рекламы, производственные предприятия, банки, страхование, масштабные корпорации и небольшие фирмы с большими объемами данных, получаемых из множества разных источников и направляемых в разные системы-приемники.
Расписание курсов для дата-инженеров
Код курса | Название курса | Дата начала курса | Цена | Ак.часов | |
---|---|---|---|---|---|
GPDE | Greenplum для инженеров данных и аналитиков данных | 24 Июн | 09 Сен | 72 000 | 24 |
DEVKI | Apache Kafka для инженеров данных | 27 Май | 04 Сен | 72 000 | 24 |
FLINK | Потоковая обработка данных с помощью Apache Flink | 01 Авг | 28 Окт | 48 000 | 16 |
NIFI3 | Эксплуатация Apache NIFI | 13 Май | 24 Июл | 72 000 | 24 |
AIRF | Data Pipeline на Apache Airflow | 22 Май | 28 Авг | 72 000 | 24 |
YARF | AIRFLOW с использованием Yandex Managed Service for Apache Airflow™ | 27 Май | 19 Июн | 72 000 | 24 |
CLICH | Построение хранилища данных на базе Clickhouse | 03 Июн | 09 Сен | 72 000 | 24 |
CORS | Core Spark - основы для разработчиков | 13 Май | 01 Июл | 48 000 | 16 |
SPOT | Потоковая обработка в Apache Spark | 16 Май | 08 Авг | 48 000 | 16 |
SPAD | Архитектура данных с Apache Spark | 27 Май | 26 Авг | 84 000 | 28 |
HDDE | Hadoop для инженеров данных | 17 Июн | 120 000 | 40 | |
DPREP | Подготовка данных для Data Mining на Python | по запросу | 72 000 | 32 |
Карта обучения дата-инженеров
в Школе Больших Данных
Основы обработки больших данных
DPREP: Подготовка данных для Data Mining на Python
HDDE: Hadoop для инженеров данных
AIRF: Data Pipeline на Apache Airflow и Apache Hadoop
Инструменты сбора и преобразования данных
CORS: Core Spark - основы для разработчиков
DBT: Data Build Tool для инженеров данных
DEVKI: Apache Kafka для инженеров данных
Фреймворки потоковой обработки
SPOT: Потоковая обработка в Apache Spark
NIFI3: Эксплуатация Apache NIFI
FLINK: Потоковая обработка данных с помощью Apache Flink
Озера и хранилища данных
GPDE: Greenplum для инженеров данных и аналитиков данных
SPAD: Архитектура данных с Apache Spark
CLICH: Построение хранилища данных на базе Clickhouse
Все образовательные программы направления Data Engineering составлены практикующими экспертами с большим практическим опытом. Каждый из наших методистов-разработчиков и преподавателей работает как data engineer и отлично знает все рассматриваемые инструменты. В рамках обучения по любой образовательной программе вы менее чем за месяц под руководством опытного эксперта самостоятельно выполните проект и получите реальный опыт построения пайплайнов и использования современных инструментов.
Кому нужно обучение по Data Engineering
Понять принципы организации и работы корпоративных хранилищ и озер данных
Познакомиться с основами Data Science и Machine Learning
Освоить лучшие практики построения ETL/ELT-конвейеров с Spark, Livy, AirFlow и других технологий Big Data, включая DevOps инструменты (docker)
Овладеть востребованными пакетными и потоковыми оркестраторами заданий (AirFlow, NiFi)
Научиться работать с технологиями потоковой передачи событий (Kafka, Spark Streaming, Flink)
Понять, что такое DataOps, чем отличается от devops и как это использовать: практический кейс
Выбирайте свою специализацию, а мы подберем для вас нужный обучающий курс или разработаем индивидуальную образовательную программу.
Как проходят практические тренинги по дата-инженерии в «Школе Больших Данных»
Курсы для дата-инженеров в нашем учебном центре организованы в виде краткосрочных интенсивов. Вы будете изучать только необходимую теорию с огромным количеством практики, чтобы менее чем за месяц повысить свой профессиональный уровень как дата инженер и получить новые навыки для работы.
Обучение проходит в форме интерактивного семинара (workshop). Каждое занятие предполагает индивидуальный фидбэк преподавателя по работе слушателя. Практическая часть включает проектирование собственных пакетных и потоковых ETL-конвейеров, а также их реализацию для DWH, Data Lake и конечных приложений.
Окончив курсы для дата-инженеров в нашем Учебном Центре с государственной лицензией на образовательную деятельность, вы получите сертификат или удостоверение установленного образца, которые могут засчитываться в качестве свидетельства о повышении квалификации.
Стань востребованным инженером данных вместе с BigDataSchool!
География наших клиентов
- Москва
- Санкт-Петербург
- Нижний Новгород
- Екатеринбург
- Казань
- Краснодар
- Красноярск
- Перьм
- Челябинск
- Новосибирск
- Томск
- Тверь
- Саратов
- Самара
- Ростов-на-Дону
- Хабаровск
- Волгоград
- Калуга
- Якутск
- Севастополь
- Тольяти
- Владивоссток
- Тюмень
- Южно-Сахалинск
- Уфа
- Ставрополь
- Минск
- Алматы
- Астана
- Ташкент
- Душанбе
- Бешкек
«Школа Больших Данных»
Адрес:
127576, г. Москва, м. Алтуфьево,
Илимская ул. 5 корпус 2, офис 319, БЦ «Бизнес-Депо»
Телефон:
+7 (495) 414-11-21
+7 (995) 100-45-63
E-mail:
Часы работы:
Понедельник - Пятница: 09.00 – 18.00
Остались вопросы?
Звоните нам +7 (495) 41-41-121 или отправьте сообщение через контактную форму. Также вы можете найти ответы на ваши вопросы в нашем сборнике часто задаваемых вопросов.