Apache Kafka для инженеров данных
(Core Apache Kafka)

Q: Часть 1. Основные концепции и архитектура Apache Kafka

Архитектура и история возникновения Kafka Основные абстракции и понятия Основные API Изучим основные компоненты и API Kafka , принципы их взаимодействия и killer features .

Q: Часть 2. Topic, partition и offset в Apache Kafka

Понятие топика, раздела и смещения Управление Topic -ами из консоли Отслеживание последнего прочитанного сообщения Семантики доставки сообщений ( at least once , at most once , exactly once ) Разберемся в анатомии топика, использовании механизмов партиционирования и consumer групп.

Q: Часть 3. Producer API

Программная публикация сообщений в топики Kafka Управление партиционированием Погрузимся в детальную настройку и использование Kafka Producer -а и best practices на стороне производителя сообщений.

Q: Часть 4. Consumer API

Прием сообщений point-to-point Kafka Broadcasting и группы Управление смещением Научимся принимать сообщения и на практике реализуем минимальное приложение, работающее с Kafka . Познакомимся с концепцией групп ( consumer groups ) и научимся настраивать группы для работы с сообщениями в режиме broadcasting.

2х-дневный курс для специалистов, желающих получить и систематизировать знания по использованию Apache Kafka для организации асинхронного взаимодействия систем и надежной передачи данных между приложениями в реальном времени

Apache Kafka для инженеров данных

На курсе вы научитесь создавать приложения, работающие с распределенным журналом Kafka, а также использовать его в парадигмах «издатель -подписчик» (Pub/Sub) и очередь сообщений (Message Queue). Вы узнаете, как публиковать и подписываться на топики Kafka, а также познакомитесь с лучшими практиками применения этой распределенной платформы потоковой обработки событий.

В теоретической части вы узнаете об основных API (Producer API, Consumer API), архитектуре Kafka и внутренних принципах ее работы, а также об особенностях реализации этой платформы, тонкостях сериализации и десериализации данных, структуре хранения и сжатия логов.

Чтобы закрепить полученные знания, на практике вы напишете несколько собственных приложений продюсеров и потребителей. Благодаря подробным объяснениям и комментариям, вы поймете, как наилучшим образом использовать предоставляемые Apache Kafka API для решения своих бизнес-задач.

Кому нужно обучение по Apache Kafka

Цель курса:

Научиться создавать приложения, работающие с распределенным журналом Kafka, и использовать его в парадигмах Pub/Sub и Message Queue, освоить лучшие практики потоковой обработки событий.

Аудитория:

Практические курсы по разработке с использованием основных API платформы Kafka и интеграции ее с другими системами ориентированы на дата-инженеров, программистов, разработчиков Big Data и специалистов, которые хотят:

изучить базовые методы и особенности записи данных в Kafka (Producer API)
научиться читать данных из Kafka (Consumer API)
разобраться, какие конфигурационные параметры влияют на производительность платформы и каким образом
понять, в чем особенность использования разных языковых API (на примере Java и Python)
освоить лучшие практики (best practices) по реализации процессов обмена данными между Apache Kafka и внешними системами

Предварительный уровень подготовки:

Как проходят курсы

Офлайн-обучение или онлайн-курс проходят в формате интерактивного семинара: даже в дистанционном режиме с вами занимается живой преподаватель - рассказывает теорию, дает практические задания и проверяет результаты выполнения. В качестве примеров рассматриваются кейсы из реального бизнеса и лучшие практики применения Apache Kafka для распределенной обработки событий в реальном времени. На практике вы освоите Producer и Consumer API как способы записать информацию в Kafka и считать ее оттуда. Знакомясь с этими API, вы узнаете, как работают механизмы сериализации и десериализации данных в Apache Kafka, создав свои собственные приложения-продюсеры и потребители событий.

Продолжительность курса: 16 академических часов, 2 дня

Соотношение теории к практике: 50/50

По завершении обучения вы получите

Успешно окончив курс "Apache Kafka для инженеров данных" в нашем лицензированном учебном центре «Школа Больших Данных», вы получите сертификат или удостоверение установленного образца, которые могут засчитываться в качестве свидетельств о повышении квалификации.

Программа курса

«Apache Kafka для инженеров данных»

Часть 1. Основные концепции и архитектура Apache Kafka

Архитектура и история возникновения Kafka
Основные абстракции и понятия
Основные API

Изучим основные компоненты и API Kafka, принципы их взаимодействия и killer features.

Часть 2. Topic, partition и offset в Apache Kafka

Понятие топика, раздела и смещения
Управление Topic-ами из консоли
Отслеживание последнего прочитанного сообщения
Семантики доставки сообщений (at least once, at most once, exactly once)

Разберемся в анатомии топика, использовании механизмов партиционирования и consumer групп.

Часть 3. Producer API

Программная публикация сообщений в топики Kafka
Управление партиционированием

Погрузимся в детальную настройку и использование Kafka Producer-а и best practices на стороне производителя сообщений.

Часть 4. Consumer API

Прием сообщений point-to-point
Kafka Broadcasting и группы
Управление смещением

Научимся принимать сообщения и на практике реализуем минимальное приложение, работающее с Kafka.

Познакомимся с концепцией групп (consumer groups) и научимся настраивать группы для работы с сообщениями в режиме broadcasting.

Часть 5. Inside Kafka

Особенности хранения данных
Сериализация и десериализация данных и Confluent Registry
Компактируемые топики и retention
Конфигурация и производительность процесса работы с данными в Kafka
ksqlDB как способ создания не сложных потоковых приложений

Познакомимся с внутренним устройством топиков, партиций и сегментов. Поймем влияние параметров конфигурации на производительность процесса публикации потребления сообщений.

Научимся сериализовать и десериализовать данные с использованием Avro, познакомимся с ksqlDB, его особенностями и применимостью.

Для практических упражнение во время курса мы будем использовать Python или Java.

Кто проводит курс

Ермилов Дмитрий

Академия Федеральной службы безопасности Российской Федерации (Москва, 2012)

Профессиональные компетенции:

Ведущий Data Scientist в ФГУП “Центр информационных технологий”, Москва
Руководитель программ в Университете искусственного интеллекта, Москва.
Кандидат наук (2017 год, Московский государственный университет им. М.В. Ломоносова, Москва)

Записаться на курс

Остались вопросы по формату обучения, содержанию курсов, стоимости, сертификатам или другим важным моментам?

Оставьте номер телефона или e-mail и мы оперативно проконсультируем вас в течение рабочего дня.

Я даю свое согласие на обработку персональных данных и соглашаюсь с политикой конфиденциальности.

Apache Kafka для инженеров данных (Core Apache Kafka)