Курсы Big Data, Hadoop, Arenadata, Kafka и Spark

15Янв

CDC-репликация Big Data в реальном времени с Apache Kafka и Debezium в Confluent Cloud

Автор Анна Вичуговав категории Kafka, Use Cases, Блог

обработка данных, большие данные, Big Data, архитектура, Kafka, SQL

В этой статье поговорим про интеграцию данных с помощью CDC-подхода и репликацию SQL-таблиц из корпоративной СУБД в несколько разных удаленных хранилищ в реальном времени с применением Apache Kafka и Debezium, развернутых в Kafka Connect и Confluent Cloud. Постановка задачи: CDC с Big Data в реальном времени Рассмотрим кейс, который часто...

15Янв

Как работают пользовательские функции в Apache Hive

Автор Сергей Ушаковв категории Hive, NoSql, Блог

Hive, курсы по hive, обучение hadoop, курсы hadoop hive

В прошлый раз мы говорили про виды таблиц для быстрой работы с Big Data в Apache Hive. Сегодня поговорим про создание пользовательских функций и их применение в Hive. Читайте далее про особенности создания и применения UDF для работы с Big Data в распределенной платформе Apache Hive. Что такое пользовательские функции...