Продолжая рассказывать про курсы Apache Spark для разработчиков на практических примерах, сегодня рассмотрим, как кэширование данных позволяет оптимизировать распределенные вычисления в этом Big Data фреймворке. Читайте далее, как ускорить выполнение…
Метка: программирование
Как перейти от Python к PySpark: ТОП-10 рекомендаций по настройке Spark-заданий
Автор Анна ВичуговаКатегория Spark, Use Cases, Статьи
Говоря про обучение Apache Spark для разработчиков, сегодня мы рассмотрим, как быстро конвертировать Python-скрипты в задания PySpark и какие конфигурационные параметры при этом нужно настроить, чтобы эффективно использовать все возможности…
От open-source до Confluent: 3 клиента Python для Apache Kafka
Автор Анна ВичуговаКатегория Kafka, Статьи
Развивая наш новый курс по Apache Kafka для разработчиков, сегодня мы рассмотрим 3 способа о взаимодействии с этой популярной Big Data платформой потоковой обработки событий с помощью языка Python, который…
Помнить все: как устранить утечки памяти в приложениях Apache Spark – 7 советов от Disney
Автор Анна ВичуговаКатегория Spark, Use Cases, Статьи
Сегодня рассмотрим Apache Spark с важной для разработчиков распределенных приложений точки зрения, разобрав как в рамках этого Big Data фреймворка справиться с утечками данных при их потоковой передаче. Читайте далее,…
Зачем менеджеру язык программирования R: 7 причин освоить аналитический инструмент Big Data и Machine Learning
Автор Анна ВичуговаКатегория Machine Learning, Новости, Статьи
Мы уже рассказывали, зачем HR-специалисту большие данные, как Big Data и Machine Learning помогают PR-менеджеру в управлении корпоративной репутацией, а маркетологу в формировании персональных рекламных предложений. Сегодня поговорим об одном…