В этой статье для дата-инженеров и разработчиков распределенных приложений потоковой аналитики больших данных разберем пример перевода сервиса Strava с кластера Cassandra в облачное хранилище AWS S3 и какую роль в…
Метка: Cassandra
Лямбда-архитектура IoT-системы на Apache Kafka, Flink и Cassandra
Автор Анна ВичуговаКатегория Flink, Internet of Things, СтатьиДобавляя в наши курсы для дата-инженеров интересные кейсы, сегодня рассмотрим, как реализовать Лямбда-архитектуру для комплексной аналитики больших данных с помощью Apache Flink, Kafka и Cassandra на примере системы интернета вещей.…
От Cassandra к Google Cloud Spanner: опыт Uber
Автор Анна ВичуговаКатегория Use Cases, СтатьиСегодня рассмотрим, как Uber эффективно обрабатывает миллионы запросов на поездки c помощью технологий надежного хранения и быстрой аналитики больших данных. Вас ждет краткий ликбез по системе геопространственной индексации H3 и…
Графовая аналитика больших данных с DataStax Enterprise Graph на Cassandra и Spark SQL
Автор Анна ВичуговаКатегория Spark, СтатьиВ рамках продвижения нашего нового курса по графовой аналитике больших данных в бизнес-приложениях, сегодня рассмотрим, что такое DataStax Enterprise Graph. Читайте далее, как немецкая ИТ-компания Traversals с помощью этой распределенной графовой…
Масштабируемая видеоаналитика в реальном времени с нейросетями YOLO на Apache Kafka, Spark Structured Streaming и Cassandra
Автор Анна ВичуговаКатегория Kafka, Machine Learning, Spark, Use Cases, СтатьиВ рамках обучения аналитиков Big Data и разработчиков Apache Spark и Kafka, сегодня рассмотрим кейс ИТ-компании Southworks по онлайн-обработке потокового видео как наглядный пример эффективного сочетания этих потоковых фреймворков с…
Apache Kafka и прочая Big Data для железнодорожников: кейс Deutsche Bahn
Автор Анна ВичуговаКатегория Kafka, Use Cases, СтатьиЧтобы добавить в наш новый курс по Apache Kafka для разработчиков еще больше практических примеров, сегодня мы приготовили для вас кейс немецкой железнодорожной компании Deutsche Bahn AG. Читайте далее, почему…
Чем плоха CAP-теорема: критика и альтернативы для NoSQL и других Big Data систем
Автор Анна ВичуговаКатегория Новости, СтатьиВ этой статье мы расскажем про краеугольный камень распределенных Big Data систем – CAP-теорему, в которой одновременно возможно реализовать только 2 свойства из 3-х, по аналогии с треугольником ограничений в…
Apache Cassandra vs HBase: что и когда выбирать для NoSQL в Big Data
Автор Анна ВичуговаКатегория HBase, СтатьиРассмотрев ключевые сходства и различия Cassandra и HBase, сегодня мы поговорим, в каких случаях стоит выбирать ту или иную нереляционную СУБД для обработки больших данных (Big Data) в NoSQL-хранилище. Где…
Apache Cassandra и HBase: конкуренты или альтернативы – 10 ключевых сходств и отличий
Автор Анна ВичуговаКатегория HBase, Новости, СтатьиCassandra и HBase считаются наиболее популярными NoSQL-СУБД в мире Big Data. Сегодня мы поговорим, что между ними общего и чем отличаются эти нереляционные базы данных, сравнив их по 10 ключевым…
Как Apache Cassandra, Kafka, Storm и Hadoop формируют рекомендации пользователям Spotify
Автор Анна ВичуговаКатегория Kafka, Machine Learning, Spark, Use Cases, СтатьиПродолжая разговор про примеры практического использования Apache Cassandra в реальных Big Data проектах, сегодня мы расскажем вам о рекомендательной системе стримингового сервиса Spotify на базе этой нереляционной СУБД в сочетании…