Курсы Big Data, Hadoop, Arenadata, Kafka и Spark

05Авг

ИИ и векторные базы данных: как это работает?

Автор Анна Вичуговав категории Machine Learning, NoSql, Блог

архитектура больших данных, ИИ и векторные СУБД, метод ближайших соседей машинное обучение, knn machine learning nosql, обучение Data Science примеры курсы обучение, NoSQL векторные базы данных примеры курсы обучение, администратор дата-инженер архитектор больших данных примеры курсы обучение, Школа Больших Данных Учебный Центр Коммерсант

Как устроены векторные базы данных и почему они стали так популярны с распространением ИИ. Архитектура, алгоритмы, принципы работы и примеры векторных СУБД. Что такое векторная СУБД и при чем здесь ИИ Как и следует из названия, векторная база хранит данные в виде векторов. Это понятие из математики означает специализированное представление...

30Июл

3 новых графовых алгоритма в Neo4j: новинки 2023

Автор Анна Вичуговав категории Neo4j, NoSql, Блог

графовые алгоритмы Neo4j , обучение Neo4j graph data science курсы примеры, курсы дата-аналитик Neo4j примеры обучение, обучение аналитике больших данных, Neo4j задачи на графах бизнес приложения примеры, поиск путей и выявление сообществ Neo4j, обучение большим данным, Школа Больших Данных Учебный Центр Коммерсант

Как включить отрицательные веса в поиск пути, выявлять центральные и периферийные кластеры на основе заданной плотности, а также делать выборки из больших графов для масштабирования машинного обучения. Знакомимся с графовыми алгоритмами, недавно добавленными в библиотеку Neo4j Graph Data Science 2.4: декомпозиция K-ядра, алгоритм кратчайшего пути Беллмана-Форда и случайное блуждание с...

23Июл

Мультимодельные базы данных: мифы и реальность на примере 3-х СУБД

Автор Анна Вичуговав категории NoSql, Блог

архитектура больших данных хранилища базы СУБД, NoSQL мультимодельные базы данных примеры, курсы обучение, архитектура данных, графы примеры курсы обучение, обработка графов и документов в Greenplum и PostgreSQL, обучение Greenplum Arenadata DB курсы, Greenplum для инженеров данных и и разработчиков, хранение и аналитика больших данных с Greenplum, Школа Больших Данных Учебный центр Коммерсант

Как устроены по-настоящему мультимодельные базы данных, чем они отличаются от реляционных и NoSQL-СУБД, а также какова истинная природа универсального подхода к хранению и оперированию данными. Разбираемся на примере ArangoDB, OrientDB и Cosmos DB. Что такое мультимодельная СУБД и зачем она нужна Любая технология предназначена, прежде всего, для решения конкретных проблем,...

22Июл

Что такое GQL и при чем здесь Cypher: новый стандарт языка запросов к графам

Автор Анна Вичуговав категории NoSql, Блог

графы примеры курсы обучение, обработка графовых данных в NoSQL, язык запросов к графам, стандарт SQL для графовых баз данных, NoSQL графы примеры курсы обучение, обучение большим данным курсы, GQL для инженеров данных и и разработчиков, графовые алгоритмы, Школа Больших Данных Учебный центр Коммерсант

Кто и зачем создает аналог SQL для запросов к графовым базам данных, когда выйдет официальная версия стандарт и при чем здесь Cypher из Neo4j. Что такое GQL и кто его разрабатывает В рамках продвижения нашего курса по графовым алгоритмам в бизнес-приложениях мы часто рассказываем про инструменты хранения и анализа графовых...

13Июл

Что такое BioCypher: возможности Neo4j для биомедицины

Автор Анна Вичуговав категории Machine Learning, Neo4j, NoSql, Блог

Data Science биомедицины Neo4j BioCypher Biolink, графовые базы данных СУБД NoSQL в биомедицине примеры курсы обучение, обработка графовых данных графы, обучение NoSQL Neo4j, обучение NoSQL Neo4j курсы, NoSQL Neo4j для инженеров данных и и разработчиков, NoSQL Neo4j Data Science, хранение и аналитика больших данных графовые базы данных NoSQL Neo4j, Школа Больших Данных Учебный центр Коммерсант

Зачем биомедикам понадобился свой язык описания онтологий, как эти задачи решает BioCypher и при чем здесь Neo4j: практическое приложение Data Science и графовых алгоритмов в биомедицинской сфере. Что такое BioCypher Графовые алгоритмы активно применяются в биомедицине для анализа различных биологических данных, таких как геномные, протеомные, данные о белковых взаимодействиях и...

30Июн

Под капотом Neo4j: изоляция транзакций и составные базы данных

Автор Анна Вичуговав категории Neo4j, NoSql, Блог

графовые базы данных СУБД NoSQL примеры курсы обучение, обработка графовых данных графы, обучение NoSQL Neo4j, обучение NoSQL Neo4j курсы, NoSQL Neo4j для инженеров данных и и разработчиков, NoSQL Neo4j Data Science, хранение и аналитика больших данных графовые базы данных NoSQL Neo4j, Школа Больших Данных Учебный центр Коммерсант

Сегодня заглянем внутрь Neo4j, чтобы разобраться с базовыми концепциями этой графовой базы данных. Какие уровни изоляции транзакций поддерживаются в Neo4j, почему одна установка по умолчанию содержит две базы данных, что такое составная БД и как с этим работать. Транзакции в Neo4j Neo4j — это популярная нативная графовая СУБД, способная управлять...

26Июн

Архитектура данных для реализации паттерна Event Sourcing

Автор Анна Вичуговав категории NoSql, Блог

архитектура данных, курсы Big Data архитектор примеры обучение, Apache HBase Kafka PostgreSQL Greenplum MongoDB Event Sourcing, Event Sourcing паттерн примеры курсы обучение хранилища данных, хранилища данных в микросервисной архитектуре, CQRS Event Sourcing, NoSQL курсы примеры обучение, Школа Больших Данных Учебный центр Коммерсант

Что представляет собой паттерн проектирования микросервисов под названием источник событий (Event Sourcing) и как его реализовать в реляционных базах данных и NoSQL-системах. Разбираемся с архитектурой данных и архитектурой ПО на практических примерах. Архитектурный шаблон Event Sourcing Многие архитектурные шаблоны рассматривают сущности (entity) как основную концепцию, описывая способы их сохранения и...

03Июн

Как на самом деле устроены графовые базы данных?

Автор Анна Вичуговав категории Neo4j, NoSql, Блог

графовые алгоритмы на больших данных примеры курсы обучение, графы графовые базы данных СУБД NoSQL примеры курсы обучение, обработка графовых данных в Greenplum и PostgreSQL графы, обучение NoSQL Neo4j, обучение NoSQL Neo4j курсы, NoSQL Neo4j для инженеров данных и и разработчиков, NoSQL Neo4j Data Science, хранение и аналитика больших данных графовые базы данных NoSQL Neo4j, Школа Больших Данных Учебный центр Коммерсант

Что такое безиндексная смежность и как она снижает сложность алгоритмов обхода графа, позволяя быстро и эффективно запрашивать множество узлов и отношений. Разбираемся с уникальными принципами работы графовых баз данных на примере Neo4j. Архитектура и принципы работы графовых баз данных Несмотря на стремление разработчиков современных СУБД к унификации их решений, первичная...

26Май

Кто кому заплатил: пример поиска банковских транзакций в Neo4j

Автор Анна Вичуговав категории Neo4j, NoSql, Блог

Cypher Python Neo4j AuraDB графы примеры курсы обучение, обучение Neo4j примеры, курсы дата-аналитик Neo4j Python примеры обучение, обучение аналитике больших данных, Neo4j задачи на графах бизнес приложения примеры, Cypher Python Neo4j примеры курсы обучение, обучение большим данным, Школа Больших Данных Учебный Центр Коммерсант

Чтобы показать еще один вариант использования графовой базы данных Neo4j, сегодня реализуем небольшое Python-приложение, которое генерирует граф знаний в облачной платформе Aura DB. Ищем финансовые переводы между компаниями и физическими лицами, считаем общую сумму и визуализируем найденные транзакции с помощью библиотеки Networkx. Python-приложение для работы с Neo4j в AuraDB Как...

24Май

В помощь дата-инженеру: как организовать конвейер инкрементной загрузки данных

Автор Анна Вичуговав категории NoSql, Spark, Блог

архитектура данных, инженер данных архитектор Big Data примеры курсы обучение, инкрементный ETL, инженерия Big Data, Data Lake Delta Lake ETL примеры курсы обучение, Школа Больших Данных Учебный Центр Коммерсант

Инкрементные конвейеры загрузки больших объемов данных в корпоративное хранилище или озеро как самый экономичный способ масштабирования архитектуры данных. Разбираемся, как дата-инженеру эффективно организовать такие ETL-конвейеры. 2 способа организации конвейеров инкрементной загрузки данных Инкрементный ETL (Extract, Transform and Load) для классического DWH стал обычным явлением с источниками CDC (сбор данных об...