Как быстро и эффективно с помощью Neo4j выявить преступников, незаконно ввозящих в страну контрафактные товары. Почему графовая СУБД Neo4j обошла документо-ориентированную MongoDB, из чего состоит алгоритм поиска рецидивистов средствами технологий…
Метка: NLP
NLP в Neo4j с Cypher: простой пример
Автор Анна ВичуговаКатегория Neo4j, СтатьиНедавно мы писали про рекомендательную систему американской медиа-компании Meredith Corporation на основе графовой СУБД Neo4j и алгоритма непересекающихся множеств (Union-Find). Продолжая эту тему в рамках нашего нового курса по графовой…
NLP с Graph Data Science в Neo4j: 3 эмбеддинг-алгоритма
Автор Анна ВичуговаКатегория Machine Learning, Neo4j, СтатьиВ рамках нашего нового курса графовым алгоритмам в бизнес-приложениях, сегодня разберем эмбеддинг-алгоритмы в библиотеке Graph Data Science СУБД Neo4j: их особенности и возможности практического использования для задач обработки естественного языка…
3 метода векторизации слов в PySpark
Автор Роман КотюбеевКатегория Machine Learning, Spark, СтатьиПродолжаем говорить о NLP в PySpark. После того как тексты обработаны: удалены стоп-слова и проведена лемматизация — их следует векторизовать для последующей передачи алгоритмам Machine Learning. Сегодня мы расскажем о…
Предобработка текстов на русском в PySpark
Автор Роман КотюбеевКатегория Spark, СтатьиВ одной из прошлых статей мы говорили о методах NLP (natural language processing) в PySpark. Сегодня мы покажем, как обработать реальный датасет, который содержит тексты на русском языке. Читайте у…
Конвейер Big Data для Machine Learning на Apache Kafka: разбираем систему речевой аналитики
Автор Анна ВичуговаКатегория Kafka, Machine Learning, Use Cases, Распознавание Речи, СтатьиВ этой статье мы рассмотрим комплексный конвейер (pipeline) обработки больших данных с помощью алгоритмов машинного обучения (Machine Learning) для системы речевого анализа Callinter от китайской компании Fano Labs. Apache Kafka…