Hadoop: практичное применение инструмента

hadoop

Hadoop – специализированный пакет алгоритмов и инструментов, предназначенных для массированной обработки информации. Его задача – работа с крупнейшими массивами данных, упорядоченных и неупорядоченных. Инструмент настолько эффективен, что достаточно широко используется в ряде алгоритмов поисковых систем и при построении ресурсоемких сайтов. Однако, Hadoop можно использовать и в гораздо более практичных и приближенных к повседневным задачам целях. Например, внедрить систему в своей компании для решения различных задач, связанных со структурированием и анализом имеющихся и поступающих данных. Суть Hadoop заключается в том, что Далее …

Без рубрики

14-16 ноября-«Безопасность озера данных Hadoop HortonWorks»

3х-дневный практический workshop по обеспечению безопасности озер данных (Data Lakes) на кластерах Hadoop  (рассматриваемые дистрибутивы HortonWorks, ArenaData, Cloudera). Практически рассмотрим модели безопасности, настройка периметра безопасности Data Lakes, средства контроля доступа к большим данным, аудит, шифрование, антивирусная защита … Подробнее смотрите на сайте  курс «Безопасность озера данных Hadoop (HortonWorks HDP)»  

26-30 ноября 5-дневный курс «Data Science — Машинное обучение в R» 

Практические навыки алгоритмов машинного обучения с использованием R: Априори, нейронные сети, линейная, логистическая и множественная регрессия, кластеризация

5-7 декабря курс «Аналитика больших данных для менеджеров»

Все что необходимо руководителям и менеджерам для понимания принципов аналитики больших данных, основ построения кластеров Hadoop, цифровой трансформации, Промышленного Интернета Вещей, машинного обучения и Data mining

KSQL — для тех кто любит Kafka и не знает Java

KSQL — это движок SQL с открытым исходным кодом для Apache Kafka. Он обеспечивает простой, но мощный интерактивный SQL интерфейс для потоковой обработки на Kafka, без необходимости писать код на языке программирования, таком как Java или Python.  SELECT * FROM payments-kafka-stream WHERE fraud_probability > 0.8                                                                    KSQL поддерживает широкий Далее …

10-14 декабря курс «Администрирование кластера Hadoop»

Практические занятия по установке, конфигурированию и поддержке кластера под управлением Cloudera Manager, настройка безопасности Kerberos, мониторинг, восстановление, резервное копирование.  

Cloudera выпустила новый релиз Cloudera Enterprise 6.0

10 сентября 2018 г. компания Cloudera  выпустила новую платформу для построения решений Data Warehousing и Machine Learning  предназначенную для унификации контроля и управления длительными и  переходящими нагрузками в Public Clouds и центрах данных с испольованием нового решения Cloudera Altus.   Cloudera Enterprise 6.0 построенная поверх новой версии дистрибутива Apache Hadoop 3.0  добавляет ряд новых улучшений в  состав и характеристики компонент решения: Cloudera Altus Director — решение для управления несколькими высилительными кластерами и кластерами данных  в гибридном облаке. Новая версия Solr — Далее …

20 сентября — «Аналитика больших данных для руководителей»в Казахстане

20-22 сентября Учебный Центр «Школа Больших Данных» приглашает на курс «Аналитика Больших данных для руководителей» в г. Алмата, Республика Казахстан