20 проблем для Data Scientist, от которых не спасет CRISP-DM

машинное обучение, Machine Learning, обработка данных, Big Data, Большие данные, статистика, Data Science, Data Scientist

Иван Гуз, директор по аналитике и клиентскому сервису Avito, 24.04.2018 на митапе AI Community и AI Today для специалистов по Data Science в офисе компании [1] рассказал о самых главных проблемах, которые подстерегают исследователя данных на практических проектах и от чего не убережет даже подробно проработанный стандарт CRISP-DM. Из его доклада [2] мы выделили топ-20 популярных ошибок и варианты их решений. Часть из них уже упоминалась в статье, посвященной выступлению Станислава Гафарова, руководителя направления по развитию ИТ-систем АО «СберТех» [3], которое состоялось в рамках того же мероприятия [1]. А в сегодняшнем материале мы подробно описываем трудности каждой фазы CRISP-DM – читайте внимательно, чтобы избежать подобных ошибок в своей практике!   5 проблем бизнес-анализа по CRISP-DM Неточная постановка задачи: расплывчатые формулировки Далее …

7 популярных ошибок при работе с данными по стандарту CRISP-DM

машинное обучение, Machine Learning, CRISP-DM, обработка данных, Big Data, Большие данные, статистика

Посмотрев выступление Станислава Гафарова [1], руководителя направления по развитию ИТ-систем АО «СберТех», от 24.04.2018 на митапе AI Community и AI Today для специалистов по Data Science в офисе Авито [2], мы составили ТОП-7 ошибок при работе с данными по методологии CRISP-DM. На основании жизненного цикла работы с информацией по стандарту CRISP-DM, эксперт выделяет 3 типа ошибок [1]: ошибки бизнеса и понимания данных; ошибки подготовки данных и моделирования; ошибки развертывания модели в промышленную эксплуатацию. Далее подробно описаны ошибки каждого типа, возникающие при анализе информации, работе с большими данными (Big Data) и машинном обучении (Machine Learning). 1. Фаза Business Understanding: недостаточная подготовка к использованию CRISP-DM CRISP-DM предполагает довольно высокий уровень зрелости бизнес-процессов по модели CMMI, о которой мы рассказывали здесь. Поэтому, если Далее …

Что такое «цифровая трансформация»?

цифровая трансформация

Digital transformation или Цифровая трансформация – совокупность процессов по тотальному переходу от традиционных методов осуществления деятельности к максимально возможному внедрению современных Digital-технологий. Это новейший бизнес-тренд, направленный на компьютеризацию, использование общего и специального ПО, эксплуатация возможностей Интернета для повышения конкурентоспособности и роста прибыльности. Может показаться, что компьютеризация и использование различных программных возможностей вполне подпадает под определение автоматизации. Это не совсем корректно, ведь автоматизация – лишь один из аспектов глобальной цифровой трансформации. На самом деле имеется ввиду полный перевод бизнеса на Digital-основу с соответствующим ускорением всех процессов и повышением их эффективности. Интернет – площадка для поиска клиентов с бесконечными возможностями. И если вы желаете ими пользоваться, внедрение Digital transformation в компании становится неизбежным. Зачем это нужно? Пользы от цифровой трансформации очень много, Далее …

26-30 ноября 5-дневный курс «Data Science — Машинное обучение в R» 

Практические навыки алгоритмов машинного обучения с использованием R: Априори, нейронные сети, линейная, логистическая и множественная регрессия, кластеризация Related Posts:DSML: Машинное обучение в RАдминистрирование кластера HadoopDSAV: Анализ данных и визуализация в RBDAM: Аналитика больших данных для руководителей

5-7 декабря курс «Аналитика больших данных для менеджеров»

Все что необходимо руководителям и менеджерам для понимания принципов аналитики больших данных, основ построения кластеров Hadoop, цифровой трансформации, Промышленного Интернета Вещей, машинного обучения и Data mining Related Posts:BDAM: Аналитика больших данных для руководителейБезопасность озера данных Hadoop (Cloudera…DSEC: Безопасность озера данных HadoopHDDE: Hadoop для инженеров данных

20 сентября — «Аналитика больших данных для руководителей»в Казахстане

20-22 сентября Учебный Центр «Школа Больших Данных» приглашает на курс «Аналитика Больших данных для руководителей» в г. Алмата, Республика Казахстан  

Конференция Больших Данных 2018

13 сентября 2018  в Москве пройдет 5я Практическая конференция по Большим Данным. В рамках программы конференции будут проведены три трека программ: Бизнес Технический Научный В форме чемпионата Big Data Hackathon среди специалистов в области Data Science будет предложенно  решить различные задачи на датасетах партнеров Big Data Conference В программе новые, неопубликованные ранее кейсы, обсуждение эффективности разных подходов и уроки для начинающих использовать большие данные для бизнеса, доклады посвященные техническим деталям реализации подходов Data Science, и научные доклады посвященные методам Data Mining, машинного и глубокого обучения(Machine Learning  и Deep Learning )и искусственного интелекта (Artificial Intelligence).  Подробнее ознакомиться с программой и зарегистрироваться на мероприятие можно на сайте bigdataconf.org. Related Posts:BDAM: Аналитика больших данных для руководителейDSEC: Безопасность озера данных HadoopБезопасность озера данных Hadoop (Cloudera…HDDE: Hadoop для инженеров данных