20 проблем для Data Scientist, от которых не спасет CRISP-DM

машинное обучение, Machine Learning, обработка данных, Big Data, Большие данные, статистика, Data Science, Data Scientist

Иван Гуз, директор по аналитике и клиентскому сервису Avito, 24.04.2018 на митапе AI Community и AI Today для специалистов по Data Science в офисе компании [1] рассказал о самых главных проблемах, которые подстерегают исследователя данных на практических проектах и от чего не убережет даже подробно проработанный стандарт CRISP-DM. Из его доклада [2] мы выделили топ-20 популярных ошибок и варианты их решений. Часть из них уже упоминалась в статье, посвященной выступлению Станислава Гафарова, руководителя направления по развитию ИТ-систем АО «СберТех» [3], которое состоялось в рамках того же мероприятия [1]. А в сегодняшнем материале мы подробно описываем трудности каждой фазы CRISP-DM – читайте внимательно, чтобы избежать подобных ошибок в своей практике! 5 проблем бизнес-анализа по CRISP-DM Неточная постановка задачи: расплывчатые формулировки и Далее …

7 популярных ошибок при работе с данными по стандарту CRISP-DM

машинное обучение, Machine Learning, CRISP-DM, обработка данных, Big Data, Большие данные, статистика

Посмотрев выступление Станислава Гафарова [1], руководителя направления по развитию ИТ-систем АО «СберТех», от 24.04.2018 на митапе AI Community и AI Today для специалистов по Data Science в офисе Авито [2], мы составили ТОП-7 ошибок при работе с данными по методологии CRISP-DM. На основании жизненного цикла работы с информацией по стандарту CRISP-DM, эксперт выделяет 3 типа ошибок [1]: ошибки бизнеса и понимания данных; ошибки подготовки данных и моделирования; ошибки развертывания модели в промышленную эксплуатацию. Далее подробно описаны ошибки каждого типа, возникающие при анализе информации, работе с большими данными (Big Data) и машинном обучении (Machine Learning). 1. Фаза Business Understanding: недостаточная подготовка к использованию CRISP-DM CRISP-DM предполагает довольно высокий уровень зрелости бизнес-процессов по модели CMMI, о которой мы рассказывали здесь. Поэтому, если Далее …

Что такое «цифровая трансформация»?

цифровая трансформация

Digital transformation или Цифровая трансформация – совокупность процессов по тотальному переходу от традиционных методов осуществления деятельности к максимально возможному внедрению современных Digital-технологий. Это новейший бизнес-тренд, направленный на компьютеризацию, использование общего и специального ПО, эксплуатация возможностей Интернета для повышения конкурентоспособности и роста прибыльности. Может показаться, что компьютеризация и использование различных программных возможностей вполне подпадает под определение автоматизации. Это не совсем корректно, ведь автоматизация – лишь один из аспектов глобальной цифровой трансформации. На самом деле имеется ввиду полный перевод бизнеса на Digital-основу с соответствующим ускорением всех процессов и повышением их эффективности. Интернет – площадка для поиска клиентов с бесконечными возможностями. И если вы желаете ими пользоваться, внедрение Digital transformation в компании становится неизбежным. Зачем это нужно? Пользы от цифровой трансформации очень много, Далее …

11-13 сентября курс «Аналитика больших данных для менеджеров»

Расширенный тренинг для руководителей и собственников компаний, менеджеров проектов по большим данным и специалистов желающих получить полное представление о технологиях и трендах  в больших данных для понимания принципов аналитики больших данных, основ построения кластеров Hadoop, цифровой трансформации, Промышленного Интернета Вещей, машинного обучения и Data mining:ltv , компонентах экосистемы Hadoop и NoSQL, облачных вычислений, Data Lakes, DevOps, Agile, микросервисах, dockers & kubernets.     Related Posts:DSEC: Безопасность озера данных HadoopHDDE: Hadoop для инженеров данных20 проблем для Data Scientist, от которых не спасет CRISP-DMКак продавать проекты Больших данных

Конференция Больших Данных 2018

13 сентября 2018  в Москве пройдет 5я Практическая конференция по Большим Данным. В рамках программы конференции будут проведены три трека программ: Бизнес Технический Научный В форме чемпионата Big Data Hackathon среди специалистов в области Data Science будет предложенно  решить различные задачи на датасетах партнеров Big Data Conference В программе новые, неопубликованные ранее кейсы, обсуждение эффективности разных подходов и уроки для начинающих использовать большие данные для бизнеса, доклады посвященные техническим деталям реализации подходов Data Science, и научные доклады посвященные методам Data Mining, машинного и глубокого обучения(Machine Learning  и Deep Learning )и искусственного интелекта (Artificial Intelligence).  Подробнее ознакомиться с программой и зарегистрироваться на мероприятие можно на сайте bigdataconf.org. Related Posts:Как подготовить данные к моделированию: 5 операций…Зачем нужна очистка данных для Data Mining: 10…20 проблем для Data Scientist, Далее …