Я знаю, что вы делали прошлым летом и сегодня утром: как государство и бизнес собирают Big Data о каждом из нас

Автор Категория , ,
Я знаю, что вы делали прошлым летом и сегодня утром: как государство и бизнес собирают Big Data о каждом из нас

Мы уже писали о преимуществах DaaS-похода, когда облачные провайдеры предоставляют данные как услугу, включая сложную предиктивную аналитику с использованием алгоритмов машинного обучения. Это позволяет быстро и удобно воспользоваться технологиями Big Data без существенных инвестиций в ИТ-инфраструктуру и дорогих специалистов, таких как Data Scientist, инженер и аналитик больших данных. Однако все плюсы достоинства этой бизнес-модели немного меркнут, когда товаром становитесь вы сами. Сегодня мы расскажем, как большой брат проникает в личную жизнь россиян еще больше, а понятие приватности стремительно исчезает, уступая место тотальному контролю со стороны государства и крупных корпораций.

Телефон и твой номер тянут меня, как магнит или DaaS-сервисы от мобильных операторов

Пока бизнес пытается легализовать для граждан торговлю собственными персональными данными, запуская маркетплейс «Датамания» совместно с отечественным Фондом развития интернет-инициатив [1], многие крупные корпорации уже вовсю играют на этом поле. В частности, один из мобильных операторов сотовой связи в России, компания «Вымпелком» в июле 2020 года анонсировала новый сервис, который позволяет получать сведения о демографии граждан по 16-ти параметрам: пол, возраст, уровень дохода, интересы, сервисы и приложения в интернете и прочие данные, которые можно получить с помощью методов Data Mining по базам Вымпелкома.

Пока этот сервис экспресс-аналитики больших данных открыт для пользователей бесплатно в демонстрационных целях, но до конца 2020 года появится его платная версия. Таким образом, сегодня воспользоваться этим маркетинговым инструментом может любой желающий, авторизовавшись в личном кабинете на сайте «Билайна» и загрузив в форму телефонные номера, которые нужно проанализировать (не менее 300). Система отфильтрует абонентов Вымпелкома и выдаст по ним обезличенную статистику, например, каков процент мужчин и женщин в рассмотренной выборке с разбивкой по возрастам и типам занятости. Справедливости ради стоит отметить, что Вымпелком – не единственный сотовый оператор, который позволяет такие манипуляции с данными своих клиентов. Подобные DaaS-сервисы есть и у МТС с начала 2020 года, а также Tele2 с 2019 года. Разумеется, большинство клиентов этих телекоммуникационных компаний не давали своего согласия на участие в подобного рода исследованиях [2].

Big Data о каждом под государственным флагом

Впрочем, коммерческие корпорации подчеркивают, что их DaaS-решения полностью соответствуют требованиям 152-ФЗ «О персональных данных», поскольку результаты Data Mining’a выдаются в обезличенном виде, в отличие от государственных сервисов. К примеру, в июле 2020 года Министерство экономики предложило вывести обработку персональных данных в рамках экспериментальных правовых режимов из-под действующего регулирования, включая тайну связи, переписки и телефонных переговоров, а также врачебную тайну. Это означает, что можно будет не соблюдать тайну связи, переписки и телефонных переговоров, а также врачебную тайну, а также не соблюдать требования об обязательном получении письменного согласия гражданина на обработку его данных и возможности отозвать такое согласие. Пока этот законопроект находится на стадии согласования, но решение по нему должно быть принято до 31 августа 2020 года. В качестве экспериментов выступают проекты фонда «Иннопрактика» и «Национальной базы медицинских знаний» (НБМЗ) по применению искусственного интеллекта (ИИ) в медицине и сервис для повышения эффективности малого и среднего бизнеса, которым занимается Ассоциация больших данных. Ожидается, что новый законопроект повысит качество диагностировании заболеваний, облегчая принятие врачебных решений с помощью ИИ при мониторинге состояния пациентов, назначении и корректировке лечения. А непрерывный сбор банковских, абонентских и другие клиентских данные, позволит предпринимателям более эффективно находить новые рынки прочие возможности улучшения бизнеса. Однако, эксперты в области приватности данных, в частности, зампред комиссии по правовому обеспечению цифровой экономики московского отделения Ассоциации юристов России Александр Савельев, подчеркивают, что этот законопроект фактически уничтожает неприкосновенность личной информации под видом развития инноваций. Причем речь идет не только о тотальном контроле государства за своими гражданами, но и огромных рисках различных правонарушений, от финансовых мошенничеств по телефону до физических преступлений, когда персональные данные о доходе и местонахождении человека попадают в недобросовестные руки [3]. Подробнее о других этических проблемах цифровизации мы рассказывали здесь.

Тем не менее, власть продолжают усиливать мониторинг за обывателями. В частности, в мае 2020 года госдума приняла законопроект № 759897-7 «О едином федеральном информационном регистре, содержащем сведения о населении Российской Федерации». Каждому гражданину присвоят уникальный неизменяемый номер, а всю информацию сконцентрируют в одной базе (реестре). В этом едином информационном ресурсе будут храниться данные о каждом жителе России: ФИО, дата и место рождения, пол, гражданство, СНИЛС, ИНН, семейное положение и другие сведения. Оператором реестра выступит Федеральная налоговая служба (ФНС). Ожидается, что подобный сервис позволит бороться с правонарушениями и сократит мошенничества при получении мер социальной поддержки и уплаты налогов, сборов и других обязательных платежей, а также повысит собираемость налогов. Закон начнет действовать с 1 января 2022 года, но некоторые его положения вступят в силу чуть позже. Переходный период предусмотрен до конца 2025 года [4]. Примечательно, что силовые ведомства и спецслужбы, такие как МВД и Минобороны, будут иметь непосредственный доступ к этому реестру данных обо всех россиянах [5].

При всех возможных плюсах данного проекта, например, отсутствие разночтений в данных об одном человеке в разных ведомствах, стоит помнить, что наличие единой базы о населении всей страны – это потенциальный источник величайшей утечки информации, несмотря на все заверения авторов законопроекта о высокой степени защиты этого ресурса [6]. Эти опасения подтверждают, например, новости о том, что паспортные данные граждан, оштрафованных за нарушение режима самоизоляции в пандемию коронавируса COVID-19, оказались в открытом доступе. Однако, вину за это столичная мэрия возложила на самих оштрафованных [7].

Таким образом, государство и крупный бизнес стремительно приобретают права на использование личных данных граждан в своих целях, оставляя им только ответственность за утечки этой информации и ее применение в неправомерных целях. Завтра мы продолжим разговор про государственные инициативы в области цифровой экономики и рассмотрим новую программу господдержки ИТ-отрасли, включая налоговые маневры и прочие меры.

А как найти тонкий баланс между эффективным Data Mining’ом и обеспечением приватности с помощью технологий Big Data в реальных проектах цифровизации вашего бизнеса или цифровой трансформации государственных и муниципальных предприятий, вы узнаете на нашем обновленным курсе «Аналитика больших данных для руководителей» в лицензированном учебном центре обучения и повышения квалификации разработчиков, менеджеров, архитекторов, инженеров, администраторов, Data Scientist’ов и аналитиков Big Data в Москве.

 

Источники

  1. https://www.kommersant.ru/doc/4235317
  2. https://habr.com/ru/news/t/512132/
  3. https://www.kommersant.ru/doc/4424832
  4. https://www.rbc.ru/rbcfreenews/5ec65a039a7947acd3396b76
  5. https://www.rbc.ru/politics/21/05/2020/5ec6af6c9a7947d9a282a42c
  6. https://habr.com/ru/news/t/503256/
  7. https://www.rbc.ru/society/18/05/2020/5ec296eb9a7947914aba7e7e