Big Data и Machine Learning против COVID-19: 3 кейса про коронавирус и искусственный интеллект

Big Data, Большие данные, Machine Learning, машинное обучение, искусственный интеллект, предиктивная аналитика

11 марта 2020 года ВОЗ объявила о пандемии нового коронавируса (Covid-19), который в декабре 2019 был впервые обнаружен в китайском мегаполисе Ухань. С тех пор вирус стремительно распространяется по всей планете, вызывая острые респираторные заболевания. Сегодня мы расскажем, почему, несмотря на повсеместные карантины и обвал мировых рынков, все не все так страшно и как технологии больших данных (Big Data) помогают справиться с этой напастью.

Еще раз о коронавирусе: кто виноват и что делать

Прежде всего, чтобы снизить градус паники, отметим, что даже при высокой заразности, коронавирус относительно легко переносится большей частью людей. Именно этим обусловлена широчайшая площадь его распространения: человек не зная, что болен, продолжает жить обычной жизнью: работает, ходит в магазин, кафе, кино, развлекательные и учебные центры, а также прочие общественные места. При этом он активно распространяет инфекцию, которая, как и любой вирус, в большей степени опасна для наиболее беззащитных членов общества.

Врачи отмечают, что в зоне риска находятся люди старше 70 лет, а также лица с ослабленным иммунитетом и никотиновой зависимостью. Более 80% заразившихся переносят болезнь как сезонное ОРВИ или грипп: повышенная температура, кашель, слабость в течение недели с последующим выздоровлением. У некоторых людей вообще отсутствуют даже такие симптомы, а 30–40% населения вообще не подвержены инфекции. В частности, считается, что маленькие дети болеют сравнительно легко и без осложнений. Однако, они могут выступать переносчиками вируса, поэтому каждому из нас нужно соблюдать меры предосторожности: есть и спать в достаточном количестве, тщательно мыть руки и лицо, дезинфицировать поверхности, ограничить посещения мест с большим скоплением людей, в т.ч. культурно-массовые мероприятия и общественный транспорт. Благодаря таким, на первый взгляд, несложным мерам, даже при самом неблагоприятном прогнозе, инфекция во всем мире будет взята под контроль к июлю 2020 года [1].

Аналитики McKinsey также прогнозируют естественное снижение распространения вируса с наступлением весны в Северном полушарии. С экономической точки зрению коронавирус в наибольшей степени затронет малый и средний бизнес, однако крупные компании также могут пострадать, особенно сфера услуг, авиация, ресторанный и туристический бизнесы. Ожидается общее снижение роста глобального ВВП, что приведет к замедлению мировой экономики, хотя и не к рецессии [2].

Поэтому продолжаем жить и работать дальше с учетом современных реалий и будущей перспективы, что в итоге все будет хорошо. Например, даже в условиях пандемии Covid-19, наш учебный центр «Школа Больших Данных» работает в штатном режиме согласно утвержденному расписанию. Для компаний, ограничивающих передвижения своих сотрудников, доступен дистанционный формат обучения в режиме удаленного взаимодействия.

Big Data против COVID-19

Возвращаясь к коронавирусу, отметим, что прозрачность данных и адекватность статистики – это ключевые факторы, которые помогают медикам и другим компетентным специалистам понять особенности чрезвычайной ситуации и своевременно принять нужные меры. В частности, создается множество сайтов с интерактивной информацией о заболевших, выздоровевших и погибших от Covid-19. Например, Яндекс представил свой дэшборд с мировой картиной и детальной разбивкой по областям РФ, используя отчеты Роспотребнадзора и Университета Джонса Хопкинса в США [3]. Это – классический пример высоконагруженной Big Data системы, которая в режиме near real-time получает данные из разных источников, агрегирует их и представляет множеству пользователей в наглядном виде.

карта COVID-19 Яндекс, большие данные, Big Data
Интерактивная карта COVID-19 от Яндекса

Искусственный интеллект vs коронавирус: выигрывает человек

Data Science помогает бороться с вирусом с момента его возникновения. В частности, Big Data система машинного обучения для мониторинга здоровья BlueDot, зафиксировала вспышку пневмонии, вызванной коронавирусом еще 31 декабря 2019 года, т.е. раньше специалистов ВОЗ. Платформа в режиме реального времени анализирует новостные сводки в СМИ на иностранных языках, официальные заявления властей, а также отчеты о болезнях в животном и растительном мирах. Также искусственный интеллект (ИИ) BlueDot агрегирует и косвенные данные: посты в блогах и на форумах, а также брони авиабилетов по всему миру. Благодаря этому система верно определила не только место возникновения эпидемии, но и пути ее дальнейшего распространения: от китайского Уханя в Бангкок, Сеул, Тайбэй и Токио [4].

Другой показательный пример использования Artificial Intelligence в борьбе с Covid-19 – это автоматическая диагностика заболевших с помощью алгоритмов Machine Learning для распознавания данных компьютерной томографии. С начала марта 2020 года эта система проходит опытную эксплуатацию в Национальном суперкомпьютерном центре в Тяньцзине, который разработал ее совместно с Китайской ассоциацией по борьбе с раком [5]. Также в Китае был создан подвижный робот для бесконтактного измерения температуры тела. Благодаря интеграции этого устройства с национальной системой распознавания лиц и наличию технологии 5G, оно способно выявить отсутствие медицинской маски и сделать личное предупреждение. Этот робот способен одновременно отслеживать целых 32 объекта во время патрулирования улиц, что весьма востребовано в условиях всеобщего карантина в Китае [6].

Наконец, Machine Learning и другие методы Data Science используются для разработки вакцины и лекарств от коронавируса. Например, ИИ-система AlphaFold исследовательского подразделения DeepMind корпорации Google предсказала возможную структуру некоторых белков COVID-19, используя технологию матричного моделирования. Точное знание компонентного и структурного состава коронавируса позволит синтезировать вещества для лечения заболеваний, вызванных этой инфекцией. Пока еще полученные исследования не проверены экспериментально, но они помогут ученым понять, как функционирует вирус, чтобы создать гипотезы по эффективной терапии [7].

COVID-19, Data Science
Белковая структура коронавируса

Удаленная работа и дистанционное обучение

Чтобы снизить распространение инфекции и предупредить чрезмерную нагрузку на национальную систему здравоохранения, многие ИТ-компании частично перевели своих сотрудников на удаленный режим работы. В частности, с марта 2020 года Яндекс, Лаборатория Касперского, ВКонтакте, Mail.ru Group, ДоДо пицца, Тинькофф банк и другие предприятия [8], а также многие отечественные университеты (МГУ, МГУ, МГИМО, ВШЭ и пр.) переводят мероприятия в онлайн, организуют защищенные каналы, удаленные рабочие столы и другие технические возможности для дистанционной работы или обучения [9].

Таким образом, пандемия коронавируса – это не всеобщие каникулы, а повседневная работа в новых условиях. Ведь, по большому счету, разработчику и тестировщику ПО, DevOps-инженеру облачного кластера, техническому писателю или другому ИТ-специалисту для эффективной работы нужны системы и данные, а не физический офис. А если все-таки специфика вашей отрасли не предполагает удаленного режима, то карантин – это отличный повод заняться самообразованием или повысить квалификацию своих сотрудников, организовав для них курсы по Apache Spark, Kafka, Hadoop и прочим технологиям Big Data.

Напоминаем, что даже в период пандемии Covid-19 наш лицензированный учебный центр «Школа Больших Данных» работает в штатном режиме, реализуя образовательные курсы обучения и повышения квалификации руководителей и ИТ-специалистов (менеджеров, архитекторов, инженеров, администраторов, Data Scientist’ов и аналитиков Big Data) в Москве согласно утвержденному расписанию. Для компаний, ограничивающих передвижения своих сотрудников, предлагается дистанционный формат обучения в режиме удаленного взаимодействия.

расписание компьютерные курсы для руководителей, аналитиков, программистов, администраторов и пользователей Internet of Things, Big Data и Machine Learning Смотреть расписание занятий
регистрация на компьютерные курсы для руководителей, аналитиков, программистов, администраторов и пользователей Internet of Things, Big Data и Machine Learning Зарегистрироваться на курс

Источники

  1. https://www.business-gazeta.ru/article/461083
  2. https://www.mckinsey.com/~/media/McKinsey/Email/Shortlist/79/2020-03-13.html
  3. https://yandex.ru/web-maps/covid19?ll=41.775580%2C54.894027&z=3
  4. https://www.vesti.ru/doc.html?id=3234152
  5. http://russian.news.cn/2020-03/09/c_138859409.htm
  6. https://nv.ua/techno/innovations/koronavirus-v-kitae-sozdali-robotov-dlya-borby-s-epidemiey-50072122.html
  7. https://regnum.ru/news/2878295.html
  8. https://habr.com/ru/post/492086/
  9. https://academia.interfax.ru/ru/news/articles/4311/