Как графовая аналитика спасает ваши деньги: пара реальных кейсов

Автор Категория ,
Как графовая аналитика спасает ваши деньги: пара реальных кейсов

Сегодня рассмотрим, как методы графовой аналитики больших данных помогают бороться с эпидемией финансовых мошенничеств: выявлять номера злоумышленников, идентифицировать фрод-транзакции, выявлять и предотвращать схемы отмывания денег. Читайте далее, что под капотом AML-систем и как инструменты Data Science предотвращают злоупотребление методами социальной инженерии.

Немного истории: что такое социальная инженерия и чем это опасно

Социальная инженерия – это психологическое манипулирование людьми с целью совершения определенных действий или разглашения конфиденциальной информации. Первые примеры такого манипулирования можно найти еще в библейской истории, однако, несмотря на древность этого подхода, он эффективно применяется и по сей день.

В 2020 году мошенники вывели у клиентов банков более 150 миллиардов рублей, при этом большая часть хищений была совершена с использованием методов социальной инженерии. А в 1-м квартале 2021 года объем похищенных средств вырос в 1.5 раза по сравнению с прошлогодними показателями. Сегодня средний чек успешной мошеннической операции составляет около 8 тысяч рублей, а новостные сайты каждого региона России пестрят объявлениями о множестве пострадавших. Получается, эпидемия финансовых мошенничеств по охвату и понесенным последствиям сравнима с пандемией COVID-19, о чем мы писали в прошлой статье.

Однако, современные инструменты Data Science, в частности, графовая аналитика больших данных, помогают и здесь. Борьба с эпидемией финансовых мошенников происходит по трем основным направлениям:

  • нахождение мошеннических номеров;
  • идентификация подозрительных и/или злонамеренных транзакций, называемых фрод-операциями от английского fraud;
  • обнаружение и предотвращение схем вывода украденных средств, т.е. «отмывание денег» (AML).

Рассмотрим, как анализ графов работает в каждом из этих направлений подробнее.

Графовые алгоритмы. Бизнес-приложения

Код курса
GRAF
Ближайшая дата курса
13 декабря, 2022
Длительность обучения
24 ак.часов
Стоимость обучения
45 000 руб.

Нахождение мошеннических номеров

В настоящее время практикуются два основных подхода для обнаружения мошеннических номеров:

  • на основе базы пользовательских отзывов, где мошеннические номера добавляются в соответствующие справочники. Основным недостатком подхода является задержка – в справочниках пользовательских отзывов номера появляются в среднем через три дня после их появления в сети. За это время мошенники успевают вывести большое количество денежных средств и поменять номер телефона, с которого происходят противоправные действия.
  • использование алгоритмов машинного обучения (Machine Learning), которые позволяют находить мошеннические номера уже через час после их появления в сети с высокой точностью обнаружения (от 80%).

Также ML-алгоритмы, в отличие от базы пользовательских отзывов, позволяют реализовать регулярную автоматическую верификацию, корректировку и обновление списка. Для построения модели рассчитываются факторы, характеризующие профиль поведения мошеннических номеров. Например, средняя продолжительность разговора, отношение количества входящих и исходящих звонков с номера и пр. Также высокую значимость показывают факторы на базе графовой меры связности, поскольку мошенники охотятся «стаями» и жертвы обычно подвергаются атакам сразу с нескольких мошеннических номеров.

Идентификация фрод-транзакций

Если система безопасности банка не смогла зафиксировать факт звонка с мошеннического номера, следующей стадией защиты является система обнаружения мошеннической транзакции. Эта система учитывает следующий набор факторов:

  • информации о платежах с анализируемой карты за прошлые периоды;
  • характеристики анализируемой транзакции;
  • категория компании, в которой проходит анализируемая транзакция (определяется модельным путем).

Определение категории анализируемой транзакции является самостоятельной задачей, требующей специального подхода, в том числе на базе анализа графовых характеристик. Об этом мы расскажем в нашей новой статье.

Обнаружение и предотвращение схем вывода украденных средств (AML)

Если мошенническая транзакция все же была совершена, то следующим этапом борьбы с мошенниками является идентификация факта обналичивания украденных денежных средств с последующей поимкой преступников и разрушением сетей обнальщиков.

Действенным подходом для обнаружения новых обнальщиков является нахождение графовых метрик пересечения между лицами, осуществляющими переводы. Например, в одном реальном кейсе этот подход позволил обнаружить 552 новых обнальщиков по 82 известным.

Графовая аналитика Big Data и большие деньги: борьба с мошенничеством

Рис1. Граф лиц, осуществляющих обналичивание украденных денежных средств

Обнаружение лиц, играющих центральную роль в сетях обнальщиков, и их поимка позволяют разрушить всю сеть преступников. Например, сообщество платежей из 195 участников распалось на изолированные вершины после удаления 6 узлов с наибольшем значением меры центральности.

Графовая аналитика Big Data и большие деньги: борьба с мошенничеством

Рис2. Исходное сообщество платежей из 195 участников

Графовая аналитика Big Data и большие деньги: борьба с мошенничеством

Рис3. Преобразованный граф сообщества после удаления 6 узлов с наибольшем значением меры центральности

Вместо заключение

Эпидемия финансовых мошенников захлестнула Россию и лишь благодаря современным аналитическим технологиям нам удается сдерживать преступников. Основное преимущество подходов на базе графовых алгоритмов в том, что их работу практически невозможно смоделировать со стороны мошенников. Ведь построение графовых метрик требует огромного объема данных и видения всей картины целиком. Эта целая картина есть у банка, но ее нет у злоумышленников. Как еще алгоритмы на графах можно использовать для решения реальных бизнес-задач, читайте в нашей следующей статье про разметку данных с помощью человека и ИИ.

Графовые алгоритмы. Бизнес-приложения

Код курса
GRAF
Ближайшая дата курса
13 декабря, 2022
Длительность обучения
24 ак.часов
Стоимость обучения
45 000 руб.

Освойте практику применения алгоритмов кластеризации, меры центральности узлов графа, нахождения путей и выявления сообществ средствами графовой аналитики больших данных на нашем новом курсе «Графовые алгоритмы. Бизнес-приложения» в лицензированном учебном центре обучения и повышения квалификации для разработчиков, менеджеров, архитекторов, инженеров, администраторов, Data Scientist’ов и аналитиков Big Data в Москве.