Détecter la fraude par la visualisation multidimensionnelle

L’usurpation d’identité, la fraude à la carte bancaire, le vol d’identifiants sur des sites d’e-commerce sont malheureusement devenus des crimes très banal avec l’avènement du digital. Les techniques ne sont même plus cachées ou transmises de grand maître à jeune apprenti voleur… elles ne sont qu’à un click près via une recherche Google !

Lorsque l’on est chargé de la sécurité et traquer la fraude, on peut se sentir perdu face à l’immensité de l’océan de données à manipuler. Le nombre de dimensions peut très vite nous dépasser : userid, adresse ip, n° de carte bancaire, lieu de commande, lieu de livraison, n° commande, montant, nature de l’achat …

A ceci s’ajoute 2 niveaux de complexité que sont d’une part le facteur de volumétrie lié aux dimensions (ex : nb de user ID, nb de transactions…) et d’autres part la nature 1-n de la relation entre dimensions (1 userID mais plusieurs commandes)… Bref un dataset extrêmement compliqué à manipuler et à analyser.

Et c’est là que la data-visualisation apporte toute sa valeur ajoutée. Le site LinkFurious nous en a fait une brillante démonstration récemment que l’on peut résumer comme suit :

  • L’analyse unidimensionnelle par la statistique (moyenne, écart-type…) n’est pas efficace
  • La nature des relations 1-n entre les différents éléments ne peut être pleinement assimilée au travers de tables de données
  • L’utilisation de graphiques en réseaux (nœuds & liens) permet de restituer visuellement la réalité des relations entre les éléments

Pour mieux comprendre, voici 2 exemples d’utilisation de cette technique. Dans le 1er cas, nous pouvons voir la réalité d’un utilisateur au travers de la visualisation de plusieurs informations :

  • UserID
  • Adresse IP
  • Adresse postale de livraison
  • Carte de Crédit
  • N° de téléphone

Dans le 2ème cas, nous pouvons voir que derrière une même adresse email, plusieurs individus coexistent avec des différences notables sur des éléments clefs :

  • Adresse IP
  • Adresse postale de livraison
  • Carte de Crédit

Sans de telles modalités de visualisation, il est plus compliqué de comprendre et d’analyser les univers de données multidimensionnelles.

Share/Save/Bookmark

Leave a Comment