Grand angle

  • Taille du texte
    Zoom - Zoom +
  • Imprimer la page
  • Envoyer par e-mail

Jusqu’où le Big Data permet-il de prédire le comportement des consommateurs ?

16 mai 2014

Eurovision, Miss France, épidémie de choléra, paris sportifs, incendies… Sur ces sujets inattendus, le Big Data a permis d’établir des prévisions très justes.

7 prédictions étonnantes grâce au Big Data



1 – Les résultats de l’Eurovision

L’an dernier, pour démontrer la valeur de son modèle prédictif, David de Rotschild, un économiste de Microsoft Research, a choisi de l’appliquer à l’Eurovision. Avec succès : il a annoncé le nom de la chanson gagnante plusieurs jours avant le résultat officiel ! Il a même trouvé les cinq premiers pratiquement dans l’ordre. «  Cela ne vient pas d’une boule de cristal, a commenté cet économiste. Ces prévisions sont basées sur des analyses sophistiquées appliquées à des jeux de données massives. »

Pour réaliser ses prédictions, il s’est appuyé sur les commentaires laissés sur les réseaux sociaux, les recherches effectuées sur Google, les sondages d’opinion, les paris d’internautes (sur des sites comme Bet365, Betfair…), etc. Ce qui lui a permis de trouver où iraient les votes des membres du jury le soir de l’Eurovision. L’ambition de Microsoft Research n’est bien sûr pas de se lancer dans la chanson, mais de construire un modèle prédictif le plus précis possible, qui pourra être utilisé pour comprendre l’évolution des marchés financiers ou de l’économie internationale.

Plus d’infos :
- Statosphere

2 – Les finalistes de Miss France

Pour attirer l’attention sur ses travaux, la start-up nantaise Dictanova a, elle, appliqué son modèle au concours Miss France. Sa méthode de prédiction repose sur l’analyse sémantique de tweets. Son logiciel est notamment capable de différencier les messages bienveillants des tweets moqueurs. En étudiant en temps réel les 360 000 messages laissés sur Twitter par 100 000 téléspectateurs lors de l’élection de Miss France 2013, Dictanova a pu déterminer vers quelle candidate irait le vote du public. La start-up a même trouvé le nom des 5 finalistes.

Plus d’infos :
- Statosphere

3 – Les bâtiments où peut se déclencher le prochain incendie

3 000 incendies majeurs se déclenchent chaque année à New York. Quels sont les immeubles à surveiller en priorité ? Les facteurs de risque sont connus : le revenu moyen du quartier (un incendie a plus de risque de se déclencher dans un quartier pauvre), l’âge des immeubles, la présence de « sprinklers » (dispositifs de dispersion d’eau), la qualité des installations électriques, la présence d’ascenseurs…

Au final, ces facteurs sont nombreux. Et ils concernent les 330 000 immeubles sous la responsabilité des pompiers de la ville. Pour décider quels bâtiments inspecter en priorité, le « New York City Fire Department » utilise depuis juillet 2013 un algorithme qui explore 60 critères et attribue une note de risque à chaque immeuble. Chaque semaine, ce logiciel de « data mining » (analyse de données) fournit aux pompiers la liste des bâtiments à aller inspecter car pouvant être le foyer du prochain incendie.

Plus d’infos :
- Wall Street Journal

4 – Le prochain endroit où un individu va se rendre

Nokia a organisé un concours en partenariat avec l’Ecole polytechnique fédérale de Lausanne, en Suisse. Parmi les questions posées : peut-on prédire le prochain endroit où va se rendre une personne ? Pour y répondre, les chercheurs participant à la compétition disposaient des données collectées auprès de 200 utilisateurs de smartphone habitant la région de Genève : appels passés, tweets envoyés, bornes Wi-fi utilisées, etc.

«  On s’aperçoit que nous avons des comportements assez routiniers, explique un des doctorants qui a remporté l’épreuve. C’est difficile à admettre pour le cerveau humain, mais nous sommes assez prévisibles à partir du moment où l’on dispose de suffisamment de données à analyser. » En pratique, on observe qu’une personne fréquente, plus ou moins régulièrement, 80 endroits différents. «  Nous avons développé un algorithme capable d’apprendre des personnes et de leurs déplacements », poursuit le jeune chercheur.

Son équipe a même envisagé le cas de l’utilisateur changeant d’emploi ou de lieu de résidence au cours de l’expérience. «  Il fallait que l’algorithme détecte ce changement d’habitude et réagisse très vite. A posteriori, je pense que ce facteur explique en partie notre victoire. » Au final, l’équipe a réussi à déterminer le prochain endroit où allait se rendre une personne avec un taux de réussite moyen de 60 %. Sur certains groupes d’individus, ce taux est même monté à 93 % !

Plus d’infos :
- Les Echos

5 – Le résultat des matchs de foot

Les paris sportifs sont l’un des domaines qui attirent les start-up du Big Data. Plusieurs dizaines se sont lancées sur ce marché aux Etats-Unis et la tendance arrive en Europe. Une start-up polonaise, Betegy, affirme par exemple pouvoir prédire l’issue de 9 matchs de football de Premier League sur 10. Elle a mis au point un algorithme qui prend en compte les facteurs traditionnellement associés à la prédiction sportive comme les performances récentes des équipes ou les confrontation passées.

Mais elle intègre aussi des informations plus originales comme la météo ou savoir si le match se joue le jour de l’anniversaire de l’entraîneur (ce qui influerait positivement sur le résultat). Le taux de réussite de prédiction de 90 % ne concerne toutefois que certains matchs du championnat anglais, où il y a plusieurs gros clubs qui apportent de la stabilité. Ailleurs, pour les autres championnats européens, le taux de précision atteint 55 %.

Plus d’infos :
- Slate

6 – Les épidémies de choléra

En 2012, Cuba a été touché par une épidémie de choléra. Une première en cinquante ans qui a surpris le gouvernement et la communauté médicale. Pourtant, deux scientifiques, Eric Horvitz, codirecteur de la recherche chez Microsoft, et Kira Radinsky, chercheuse à l’institut de recherche israélien Technion, affirment avoir réussi à prédire qu’une épidémie de choléra allait se déclencher dans ce pays.

Ils ont compilé l’intégralité des articles du « New York Times » et bien d’autres sources d’information sur internet. Ces données ont été traitées pendant un mois sur une trentaine d’ordinateurs, avec un objectif : trouver des corrélations entre certains événements, puis développer des modèles mathématiques permettant de prédire d’autres événements. Ils ont ainsi mis en évidence qu’un territoire enclavé avait de plus fortes chances d’être touché par une épidémie de choléra après des tempêtes, notamment s’il a d’abord été frappé par la sécheresse. L’enchainement exact des événements à Cuba.

Plus d’infos :
- Les Echos

7 – Le prochain sujet qui fera le buzz

Trendsboard est une start-up qui propose de déterminer en temps réel quels sont les sujets d’actualité les plus « tendances », soit auprès de l’ensemble de la population, soit auprès d’une cible donnée. L’outil passe au crible les contenus publiés par les médias (plus de 10 000 sources), en les classant en fonction du sujet et en les notant selon leur viralité sur les réseaux sociaux ou leur visibilité sur Google News.

Ce savoir-faire s’est notamment traduit par la mise au point pour Pepsi d’une application mobile destinée aux 13/17 ans : Pespibuzz. Cette application agrège les vidéos et les tweets les plus populaires sur cette cible. La nouvelle étape pour Trendsboard est d’arriver à identifier les prochains sujets qui vont faire le buzz. La start-up teste ainsi une nouvelle fonctionnalité permettant de repérer les sujets qui montent sur les réseaux sociaux mais qui ne sont pas encore repris par la presse. Trendsboard travaille aussi sur un module capable de prédire les « opportunités du moment » pour les médias, c’est-à-dire les sujets que l’outil juge pertinent de traiter pour être bien placé sur Google News.

Plus d’infos :
- ZDnet

 
À suivre :
Comment SFR et Danone affinent leur stratégie en prédisant le comportement des consommateurs