Data Asset : le succès grâce aux données


La donnée, un actif vital de l'entreprise
Valoriser la donnée n'est plus accessoire. De plus en plus souvent, l'entreprise est tenue de se réinventer autour de la donnée pour servir ses clients. Si l'exemple le plus complet vient de façon inattendue d'une agence média, Havas Media Group, d'autres témoignages ont appuyé ce constat. En...
DécouvrirLe 24 septembre 2015, CIO a organisé à Paris une Matinée Stratégique sur « Data Asset : la donnée, actif de l'entreprise ». Nicolas Korchia, responsable BI chez Mappy, et Gaëlle Periat, responsable BI chez BlaBlaCar, y ont apporté leur témoignage.
PublicitéDeux très belles réussites dans les jeunes entreprises françaises doivent une bonne part de leur succès à leur gestion des données. Il s'agit de Mappy, qui est aujourd'hui filiale du groupe SoLocal (ex-Pages jaunes) auquel il fournit ses solutions cartographiques, et de BlaBlaCar, le spécialiste du covoiturage. Nicolas Korchia, responsable BI chez Mappy, et Gaëlle Periat, responsable BI chez BlaBlaCar, ont ainsi apporté leur témoignage sur la table ronde « collecter, stocker, analyser et délivrer de l'information de valeur » à l'occasion de la Matinée Stratégique « Data Asset : la donnée, actif de l'entreprise » organisée par CIO à Paris le 24 septembre 2015.
BlaBlaCar a vingt millions de clients dans dix-neuf pays, du Mexique à l'Inde en passant bien sûr par les pays européens, dont son berceau historique, la France. Les utilisateurs achètent ou proposent du covoiturage en adoptant diverses attitudes, comme la pratique d'un certain niveau de bavardage en cours de trajet (les modes Bla, BlaBla ou BlaBlaBla). Le choix d'un covoitureur sera également fonction des appréciations portées par les covoiturés précédents. Gérer la connaissance client est donc au moins autant important que maîtriser les trajets proposés ou demandés.
Une grande variété de technologies au service de la connaissance client
Pour gérer toute cette information, BlaBlaCar utilise une grande variété d'outils. Il s'agit aussi bien de bases de données verticales HP Vertica, d'un cluster Hadoop, un DMP... « J'ai en charge l'équipe technique, celle des data ingénieurs, qui va veiller à la bonne collecte des données, par exemple » a précisé Gaëlle Periat. L'analyse est réalisée par une équipe dédiée, côté métier. Gaëlle Periat s'en est expliquée : « notre but était que les analystes puissent travailler sans avoir à demander quoique ce soit ». L'équipe technique se charge donc de rendre disponibles et exploitables les données qui sont affichées et analysées grâce à un outil de visualisation, en l'occurrence Tableau Software.
Il existe donc deux couches : une de visualisation (avec Tableau Software) et une de collecte et stockage. Cette dernière comprend trois outils distincts. « Hadoop est bien adapté aux très gros volumes mais les performances étaient insuffisantes par rapport à nos besoins » a regretté Gaëlle Periat. Un simple trajet Paris-Lille peut en effet se découper en plusieurs étapes avec des montées et des descentes de covoiturés, ce qui, techniquement, devient donc un enchaînement de trajets, multipliant les données à traiter. Du coup, les données sont retraitées dans une base HP Vertica pour que les analystes puissent disposer de la performance nécessaire. Le DMP, Data Science Studio de Dataiku, lui, est utilisé pour faciliter l'intégration des données tiers, notamment les données non-structurées en provenance des médias sociaux. « Ce produit est intéressant car on peut y écrire des scripts en Python pour automatiser des traitements fastidieux » a indiqué Gaëlle Periat. Il est ainsi possible de faire une petite extraction partielle de données pour qu'un analyste puisse expérimenter des traitements avant de réaliser une extraction plus complète et mise à disposition dans Vertica. L'équipe d'analyse peut en effet se retourner vers l'équipe technique pour obtenir des données adaptées à un nouveau besoin, par exemple en lien avec la sortie d'une nouvelle fonctionnalité afin d'en vérifier la pertinence. Il peut s'agir d'une nouvelle extraction ou bien d'une nouvelle collecte.
Vertica est toujours le point d'entrée pour la visualisation avec Tableau. Mais Hadoop gère en amont la collecte globale des informations issues de toutes les applications métier, du site web ou de l'application mobile ainsi que celles ayant été absorbées par le DMP. Les données de Hadoop sont déversées dans Vertica toutes les heures.
PublicitéTirer de la valeur de l'analyse comportementale
Analyser les comportements des consommateurs peut certes être une satisfaction intellectuelle mais elle est surtout une source de valeur métier considérable. L'analyse opérée chez BlaBlaCar permet ainsi, pratiquement instantanément, de suivre l'efficacité d'une campagne promotionnelle. De ce fait, l'entreprise peut décider d'adapter ses actions marketing en fonction des retours aussitôt constatés. Gaëlle Periat a ainsi précisé : « tous les jours, le marketing manager, à New Dehli, Paris, Moscou ou Mexico, reçoit les données en provenance de Facebook ou autre, avec les budgets consommés et les résultats sur l'activité ; de là, il peut décider de continuer, d'arrêter ou d'adapter son action. »
Comme l'entreprise est en forte croissance, notamment avec l'ouverture de nouveaux pays, les données cumulées sur les ouvertures précédentes peuvent guider les actions lors de la création d'une nouvelle filiale. Si l'implantation ne suit pas la même dynamique qu'auparavant, il peut exister des raisons culturelles ou contextuelles à rechercher et à traiter. La valeur de l'exploitation des données est strictement interne. « Chez nous, rien ne sort » a confirmé Gaëlle Periat. Les données sont d'ailleurs stockées sur deux datacenters répliqués appartenant à l'entreprise, sans recours à des ressources externes. Les droits d'accès sont également gérés avec rigueur car les données -personnelles (trajets...) ou financières- sont toutes sensibles.
Les PIL au coeur de la valeur métier
A l'inverse, chez Mappy, les données y sont certes également extrêmement nombreuses et au coeur de la génération de valeur mais par la revente à des clients. L'ensemble de la plate-forme traite 150 Go de logs chaque jour dans un cluster Hadoop. Et le cluster est également uniquement installé sur des serveurs appartenant au groupe.
En l'occurrence, Nicolas Korchia s'intéresse bien sûr aux statistiques de fonctionnement du service, utilisées en interne, mais aussi et surtout aux quatre millions de points d'intérêt locaux (PIL). « Il s'agit des hôtels, des restaurants, des opticiens... bref de tout ce qui vous intéresse vous et qui justifie que vous utilisiez l'application Mappy au quotidien » a expliqué Nicolas Korchia.
Le but de Mappy est de proposer les PIL les plus appropriés en fonction du contexte et de la recherche. Par exemple, en tapant simplement « sandwich » dans la recherche, Mappy va afficher les sandwicheries les plus proches du mobinaute. Nicolas Korchia a précisé : « ce qui nous intéresse, c'est d'une part de trouver la réponse la plus pertinente pour l'utilisateur, d'autre part de suivre la performance des différents annonceurs : combien de fois tel annonceur a été affiché dans la liste des réponses, à quel rang, combien de fois le mobinaute a cliqué sur sa fiche détaillée pour obtenir plus d'information (carte des sandwiches, horaires d'ouverture...), etc. » Les 10 millions visiteurs uniques peuvent réaliser une quarantaine d'actions types traquées sur les quatre millions de PIL et cela chaque jour. « Rien que sur une année, on dépasse les deux milliards de lignes » a pointé Nicolas Korchia.
Comprendre le client par l'analyse des données
Si un simple boulanger de quartier ne va pas forcément être passionné par une telle analyse, il en est tout autrement pour une chaîne telle qu'une franchise de fast-food ou une coopérative d'opticiens. Nicolas Korchia a observé : « ces annonceurs vont vouloir comprendre, par exemple, pourquoi tel point de vente sous leur enseigne marche mieux que tel autre, notamment en fonction de la présence de concurrence aux alentours ou bien devenue spontanée par opposition à une recherche préalable sur les Pages Jaunes. »
Pour l'instant, Mappy exploite de l'information brute sur la performance des marques gérées par les annonceurs-clients. L'entreprise ne réalise pas une analyse a priori et ne cède pas non plus d'informations sur les concurrents. La commercialisation de cette connaissance auprès des annonceurs passe par Pages Jaunes.
Comme chez BlaBlaCar, l'équipe d'analyse est distincte de l'équipe technique. « Mais, pour nous guider, je dispose tout de même d'un analyste dans mon équipe » a tempéré Nicolas Korchia. L'accès aux données se fait également avec Tableau Software.
Les équipes commerciales et marketing seront donc chez Mappy comme chez BlaBlaCar les premiers clients des data scientists.
Article rédigé par

Bertrand Lemaire, Rédacteur en chef de CIO
Commentaire
INFORMATION
Vous devez être connecté à votre compte CIO pour poster un commentaire.
Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire