Voyages-SNCF propose des voyages moins chers grâce au Big Data


SNCF : mener une révolution numérique à l'âge de 80 ans
Opérateur ferroviaire aux nombreuses filiales, la SNCF ne fait pas penser à une start-up. D'autant que, créée le 1er janvier 1938 en application du décret-loi du 31 août 1937, la SNCF fête actuellement ses 80 ans. Pourtant, cette entreprise mène une réelle transformation numérique exemplaire au...
DécouvrirEn s'appuyant sur son Big Data Sumo, Voyages-SNCF peut proposer des itinéraires moins coûteux que ceux optimisés sur la base du temps de parcours.
PublicitéChaque trajet en train est proposé -concurrence oblige- au même tarif à tous les distributeurs. Comment, dès lors, un distributeur pourrait-il proposer des tarifs mieux optimisés que ses concurrents ? C'est le défi relevé par Voyages-SNCF grâce au Big Data. « Avec les mêmes offres de base, Voyages-SNCF veut être un meilleur distributeur que ses concurrents en proposant des voyages moins chers et adaptés au profil du client » a résumé Gilles de Richemond, directeur de VSC-Technologies (VSC-T).
VSC-Technologies est la filiale digitale de Voyages-SNCF, l'agence de voyages du groupe SNCF. VSC-Technologies a un volume d'activité de 100 millions d'euros, à 40 % pour Voyages-SNCF, 60 % pour le reste du groupe, grâce à une usine logicielle industrialisée. Ses 750 collaborateurs sont répartis sur Paris, Lille et Nantes. Il dispose de 5000 serveurs en propre et s'appuie sur un cloud hybride avec OVH. Voyages-SNCF, lui, reste un des principaux sites e-commerce en France avec 14 millions de visiteurs uniques par mois (aujourd'hui majoritairement par mobile). Les 1,5 milliard de recherches effectuées par ceux-ci chaque année sur les 33 millions de voyages possibles créent 4,4 millions de logs de devis traités par jour soit 100 To par mois.
Du Big Data technique à l'IT différenciante
Les premiers travaux sur le Big Data ont été effectués au sein de VSC-T en 2010 en traitant ces logs. « A l'époque, il s'agissait surtout de gérer les infrastructures en détectant toutes les anomalies, qu'il s'agisse de qualité de service au sens strict ou de qualité de l'expérience client (désagréments qui ne sont pas des dysfonctionnements) » s'est rappelé Gilles de Richemond. En 2014, VSC-T s'est lancé dans un travail sur la connaissance client et, depuis 2016, travaille aussi à améliorer son offre. Depuis un an et demi, VSC-T est entré dans un consortium avec Bull autour du calcul intensif. Un partenariat a également été noué depuis trois ans avec Telecom Paris-Tech.
« l'IT est coeur de métier, un levier business, un différenciateur métier. »
Pour Gilles de Richemont, « l'IT est coeur de métier, un levier business, un différenciateur métier. » C'est l'IT qui va permettre, par ses innovations, à Voyages-SNCF d'être plus performant que ses concurrents dans la distribution de voyages. Or le mécanisme normal de création d'itinéraire n'est pas nécessairement ce qui correspond le mieux aux attentes des voyageurs. Ce mécanisme repose sur une succession de deux étapes : d'abord calculer un itinéraire optimisé en termes de temps de trajet puis rechercher les prix dans le système de réservation de la SNCF. « Or, pour économiser trente euros, certains voyageurs sont prêts à mettre deux heures de plus sur leur trajet, avec des correspondances, mais ce n'est pas vrai pour tous » a expliqué Gilles de Richemont.
PublicitéSumo : le Big Data pour trouver des trajets alternatifs
L'historique anonymisé des devis issus des recherches des internautes est stocké dans Sumo, un système Big Data « gros et agile » (d'où son nom) réalisé avec l'assistance de Xebia. Une quinzaine de serveurs physiques HP ont été, à cette fin, équipés d'Hortonworks 2.5.3 avec un stockage et un traitement par la combinaison Hadoop / Hive / Spark. Les échanges de données sont pilotés par le composant de dataflow HDF. Quant à la restitution, elle combine des technologies de recherche et de visualisation : ElasticSearch, Qlik et SAS. Cet historique peut être complété par des requêtes spécifiques au système de réservation décidées par l'intelligence artificielle de Sumo.
Sumo permet ainsi d'optimiser l'étude des prix sans re-solliciter le système de réservation, avec le risque de le saturer. Les requêtes dans Sumo visent alors à trouver des itinéraires non-optimisés sur le plan du temps de trajet mais pouvant être moins chers. Les trajets alternatifs font alors l'objet d'un devis classique dans le système de réservation, mais sans avoir à le saturer. Gilles de Richemond donne un exemple : « pour faire Lille-Marseille, vous pouvez économiser 20 à 40 euros si vous acceptez une correspondance de plus de deux heures à Marne-la-Vallée. Le traitement Big Data permet de repêcher des options contre-optimisées mais moins chères, ce qui pourrait remettre en avant certaines liaisons, notamment Intercités, par rapport aux TGV. »
Une optimisation tarifaire qui n'est pas une optimisation du temps
Malgré une combinatoire énorme, le fait de traiter des données stockées dans le Big Data Sumo (et non interrogées en transactionnel en temps réel sur le système de réservation) permet une réponse rapide. Tout le problème est de fixer des critères de tri. Par exemple : veut-on ou pas proposer des trajets avec des correspondances nécessitant une nuit sur place ? Pour l'heure, la réponse est non. De même, il faut un différentiel de prix positif. « Nous n'allons pas proposer des alternatives à la fois plus longues et plus chères » a souligné Gilles de Richemond.
Pour l'heure, après un mois de mise en production, le système est opérationnel sur une dizaine de liaisons. La généralisation va se faire petit à petit à toutes les liaisons. L'offre doit également tenir compte d'une certaine personnalisation. Il ne s'agit d'afficher des options innombrables qui rendraient la liste illisible. Quelqu'un voyageant systématiquement en 1ère classe avec un aller-retour dans la journée va en effet être assez peu probablement intéressé par une offre plus lente mais moins chère.
Article rédigé par

Bertrand Lemaire, Rédacteur en chef de CIO
Commentaire
INFORMATION
Vous devez être connecté à votre compte CIO pour poster un commentaire.
Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire