Pour son data lake, Primagaz mise sur une infrastructure hyperconvergée
Pour faciliter le travail de ses data scientists, le distributeur de gaz Primagaz a bâti un data lake sur une infrastructure hyperconvergée, basée sur les solutions de Nutanix.
PublicitéPour accompagner la transition énergétique, Primagaz, acteur historique français de la distribution de gaz, s'est engagé il y a quelques années dans une trajectoire d'entreprise dénommée Primagaz Next. Son ambition est à terme de proposer uniquement des énergies renouvelables, comme le biogaz. Dans ce contexte, l'entreprise veut que la DSI devienne une force de proposition auprès des métiers, qui facilite les différentes initiatives grâce à un modèle de DSI-as-a-Service. Les infrastructures existantes n'offraient pas la souplesse requise pour mettre en place cette vision et devaient au préalable être modernisées. La DSI a donc lancé une démarche d'industrialisation de l'infrastructure, en commençant par un domaine directement lié à l'innovation métier : la data science. Plusieurs data scientists travaillent en effet sur les données disponibles en interne, afin d'aider Primagaz à concevoir de nouveaux services pour les clients. Jusqu'à présent, cette équipe ne disposait pas d'un data lake. Les data scientists devaient donc télécharger des séries de données provenant de différents systèmes éparpillés dans l'entreprise, un processus fastidieux et sans valeur ajoutée.
Pour fluidifier cette étape, la DSI a décidé de mettre en place une architecture de données industrialisée. L'infrastructure destinée à accueillir ce data lake devait être flexible, évolutive et performante, pour que les data scientists puissent facilement accéder aux ressources dont ils avaient besoin. Pour ces raisons, la DSI s'est orientée vers la gamme d'hyperconvergence (HCI) de Nutanix, dont elle utilisait déjà les solutions de virtualisation des postes de travail (VDI).
Déploiement facilité des environnements de data science
Avec l'aide de l'ESN Anetys, Primagaz a mis en place un cluster HCI de trois noeuds qui héberge le data lake. Celui-ci est construit sur l'hyperviseur AHV, associé à la solution de stockage des fichiers Files, qui permet un accès rapide aux données. Les opérations nécessaires pour provisionner données, ressources de calcul et outils de data science comme RStudio sont industrialisées, grâce à la solution d'automatisation et d'orchestration applicative Calm. Ainsi, un clic suffit pour déployer les environnements nécessaires au traitement, à l'exploration et à l'analyse des données.
« Nous avons pour l'instant chargé un To de données dans notre data lake et prévoyons de monter progressivement en puissance. La solution nous permet de croître à notre rythme, par le simple ajout de noeuds, pour du stockage ou du calcul », explique Olivier Huet, responsable des opérations IT de Primagaz. Celui-ci indique également que le projet sert de test, pour voir comment utiliser ces solutions d'hyperconvergence sur plus large échelle. « Nous envisageons ensuite de migrer nos anciens systèmes ESX vers de l'hyperconvergence sous AHV. L'idée est de s'appuyer sur les solutions du portefeuille de Nutanix pour transformer la DSI en un centre de services à destination des métiers, comme du DBaaS ou du cloud public », ajoute Olivier Huet.
Article rédigé par
Aurélie Chandeze, Rédactrice en chef adjointe de CIO
Suivez l'auteur sur Linked In,
Commentaire
INFORMATION
Vous devez être connecté à votre compte CIO pour poster un commentaire.
Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire