Comment Convergint a construit son équipe de data science en partant de zéro

Bhuvana Badrinathan, la première DSI de l'installateur de systèmes intégrés pour les bâtiments Convergint, a mis en place des capacités d'exploitation de données afin de prédire le chiffre d'affaires en utilisant l'ingestion automatique et l'ingénierie des données. Pour CIO États-Unis, elle revient sur la mise en place de la data science dans son organisation.
PublicitéExploiter les données, les outils analytiques et l'apprentissage machine peut fournir un avantage compétitif aux entreprises. Mais réussir à monter un programme de machine learning semble hors de portée pour beaucoup d'entre elles. Elles manquent parfois de data scientists, d'ingénieurs données ou d'autres talents spécifiques ; les processus de science des données peuvent sembler trop chronophages ou encore nécessitent trop de ressources. Tel est le dilemme auquel Convergint Technologies s'est retrouvé confronté il y a quelques années de cela. L'activité de cet intégrateur global, basé à Schaumburg dans l'Illinois, consiste à concevoir, installer et gérer des systèmes intégrés pour le bâtiment, comme des systèmes de sécurité électroniques, d'alerte incendie ou de sûreté. L'équipe dirigeante de l'entreprise voulait exploiter l'intelligence artificielle pour établir des prévisions de vente. Le seul problème ? Convergint n'avait pas de fonction de data science. Le groupe ne disposait même pas d'un DSI.
Cette situation a commencé à changer quand Convergint a recruté Bhuvana Badrinathan pour devenir sa première DSI. « Quand j'ai rejoint l'entreprise, nous n'avions même pas d'équipe data officielle. Nous n'avions même aucun data scientist », se souvient Bhuvana Badrinathan. « Nous avions absolument besoin de créer une équipe robuste autour des données et de nous assurer que nous avions un budget dédié. Nous sommes en train d'établir la gouvernance des données et de mettre en place un comité de pilotage sur les données. » Convergint a constaté qu'il lui fallait un nouveau système ERP. L'entreprise avait aussi besoin de supporter quantité d'applications en contact direct avec les clients. « Il fallait que nous augmentions nos capacités en matière de données », souligne la DSI. « Quand vous n'avez pas les données, ou qu'au contraire celles-ci sont disséminées partout, mais que vous ne pouvez pas les utiliser pour la prise de décision et la stratégie, cela revient quasiment à avoir un bandeau sur les yeux. Vous ne savez pas exactement vers quelle direction aller. »
La data science en partant d'un terrain vierge
Quand Bhuvana Badrinathan a accepté le poste, Convergint ne disposait pas des ressources adéquates pour l'analyse de données initialement souhaitée, et leur processus en place nécessitait beaucoup d'intégrations pour obtenir des informations utiles. De ce fait, l'entreprise peinait à créer un processus capable de passer à l'échelle et répétable pour produire des modèles exécutables. Les modèles qu'elle avait créés prenaient souvent des mois à être conçus et déployés, ce qui se traduisait par des prévisions inexactes et de longs délais de réponse au marché. « L'une des premières choses qui m'ont intéressé avec Convergint était cette possibilité de s'attaquer à ce sujet des données, car c'est là que se trouve le différenciateur », confie Bhuvana Badrinathan. « Amener Convergint à devenir une entreprise prenant des décisions basées sur les données est l'un des aspects qui me passionne, et alléger notre empreinte environnementale en est un autre. »
PublicitéPour Bhuvana Badrinathan, une transformation digitale réussie, comme celle pour laquelle elle a été recrutée par Convergint, dépend de trois facteurs. Tout d'abord, il faut démarrer par des bases solides, ce qui consiste à identifier deux ou trois cas d'usage qui apportent énormément de valeur à l'entreprise. Ensuite, il faut investir avec soin, de sorte à maximiser l'avantage compétitif en générant des profits, de la valeur ou en atteignant les objectifs. Enfin, il faut de la discipline pour rester sans cesse concentré sur les cas d'usage et l'avantage compétitif qu'ils cherchent à fournir. Pour exploiter les données dans la prise de décision, tout le monde chez Convergint devait pouvoir accéder facilement à des données vérifiées et validées. « Cela nécessite d'avoir des sources de données fiables, qui sont vérifiées et validées, et à s'assurer que nous avons des outils comme les tableaux de bord de Power BI, qui ne se contentent pas de présenter les données, mais servent comme source courante d'informations que les collaborateurs peuvent utiliser pour prendre des décisions », explique Bhuvana Badrinathan. Son équipe devait donc créer un pipeline de développement robuste, avec des processus d'alimentation et de livraison fiables.
De plusieurs mois à quelques jours
Bien entendu, il est facile de parler de démocratisation des données, mais en pratique cela peut se révéler plus compliqué. Bhuvana Badrinathan a commencé par se concentrer sur les déplacements de données - comment extraire des données d'une source, les transformer et ensuite les charger dans une autre base. Adopter une approche de gestion des données de référence, ou MDM (master data management) faisait partie du processus pour s'assurer que les données étaient correctement nettoyées et enrichies. La DSI a fermement insisté pour que l'entreprise recrute en priorité un data scientist pour la guider dans ce processus, mais cela s'est également révélé une tâche difficile. « Nous avions besoin d'un data scientist immédiatement, mais j'ai constaté après avoir recruté et obtenu des data scientists que tout demandait énormément de temps », observe la DSI. « Poser de bonnes questions aux données et aux métiers et en faire un proof of concept (POC) ne prenait pas beaucoup de temps. Ce qui était chronophage était de prendre ce POC et de l'industrialiser pour en faire quelque chose d'opérationnel. Cela prenait une éternité. Après avoir démarré avec trois data scientists, l'équipe a rapidement été réduite à un seul.
Pour faciliter les choses, Convergint s'est alors tournée vers la société de machine learning dotData et a déployé sa plateforme AutoML 2.0 d'automatisation des data sciences. Bhuvana Badrinathan explique que celle-ci a aidé Convergint à automatiser l'intégralité de son processus de data science, depuis l'ingestion jusqu'à l'ingénierie des données, la sélection des sets de machine learning et l'intégration des modèles d'apprentissage machine dans les environnements de production. L'automatisation a aidé le data scientist de l'entreprise à bâtir des modèles de prévisions plus pertinents et à les monter bien plus vite. « Quand nous avions plusieurs data scientists et que nous tentions de faire les mêmes choses, cela prenait des mois pour répondre à des questions telles que 'Quelles sont les tendances ? Pourquoi avons-nous ce résultat ? À quoi pouvons-nous nous attendre dans le futur ?' Maintenant, cela prend quelques jours, une paire de semaines au maximum », souligne Bhuvana Badrinathan. « Nous avons désormais un comité de pilotage des données mensuel, qui consacre 90% de son temps à regarder où sont les cas d'usages métiers et quelles sont nos priorités. »
Même s'il reste encore beaucoup de chemin à parcourir dans cette transformation, Bhuvana Badrinathan affirme que celle-ci a déjà commencé à payer. L'un des premiers projets data était un algorithme de machine learning pour aider Convergint à prédire son chiffre d'affaires. Cet algorithme, de même que la capacité de l'entreprise à ajuster rapidement le modèle, ont aidé l'entreprise à faire face à ce cygne noir qu'a représenté la pandémie de Covid-19. « La machine ne sait pas ce qu'est une pandémie », pointe la DSI. « Tout ce qu'elle connaît, ce sont les données historiques avec lesquelles vous l'avez précédemment alimentée. Mais au fil des mois, quand la pandémie s'est installée, les tendances ont changé. Alors qu'elles changeaient, la machine apprenait et s'ajustait. Le premier mois, elle n'a pas compris la situation. Le second, elle a fait des prédictions excessives. Mais dès le troisième et le quatrième mois, tout a commencé à se normaliser. La machine a pu apprendre de ces données. »
Article de Thor Olavsrud / CIO États-Unis (Adaptation et traduction par Aurélie Chandèze)
Article rédigé par

La rédaction de CIO Etats-Unis,
Suivez l'auteur sur Google+, Linked In, Twitter
Commentaire
INFORMATION
Vous devez être connecté à votre compte CIO pour poster un commentaire.
Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire