Stratégie

Regeneron se tourne vers l'IT pour accélérer la découverte de médicaments

Regeneron se tourne vers l'IT pour accélérer la découverte de médicaments
Bob McCowan, DSI de Regeneron Pharmaceuticals : « L’association d’une IT et d’une science améliorées, comme nous le faisons chez Regeneron, sont un moteur d’innovation optimum. »

Pour Bob McCowan, DSI de la société pharmaceutique Regeneron, la transformation numérique et data qu'il a initiée doit permettre aux scientifiques de l'entreprise de disposer des données dont ils ont besoin pour expérimenter et tester des hypothèses.

PublicitéÀ l'ère numérique, l'énorme pression à laquelle sont soumises les entreprises pharmaceutiques pour réaliser des prouesses médicales pèse autant sur les épaules des DSI que sur celles des chercheurs. Dans la majorité des laboratoires modernes, la rigueur est de mise pour garantir l'exactitude des données et la véracité des formules scientifiques, ainsi que celle des algorithmes d'apprentissage machine et des outils de manipulation de données. C'est en 2014 que Bob McCowan a rejoint Regeneron Pharmaceuticals, une société pharmaceutique et de biotechnologies dont la capitalisation s'élève à 81,5 milliards de dollars, afin de gérer l'infrastructure du datacenter hébergeant les activités scientifiques, commerciales et de fabrication. Il a été promu DSI de Regeneron Pharmaceuticals en 2018. À ce titre, il savait que, outre une bonne équipe et de bons éléments techniques, les données étaient la clé de la réussite future de Regeneron. « Tout est une question de données. Tout ce que nous faisons est axé sur les données, et à l'époque, nous étions très axés sur le datacenter, mais la technologie avait beaucoup de limites », relate Bob McCowan. « Si nous pouvions assurer le succès de l'entreprise, cela ne nous permettait pas de passer à l'échelle et de disposer de la puissance nécessaires », ajoute-t-il.

Pour répondre aux besoins futurs de l'entreprise, Bob McCowan savait que Regeneron devait engager une transformation majeure et construire un pipeline de données plus performant, capable d'injecter des données provenant d'un millier de sources dans des « formats analytiques prêts à l'emploi » pour que l'entreprise et les scientifiques puissent les consommer. Or pour cela, le passage au cloud était essentiel. « La seule façon de permettre à nos scientifiques d'évoluer et de se développer était d'adopter totalement le cloud, et pas seulement en termes de puissance de calcul et de stockage, mais en profitant de la possibilité de se déployer dans différents environnements, dans différents pays. Si vous n'êtes pas dans le cloud, vous prenez le risque d'être laissé de côté », estime Bob McCowan.

Donner du pouvoir aux scientifiques grâce au cloud

C'est à la fin de 2018 que Bob McCowan a entrepris de faire migrer Regeneron vers Amazon Web Services. En 2020, le service IT avait déplacé environ 60 % de toutes les données de l'entreprise vers le cloud, ce qui n'est pas une mince affaire pour une entreprise internationale qui a généré un chiffre d'affaires de 16 milliards de dollars en 2021, emploie plus de 10 000 personnes et détient neuf médicaments approuvés par la FDA et l'EMA, et 30 autres en cours d'essais cliniques. Depuis, l'infrastructure multicloud de l'entreprise s'est étendue à Microsoft Azure pour les applications professionnelles et à Google Cloud Platform pour offrir à ses scientifiques davantage d'options d'expérimentation. « Google a créé des algorithmes et des outils très intéressants, disponibles dans AWS », indique le DSI. « Et il y a des choses que les chercheurs de Regeneron ne peuvent tester que dans le cloud de Google. Nous utilisons donc les trois clouds principaux, mais le coeur du projet se situe autour d'AWS », précise-t-il. Du fait de la complexité de l'expérimentation et des tests de Regeneron, l'entreprise utilise divers outils SaaS standard pour l'analyse. Mais le vrai différenciateur, c'est sa plateforme améliorée de découverte de données MetaBio, basée sur le cloud, qui fournit un grand de nombre de services de données, d'outils de gestion des données et d'outils d'apprentissage machine. « C'est en quelque sorte le joyau de la couronne des opérations d'analyse de l'entreprise », confie le DSI.

PublicitéDistinguée en 2022 par le prix CIO 100, la plateforme MetaBio fournit une source unique pour les ensembles de données dans un format unifié, si bien que les chercheurs peuvent extraire rapidement des informations sur diverses fonctions thérapeutiques sans avoir à se préoccuper de la manière de préparer ou de trouver les données. « Les scientifiques viennent à nous avec des livres blancs qui proposent des pistes théoriques pour analyser des expériences scientifiques », explique Bob McCowan. « Nous travaillons avec eux, nous construisons les modèles IT et nous les exécutons, qu'il s'agisse d'imagerie sur des particules invisibles à l'oeil nu ou de repliement de protéines. Dans d'autres cas, il s'agit de besoins de calcul plus standards et nous les aidons à fournir les données dans les bons formats. Ensuite, les données sont consommées par des outils de calcul en mode SaaS, mais elles restent toujours dans l'entreprise et sous le contrôle de nos solutions basées sur le cloud ».

Bien entendu, une grande partie des données de Regeneron sont confidentielles. Pour cette raison, bon nombre de ses outils data - et même son datalake - ont été construits en interne en utilisant AWS. « Nous avons nos propres datalakes dans AWS », explique le DSI. Celui-ci a également piloté le développement de la Regeneron Deva Platform, une plateforme destinée à simplifier, mettre à l'échelle et accélérer l'expérience analytique sur les phases d'exploration initiales, qui a valu à Regeneron de recevoir le prix CIO 100 2020. « Avec quelques petits ajustements, nous permettons aux chercheurs de connecter les données d'une manière tout à fait nouvelle. Pour le datalake, notre volonté est de connecter chaque groupe, depuis notre centre génétique jusqu'à la sécurité clinique et à la recherche précoce, en passant par la fabrication, un challenge difficile quand on dispose de 30 ans de données », fait valoir le DSI. « La plateforme de données fournit un accès constant à des données connectées et contextualisées via des datalakes, des clouds évolutifs, des services de traitement des données et d'IA », ajoute Bob McCowan, en précisant que les datalakes de l'entreprise gèrent environ 200 téraoctets de données.

Nourrir l'innovation avec des données

Bob McCowan veille à ne pas restreindre l'utilisation d'outils externes - en particulier les outils nativement cloud - qui aident les scientifiques à faire des découvertes. Au niveau de l'infrastructure, les scientifiques de Regeneron utilisent AWS EMR et Cloudera. Pour le pipeline de données, ils utilisent Apigee, Airflow, NiFi et Kafka, et pour l'entrepôt de données, les chercheurs utilisent Redshift. Au fur et à mesure que l'on monte dans la pile, différentes analyses de données entrent en jeu, comme DataIQ. Concernant les langages, les scientifiques utilisent Python et Jupyter Notebooks. Pour Bob McCowan, l'essentiel est de donner aux scientifiques tous les outils qui leur permettent d'explorer leurs hypothèses et de tester leurs théories. « L'un des aspects les plus notables de Regeneron, c'est que nous sommes tous très curieux », pointe le DSI. « Nous sommes motivés par la science et par l'innovation, et nous essayons de ne pas mettre de limites strictes à ce que nous faisons, pour éviter d'étouffer l'innovation », ajoute-t-il.

« Même si les chercheurs de Regeneron disposent d'outils d'IA et de ML, les données restent la clé », affirme Bob McCowan. Et selon lui, c'est la puissance du cloud et de l'analytique qui, à elle seule, pourrait mettre les chercheurs sur la voie d'une découverte prometteuse à partir de données vieilles de 10 ans. « J'ai lu des milliers de choses sur certains projets fantastiques utilisant l'IA et le ML, mais dont on ne voit jamais le résultat, parce qu'ils n'aboutissent pas », observe Bob McCowan. « Et la raison pour laquelle ils échouent, c'est que les gens ne réfléchissent pas assez à la provenance des données. C'est pour cette raison que nous avons construit notre infrastructure de données : quand les données atterrissent dans les datalakes, et que nous commençons à appliquer l'IA et le ML, nous savons que nous utilisons ces modèles sur données de haute qualité ».

En tant que leader technologique de l'entreprise, le travail de Bob McCowan consiste à tout numériser et à aider les scientifiques à utiliser au mieux les données et les métadonnées, quelle que soit la façon dont elles sont générées. « On en revient toujours aux données et aux informations que nous pouvons fournir à l'aide de différentes technologies, afin d'avoir une capacité de prise de décision plus rapide », explique Bob McCowan. Il ajoute que le fait de donner aux scientifiques la possibilité de réaliser des expériences de manière mathématique grâce à des moteurs utilisant des modèles d'IA et de ML accélère la découverte, mais que cela ne remplacera jamais la paillasse du laboratoire. « L'association d'une IT et d'une science améliorées, comme nous le faisons chez Regeneron, sont un moteur d'innovation optimum », affirme Bob McCowan. Dans le cas présent, la plateforme de données MetaBio est appelée à jouer un rôle clé en facilitant les découvertes spectaculaires bien plus rapidement qu'auparavant. « Grâce à la numérisation de toutes les données, nous pouvons appliquer la technologie et les outils pour aider les scientifiques à établir des liens qu'ils n'étaient pas en mesure de faire jusque-là », estime Bob McCowan. « Si l'on adopte une perspective purement data, ce que nous pouvons faire, c'est trouver des moyens pour que les scientifiques puissent mieux relier les données entre elles, plus rapidement, faire des découvertes et mettre les médicaments sur le marché en cinq ou quatre ans, contre dix ans auparavant ».

Partager cet article

Commentaire

Avatar
Envoyer
Ecrire un commentaire...

INFORMATION

Vous devez être connecté à votre compte CIO pour poster un commentaire.

Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire

    Publicité

    Abonnez-vous à la newsletter CIO

    Recevez notre newsletter tous les lundis et jeudis