Le ministère des Armées mobilise l'IA générative

L'application GenIAl du MinArm, proposant des fonctions de synthèse, de traduction ou de transcription, offre un exemple d'assistant tournant sur des infrastructures totalement protégées. En exploitant le potentiel de l'Open Source et de l'Open Weights.
PublicitéUn agent conversationnel pour les agents du ministère des Armées, disponible sur le réseau interne Intradef. Dévoilé pour la première fois en février dernier, l'application GenIAl.intradef a été développée par le Centre d'expertise données et IA (Cedia) du Secrétariat général pour l'administration, une structure créée en juin dernier sur la base d'un laboratoire qui, lui, avait déjà presque 10 ans d'existence.
« Dès août 2023, le ministère avait la volonté de mettre sur pied une solution interne souveraine reproduisant les interfaces conversationnelles présentes dans le grand public », précise Guillaume Vimont, le responsable du Cedia. Développée sur les infrastructures du MinArm, notamment sur la base de la technologie Elastic, la solution offre des fonctions classiques des assistants : synthèse de documents, traduction, transcription, mais aussi reconnaissance de caractères. « Nous avons beaucoup travaillé avec l'Open Source et avec l'Open Weights pour les modèles de GenAI, qui sont des leviers intéressants pour s'approprier les technologies. C'est ce qui a permis de passer le service à l'échelle », indique Guillaume Vimont.
Un déploiement calé sur la disponibilité des GPU
Voulant éviter le développement d'usages non approuvés de la technologie - le Shadow AI -, le ministère a choisi de mettre rapidement son assistant en production. « Ce choix permettait aussi de mettre en évidence la valeur immédiate qu'y trouvent les métiers et de dessiner des pistes d'évolution pour la plateforme », souligne le responsable du centre d'expertise. Dès décembre 2023, un prototype de GenIAl est disponible, suivi en 2024 par un passage à l'échelle progressif. « Car nous faisions face à une problématique de disponibilité des ressources en GPU sur nos infrastructures », précise Guillaume Vimont. L'application est réellement ouverte à la mi-décembre et compte aujourd'hui quelque 35 000 utilisateurs, avec un rythme de plus de 1000 connectés chaque jour. A terme, le MinArm entend équiper entre 60 000 et 95 000 personnes avec son assistant.
Un passage à l'échelle qui s'est accompagné d'investissements de la part du ministère. Dans les infrastructures évidemment. Mais également dans les équipes. « Mi-2023, nous étions 1,5 ETP à assurer la conception d'un petit prototype, se remémore Guillaume Vimont. Pour la phase d'industrialisation, le lab est devenu un centre regroupant une dizaine d'ingénieurs, secondé par l'équipe de l'Amiad », l'Agence ministérielle de l'intelligence artificielle de défense qui compte déjà plus de 100 ingénieurs.
Des modèles Open Weights réentraînés
PublicitéPour l'heure, GenIAl s'apparente à « un produit de grande consommation, mais suffisamment spécialisé pour répondre aux contraintes internes », selon l'expert. Par exemple, l'assistant serait ainsi en mesure de ramener de 10 à 2 le nombre d'allers-retours sur les notes d'état-major entre rédacteurs et relecteurs. « Mais l'objectif désormais consiste à traiter des cas davantage orientés métiers sur cette plateforme », indique Guillaume Vimont. Pour bâtir son assistant, le MinArm se base sur des modèles librement disponibles. « Nous ne nous figeons pas sur un modèle particulier, car ce marché évolue vite, dit le responsable. Mais les modèles doivent répondre à nos critères en matière d'Open Weights (accès aux paramètres du réseau de neurones issus du pré-entraînement, NDLR), d'évaluation des risques ou de licences. Sans oublier un nombre de paramètres adapté à nos infrastructures. »
Sur cette base, le centre d'expertise se concentre ensuite sur le fine-tuning des modèles, avec le vocabulaire spécifique du ministère, mais aussi avec « sa vision du monde ». Pour ces phases de spécialisation, le MinArm dispose d'ailleurs des données collectées par l'application (notamment les entrées/sorties) depuis août 2023. « Soit des millions d'enregistrements stockés avec une politique d'accès pensée en fonction du besoin d'en connaître », précise Guillaume Vimont, soit la politique de restriction d'accès à l'information propre aux domaines militaire et du renseignement.
Vers un modèle de fondation fabriqué par le MinArm ?
Une base qui pourrait, à terme, permettre au ministère d'entraîner son propre modèle de fondation ? Le responsable du Centre d'expertise n'écarte pas totalement l'hypothèse - d'autant que le ministère a annoncé, en octobre 2024, l'acquisition d'un supercalculateur pour entraîner et spécialiser des modèles d'IA, machine dont la mise en service est attendue cette année -, mais indique qu'il est encore « trop tôt » pour se frotter à pareil développement. « C'est une option que nous gardons en tête si l'Open Weights venait à disparaître », ajoute-t-il.
Sans attendre ces éventuelles inflexions, le Cedia travaille actuellement à l'intégration de modèles multimodaux, capables de traiter les images ou les sons. Attendues pour lundi prochain, de premières fonctions multimodales, qui ont nécessité un réentraînement des modèles, permettront aux agents du ministère de valoriser d'importants silos de données jusqu'alors hors de portée de GenIAl.
Article rédigé par

Reynald Fléchaux, Rédacteur en chef CIO
Suivez l'auteur sur Twitter
Commentaire
INFORMATION
Vous devez être connecté à votre compte CIO pour poster un commentaire.
Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire