Projets

L'Unédic remet ses données au boulot

L'Unédic remet ses données au boulot
Stéphane Rondeau, responsable du pôle data de l’Unédic, lors de l’événement organisé par Cloudera : « en 2025, nous prévoyons d’intégrer nos premiers GPU à la plateforme, pour conserver notre autonomie ». (Photo : R.F.)

Pour sortir d'un mode d'exploitation des données trop figé, l'organisme paritaire a construit sa propre plateforme Big Data. Associée à un service chargé de concevoir des produits data.

PublicitéOrganisme paritaire chargé du pilotage et de la gestion de l'assurance chômage, l'Unédic joue un rôle central dans la politique de l'emploi, malgré un nombre de salariés assez modeste (une centaine). Chargé notamment d'informer et d'éclairer les partenaires sociaux et les citoyens, mais aussi d'accompagner les opérateurs que sont France Travail et l'Urssaf, l'Unédic est attendu pour son expertise sur les évolutions du marché du travail et sur les tendances de l'économie.

Une mission qui explique la volonté de l'association de moderniser et de reprendre en main sa plateforme de données. « L'objectif était de répondre à l'obsolescence du fichier national des allocataires hébergé par France Travail, avec qui nous fonctionnions en mode client/fournisseur. Une organisation reposant sur des technologies anciennes et nous offrant peu de réactivité », explique Stéphane Rondeau, responsable du pôle data de l'Unédic, qui s'exprimait à l'occasion d'un événement organisé par Cloudera, le 14 novembre, à Paris. « Or, nous avions de plus en plus de demandes d'analyses sur des populations ou sous-populations données et des velléités d'enrichir ces analyses avec de nouvelles données, comme celles de la DPAE (Déclaration préalable à l'embauche) ou de la DSN (Déclaration sociale nominative). Sans oublier le besoin d'autonomie qu'exprimaient nos métiers », reprend le responsable.

Une U-Zine pour concevoir des produits data

Dès 2018, la mutation est engagée avec un premier prototype mené sur la plateforme Big Data de Cloudera. Les premières intégrations de données suivent l'année d'après. En 2020, sur cette base, l'Unédic conçoit un simulateur des réformes de l'assurance chômage. Puis, l'année suivante, la plateforme est associée à des outils collaboratifs et raccordée au RIE (Réseau interministériel de l'Etat). Avant une augmentation des capacités et l'intégration de nouvelles sources de données en 2022.

L'an dernier, la plateforme s'enrichit à nouveau, avec de premiers travaux à base d'IA, comme des analyses de sentiment. Mais ce n'est que cette année que la plateforme historique (reposant sur la technologie SAS Institute) est décommissionnée et que l'Unédic met sur pied sa fabrique data, baptisée U-Zine. « Et, en 2025, nous prévoyons d'intégrer nos premiers GPU à la plateforme, toujours dans cette volonté de conserver notre autonomie », ajoute Stéphane Rondeau.

Auparavant, seulement une mise à jour mensuelle

Pour Stéphanie Terrasse, directrice de projet Data Science à l'Unédic, la nouvelle plateforme vient gommer les limites du précédent environnement, en termes de stockage, de temps de calcul et de flexibilité de l'outillage. « Et, auparavant, nous n'avions accès qu'à une mise à jour mensuelle des données, sans historisation », souligne l'experte.

PublicitéSelon cette dernière, la transition vers Cloudera a servi de levier à la nouvelle stratégie data de l'organisme paritaire, qui se déploie selon quatre axes : la centralisation des données venant de multiples partenaires et la fin du lien de dépendance à France Travail ; la capacité à exploiter en propre une infrastructure Big Data ; la mise en oeuvre de services clefs en main au bénéfice des métiers et des partenaires (portail Open Data, tableaux de bord, cas d'usage développés par l'U-Zine) ; enfin, un renforcement de la gouvernance et de la sécurité (notamment via une gestion fine des habilitations et la traçabilité des accès).

Plus de performances, plus de simulations

Selon les deux responsables, la nouvelle organisation de la donnée a permis à l'Unédic de gagner en flexibilité. « Par exemple, en 2020, lors de la crise du Covid, nous avons enregistré un pic d'activité partielle. La nouvelle plateforme nous a permis d'intégrer et d'analyser rapidement ces données », illustre Stéphanie Terrasse. Sans oublier les bénéfices qu'apporte cette modernisation en matière de performances intrinsèques, avec des analyses réalisées souvent en quelques minutes contre plusieurs heures auparavant. « Ce qui permet, par ricochet, d'effectuer davantage de simulations », souligne l'experte en Data Science.

Voué à la création de produits data, l'U-Zine s'est lancé dans de premiers tests avec l'IA générative. D'abord en mettant en place une application RAG permettant, via Llama 3 hébergé en interne, de requêter un document PDF. Le Data Office a aussi mis au point une seconde application analysant l'impact des catastrophes naturelles sur l'activité partielle. « Dans ces circonstances, les employeurs transmettent leurs observations via un texte libre que nous analysons avec un LLM », détaille Stéphanie Terrasse. En l'occurrence ici, grâce à l'API de GPT.

Partager cet article

Commentaire

Avatar
Envoyer
Ecrire un commentaire...

INFORMATION

Vous devez être connecté à votre compte CIO pour poster un commentaire.

Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire

    Publicité

    Abonnez-vous à la newsletter CIO

    Recevez notre newsletter tous les lundis et jeudis