Projets

La Chambre des Notaires de Paris mise sur l'IA pour classer des documents complexes

La Chambre des Notaires de Paris mise sur l'IA pour classer des documents complexes
Bertrand Savouré, Président de la Chambre des Notaires de Paris : « Nous mettons la priorité sur l’innovation au bénéfice de nos clients. »

Le 11 février, la Chambre des Notaires de Paris a présenté son projet VictorIA. Basé sur la technologie d'intelligence artificielle (IA) d'Hyperlex, celui-ci vise à automatiser le tri et l'analyse des nombreux documents rattachés aux grandes opérations immobilières.

Publicité« Le notariat reçoit et traite un nombre considérable de données », souligne Stéphane Adler, Vice-Président de la Chambre des Notaires de Paris, qui regroupe plus de 1 750 notaires à Paris, en Seine-Saint-Denis et dans le Val-de-Marne. La réception, le classement et l'analyse de ces documents, aujourd'hui effectués par les collaborateurs, représentent des tâches lourdes et chronophages. Afin de renforcer la sécurité juridique de ces processus, tout en améliorant l'efficacité opérationnelle, la Chambre des Notaires de Paris a décidé d'évaluer les possibilités de l'intelligence artificielle dans le cadre de son projet VictorIA.

La technologie retenue, celle de la LegalTech Hyperlex, a déjà été mise en oeuvre dans un précédent projet, dénommé VIDOC. En 2016, les notaires ont obtenu un accès dématérialisé au fichier immobilier de la Direction Générale des Finances Publiques, récupérant à cette occasion une base de plusieurs millions de documents. A cette occasion, la Chambre des Notaires de Paris a fait appel à Hyperlex pour trier ces derniers, éliminant près de 4 millions de documents inutiles grâce à sa technologie d'intelligence artificielle. « Avec le moteur d'IA entraîné, cette opération a pris 20 heures, là où il aurait fallu 25 ans pour un humain seul », précise Stéphane Adler.

Reconnaître les différents types de documents

Après ce premier projet d'IA réussi, mené sur une période de 10 mois, la Chambre a souhaité étendre l'usage de cette technologie à l'Espace Notarial. Développé par Paris Notaires Services, ce service propose des datarooms électroniques pour regrouper les nombreux documents liés aux grandes opérations immobilières (Grand Paris, Jeux Olympiques...). « Ces dossiers comportent en moyenne 300 documents, mais dans certains cas ce nombre grimpe à plusieurs milliers », pointe Jacques Binard, DSI de la Chambre des Notaires de Paris. Sachant qu'à l'heure actuelle, plus de 33 000 datarooms ont déjà été constituées, la volumétrie en jeu est considérable.

Dans un premier temps, le moteur d'IA va s'attacher à identifier et classer les documents. Récupérés sous forme d'images, ceux-ci doivent tout d'abord être convertis en texte à l'aide d'outils de reconnaissance de caractères. Ensuite entrent en jeu des algorithmes d'IA sémantique et de traitement du langage naturel (NLP), chargés de reconnaître le type de document et d'en extraire un certain nombre d'informations clefs : clauses, dates, montants, surfaces concernées...

Un apprentissage supervisé par les experts

Pour cela, les algorithmes vont tout d'abord être entraînés sur un ensemble de documents mis à la disposition par les études. Pour permettre cet apprentissage, les données brutes doivent être auparavant enrichies par des experts métiers, en l'occurrence les notaires partenaires du projet et leurs collaborateurs, avec l'appui d'étudiants en droit. « Au départ, un label doit être associé aux fichiers par des 'taggeurs' humains, pour indiquer à la machine de quel type de document il s'agit », explique Alexandre Grux, co-fondateur et PDG d'Hyperlex. Autre point important, les notaires doivent au préalable s'accorder sur une nomenclature commune pour désigner les différents types de documents.

PublicitéUne fois que les données d'apprentissage seront suffisamment nombreuses, la solution pourra construire un premier modèle entraîné. Si les résultats ne sont pas satisfaisants, de nouveaux documents seront intégrés à la base d'apprentissage. « Une petite erreur sur les données d'apprentissage peut prendre beaucoup d'ampleur ensuite. Le contrôle des experts est essentiel lors de cette première phase », prévient Alexandre Grux. Au fur et à mesure, le modèle va s'affiner, toujours sous la supervision des experts métiers, jusqu'à ce que les résultats soient suffisamment pertinents. La dernière étape consistera à produire un algorithme d'inférence, capable de déduire les étiquettes à apposer en s'appuyant sur le modèle. Il sera alors possible de commencer à tagguer automatiquement les documents sur grande échelle.

L'IA demande des infrastructures performantes

La performance des algorithmes d'IA dépend avant tout du nombre de données disponibles, de leur pertinence et des contrôles assurés par les experts. « Il est important d'avoir beaucoup de données », insiste Alexandre Grux. L'infrastructure sous-jacente ne doit pas non plus être oubliée, d'autant que l'objectif de la Chambre est d'offrir des services industrialisables, qui peuvent être mis à la disposition de toutes les études. « Les technologies d'IA nécessitent une puissance de calcul importante », précise le DSI Jacques Binard. « Nous avons mis en place une infrastructure dédiée à ce projet chez un opérateur de cloud français, reliée à nos datacenters par une liaison privée. »

La phase d'apprentissage doit démarrer très prochainement. La Chambre prévoit de lancer les premiers services basés sur l'IA dans l'Espace Notarial d'ici fin 2020. Si les résultats sont au rendez-vous lors de la première phase du projet, la Chambre des Notaires envisage dans un second temps d'utiliser l'IA pour la recherche de clauses et l'audit de documents, voire d'aller jusqu'à l'audit de processus complexes.

Ce projet s'inscrit dans une stratégie d'innovation initiée il y a plusieurs années, comme l'a rappelé Bertrand Savouré, Président de la Chambre des Notaires de Paris : « les notaires sont une profession très dématérialisée. C'est le fruit de nombreuses années de travail. Nous voulons maintenir cette avance technologique, en optant des projets innovants, au service de nos clients. » Pour accélérer la sélection et le développement de technologies numériques au service de la profession, comme l'IA ou la blockchain (cf. encadré), la Chambre des Notaires de Paris a créé en 2018 un fonds d'innovation, auquel ses 410 études ont toutes contribué. Celui-ci est actuellement doté de 6,2 millions d'euros. Le projet VictorIA est co-financé par ce fonds et par la Banque des Territoires, à hauteur de 50 000 € pour la phase d'étude et de Proof of Concept.

Partager cet article

Commentaire

Avatar
Envoyer
Ecrire un commentaire...

INFORMATION

Vous devez être connecté à votre compte CIO pour poster un commentaire.

Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire

    Publicité

    Abonnez-vous à la newsletter CIO

    Recevez notre newsletter tous les lundis et jeudis