Françoise Banat-Berger (Archives Nationales) : « la généralisation des téléservices rend impératif de passer à l'échelle pour l'archivage numérique »


La performance business conditionnée par celle de l'IT
Toutes les entreprises reposent de plus en plus sur leur système d'information. Ce fait est reconnu depuis longtemps. Mais il en résulte une conséquence souvent négligée : la performance business est intimement liée à la performance du système d'information. Développer cette performance est donc...
DécouvrirLa Direction des Archives Nationales vient d'inaugurer la première version d'Adamant pour l'archivage numérique définitif public. Il s'agit de la première implémentation de Vitam à entrer en production. La préoccupation de l'archivage définitif ou intermédiaire de grandes masses documentaires, avec valeur probante conservée, est commune à de nombreuses organisations et même de grandes entreprises s'intéressent à l'outil co-construit par trois ministères français.
Publicité« Les méthodes artisanales ne peuvent plus convenir devant l'explosion des volumes » tranche Françoise Banat-Berger, directrice des Archives Nationales. Comme elle le reconnaît, les premiers travaux sur l'archivage de données informatisées datent d'une trentaine d'années. Mais, depuis, la transformation numérique des administrations est devenue massive. Surtout, désormais, il n'y a plus du tout de support papier dans un nombre croissant de cas. Là où, jadis, il était toujours possible d'archiver un document papier, même pour une procédure globalement électronique, ce pis-aller n'est tout simplement plus envisageable. Pour la directrice, garante de la mémoire nationale, « la généralisation des téléservices implique la disparition progressive du papier. Il est donc impératif de savoir archiver et mettre à disposition des données et des documents numériques. » C'est l'objet du programme Adamant, basé sur une implémentation de l'outil open-source Vitam en collaboration avec la Sous-Direction des Systèmes d'Information (SDSI) du Ministère de la Culture. ADAMANT (Administration Des Archives et de leurs Métadonnées aux Archives Nationales dans le Temps) a ainsi été inauguré officiellement le 7 décembre 2018.
Dépendant du Ministère de la Culture, les Archives Nationales ont été créées lors de la Révolution Française. Dès le 29 juillet 1789, l'Assemblée Constituante se préoccupe de la question de la conservation de l'oeuvre législative en cours de constitution et les textes vont se succéder pour définir puis réglementer la fonction jusque sous le règne de Napoléon 1er. Bien évidemment, les archives antérieures ont été récupérées et les Archives Nationales détiennent des documents datant du Haut Moyen-Age. « Les Archives Nationales détiennent des éléments constitutifs de preuves des actes et décisions, en plus d'un intérêt patrimonial qui en fait un Trésor National » décrit Françoise Banat-Berger.
350 kilomètres de papier et seulement 50 To de données numériques (pour l'instant)
A l'heure actuelle, les Archives Nationales détiennent 350 kilomètres linéaires d'archives papier dont, par exemple, 24 kilomètres de dossiers individuels de naturalisation. Elles conservent et mettent à disposition les archives définitives provenant des services centraux de l'Etat et opérateurs nationaux (comme les établissements publics) ainsi que quelques fonds d'origine privée ayant un intérêt patrimonial (archives de grandes familles ou d'artistes célèbres...). Les Archives Nationales récupèrent également les archives des notaires parisiens. A l'inverse, deux ministères gèrent eux-mêmes leurs archives définitives : le Ministère des Affaires Etrangères et celui des Armées. Les ministères de la Culture, des Affaires Etrangères et des Armées sont, logiquement, les co-concepteurs de Vitam, conçu comme une solution mutualisée. Pour son propre compte, le Ministère de la Culture gère donc ses archives courantes et intermédiaires sous la responsabilité de son secrétariat général, sa direction des Archives Nationales gérant l'archivage définitif. Les deux autres ministères gèrent les trois niveaux d'archivage. Les archives définitives ne constituent qu'une sélection des archives courantes et intermédiaires, dont une grande partie est réglementairement éliminée après expiration des durées d'utilité administrative.
PublicitéLes premiers éléments numériques à avoir été archivés ont été des bases statistiques de l'INSEE et de l'INED (données brutes et métadonnées, au-delà des publications qui en ont été tirées). Aujourd'hui, il y a évidemment de la bureautique et de la messagerie électronique mais aussi des supports de type vidéo comme discours et déplacements politiques ou campagnes d'information de différents ministères. Les Archives Nationales traitent des documents souvent produits dix ou quinze ans plus tôt et la question du numérique ne devient donc critique que maintenant. Pour l'heure, il n'y a que 50 To de données nativement numériques à reprendre, soit plus de 250 millions de fichiers. Françoise Banat-Berger reconnaît : « avec le papier, il arrive que l'on retrouve de vieilles archives de plus d'un siècle dans une administration ; avec le numérique, il est impossible de récupérer le contenu de l'information au bout de plusieurs dizaines d'années. Le plus volumineux concerne l'audiovisuel, les données extraites d'applications ou la production bureautique ne pèsent en fait pas très lourd. »
Un processus rigoureux mais très manuel pour l'instant
L'archivage définitif est le stade ultime d'un document. Quand une information est produite, elle est stockée in situ et sauvegardée. Ensuite, elle est archivée dans un stockage accessible, ce qui se nomme l'archivage courant. Quand le document cesse d'avoir un usage régulier mais demeure avec une nécessité de service, il arrive en archivage intermédiaire. « Par exemple, un dossier de carrière ou un dossier patient en hôpital peuvent être gardés ainsi durant des dizaines d'années » pointe Françoise Banat-Berger. Enfin, après élimination de ce qui n'a pas d'intérêt patrimonial ou historique, le document arrive en archivage définitif. Dans tous les cas, les documents archivés doivent être accessibles et restituables.
Et c'est là qu'arrive un soucis supplémentaire : celui du droit d'accès. Pour préserver la vie privée et les données personnelles, la sécurité publique ou d'autres secrets protégés qui sont définis dans le code du Patrimoine, des groupes de documents peuvent être en accès restreint durant 25, 50 ou même 100 ans à compter de la date de production du dernier document inclus. L'accès durant ces périodes nécessite suit une procédure précise dérogatoire. C'est notamment le cas pour les documents des cabinets ministériels, reversés systématiquement aux Archives Nationales lors de chaque remaniement, selon une procédure de plus en plus rigoureuse. Françoise Banat-Berger précise : « s'agissant du numérique, les fichiers bureautiques et les courriers électroniques des cabinets ministériels sont collectés depuis quelques années. Mais les mails et leurs pièces jointes doivent faire l'objet de plusieurs traitements complexes, notamment de dédoublonnage. »
Le programme Adamant fait de Vitam la pierre angulaire du SIA v3
Pour couvrir ce besoin métier fondamental, les Ministères de la Culture, des Armées et des Affaires Etrangères ont donc mené un développement mutualisé d'un outil open-source baptisé Vitam, sous l'égide de la DINSIC, la « DSI groupe » de l'Etat. « Cette solution est opérationnelle depuis le mois de Mars 2018 » indique Jean-Séverin Lair, directeur du programme Vitam. Le programme Adamant des Archives Nationales en constitue la première implémentation réellement opérationnelle entrée en production. Adamant n'est évidemment pas le premier outil informatisé gérant des archives. Et Vitam ne doit pas être confondu avec un système d'archivistique ordinaire. Le Système d'Information Archivistique (SIA) permet, depuis sa première version, de gérer les accès aux archives papier et, depuis la v2, les inventaires. Le SIA est accessible via un portail, utilisé notamment pour les demandes d'accès. Le SIA, jusqu'à présent, gérait donc des archives papier et était utilisé pour savoir ce qui était archivé, qui avait le droit d'accéder à quoi, qui demandait d'accéder à quoi et qui accédait effectivement à quoi. Avec Adamant, on parle bien d'archives nativement numériques qui sont gérées dans l'outil lui-même.
Françoise Banat-Berger précise : « le Programme Adamant comprend trois axes. Tout d'abord, le SIA v3, couplé avec Vitam pour gérer les archives nativement numériques. Ensuite, il y a l'accompagnement du personnel (tous les archivistes seront amenés à traiter du numérique et plus seulement des archivistes spécialisés) et enfin une reprise des données qui ont été traitées artisanalement jusqu'ici. » Le SIA v3 se base aujourd'hui sur Vitam v1 qui gère essentiellement les prises en charge de documents, en archives intermédiaires ou définitives, sur supports disques. La version suivante gérera les accès Intranet, la dernière version devant gérer aussi les accès Internet avec la prise en compte de tous les aspects sécuritaires (droits d'accès pointus) ainsi que le stockage sur bandes.
Des supports réinscriptibles dupliqués
L'archivage s'opère donc sur des supports de type disques pour les documents nativement numériques. « Comme à l'INA [Institut National de l'Audiovisuel, NDLR], on ne détruit pas a priori les supports originaux des archives audiovisuelles mais, ici, on parle bien de l'archivage du nativement numérique, donc sans support précis associé » décrit Françoise Banat-Berger. Le stockage d'archivage s'opère sur des supports par nature réinscriptibles avec réplication dans deux sites (des datacenters de la DINSIC) avec des technologies différentes et un contrôle systématique de l'enregistrement. Les migrations d'offres de stockage sont anticipées afin d'éviter l'obsolescence. « Le vrai write once (genre DVD) est lent et peu pérenne, le plus pérenne étant en fait la bande magnétique » justifie Jean-Séverin Lair, directeur du programme Vitam.
Le document qui va être archivé va être conservé dans son état d'origine. Jean-Séverin Lair stipule : « la préconisation est de toujours conserver l'original à titre de preuve finale si jamais le besoin s'en fait sentir. Mais, pour l'usage ordinaire, il est par contre nécessaire de prévoir un format lisible et accessible. » Les documents pourront donc être convertis dans un format adéquat avec anticipation de conversions successives en cas de besoin. Mais ce « format adéquat » n'est pas toujours le fameux PDF/A ! « Il faudrait écrire des livres entiers sur la légende du PDF/A ! Pour le texte courant, c'est parfait. Mais, par exemple, pour des tableurs, il est nécessaire de préserver les formules » relève Jean-Séverin Lair qui insiste particulièrement sur ce point. Vitam est capable de gérer des « campagnes de migration » selon des scénarios de préservation multicritères (selon les formats, les fonds, etc.). Vitam inclus des « griffons », nom donné aux plug-ins (ou greffons), dédiés pour effectuer ces conversions de formats. Le choix du format relève d'une stratégie de conservation (quoi garder pour quel usage) qui, parfois nécessite des compromis.
Un traitement pour l'instant obligatoirement manuel
Pour l'instant, les entrées sont manuelles, il n'existe pas de flux via API déversant automatiquement des documents dans Adamant. Plusieurs raisons justifient cette approche. D'une part, il s'agit de filtrer et d'opérer des choix pour l'archivage définitif. D'autre part, les documents qui arrivent aujourd'hui ont dix ou quinze ans et rien n'avait été prévu pour faciliter un archivage automatisé. Et, concernant la bureautique et la messagerie, il faudra toujours opérer un tri et une indexation manuels. Jean-Séverin Lair explique : « les données d'origine applicative sont structurées et peuvent donc être intégrées automatiquement en fonction d'une stratégie. Pour éviter le traitement manuel de la bureautique, il est envisagé de la basculer au maximum dans des GED, comme l'outil Diplomatie intégrant la messagerie sécurisée du Ministère des Affaires Etrangères. A voir si cela suffira pour pouvoir automatiser totalement... »
La première application qui sera intégrée avec une certaine automatisation est Solon, des services du Premier Ministre. Cette application gère le workflow de préparation des textes législatifs et réglementaires, processus qui a évidemment une très grande importance patrimoniale. L'opérateur de Solon est la DILA (Direction de l'Information Légale et Administrative). Solon exportera les données dans le format d'échange pour l'archivage (le SEDA), données qui seront ensuite importées dans Adamant en mode batch. A terme, le versement en flux se fera via API car, dans ce cas précis, il n'y a rien à filtrer, la sélection des données à archiver ayant été faites en amont. La cible de l'intégration consiste aussi en une purge de Solon de tout ce qui a été archivé et une connexion temps réel permettant de retrouver, à partir de Solon, ce qui a été archivé dans Adamant.
Une logique communautaire s'amorce
Normalement, le prochain ministère à basculer en production une implémentation de Vitam devrait être le Ministère des Affaires Etrangères. Mais l'outil commence à intéresser bien au-delà des trois ministères initiaux. Les autres ministères s'y intéressent pour gérer l'archivage intermédiaire, avec une capacité à déverser directement dans l'archivage définitif. Il en est de même pour des hôpitaux (un test étant en cours) et des établissements publics.
Un opérateur privé d'archivage, une grande entreprise publique mais aussi des banques ont regardé avec attention le produit lors de présentations dédiées. « Une logique communautaire s'amorce » se réjouit Jean-Séverin Lair.
Article rédigé par

Bertrand Lemaire, Rédacteur en chef de CIO
Commentaire
INFORMATION
Vous devez être connecté à votre compte CIO pour poster un commentaire.
Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire