La problématique de l’archivage à long terme
La préservation des données dans le temps est certainement la problématique la plus difficile à laquelle doit
faire face l’archivage.
Il n’y a pas véritablement une définition communément acceptée pour la notion de "conservation des archives
à long terme".
Il est clair que l’objectif de l’archivage à long terme est de pouvoir relire les informations archivées dans le futur. Ce besoin
est un minimum, car dans certains cas on voudra aussi pouvoir travailler sur ces informations (par exemple pour trouver des corrélations
inexplorées par le passé) .Sans proposer une définition, dans le sens strict, il nous paraît raisonnable de parler
de préservation de données à long terme quand il s’agit de :
- "mettre les archives en condition de résister à des changements technologiques ou a des changements des besoins d'exploration
des informations archivées".
Pour recouvrer des informations archivées, il faut en premier lieu que ces archives n'aient pas été altérées
dans le temps. Il est donc fondamental d'assurer l’intégrité des supports d’enregistrement des données archivées
ainsi que leur pérennité dans le temps.
Mais si cette condition est nécessaire, elle n'est pas suffisante, car en effet il faut aussi être capable d’extraire les bits
du support, de les regrouper en blocs intelligibles par le système d’exploitation et d’en extraire les données qui seront exploitables
électroniquement. On se heurte alors de plein fouet aux problèmes de la pérennité des systèmes d’exploitation,
des formats de stockage et de compatibilité ascendante pour les versions des logiciels applicatifs.
La préservation des documents numériques archivés doit donc résoudre deux types d’altération dans le temps
:
- L’altération des supports sur lesquels sont enregistrés les documents dont on doit garantir l’intégrité du
codage binaire.
- L’évolution de l’environnement d’exploitation logicielle et matérielle de ces documents.
Par manque de normalisation, aujourd’hui seules les techniques de migration sont de bonne pratique dans l’industrie (les techniques d’émulation
font l’objet de projets de recherche).
On entend par migration, une action qui conduit à un changement technologique de support ou à une évolution du contexte
d'exploitation supporté.
Toute migration, qu’elle soit au niveau des supports d’enregistrement, des formats ou au niveau de l’application se traduit généralement
par une modification du codage initial des contenus. Cette opération demande d’être strictement contrôlée, et (en
fonction du volume de données et de la complexité de la transformation) peut être coûteuse, longue et fastidieuse.
Il n’y a pas de solution miracle pour la préservation des données à long terme. Même les tiers-archiveurs, réputés
spécialistes de l’archivage, s’ils vous garantissent l’intégrité des archives que vous confiez à leur coffre-fort,
se gardent bien de prendre en charge la migration des environnements logiciels et même des supports. Toute migration comporte un risque
(même très faible) d'altération de donnés et on peut comprendre que les prestataires des services d'archivage ne
soient pas prêts d'assumer ce type d'aléa. Les utilisateurs ne peuvent donc pas se dégager entièrement de la responsabilité
de conservation de leurs données. Ils n’ont en réalité aucune garantie, à moins de prendre en compte eux-mêmes
le problème.
C’est donc à chaque organisation, de définir sa propre stratégie de conservation et d’en superviser l’exécution.
En conséquence, les organisations doivent s’accommoder des changements technologiques (logiciels et matériels) et des changements
d’exploitation.
Pour relever ce défi, des choix et des actions sont à conduire, en notant que :
- la stratégie n’est pas une affaire de technologies, plutôt de procédures ;
- il faut privilégier les standards porteurs ;
- des migrations des données archivées sont à effectuer au cours du temps.
Nous contacter ...
|