Définir un mode d'archivage pérenne pour mes données

La gestion des données de recherche du projet doit être réfléchie et organisée différemment en fonction de l'étape à laquelle on se situe, pendant et après le projet.

Contrairement au stockage, à la sauvegarde et au dépôt des données dans un entrepôt pour le partage, l'étape de l'archivage pérenne ne concerne pas tous les projets : il est à réaliser uniquement en cas de nécessité avérée.

Définition et périmètre

L’archivage pérenne ne concerne en général qu'une partie des données produites par un projet. Pour certains projets, il n'est d'ailleurs pas nécessaire de prévoir d'archivage pérenne.

En effet, la question de l'archivage pérenne se pose uniquement pour les données présentant une valeur scientifique reconnue par la communauté d'où elles proviennent et qui nécessitent une conservation pour au moins 30 ans.

C'est une opération coûteuse qui nécessite un budget alloué. Elle se décide à l'échelle du laboratoire et non pas à l'échelle du chercheur.

Concrètement, l'archivage numérique pérenne consiste à conserver le document et l’information qu’il contient :

  • dans son aspect physique comme dans son aspect intellectuel,

  • sur le très long terme,

  • de manière à ce qu’il soit en permanence accessible et compréhensible.

Le CINES

Le CINES (Centre Informatique National de l'Enseignement Supérieur) est l’opérateur mandaté par le Ministère pour opérer la mission d’archivage pérenne pour l’Enseignement Supérieur et la Recherche.

Il développe différentes solutions, en particulier PAC, la Plateforme d’Archivage au CINES.

Selon son institution, sa discipline ou l’entrepôt choisi, il existe déjà des partenariats avec le CINES, proposant un accompagnement pour l’archivage.

Exemple : Huma-Num en SHS

Sélection des données à archiver

La valeur des données est à considérer afin de procéder à la sélection des données qu'il sera pertinent d'archiver sur le long terme.

Valeur scientifique des données

Les données sont-elles uniques, non reproductibles (ou à des coûts trop élevés) ?

• Les données ont-elles une valeur historique, c'est-à-dire représentent-elles un point de repère dans les découvertes scientifiques ?

• Les données comprennent-elles des changements dans les méthodes de traitement, de nouvelles normes ou créent-elles des précédents ?

• Les données appuient-elles les projets en cours ou les tendances scientifiques ?

• Les données sont-elles susceptibles de répondre aux besoins/orientations futurs de la communauté scientifique (potentiel de réutilisation) ?

• Les données sont-elles susceptibles d'être citées ou référencées dans une publication ?

• …

Mesures de contrôle de la qualité des données

• La qualité et la conformité de la collecte des données doivent être contrôlées et documentées. Il peut s'agir des processus comme la calibration, la répétition des échantillons ou des mesures, la capture standardisée des données, la validation de saisie des données, la revue par les pairs …

• La qualité, intégrité physique des données (non endommagées, lisibles…)\

Considérations politiques / institutionnelles

• Quelle est la politique du financeur, de l’institution ?

• Les données sont elles-conformes à la stratégie de l’institution ?

Considérations juridiques / statutaires

• Y a-t-il une raison légale ou législative pour conserver les données ?

• Existe-t-il une raison évidente pour laquelle les données peuvent être utilisées dans le cadre de litiges, d'enquêtes publiques, d'enquêtes policières ou de tout rapport ou document qui pourrait être contesté en justice ?

• Existe-t-il des obligations financières ou contractuelles qui obligent à conserver les données ?

Considérations financières

Lorsqu'on envisage la préservation des données, le coût de conservation (identifié non seulement comme étant le stockage, mais aussi la gestion, le partage, l'accès, la sauvegarde et la maintenance à long terme des données) doit être mis en balance avec les preuves d'une réutilisation potentielle des données.

Règles de tri et de conservation des archives

Consulter le référentiel de gestion des archives de la recherche, Association des archivistes français, Section Aurore.

Crédits :

Last updated