Choix des formats de fichiers
Enjeux et critères de choix
Le principal enjeu d’un choix judicieux d’un format de fichier est la préservation de sa lisibilité sur le long terme, le principal risque étant l’obsolescence.
Un format peut devenir obsolescent pour plusieurs raisons :
- Les mises à jour logicielles ne supportent plus le format ;
- Le format est remplacé par un autre ou a évolué vers un format plus élaboré ;
- L’adoption du format est lente et par conséquent, les éditeurs n’ont pas créé de logiciel compatible avec le format ;
- Le logiciel qui supporte le format n’est plus disponible sur le marché pour diverses raisons (faillite de l’éditeur, etc.).
Tous les formats sont potentiellement sujets à l’obsolescence. Cependant, suivant qu’ils sont propriétaires ou non, fermés ou ouverts, ils peuvent y être plus ou moins sujets. Il existe trois principales catégories de formats :
- Les formats propriétaires fermés : ces formats ont tendance à évoluer plus vite, et proposent en général différentes versions pour différentes plateformes ou systèmes d’exploitation avec une rétrocompatibilité assez limitée (souvent pour des raisons commerciales). Ces formats sont les plus sujets à obsolescence en raison de leur grande évolutivité et de leur dépendance à un éditeur ou à un produit spécifique.
- Les formats propriétaires ouverts : certains formats propriétaires sont ouverts, réduisant ainsi le risque d’obsolescence. Il faut cependant noter que certains éditeurs peuvent changer d’avis et décider de fermer un format qui était ouvert.
- Les formats non propriétaires ouverts : les formats dont les spécifications sont publiées par des organismes de standardisation sont les plus surs en termes de stabilité sur le long terme. La rétrocompatibilité est souvent une priorité lors de l’évolution de ces formats qui ne sont par ailleurs pas poussés à l’obsolescence par des pressions commerciales. Cependant, les formats doivent être adoptés par une large communauté d’utilisateurs et de développeurs pour être viables sur le long terme.
De manière générale, il convient de privilégier les formats ouverts et non propriétaires.
Formats de fichiers par catégorie de données
Plusieurs sites maintiennent à jour des listes de formats pour différentes catégories de données, tout en mettant en avant les formats qui sont recommandés pour la préservation à long terme.
La Library of Congress maintient à jour des listes de formats pour différentes catégories d’information qui peuvent vous aider à faire votre choix :
- Formats de fichiers pour des images
- Formats de fichier pour des vidéos
- Formats de fichier pour des sons
- Formats de fichier pour des textes
- Format de fichier pour des datasets
- Formats de fichier pour des archives du web
- Formats de fichier pour des données géographiques
- Formats génériques
Guides méthodologiques du CINES
- Guide méthodologique pour le choix de formats numériques pérennes dans un contexte de données orales et visuelles
- Guide méthodologique : le format de fichier PDF
Références
- ICPSR Digital Preservation Management Tutorial
- Sustainability of Digital Formats Planning for Library of Congress Collections