|
| ||
| Numérisation des bibliothèques / L'image numérique : acquisition | ||
|
| ||
|
Les caractéristiques du fichier numérique |
| Le format des fichiers | |
| Le nom des fichiers | |
| La compression | |
| Quelques exemples de compression | |
| Le poids des fichiers images | |
| Sites à consulter | |
|
Le nom du fichier Chaque image numérique du document numérisé génère un fichier auquel il faut attribuer un nom spécifique. Le nommage du fichier est une opération délicate lourde de conséquences sur l'exploitation ultérieure du fichier. Il ne faut pas nommer les fichiers au coup par coup, mais établir un plan de nommage exploitable lors des campagnes de numérisation ultérieures. La structure de nommage doit être élaborée en envisageant tous les cas de figure pour l'ensemble des collections. Il est préférable de ne pas inscrire le nom de l'ouvrage numérisé dans le nom du fichier, mieux vaut privilégier sa cote, sinon il faut utiliser des codes existants ou faciles à reconstituer (ex : n° de cote suivi d'un n° séquentiel). La structure du nom de fichier peut suivre le modèle suivant que l'on retrouve dans le Cahier des Clauses Techniques Particulières, proposé sur ce serveur ( à télécharger en format Word) : un code alphanumériques identifiant de l'institution. Pour les bibliothèques, il s'agit de la lettre « B » suivie du numéro RBCCN (Répertoire des bibliothèques du catalogue collectif national des publications en série) délivré par les agences régionales du CCN-PS. un numéro d'immatriculation de l'image structuré ainsi :
Chaque élément est isolé par le séparateur «_».
Les zones alphanumériques sont encodées en ISO-Latin-1. Elles ne doivent comporter aucun signe diacritique. Le nom du fichier peut être très long (plus de 20 caractères). Il est possible d'en utiliser deux versions : un fichier utilisé exclusivement en interne pourra commencer avec le code du fonds (ex : Bbl) ; en revanche dès que le fichier sera installé sur un serveur il devra comporter son préfixe « B_n° RBCCN » afin de rendre possible son identification. |
|
Le poids des fichiers images Un livre moyen de 500 pages comprenant 2 000 signes par page occupe environ 1Mo, il peut donc tenir sur une disquette. En revanche si on numérise un document similaire en mode image avec une définition de 400 dpi, il exige 3,5 Go de mémoire soit six CDR. Même comprimé en CCITT groupe IV on aura encore, avec un taux de compression de 15, 230 Mo. En conséquence sur un CDR, on peut mettre environ 600 ouvrages en mode texte, alors que l'on en mettra que 2 en mode image. On comprendra dès lors que le choix d'un support de stockage pour un document en mode texte est facile, mais s'avère bien plus problématique quand il s'agit de documents en mode image. Si on dipose d'un modem 56 Kb/s pour l'ouvrage en mode texte, il faut 3 mn pour télécharger ce document. Il faudra 1h30 pour l'autre. |
|
Sites à consulter Formats graphiques Formats graphiques pour
le web Carl Fleischauer, Digital
Formats for Content Reproductions, Washington, Library of Congress, NDLP,
13 July 1998 Flash Réseau,
n°24, "formats de fichiers graphiques et de fichiers sonores" |