|
|
||
| Numérisation des bibliothèques / L'image numérique : acquisition | ||
|
|
||
|
Les modes de numérisation |
| Définition de la numérisation | |
| Le mode image | |
| Les avantages et inconvénients du mode image | |
| Le mode texte | |
| Le mode vectoriel | |
| Bibliographie | |
| Sites à consulter | |
|
Le mode image Les images bitmap (aussi appelées images raster ou image en mode point) sont constituées d'une grille de points appelés pixels. Chaque pixel peut être codé : sur un bit pour une image en noir et blanc ; sur 8 bits pour une image en niveaux de gris ; sur 24 ou plus pour une image en couleurs. Selon le nombre de bits sur lesquels on choisit de coder un pixel, on obtiendra un choix plus ou moins grand de couleurs pour rendre l'image. On désigne couramment par profondeur du pixel (bit depth) le nombre de bits requis pour un pixel. Le mode bitonal code chaque pixel sur un bit, lui donnant ainsi la possibilité de ne prendre que deux valeurs, le noir ou le blanc. Elle est très économique en terme de mémoire. Cependant, si le mode bitonal s'applique facilement aux textes récents et très contrastés, il conviendra de prendre des précautions pour le traitement de documents faiblement contrastés, dont les fonds sont colorés, dont l'encre est pâlie ou de densité variable. L'adoption de ce mode fait perdre le rendu du support papier dont on ne pourra plus évaluer le caractère ancien. Le bitonal nécessite un examen préalable des documents (état du papier, typographie). Il faut par exemple s'assurer par des essais que les taches de roussissures ou d'humidité du papier ne seront pas interprétées par le scanner comme des points à traduire en noir, ce qui peut rendre le document illisible. Le mode niveaux de gris restitue mieux les nuances colorimétriques. Il est plus goumand en mémoire. Plus le nombre de bits utilisés pour coder un pixel est grand, plus large est la palette de gris. Ainsi un codage sur 8 bits (un octet) donne 256 gris différents. Cette technique permet, à l'inverse du bitonal, de préserver correctement l'aspect ancien des documents, ce qui a décidé certains établissements (Bibliothèque du Congrès, Conservatoire des Arts et Métiers) à l'adopter pour numériser des fonds patrimoniaux. On peut l'utiliser pour les gravures. Le mode couleurs suit le même principe que le précédent à la différence que chaque pixel correspond au codage des trois couleurs primaires rouge, vert et bleu (RVB). Chacune de ces couleurs est codée sur un nombre donné de bits. Un codage minimum de 4 bits par couleur donne 4 096 couleurs. En général, on code sur 8 bits (soit 24 bits par pixel) pour obtenir 16 777 216 couleurs. Le principal inconvénient de ce mode réside dans le poids des fichiers qui sont 24 fois plus lourds qu'en mode bitonal. En revanche, elle est recommandée pour des documents présentant un nombre important de couleurs, pour des documents mélangeant textes et illustrations en couleurs. Il est impossible de donner à une image bitmap une dimension de façon absolue car le pixel n'est pas caractérisé par une taille fixe. Cette dernière varie en effet en fonction de la résolution du périphérique de visualisation ou d'impression. La dimension d'une image bitmap peut donc se définir de la façon suivante : Nombre de pixels en largeur x nombre de pixels en hauteur = nombre de pixels de l'image Une image de 700 x 500 pixels en noir et blanc pèse 42,72 Ko. Une image de 2000 x 3000 pixels en couleur, soit 144 millions de bits, 18 millions d'octets (18 Mo), soit 12 disquettes. On peut sauvegarder 36 images de ce type sur un CD-R. |
|
Le mode vectoriel Enfin, il existe un troisième mode dit vectoriel. C'est une technique de représentation de forme par des équations mathématiques. Il est principalement utilisé dans le domaine du dessin assisté par ordinateur. Le passage d'un plan sur support papier à un plan vectoriel par le biais de la numérisation est une opération longue et coûteuse qui nécessite dans la quasi totalité des cas le recours à un opérateur spécialisé qui valide la conversion. Il existe un format
de représentation vectorielle des textes : c'est le format PDF
d'Adobe. Il présente deux
avantages : C'est un format de présentation recommandé pour la publication de documents. Il peut indexer le texte et permet une navigation entre les chapitres lorsqu'ils ont été définis. |
|
Sites à consulter La couleur - principes,
espaces colorimétriques, calibration de la chaîne graphique La couleur en informatique Susan Haigh, La
Reconnaissance optique de caractères en tant que technologie
de numérisation. Terry Kuny, Introduction
aux techniques et aux problèmes de la numérisation Preparing Quality
Images for Computer Networks Introduction to
Imaging Digital Photography
Solutions |