Fiche précédente Numérisation des bibliothèques / L'image numérique : acquisition Fiche suivante

Les modes de numérisation

  Définition de la numérisation
  Le mode image
  Les avantages et inconvénients du mode image
  Le mode texte
  Le mode vectoriel
  Bibliographie
  Sites à consulter
   
haut de page

Définition de la numérisation

La numérisation est la codification numérique des intensités lumineuses et de la colorimétrie d'un document. La représentation numérique d'un texte peut se faire selon deux modalités :

– le texte est considéré comme une image qui permet de rendre seulement la forme des caractères, il est alors représenté sur un mode photographique. Ce type de document est obtenu par numérisation directe du document (mode image).

– chaque caractère a sa représentation unique sous forme numérique, ce type de document en mode caractère est obtenu soit par saisie directe par des outils de type traitement de texte, soit par reconnaissance optique de caractères à partir d'un document en mode image.

haut de page

Le mode image

Les images bitmap (aussi appelées images raster ou image en mode point) sont constituées d'une grille de points appelés pixels. Chaque pixel peut être codé :

– sur un bit pour une image en noir et blanc ;

– sur 8 bits pour une image en niveaux de gris ;

– sur 24 ou plus pour une image en couleurs.

Selon le nombre de bits sur lesquels on choisit de coder un pixel, on obtiendra un choix plus ou moins grand de couleurs pour rendre l'image. On désigne couramment par profondeur du pixel (bit depth) le nombre de bits requis pour un pixel.

Le mode bitonal code chaque pixel sur un bit, lui donnant ainsi la possibilité de ne prendre que deux valeurs, le noir ou le blanc. Elle est très économique en terme de mémoire. Cependant, si le mode bitonal s'applique facilement aux textes récents et très contrastés, il conviendra de prendre des précautions pour le traitement de documents faiblement contrastés, dont les fonds sont colorés, dont l'encre est pâlie ou de densité variable. L'adoption de ce mode fait perdre le rendu du support papier dont on ne pourra plus évaluer le caractère ancien. Le bitonal nécessite un examen préalable des documents (état du papier, typographie). Il faut par exemple s'assurer par des essais que les taches de roussissures ou d'humidité du papier ne seront pas interprétées par le scanner comme des points à traduire en noir, ce qui peut rendre le document illisible.

Le mode niveaux de gris restitue mieux les nuances colorimétriques. Il est plus goumand en mémoire. Plus le nombre de bits utilisés pour coder un pixel est grand, plus large est la palette de gris. Ainsi un codage sur 8 bits (un octet) donne 256 gris différents. Cette technique permet, à l'inverse du bitonal, de préserver correctement l'aspect ancien des documents, ce qui a décidé certains établissements (Bibliothèque du Congrès, Conservatoire des Arts et Métiers) à l'adopter pour numériser des fonds patrimoniaux. On peut l'utiliser pour les gravures.

Le mode couleurs suit le même principe que le précédent à la différence que chaque pixel correspond au codage des trois couleurs primaires rouge, vert et bleu (RVB). Chacune de ces couleurs est codée sur un nombre donné de bits. Un codage minimum de 4 bits par couleur donne 4 096 couleurs. En général, on code sur 8 bits (soit 24 bits par pixel) pour obtenir 16 777 216 couleurs. Le principal inconvénient de ce mode réside dans le poids des fichiers qui sont 24 fois plus lourds qu'en mode bitonal. En revanche, elle est recommandée pour des documents présentant un nombre important de couleurs, pour des documents mélangeant textes et illustrations en couleurs.

Il est impossible de donner à une image bitmap une dimension de façon absolue car le pixel n'est pas caractérisé par une taille fixe. Cette dernière varie en effet en fonction de la résolution du périphérique de visualisation ou d'impression. La dimension d'une image bitmap peut donc se définir de la façon suivante :

Nombre de pixels en largeur x nombre de pixels en hauteur = nombre de pixels de l'image

Une image de 700 x 500 pixels en noir et blanc pèse 42,72 Ko.

Une image de 2000 x 3000 pixels en couleur, soit 144 millions de bits, 18 millions d'octets (18 Mo), soit 12 disquettes. On peut sauvegarder 36 images de ce type sur un CD-R.

haut de page

Les avantages et inconvénients du mode image

Le mode image produit un fac-similé électronique du document d'origine. De ce fait, il permet d'étudier la typographie, l'écriture, les illustrations. Relativement simple à réaliser, il nécessite cependant une description bibliographique du document, ce qui inclut une indexation indispensable pour un accès aisé au document.

Le mode image présente deux inconvénients majeurs. Il exclut toute recherche à l'intérieur d'un texte. Par ailleurs, il génère des fichiers importants qui occupent de la place sur les supports de stockage.

haut de page

Le mode texte

Le mode texte offre la possibilité de recherche plein texte. Il est possible d'intervenir directement sur le document électronique. En revanche, le mode texte ne permet pas de conserver la présentation initiale du document original.

Pour obtenir du mode texte, deux solutions sont possibles. La première consiste à saisir manuellement les textes. Cette technique est coûteuse en temps et en main d'oeuvre mais c'est la seule envisageable pour la numérisation de textes manuscrits ou de textes dans des polices anciennes. Elle est très fiable lorsqu'il y a double saisie.

L'autre technique consiste à utiliser un logiciel de reconnaissance optique de caractères (ROC ou OCR, Optical character recognition). A partir d'un document numérisé en mode image, le logiciel convertit la configuration des points en signes typographiques dont il déduit la valeur dans une table de codification comme l' ISO 8859-1 (ISO Latin-1) ou comme l'ISO 10646 (UNICODE).

Les outils de reconnaissance optique ne sont pas encore totalement fiables. Même si certains logiciels annoncent un degré de fiabilité de 99 %, cela signifie que l'on peut trouver jusqu'à 10 mots erronés par page. Les logiciels de reconnaissance haut de gamme peuvent atteindre un taux d'exactitude de 99,95 %, ce qui ne représente pas plus d'une erreur pour 2 000 signes. Les fabricants de logiciels de ROC améliorent régulièrement leurs produits, notamment en ayant recours à des dictionnaires ou des outils d'analyse grammaticale. Ce type d'approche est peu adapté aux documents comportant de nombreux noms propres, des formes grammaticales anciennes ou écrits en plusieurs langues.

haut de page

Le mode vectoriel

Enfin, il existe un troisième mode dit vectoriel. C'est une technique de représentation de forme par des équations mathématiques. Il est principalement utilisé dans le domaine du dessin assisté par ordinateur.

Le passage d'un plan sur support papier à un plan vectoriel par le biais de la numérisation est une opération longue et coûteuse qui nécessite dans la quasi totalité des cas le recours à un opérateur spécialisé qui valide la conversion.

Il existe un format de représentation vectorielle des textes : c'est le format PDF d'Adobe. Il présente deux avantages :
– un poids moyen des fichiers faible par rapport à l'équivalent en mode image ;
– la possibilité de préserver la forme du document quel que soit le système de restitution.

C'est un format de présentation recommandé pour la publication de documents. Il peut indexer le texte et permet une navigation entre les chapitres lorsqu'ils ont été définis.

haut de page

Bibliographie

Anne R. Kenney, Stephen Chapman, Digital Imaging for Libraries and Archives, Ithaca (New-York), Cornell University Library, 1996.

Judith A. Zidar, "Optical scanning and text recognition", Encyclopedia of Library and Information sciences, ed. Allen Kent, New york, Marcel Dekker, 1995, vol.56 (suppl.19), p. 283-306.

haut de page

Sites à consulter

La couleur - principes, espaces colorimétriques, calibration de la chaîne graphique
http://www.erag.ch/MAC/Base.htm

La couleur en informatique
http://www.fundp.ac.be/institution/autser/cc/formations/couleur/couleur.html

Susan Haigh, La Reconnaissance optique de caractères en tant que technologie de numérisation.
http://nlc-bnc.ca/pubs/netnotes/fnotes14.htm

Terry Kuny, Introduction aux techniques et aux problèmes de la numérisation
http://www.nlc-bnc.ca/pubs/netnotes/fnotes37.htm

Preparing Quality Images for Computer Networks
http://www-personal.umich.edu/~jweise/quality/NetworkedImagesTOC.HTML

Introduction to Imaging
Guide clair et concis édité par le Getty, accompagné d'un glossaire : les notions essentielles pour la réalisation d'une banque d'images.
http://www.getty.edu/gri/standard/introimages

Digital Photography Solutions
Site sur la photographie numérique
http://www.image-acquire.com/