rapports
Rapport de la Commission de réflexion sur Le livre numérique
mai 1999

Pour en savoir plus

Annexe 1 : la technologie du numérique

L'expression " livre numérique " est à elle seule porteuse de deux concepts technologiques de nature bien différente :

  • le livre, désignant un objet physique bien identifié, en trois dimensions, résultat d'une chaîne d'opérations de fabrication, dont le contenu est définitivement figé;
  • le numérique, désignant un ensemble de technologies basées sur une transformation (la numérisation) d'un signal en nombres (suite de 0 et de 1), impliquant en général l'usage d'un ordinateur.

Autrement dit, d'un monde d'atomes, éléments matériels, palpables et irréductibles, on passe à un univers de bits, éléments immatériels (virtuels), manipulables à l'infini. Aujourd'hui, ces technologies interviennent dans des proportions variables tout au long de la chaîne du livre. Parfois, la seule étape numérique d'un livre sera sa version " traitement de texte ", alors que certains livres pourront n'exister que sous forme numérique… jusqu'à ce que leur lecteur décide d'en imprimer tout ou partie.

Mais il y aura toujours, à un moment ou à un autre, passage par une étape de matérialisation du bit, que ce soit sous forme de points lumineux sur un écran, de points encrés sur une page imprimée, ou encore d'ondes résultant de la vibration d'une membrane acoustique. Cette étape de matérialisation est en effet indispensable au processus de médiatisation, car le cerveau humain n'est pas câblé pour interpréter directement une suite de codes numériques. De ce point de vue, le livre lui-même, sous sa forme traditionnelle, peut être considéré comme un terminal; en quelque sorte, l'ancêtre du terminal informatique.

Il est donc utile de faire un point succinct sur l'ensemble des technologies mises en œuvre lors des différentes phases de la chaîne du livre. Parmi ces technologies, certaines sont utilisées également dans de nombreux autres contextes, en particulier sur le réseau Internet; d'autres concernent plus directement la reproduction de textes, et donc le livre.

Saisie ou capture d'un texte sous forme numérique

En fonction de l'instant où intervient la numérisation, différentes technologies peuvent être mises en œuvre.

Saisie ou capture directe

Il s'agit de créer directement un fichier contenant les différentes informations. Ces informations peuvent être de deux natures :

  • le contenu lui même (textes, images fixes ou animées, son…), codé selon des formats plus ou moins standards (ASCII, UNICODE, GIF…) qui permettront une interprétation à des étapes ultérieures du processus;
  • une description de la structure du document, ce qui permettra d'en faciliter l'utilisation ultérieure : les zones du document (titres, chapitres, paragraphes, références…) sont identifiées par des balises (chaînes de caractères standards bien identifiées), différentes normes existent (HTLM, SGML, XML, XMI, DHTML) en fonction de l'utilisation finale envisagée, en particulier du type de support (papier, écran, Web…). Ces informations de composition peuvent être rajoutées postérieurement à la saisie du contenu, au moyen d'outils spécialisés.

Saisie ou capture à partir d'un document existant

On parle de numérisation lorsque le document original est " photographié " au sens où le fichier résultant est une " image numérique ".

L'équipement utilisé est en général un scanner, dont le degré de sophistication influera largement sur la qualité finale de l'image. La cadence de numérisation, qui peut atteindre plusieurs centaines de pages/heure, influera également sur cette qualité. Les zones de texte de l'image numérisée peuvent être ensuite soumises à une analyse optique afin de reconnaître les caractères et de les stocker en revenant au cas de figure précédent. Dans un certain nombre de cas, par exemple des documents anciens ou bien encore des textes incluant de l'iconographie, on procédera à de l'analyse d'images et à de la reconnaissance de formes.

Une fois l'information disponible sous forme numérique, différents traitements peuvent être effectués :

  • indexation : il s'agit de repérer l'information contenue dans le fichier de façon à en accélérer la localisation ultérieure. Un des aspects de l'indexation est le catalogage, que ce soit à objectif commercial ou culturel;
  • création de liens : il s'agit de faciliter le passage, on dit la navigation, d'une zone à l'autre, à l'intérieur d'un même document ou dans un autre document, pouvant être stocké n'importe où sur le réseau; o création d'un format de présentation de la page (exemples : postscript, PDF) : ce traitement conduit à figer la page de façon à en garantir l'apparence définitive, que ce soit à l'écran ou sous forme imprimée, indépendamment du système récepteur. Les langages de balisage mentionnés plus haut, peuvent conduire à des résultats différents, en terme de présentation, en fonction des systèmes utilisés par le récepteur;
  • compression : il s'agit, au moyen d'algorithmes normalisés, de réduire la taille du fichier stocké, en éliminant des informations redondantes ou à faible valeur, au prix parfois d'une dégradation, limitée, de la qualité du contenu.

Les enjeux de cette phase sont les suivants :

  • anticiper la palette la plus large possible de réutilisation des contenus, afin d'optimiser, dès le départ, l'utilisation sur différents supports, papier, site sur le Net, CD-Rom, etc… ;
  • participer aux travaux des commissions internationales de standardisation et utiliser des normes de balisage et de catalogage internationalement reconnues, afin de permettre l'intégration de l'information dans un réseau mondial, ce qui suppose des politiques de formation.

Les bases de données documentaires sont également un enjeu important en lien direct avec le stockage numérique des ouvrages, même si cette question dépasse le strict cadre du livre.

Diffusion sur support magnétique ou optique

Le support de stockage le plus largement répandu aujourd'hui est le CD-Rom, d'une capacité de l'ordre de 600 mega-octets, soit jusqu'à 250000 pages environ. Apparaît progressivement le DVD-Rom, dont la capacité est 10 fois supérieure.

Diffusion sur support papier

Deux circuits d'impression sont possibles à partir d'un même fichier :

  • le circuit traditionnel offset : la matérialisation des bits se fait par impression sur film ou gravage sur plaque;
  • l'impression numérique, dans laquelle le dispositif d'impression reçoit et interprète directement le contenu du fichier. Il est désormais possible d'imprimer et de relier des ouvrages en très petites quantités, à des débits élevés (jusqu'à plus de 10000 pages/heure, soit moins de 5 minutes pour un ouvrage de 180 pages, finitions comprises), sur des équipements dont le coût peut varier de quelques centaines de milliers de francs à un ou deux millions de francs.

On peut mentionner dans ce cadre l'expérience française du " Livre à la carte ", www.librissimo.com , qui semble intéresser de nombreuses bibliothèques et des partenaires américains.

Diffusion via un service en ligne

Différents moyens existent pour accéder à l'information via le réseau numérique :

  • librairie virtuelle : le catalogue et de nombreux services associés sont mis en ligne et il est possible de procéder à des actes de commerce électronique; o accès via le Web : depuis le poste de l'utilisateur, à l'aide d'un navigateur et d'un éventuel programme associé (Word, Acrobat…), le livre est parcouru, les pages pouvant être stockées localement et imprimées. Le contenu peut être " manipulé " et aucune garantie n'existe quant à la conformité avec l'original;
  • téléchargement sur un terminal spécialisé et propriétaire, éventuellement via un micro-ordinateur : trois dispositifs sont actuellement en cours de commercialisation aux États-Unis (RocketBook, SoftBook et EveryBook), pour des coûts compris entre 500 et 1500 dollars; un dispositif est en cours de développement en France (Cybook).

À ce jour, aucun format standard n'existe pour ce genre de service, des initiatives sont cependant en cours aux États-Unis. On peut citer par exemple Open Book Initiative, qu'a récemment rejoint Microsoft. Une information régulière est diffusée sur www.openebook.org Un site américain édite régulièrement un magazine en ligne sur ces sujets. Il s'agit de www.ebooknet.com

Du côté du lecteur

Les technologies dont doit disposer l'utilisateur final pour tirer pleinement partie des possibilités offertes par le numérique - à ce jour, essentiellement un micro-ordinateur multimédia et un accès Internet - se maintiennent à des coûts élevés pour toute une frange de la population, que ce soit en valeur d'acquisition ou en usage. Elles n'ont pas atteint leur maturité de produit grand public, si l'on songe en outre à tous les aléas quotidiens que rencontrent les particuliers équipés dans ce domaine. De plus, l'hétérogénéité du parc micro-informatique installé rend plus complexe, en l'absence de normes, la conception et la diffusion de produits à destination du grand public. Enfin, l'accès à Internet par le réseau commuté reste peu performant, même si des techniques telles qu'ADSL (haut débit sur les lignes téléphoniques classiques en utilisant des fréquences beaucoup plus élevées que celles utilisées par la voix) ouvrent des perspectives intéressantes pour les prochaines années.

Pour le lecteur habitué au support papier, qui se caractérise par sa haute définition et son haut niveau de contraste, l'utilisation intensive de l'écran conduit à une fatigue visuelle plus ou moins importante. Des recherches sont en cours pour adoucir l'effet visuel dû à la juxtaposition de pixels sans liens entre eux.

D'ici quatre à cinq ans, l'encre électronique pourrait constituer un progrès décisif. Cette encre est un ensemble d'infimes capsules en uréthane, présentant chacune une face noire et une face blanche. Ces particules sont orientées par un courant électrique parcourant le " support ", une page, aujourd'hui à peine plus épaisse qu'une couverture de magazine, au travers d'un conducteur à base de vinyle. Une fois chargé, le " livre " ne nécessite plus de fourniture d'énergie, mais il sera possible à tout moment de recharger le support avec un autre contenu. Cette technologie est en cours d'étude et de développement au Massachussets Institute of Technology, des équipes françaises s'intéressent également à cette question.

Caractéristiques d'ensemble de ces évolutions technologiques

Les bouleversements apportés par la technologie sur l'offre de livres et les pratiques de lecture sont abordés dans les sections suivantes. On peut néanmoins souligner quelques caractéristiques des évolutions technologiques en cours ou prévisibles :

  • une convergence vers une numérisation des contenus à la source, ces contenus étant ensuite déclinés sur différents supports, la fixation définitive sur papier intervenant au plus près de l'utilisateur final, démultipliant ainsi les possibilités de diffusion à moindre coût;
  • la volatilité des informations stockées sur des bits, associée à la possibilité de multiplier les liens hypertextes, rendant plus difficile à la fois l'identification et la certification des contenus, ainsi que leur pérennisation dans le temps;
  • en association avec le contenu, des informations " périphériques " (les " metadata ") de plus en plus abondantes, permettant d'en caractériser la teneur (indexation thématique, auteurs, critiques, commentaires, références…) et de développer nombre de services associés (catalogage, recherche, commercialisation, forum…).

Tout cela renforce le besoin de standardisation, préalable indispensable à une réelle généralisation grand public des possibilités définies ci-dessus. Cette standardisation, qui a déjà commencé sous l'égide des organismes de normalisation ou de regroupements d'industriels, devra concerner à la fois :

  • la description de la structure interne, aussi bien physique que logique, du contenu;
  • les informations périphériques permettant la caractérisation de ce contenu;
  • les services associés, en particulier tout ce qui pourra contribuer à la certification (scellement) du contenu et au respect des droits de propriété littéraire et artistique (cf. : l'initiative du Digital Object Identifier, évoquée dans le rapport).