(des estampes à l'ordinateur)
informatisation de l'écriture
 
  Page précente.
  le quèc ng÷
le h¸n et le n«m
les écritures de minorités
 

le quèc ng÷

D ès les débuts de l'informatique, des chercheurs ou entrepreneurs vietnamiens ont cherché à informatiser leur écriture latine. De très nombreuses solutions ont été élaborées tant au Vietnam qu'à l'étranger comme les BK-HCM, VIETSEA, VIETSTAR, VISCII, VNI, VNU, VS, 3C, etc... Nous ne considérerons ici que les normes officielles de l'Institut de normalisation du Vietnam, le Tiªu ChuÈn ViÖt nam ou Technical Committee VietNam.

L'abondance des caractères utilisés par le quèc ng÷ a toujours été une source de difficultés pour un codage normalisé de l'écriture alphabétique.

En effet l'alphabet vietnamien se compose de 2 × 21  = 42 consonnes (40 + 2, en jaune, n'appartenant ni au jeu de référence ISO 646 IRV ni au jeu ASCII) :
b c d ® f g h j k l m n p q r s t v w x z
B C D § F G H J K L M N P Q R S T V W X Z

et de 2 × 12 = 24 voyelles de base (12 + 12) :
a ¨ © e ª i o « ¬ u ­ y
A ¡ ¢ E £ I O ¤ ¥ U ¦ Y

Chaque voyelle peut supporter chacun des 6 tons :

kh«ng dÊu huyÒn hái nga² s¾c nÆng

ce qui donne une combinaison de 6 × 24 = 144 voyelles (12 + 132) :

a µ ¸ ¹ A
¨ » ¼ ½ ¾ Æ ¡ ¯ º ¿ À ¡´
© Ç È É Ê Ë ¢ Á Â Ã Ä ¢´
e Ì Î Ï Ð Ñ E
ª Ò Ó Ô Õ Ö £ Å Í Ù Ú £´
i × Ø Ü Ý Þ I
o ß á â ã ä O
« å æ ç è é ¤ Û à ð ÿ ¤´
¬ ê ë ì í î ¥ ¥° ¥± ¥² ¥³ ¥´
u ï ñ ò ó ô U  
­ õ ö ÷ ø ù ¦     
y ú û ü ý þ Y     

Or la norme ISO 2022 précise que la structure générale des jeux de 128 caractères codés sur 7 bits doit comporter un sous-ensemble de 32 caractères de contrôle - appelé C0 - dans les positions 00 à 31 et un sous ensemble de 96 caractères graphiques - appelé G0 - dans les positions 32 à 127.
Les jeux de 256 caractères codés sur 8 bits doivent eux comporter cette structure répétée deux fois ; en conséquence :

  • les positions 00 à 31 doivent contenir le groupe C0 de 32 caractères de contrôle
  • les positions 32 à 127, le groupe G0 de 96 caractères graphiques (le caractère en position 32 étant l'espace de symbole SP)
  • les positions 128 à 159, le groupe C1 de 32 caractères de contrôle
  • les positions 160 à 255, le groupe G1 de 96 caractères graphiques (le caractère en position 160 étant l'espace insécable de symbole NBSP).
D'où le dilemne : ou ne pas être conforme à l'ISO 2022 ou ne pas disposer de tous les caractères précomposés. Aussi la norme TCVN 5712:1993 prévoit-elle trois variantes :
  • VN1
    • contient toutes les lettres de base, les 5 marques de tons combinables et tous les caractères précomposés
    • non conforme à l'ISO 2022 (12 caractères majuscules précomposés en C0 et 32 autres caractères majuscules précomposés en C1)
  • VN2
    • contient toutes les lettres de base, les 5 marques de tons combinables et tous les lettres minuscules précomposés et certaines lettres majuscules précomposées
    • conforme à l'ISO 2022
  • VN3
    • contient toutes les lettres de base et toutes les lettres minucules précomposés
    • conforme à l'ISO 2022
    • nécessite deux polices : l'une avec les lettres précomposées en minuscules, l'autre avec les mêmes lettres en majuscules

Mais ces jeux ne supportent comme langue que le vietnamien et l'anglais. Aussi le TCVN travaille-t-il sur un autre jeu, basé sur l'ISO 8859-1 (dit aussi ISO Latin 1) : l'ISO 8859-V. Ce jeu est conforme à l'ISO 2022 comme tous ceux de la série 8859. Cinq lettres, à savoir les o grave et u tréma, majuscules et minuscules ainsi que le thorn majuscule "&Thorn;" sont remplacés par les signes de tons combinables. Le thorn minuscule "þ" est lui remplacé par le signe monétaire du dong, la monnaie vietnamienne. Son utilisation suppose donc que le système logiciel d'affichage prenne complètement en charge les combinaisons voyelles de base-signe de tonalité.

le h¸n et le n«m

E n préparation


les écritures des minorités

E n préparation
 
  Page précente.