![]() |
|
| <FONT FACE> réputé nuisible |
|
L'élément
Le problèmeLe texte est normalement transmis sur le Web — de même dans les autres applications Internet — comme une séquence de caractères codés. En clair, ceci signifie qu'à chaque code correspond, par convention, un seul et unique caractère, lequel est interprété et affiché par l'application réceptrice. Il existe un certain nombre de ces codes de caractères, reprenant un répertoire de caractères correspondant normalement à un système d'écriture.
Le fait est que si vous utilisez
Pourquoi est-ce mauvais ?Plusieurs problèmes découlent de la mise en œuvre de l'approche décrite ci-dessus. Le problème le plus évident est que si l'utilisateur qui parcourt votre page ne dispose pas de la police exacte que vous avez spécifiée, il verra le texte dans la police par défaut de son fureteur, qui ne sera pas une police grecque (à moins qu'il ne soit grec lui-même, bien entendu !), alors qu'il est possible qu'une police grecque tout à fait convenable soit présente sur son système, laquelle aurait pu être utilisée si seulement vous aviez codé le texte convenablement.
Cet exemple propulse au premier plan le problème de la prolifération des polices : les caractères (ou plus précisément
les glyphes)
d'une police sont numérotés, l'ensemble des combinaisons glyphe–numéro formant ce qu'il est convenu d'appeler
le codage de la police. Or, une langue ou une écriture données peuvent se concrétiser en une grande variété de codages.
Si vous utilisez une correspondance de polices simpliste (et c'est ce que fait
Avec pour conséquence la fragmentation du cyberespace en un ensemble de zones exclusives (à moins que vous ne disposiez de toutes les bonnes polices), ce qui ne correspond pas précisément à l'esprit du Web ! Imaginez seulement le fouillis qui résulterait de l'utilisation de cinq saveurs d'ASCII, toutes incompatibles, et qui obligeraient les utilisateurs à de pénibles conversions de l'une à l'autre, après avoir deviné l'essence de la saveur en cause.
Recherche, tri, traitement de texte, etc.Et qu'en est-il de la recherche de ce texte grec (ou autre) au moyen de votre moteur de recherche préféré ? Oubliez ça ! À moins de savoir exactement quelle police l'auteur a utilisée, et ce a priori, afin d'être en mesure de spécifier les faux caractères « corrects » au moteur de recherche. Même l'utilisation de la fonction de recherche textuelle de votre fureteur pour repérer un mot dans la page courante a toutes les chances de donner un résultat non satisfaisant.
De la même façon, une liste de mots grecs (ou autres, évidemment) codés par mappage de police ne pourra être triée correctement.
En fait, tout traitement du texte devient pratiquement impossible avec cette technique de codage.
Si vous créez des pages Web — et ça ne peut qu'être le cas si vous utilisez
Courrier, inforums et autres applications Internet
La raison d'être d'Internet est la communication. Le Web utilise le langage HTML comme format commun de documents
mais qu'en est-il des autres moyens de communication ? L'HTML n'est généralement pas disponible, et vous serez
forcés d'oublier l'HTMLisant
Écritures complexes
La situation est encore plus épouvantable lorsqu'on a affaire à une écriture complexe. Mais qu'est-ce au juste qu'une écriture complexe ?
Bien, disons tout simplement qu'une écriture « simple » est caractérisée par une relation biunivoque entre caractères
et glyphes ; toutes les autres écritures sont réputées complexes. Les écritures latine, cyrillique et chinoise sont des écritures dites simples.
Le chinois, simple ? Oui, dans le sens que les caractères et les glyphes chinois sont en correspondance biunivoque, mais leur traitement informatisé est complexe
à cause du très grand nombre de caractères ; un octet ne suffit pas à les coder tous (et de loin !),
il faut recourir à deux et même à trois octets et Dans quelques écritures complexes, le glyphe change en fonction de la position du caractère dans le mot (initiale, médiale, finale or isolée) ; c'est le cas en arabe. Dans d'autres cas, il existe des ligatures obligatoires qui ont pour effet de combiner deux ou plusieurs caractères en un seul glyphe, comme en dévanâgarî (utilisé par la langue hindi). Ou alors un caractère est affiché en deux glyphes de part et d'autre du glyphe d'un autre caractère, par exemple en tamoul. Également :
Conclusion
La conclusion est on ne peut plus simple : n'utilisez pas
Si vous croyez faire avancer la cause d'une langue en fabriquant des polices et en les utilisant
pour publier sur le Web via
|
| Le navigateur multilingue Tango assure l'affichage correct de toutes les langues de Babel. | ![]() |
© 1996, Alis Technologies inc. |