![]() |
|
| Les URL | |
|
Les URL sont les adresses des ressources du Web — et en fait d'un peu tout ce qu'il y a sur Internet. Ils sont définis par le RFC 1738. Dans un contexte international, cette définition pose quelques problèmes. En effet, le RFC définit d'abord un URL comme une suite de caractères, mais ensuite comme une suite d'octets transmis par le réseau, ce qui suppose une relation entre ces deux suites (un codage de caractères). Or, le RFC ne mentionne que l'ASCII comme jeu de caractères, ce qui laisse en plan, d'une part la moitié des valeurs possibles d'octets, et d'autre part la plupart des caractères des écritures du monde ! D'aucun prétendront qu'un URL, comme un numéro de téléphone, n'est qu'une adresse opaque sans signification. Mais il suffit de regarder un URL comme celui-ci :
|
pour constater qu'ils ont souvent une forte valeur
mnémonique. Or, cette valeur ne profite aujourd'hui qu'à ceux qui
peuvent se contenter de l'ASCII. Et qui n'a jamais essayé de
débusquer le serveur Web d'une société en tapant Il y a supposément une petite porte de sortie : un octet non-ASCII (valeur > 127) peut être représenté par une notation ASCII du genre %E9 (procédure dite d'url-encodage), qui remplace un octet de valeur 233 (E9 en hexadécimal). Mais il n'en reste pas moins qu'aucun caractère n'est associé à cet octet, url-encodé ou non, et que la plupart des caractères du monde ne peuvent être codés. L'internationalisation des URL fait présentement l'objet de débats au sein de l'IETF et ailleurs, mais les jeux sont loin d'être faits. En attendant, le seul choix semble être de s'en tenir à l'ASCII. |
| Le navigateur multilingue Tango assure l'affichage correct de toutes les langues de Babel. | ![]() |
© 1996, Alis Technologies inc. |