1. INTRODUCTION

L'Internet est le réseau des réseaux. Vaste amalgame de milliers d'ordinateurs, reliés entre eux par des liens de communication et par un protocole commun (TCP/IP), il s'étend aujourd'hui à plus de 80 pays. Or il tire son origine d'un seul pays, les États-Unis, où une seule langue, l'anglais, est comprise et utilisée par tous. Ce simple fait a des conséquences profondes sur les caractéristiques de l'Internet, sur ses modes d'utilisation et sur sa capacité technique à appuyer des échanges d'information en diverses langues. La plupart de ces conséquences dérivent du fait que l'Internet a été conçu en fonction de, et autour du système de codage de caractères ASCII. Ce système n'intègre qu'un répertoire très limité de caractères, en fait juste ce qu'il faut pour représenter la langue anglaise, avec pour conséquence qu'il ne peut représenter que l'anglais, le swahili et l'indonésien.

Il serait exagéré de croire que cette limite s'applique à toutes les facettes de l'Internet. En réalité, au plus bas niveau, la tuyauterie permet le transport de données arbitraires, et donc en principe d'information en n'importe quelle langue. Ce beau paysage se trouve tout de suite gâché, dès qu'on jette un coup d'oeil aux différents protocoles, aux différentes méthodes, en un mot aux services qui rendent la tuyauterie utilisable et utile : on y constate l'hégémonie, la quasi omniprésence de l'ASCII.

1.1 Les services Internet

On peut classer les services d'Internet en trois grandes catégories :

  1. les services de base, qui assurent le fonctionnement du réseau lui-même ;
  2. la messagerie, à savoir le courrier électronique et les forums de nouvelles ;
  3. la recherche et la récupération d'information, ou, plus succinctement, les services d'information Internet.

Parmi les protocoles de base, on peut énumérer les suivants : IP, TCP, UDP, ICMP et DNS. La messagerie repose sur les protocoles SMTP, son extension ESMTP, MIME et dans le cas des forums de nouvelles sur NNTP.

Du côté des services d'information, les principaux sont FTP, Telnet, Finger, Gopher, WAIS et HTTP, qui est le protocole de base du W3. Les cinq premiers sont des services de récupération d'information, mais à quatre d'entre eux sont associés des services de recherche correspondants (Archie est associé à FTP, Hytelnet à Telnet, Veronica à Gopher et divers robots non standardisés au W3). WAIS est principalement un service de recherche qui permet accessoirement la récupération. Chacun de ces services fait l'objet d'au moins un protocole standard de l'Internet, et se distingue par ce protocole, ainsi que par son intéractivité et par le type de données qu'il permet de traiter.

Plan Chapitre suivant