3. Les serveurs

3.1. Les serveurs de messagerie et de news

3.1.1. Le courrier

Le transport du courrier d'une machine à l'autre est assuré par des serveurs, logiciels tournant sur chaque machine et communiquant entre eux via SMTP. Il en existe une grande variété, presque autant qu'il y a de fabricants. Plusieurs respectent la norme au pied de la lettre et soit tronquent le huitième bit de chaque caractère transmis, détruisant ainsi tous les caractères non-ASCII, soit refuse carrément les messages non conformes. D'autres, heureusement assez répandus, sont plus conciliants et se contentent de ne générer que de l'ASCII pour les fins du protocole, mais passent sans rechigner les caractères 8 bits qu'on leur donne à transmettre. Finalement, on trouve aussi des serveurs réalisant au moins en partie le nouveau standard ESMTP, mais sans grande utilité. Le résultat est qu'il n'y a aucune garantie qu'un message autre qu'ASCII arrivera intact à destination, et qu'on observe souvent des messages massacrés. La présence de relais et de passerelles, surtout lorsqu'un message doit transiter hors de l'Internet (sur un réseau X.400 gouvernemental par ex.), ne fait qu'empirer une situation déplorable.

3.1.2. Usenet

Il n'existe qu'un petit nombre de serveurs de news. Le plus populaire est Cnews, dont les auteurs en 1986, recherchant avant tout le rendement, ont trouvé qu'il était plus simple et plus efficace de simplement ignorer la présence ou l'absence d'un huitième bit, plutôt que d'exiger 7 bits pour assurer la conformité aux normes. Cnews s'est largement répandu, justement à cause de son efficacité, et les utilisateurs d'Usenet s'étant rendu compte de sa transparence aux 8 bits, n'ont pas manqué d'en profiter, créant ainsi un état de fait qui s'est imposé aux auteurs de serveurs subséquents. Ainsi INN, serveur plus récent et de plus en plus populaire, ne se préoccupe pas du tout du huitième bit, ce qui est la bonne manière de faire. La réalisation dite de référence de NNTP fait de même.

3.2. Les serveurs WAIS et Gopher

3.2.1. WAIS

Les serveurs WAIS sont assez peu nombreux. La société WAIS Inc. en distribue une version commerciale, et deux versions gratuites sont largement répandues : freeWAIS, et sa modification freeWAIS-sf dont nous avons déjà parlé à la section 2.3, et qui est apparemment le seul logiciel WAIS à se préoccuper du problème des caractères autre qu'ASCII. Le protocole lui-même n'offrant pas d'avenue de solution à ce problème, même freeWAIS-sf s'en tire assez mal comme expliqué à la section 2.3.

3.2.2. Gopher

Il n'y a pas grand chose à dire sur les serveurs Gopher. Il en existe une certaine variété, tous plus ou moins issus de l'original de l'université du Minnesota. L'évolution semble au ralenti, d'une part à cause de la prédominance du W3 qui rend Gopher nettement moins intéressant, d'autre part à cause d'un certain resserrement des conditions de licence de l'université du Minnesota.

3.3. Les serveurs W3 (HTTP)

Il existe deux serveurs gratuits largement répandus (NCSA et CERN), tournant sur des systèmes Unix, ainsi qu'une variété de serveurs moins populaires, soit pour des systèmes autres qu'Unix, soit pour des usages particuliers. Des serveurs commerciaux ont aussi fait leur apparition, assurant aux acheteurs une qualité garantie et permettant aussi le commerce sur le W3 par le biais du chiffrement.

À l'exception d'un exemple sans importance (à cause de la mauvaise qualité de la réalisation) et d'un serveur encore expérimental, aucun serveur existant n'offre de support à la multiplicité des langues et des jeux de caractères. Aucun ne transmet le paramètre charset nécessaire à l'interprétation correcte d'un document autre qu'en ISO Latin-1, et aucun ne réalise le mécanisme de négociation de la langue prévu dans le protocole HTTP/1.0 (Accept-Language).

Alis Technologies s'apprête à lancer un serveur HTTP tenant compte de ces préoccupations. Il est basé sur la plus récente version du serveur NCSA httpd, ce qui assure une certaine standardisation. Il transmet correctement le paramètre charset, ouvrant ainsi la porte au fonctionnement sans heurt du W3 à l'échelle mondiale. De plus, il réalise le mécanisme Accept-Language, facilitant grandement le montage de serveurs multilingues et permettant aux utilisateurs de fureteurs appropriés de profiter des avantages de ce mécanisme. Le produit fini sera distribué gratuitement sur l'Internet, à l'instar de l'original.

3.4. Les moteurs de recherche sur le W3

Il n'existe pas à proprement parler de protocole pour la recherche sur le W3, comme existent par exemple Veronica pour Gopher et Archie pour FTP. Mais le problème de la recherche d'information est si aigu et si important que de nombreuses solutions ad hoc ont été réalisées. Il existe plusieurs moteurs de recherche, comme Lycos, WebCrawler et WWWW, qui parcourent le W3 et bâtissent des bases de données des documents disponibles. Les clients accèdent à ces bases de données tout simplement par le biais du W3 lui-même : une interface est installée entre la base et un serveur HTTP, les clients interrogent la base au moyen de formulaires HTML, et le serveur renvoie la réponse sous forme d'un document HTML standard, généré à la volée, qui contient des hyper-liens vers les ressources appropriées.

Ces serveurs sont fort utiles, mais aucunement adaptés à la diversité linguistique que l'on retrouve de plus en plus sur le W3. Par exemple, il y a beaucoup d'information en français sur le W3, mais elle est dispersée et noyée dans l'océan de documents en anglais (ou autres langues, elles aussi faiblement représentées).

Cette dilution a pour effet pervers de réduire la visibilité et l'utilité des données en français en deçà même de ce que la fraction francophone pourrait laisser croire. Les moteurs de recherche ont leurs limites, autant dans leur capacité à répertorier les sites que dans leurs réponses aux requêtes. Par exemple Lycos, un serveur très connu installé à l'université Carnegie-Mellon, limite ses réponses à 20 URL ; passé ce nombre, il considère qu'il a rendu le service qu'on lui demandait et passe au client suivant (qui n'en peut plus d'attendre, Lycos étant très populaire et surchargé).

Mais qu'arrive-t-il si on demande à Lycos des documents traitant de " capital ", ou de " cactus " ? Il en trouvera fort probablement beaucoup plus de vingt, mais la probabilité qu'un document en français, s'il existe, sorte parmi les vingt premiers est infime ; le lecteur francophone ne trouve donc pas l'information qu'il cherche, même si elle existe.

Y a-t-il une solution à ce problème ? Bien sûr ! Il suffit de cesser de se fier aux serveurs de recherche américains, qui s'accommodent fort bien d'une petite " pollution " par des documents en langues autres que l'anglais, et par conséquent n'ont aucune sensibilité linguistique. Car c'est là la clef de la solution : il faut un serveur qui sache distinguer les informations en français et ne répertorie que celles-ci. Il ne gaspille pas ses ressources avec la masse d'information en anglais, et surtout peut retourner au requérant francophone des URL pertinents à sa requête. On peut aussi étendre l'idée aux langues partenaires de la francophonie, le concept important étant que le serveur répertorie les documents selon leur langue, et retourne au demandeur des URL pointant à des documents dans sa langue. Alis Technologies a dans ses cartons un projet de création d'un tel serveur/moteur de recherche, projet appelé Jason ; les problèmes liés à sa réalisation sont beaucoup plus d'ordre logistique que technique.

Plan Chapitre précédent Chapitre suivant