L'avenir en messagerie doit passer par deux voies : la transmission intégrale des 8 bits, et la généralisation de MIME. La première est utile, surtout en l'absence de MIME, à l'intérieur d'un domaine linguistique donné où l'on peut raisonnablement s'entendre sur un jeu de caractères. C'est déjà pratiquement la situation sur Usenet dans les groupes identifiés à une langue, et l'expérience montre que ça fonctionne. À long terme, la transmission à 8 bits évite le gaspillage de bande passante inhérent au surcodage MIME, et reste donc utile même après la généralisation de ce dernier. Mais la transmission intégrale ne suffit pas, il faut MIME d'abord pour assurer l'étiquetage correct de messages textuels (essentiel lors de transmission en 8 bits), mais aussi pour permettre le courrier multi-média et la transmission de pièces jointes, fort utile en bureautique. ESMTP a aussi un avenir, mais il est lié à l'apparition de la transmission de messages binaires qui fait présentement l'objet de discussions au sein de l'IETF.
L'avenir dans ce domaine est beaucoup moins clair. Il apparaît assez évident que le W3 poursuivra sa croissance foudroyante dans un avenir prévisible, et qu'il deviendra de plus en plus international et multilingue. On peut prévoir des développements significatif dans plusieurs domaines :
Le concept d'URN fait déjà l'objet de discussion au sein de l'IETF. Il s'agit d'un nom donné à une ressource Internet, plutôt que d'une adresse directe ; un serveur d'URN pourra transformer ce nom en un ou plusieurs URL permettant de récupérer la ressource. L'idée est d'une part d'augmenter la persistance, la pérennité des identificateurs (l'URN demeure valide même si les URL changent, à la seule condition que le serveur d'URN soit mis à jour), d'autre part de permettre à un client de choisir, étant donné une référence (un URN), de récupérer la ressource de la source la plus accessible (coût, droits d'accès, " distance " au sens réseau, etc.). Le danger est que ces URN, qui se veulent des noms, ne puissent l'être vraiment que pour les anglophones à cause des sempiternels problèmes de jeu de caractères qui rendent la vie difficile avec les URL et les noms de fichiers.
Bien qu'il ne s'agisse pas à proprement parler de recherche ou de dissémination d'information, il nous faut mentionner l'utilisation croissante de l'Internet, et du W3 en particulier, pour le commerce. Exception faite du domaine de la simple publicité, l'aspect le plus important ici est que le commerce dépend de façon critique du chiffrement, qui permet de transmettre de façon confidentielle et authentifiable des informations diverses, financières en particulier. Or, pour pouvoir utiliser le chiffrement, deux correspondants doivent d'abord s'entendre sur une méthode commune, qu'ils connaissent tous deux et pour laquelle ils ont les logiciels appropriés. Au niveau mondial de l'Internet, plusieurs obstacles se dressent sur la voie d'une telle entente : certaines méthodes de chiffrement sont protégées par des brevets, ce qui nuit à leur dissémination ; pour des motifs de sécurité nationale, certains pays restreignent l'exportation (États-Unis) ou l'importation de logiciels de chiffrement, allant même jusqu'à les considérer comme des munitions ! Et finalement certains pays - au premier chef la France - interdisent pratiquement l'utilisation du chiffrement. Un danger ici est que l'industrie américaine, ayant accès à un marché suffisamment important, ne résolve seule ce problème pour ses propres fins, et arrive ensuite à imposer ses solutions ailleurs par le biais de la pression concurrentielle ; les industries des autres pays seraient alors laissées pour compte. Un autre, déjà partiellement réalisé, est que les particuliers en France n'utilisent, peut-être illégalement, des fureteurs capables de chiffrement pour contacter des serveurs américains. On peut aussi craindre l'apparition de méthodes de chiffrement faibles, à clés courtes par exemple, qui n'offriraient qu'une protection illusoire aux transactions. La grande activité dans de nombreux cercles de l'Internet, ainsi que les développement commerciaux, montrent bien l'importance et l'urgence de ce problème.
La dissémination de l'Internet aux quatre coins de la planète fait aussi apparaître des besoins nouveaux, qui constituent en même temps des occasions de développement. Par exemple, des applications comme le W3 sont plutôt gourmandes en ressources, en particulier en bande passante, et cette dernière fait cruellement défaut dans certaines régions (par ex. certains pays d'Afrique) ; de même, le matériel y est souvent plus limité (peu de mémoire, écran monochrome, etc.). Diverses optimisations des clients comme des serveurs peuvent pallier ces problèmes et permettre un accès acceptable au Tiers-Monde : protocoles et serveurs adaptés permettant au client de signaler l'absence d'un écran couleur (images en noir et blanc), d'indiquer une préférence pour un document épargnant la bande passante (moins d'images, plus petites, en noir et blanc) ; fureteurs adaptés contenant des pointeurs vers des ressources " proches ", et permettant de négliger à volonté certaines caractéristiques gourmandes comme les arrière-plans de document, la profusion des fontes ; utilisation judicieuse de serveurs mandataires à antémémoire, peut-être à plusieurs niveaux (partie de continent, pays, régions,...). On peut aussi imaginer pour l'avenir la création de relais de serveurs de listes de messagerie, qui permettraient l'envoi en différé de pages HTML contenant des nouvelles ou des services abonnataires. L'aspect différé élimine l'effet négatif du goulot de bande passante, alors que l'utilisation d'HTML rend les informations transmises beaucoup plus attrayantes.
La recherche des ressources restera pour encore longtemps un problème aigu, et est promise à de grand développement. Les interfaces en langue naturelle pourraient y jouer un grand rôle. Nous y reviendrons dans une section subséquente. D'autre part la spécialisation des outils de recherche (par langue, par ex.) et l'intégration des différents types existants (Archie, Veronica, WAIS, robots W3) ou à venir semblent être des voies d'avenir.
Deux autres développements en cours nous semblent digne de mention, l'un à cause de son intérêt évident, l'autre simplement parce qu'il semble devenir populaire.
Le premier est le domaine des agents logiciels ; ici on ne transmet pas simplement des documents passifs, qu'un programme doit interpréter et afficher après réception, mais des programmes, des mini-applications que le fureteur exécute sur la machine du destinataire. Les possibilités sont presque infinies, mais certains problèmes de taille, en particulier de sécurité informatique, restent à régler complètement. L'archétype de ce nouveau domaine est le langage Java de Sun Microsystems, conçu spécialement pour améliorer la sécurité, et le fureteur de démonstration HotJava.
Le second est Adobe Acrobat, et le format de fichier correspondant PDF. Fondé sur le langage de description de page Postscript, ce format et les logiciels y associés permettent la transmission de documents hyper-textes en forme typographique définie et complète. La popularité croissante semble due à deux faits : d'une part Adobe distribue gratuitement les visualisateurs nécessaires à l'emploi de ce format attrayant, et d'autre part beaucoup de producteurs de document (des publicitaires par ex.) apprécient le contrôle typographique parfait qu'il permet, même si c'est au détriment de l'utilité ultérieure de leurs documents.
Jusqu'à maintenant les capacités audio des ordinateurs sont restées assez limitées, se bornant pratiquement à la reproduction plus ou moins bonnes de sons " en boîte ". Les applications étaient plutôt du domaine ludique, mais ceci est en train de changer avec l'apparition de capacités peu onéreuses de synthèse et même de reconnaissance de parole. Ici encore le problème de l'omniprésence de l'anglais apparaît, mais sous un jour un peu différent : on n'a pas affaire à du texte écrit, et donc non plus au sempiternel problème des jeux de caractères codés, mais le développement en milieu anglophone des matériels et logiciels qui risquent de devenir standards (au moins sur l'Internet) ne garantit en rien la reproduction et la reconnaissance correctes de langues autres que l'anglais.
Bien sûr, il n'existe pas que de la technologie d'origine anglo-saxonne en ce domaine. En France, l'équipe Dialogue en Lorraine (Loria, partenariat CRIN-INRIA) et l'Institut de la communication parlée à Grenoble (partenariat INPG-Grenoble III) entre autres s'occupent de ces problèmes. Les deux ont des relations industrielles et européennes importantes, assurant à leurs projets des retombées sérieuses, mais l'histoire récente nous montre que même dans le cas de technologies issues d'ailleurs que du monde anglo-saxon, (p. ex. le W3, issu du CERN), la domination de l'anglais se fait sentir. La vigilance s'impose pour s'assurer que les futures interfaces audio de l'Internet sauront traiter convenablement le français et les autres langues. Il est peut-être pertinent de noter qu'un intérêt porté à la reconnaissance et à la synthèse de plusieurs langues peut aussi favoriser l'émergence de technologies sachant bien s'accommoder de plusieurs accents dans une même langue, et par conséquent de meilleurs produits.
Il est évident que les interfaces en langue naturelle sont appelées à jouer un rôle de plus en plus important, à mesure que de plus en plus d'utilisateurs, de moins en moins spécialistes du domaine documentaire, voudront trouver de l'information sur l'Internet et les futures inforoutes. De telles interfaces offrent plusieurs avantages : le premier, évident, est qu'elles permettent une recherche efficace par des personnes non spécialistes du domaine de la recherche documentaire.
En seconde analyse, il apparaît que des logiciels capables de " comprendre " une question en langue naturelle seront aussi à même d'interpréter et de " comprendre " les documents du fond auxquels ils accèdent, ouvrant ainsi la porte à des recherches beaucoup plus efficaces et fructueuses. Ainsi, lors d'une recherche sur " la corruption dans le milieu politique ", un logiciel intelligent pourra trouver pertinent un document mentionnant que " le maire de X a touché un pot-de-vin ", ce qui est tout à fait hors de portée d'une recherche par mots-clés.
Dès lors, une extension évidente est le multilinguisme. Le même logiciel intelligent ne pourrait-il pas trouver un document contenant " the mayor of X pocketed a backhander " ? La présence sur l'Internet de documents en multiples langues, et même parfois multilingues, rend cette possibilité extrêmement attrayante.
Le projet SPIRIT de la société française T.Gid s'attaque à ce problème, allant même jusqu'au multilinguisme. Nous ne pouvons qu'approuver cette démarche, mais devons toutefois mentionner deux aspects qui nous semblent limitatifs : le serveur SPIRIT-W3 sera accessible de l'Internet, permettant au monde d'interroger sa base de données, mais il ne semble pas que ses capacités d'analyse linguistique puissent être utilisées pour fouiller l'Internet. C'est donc une voie à sens unique. D'autre part le multilinguisme est fort limité au départ, ce qui se comprend aisément, mais il appert que le manque d'attention dès l'origine aux problèmes de jeux de caractères pourrait nuire considérablement à l'extension future à d'autres langues ; il y aura problème dès que l'ISO Latin-1 ne suffira plus. L'Internet est farci d'exemples de logiciels et de protocoles par ailleurs très bons qui se butent à ce problème en voulant s'étendre dans le monde.