|
Das HTTP dient hauptsächlich zur Verwaltung von Kommunikationen
zwischen dem Kunden und dem Server, um dem ersteren die
Anforderung von Dokumenten und dem letzteren deren Beantwortung
durch die Übermittlung der angeforderten Dokumente sowie ausreichender
Meta-Informationen zu ermöglichen, so daß der Kunde diese
richtig interpretieren kann. Es ist außerdem wünschenswert, daß diese
Anforderungen auch Meta-Informationen enthalten, da die Interpretation
dieser Informationen, dem Server die effektivere Erfüllung der
Anforderungen ermöglicht.
Obwohl das HTTP schon seit 1990 als Grundprotokoll für das WWW im
Gebrauch ist, gibt es bis heute (Juni 1996) noch keine offizielle
HTTP-Norm. Die Version 1.0 des Protokolls wird zwar in RFC 1945 beschrieben,
ist jedoch keine Norm, sondern nur ein Informationsdokument. Die
Diskussionen zur Freigabe der als Norm gestalteten Version 1.1 sind
jedoch glücklicherweise nahezu abgeschlossen.
Der charset Parameter
Zur Übermittlung von Meta-Informationen zwischen dem Kunden und dem
Server verwendet das HTTP sowohl für Anforderungen als auch für
Antworten MIME-Vorsätze. Die zweifelsohne wichtigste Zeile des
Vorsatzes von Antworten auf Anforderungen wird als
Content-Type (Inhaltstyp) bezeichnet; sie gibt dem
Kunden Aufschluß über die Art der vom Server übermittelten Daten,
z.B. HTML-Text, Klartext, GIF-Image, AU Sound, etc.
Die richtige Interpretation von Textdaten bedarf jedoch der
Kenntnis der zusätzlich zu den grundsätzlichen Informationen
verwendeten Zeichencodes. Dazu verfügt der MIME-Vorsatz über den
charset Parameter (charset steht für Character
Set d.h. Zeichensatz); dieser Parameter wird dem Typ in der
Content-Type (Inhaltstyp) Zeile angehängt.
Das Web macht jedoch leider selten Gebrauch von diesem Parameter. Dies
liegt daran, daß das Web anfänglich nur die ISO-Norm 8859-1 verwendet
hat und dieser Zeichensatz zum impliziten Code wurde; in der RFC 1945 wurde
Forts.
|
er sogar als solcher bezeichnet. Die europäischen und amerikanischen
Entwickler von HTTP Serversystemen fanden die ISO 8859-1 ausreichend
und haben ihn deshalb erst gar nicht implementiert. Trotz der RFC 1945 ist die ISO
8859-1 jedoch heute kein impliziter Code mehr; und da kein neuer Code
festgelegt wurde, gibt es heute keinen echten Code mehr, selbst wenn
viele im Gebrauch sind.
Wollen wir hoffen, daß die neue HTTP-Norm 1.1 diesen de facto
Zustand erkennt und den charset Parameter zur allgemeinen
Pflicht macht.
Sprachenaushandlung
Die Sprachenaushandlung ist einer der Aspekte der inhaltsbezogenen
(Content-Type) Aushandlung - dieses HTTP-Konzept ist schon seit langem
im Gespräch. Es basiert auf der Idee, daß ein Dokument in vielen
Sprachvarianten, -formaten bzw. -codes existieren kann. Zur Angabe
seiner Fähigkeiten und/oder Präferenzen stehen dem Kunden besondere
Vorsatzzeilen zur Verfügung, die vom Server zur Auswahl der von allen
Varianten am besten geeigneten Version verwendet werden.
Diese Idee wurde zwar mit der vorliegenden Version 1.0 (RFC 1945) aufgegeben,
wird aber in der neuen HTTP-Norm 1.1 wieder aufgegriffen. Aber wie so
oft beim W3 (WWW), können die Normen mal wieder mit der Realität nicht
Schritt halten: es gibt bereits zahlreiche Browser und Server, die
allgemeine inhaltsbezogene (Content-Type) Aushandlungen, insbesondere
aber Sprachenaushandlungen, ermöglichen.
Auf dem Weg durch mehrsprachige Sites bietet die
Sprachenaushandlung viele Vorteile. Der Kunde erhält die gewünschte
Version direkt. Dadurch wird Zeitverschwendung vermieden. Er braucht
sich nicht mehr die vielen Seiten von oft schlecht zu begreifenden
oder gar unverständlichen Informationen zu kämpfen, um die gewünschte
Sprache für die Hyperlink-Verbindung zu finden.
|