|
URLs sind Adressen für Web-Ressourcen sowie für fast alle anderen Einrichtungen am Internet. Sie werden in der RFC 1738 definiert. Allerdings bringt diese Definition im internationalen Kontext einige Probleme mit sich.
Die URL wurde in der RFC zunächst als eine Zeichenfolge, später aber als eine Bytefolge definiert, die über das Netz geschickt wird. Dadurch wurde eine Beziehung zwischen diesen beiden Folgen (Zeichencodierung) angedeutet. Da sich der RFC jedoch nur auf den ASCII-Zeichensatz bezieht, wird die Hälfte aller möglichen Bytewerte sowie die Mehrzahl der zur Darstellung der Schriftsprachen der Welt verwendeten Zeichen übersehen!
Manche Leute werden behaupten, daß eine URL, genau wie eine Telefonnummer, lediglich eine bedeutungslose Leeradresse ist. Wenn Sie die nachfolgende URL jedoch näher betrachten, wird Ihnen sicher auffallen, daß diese auch einen mnemonischen Wert hat:
<http://www.alis.com/alliances/ alliances.fr.html>
Forts.
|
Dieser Wert ist jedoch zur Zeit nur für diejenigen von Nutzen, die sich mit dem ASCII-Code zufriedengeben. Wer hat nicht schon versucht den Web-Server einer Firma durch Eingeben von http://www.<Firma>.com aufzuspüren? Versuchen Sie dies einmal mit einer chinesischen Firma!
Es soll angeblich einen Ausweg geben: ein Nicht-ASCII-Byte (Wert >127) kann durch eine ASCII-Schreibweise wie %E9 (dem sogenannten URL-Codierungsverfahren) dargestellt werden, die einen Byte durch den Wert 233 (E9 im Hexadezimalsystem) ersetzt. Es gibt jedoch weder URL-kodierte noch andere Zeichen, die diesem Byte zugeordnet sind. Außerdem können die meisten Zeichen, aus denen sich die Weltsprachen zusammensetzen, auf diese Art und Weise nicht kodiert werden.
Obwohl die Internationalisierung von URL derzeit sowohl von der IETF als auch von anderen Organisationen diskutiert wird ist noch keine Entscheidung getroffen. Einstweilen scheint uns nichts anderes übrig zu bleiben, als den ASCII-Code zu verwenden.
|