|
Los URL son direcciones de recurso para el Web, así como para casi cualquier cosa en Internet, definidas por
RFC 1738. Dicha definición presenta algunos problemas en un contexto internacional.
El RFC define inicialmente un URL como una secuencia de caracteres, pero luego lo presenta como una secuencia de bits que se envían por la red, suponiendo así una relación entre estas secuencias (codificación de los caracteres). Sin embargo, el RFC se refiere sólo al conjunto de caracteres ASCII, ¡ignorando así la mitad de los posibles valores de bits y la mayoría de los caracteres usados por los idiomas escritos del mundo!
Algunos podrían sostener que un URL - tal como un número de teléfono - es sólo una referencia ciega sin significado. Pero sólo basta con ver un URL como éste:
<http://www.alis.com/alliances/ alliances.fr.html>
Cont.
|
para darse cuenta de que generalmente poseen un gran valor mnemotécnico. Sin embargo, hoy en día este valor sólo puede ser utilizado por quienes puedan contentarse con ASCII. ¿Cuántos no hemos tratado alguna vez de averiguar el servidor de red de una compañía al escribir http://www.<compañía>.com? ¡Inténtelo con una compañía china!
Supuestamente, existe una solución: un bit que no pertenece a ASCII (valor >127) se puede representar utilizando una notación ASCII tal como %E9 (el denominado proceso de codificación URL) que reemplaza un bit por el valor 233 (E9 en hexadecimal). Sin embargo, no existe un carácter - codificado o no - asociado con este bit y la mayoría de los caracteres del mundo no se pueden codificar de esta manera.
La internacionalización del URL se discute actualmente dentro del IEFT y en otras instancias, pero aún no se ha tomado ninguna decisión definitiva. Entretanto, la única opción parece ser seguir utilizando ASCCI.
|