Escolar Documentos
Profissional Documentos
Cultura Documentos
la Iñtërnâçiônàlizæçiøn -
parte I
Publicado por Juan Pablo el 25.Ene.2006 | Comentarios (23)
Introducción
Veamos algunas definiciones:
Binario Caracter
------------------
1001000 | H
1101111 | o
1101100 | l
1100001 | a
Viajando al pasado
TABLA US-ASCII
* | 0 1 2 3 4 5 6 7 8 9 A B C D E F
--------------------------------------------------------------
0 | NUL SOH STX ETX EOT ENQ ACK BEL BS TAB LF VT FF CR SO SI
1 | DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
2 | (1) ! " # $ % & ' ( ) * + , - . /
3 | 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4 | @ A B C D E F G H I J K L M N O
5 | P Q R S T U V W X Y Z [ \ ] ^ _
6 | ` a b c d e f g h i j k l m n o
7 | p q r s t u v w x y z { | } ~ DEL
Los creadores del ASCII decidieron utilizar 7 bits para almacenar sus
caracteres, 27 = 128; todo era perfecto, asumiendo que tú eras un
hablante inglés. Pero sobraba un bit para completar el byte, aquel bit se
utilizó como bit de paridad y así detectar errores de transmisión. A poco
andar muchos comenzaron a pensar que ese bit de paridad podría ser
usado para ampliar la gama de caracteres, si sacamos cuentas 28 =
128×2 = 256 caracteres distintos, ¡vaya vaya!. Y he aquí donde
comienzan los problemas (voy por un café).
Donde mi primo escribió una “A” yo leí una “A” (que corresponde
al ASCII 65 que es menor a 127), pero donde mi primo escribió una “Ω”
(letra griega mayúscula omega que corresponde al ASCII 217 mayor a
127) yo leí “Ù” (letra mayúscula latina U con acento grave). ¿Por qué
ocurrió esto?, porque mi primo usa en su computador un sistema de
codificación (familia del ASCII) llamado Windows 1253 y yo uso otro
llamado Windows 1252, ¿comienzas a percibir el problema?. Por
supuesto existen muchos otros sistemas de codificación, todos ellos
parientes de nuestro ASCII inicial. No lo olvides, los primeros 127
caracteres no han cambiado para ninguna familia de códigos ASCII, ellos
se mantienen intactos (sí, lo repito para que quede bien claro). Habían
tantos sistemas de codificación como idiomas, todo esto no sería un
gran problema en sistemas cerrados, donde no hay intercambio entre
idiomas, pero nadie pensó en el nacimiento de la Red de Redes
(Internet), donde sí se produce un gran intercambio de información, es
definitivo señores... ¡tenemos serios problemas!.
Caracter Unicode
A U+0041
a U+0061
ß U+00DF
H o l a
U+0048 U+006F U+006C U+0061
00 48 00 6F 00 6C 00 61
48 00 6F 00 6C 00 61 00