Você está na página 1de 16

Representao de Caracteres

Aula 9

Roteiro

Nmero Decimal (BCD);


EBCDIC;
ASCII;
Unicode

Representao de Caracteres e Smbolos


A representao de caracteres e smbolos em
computador feita atribuindo-se a cada
caractere ou smbolo um cdigo binrio. Desta
forma, so construdas tabelas (padres) em que
cada cdigo binrio representa, para o
computador, um determinado caractere ou
smbolo.

BCD
BCD, Decimal Codificado em Binrio, que foi
criado de forma mais semelhante com o sistema
decimal, pois ele combina certas caractersticas dos
sistemas binrio e decimal. Ele representa dgitos
decimais de 0 at 9 com cdigos binrios de 4
dgitos, bits, para nmeros maiores combina-se 2,
3, ..., n sequencias de 4 bits, exemplos.
DECIMAL / BCD
0 0000
6 0110

EBCDIC
Extended Binary Coded Decimal Interchange Code (EBCDIC)
uma codificao de caracteres 8-bit que descende diretamente do
cdigo BCD com 6-bit e foi criado pela IBM como um padro no
incio dos anos 1960 e usado no ibm 360.
Como consequncia daquela descendncia direta o cdigo EBCDIC
podia ser truncado para 6 bit dando origem ao cdigo BCD com 6
bit.
Representa uma primeira tentativa de normalizao em paralelo
com a normalizao ASCII utilizada pelo governo dos Estados
Unidos no final dos anos 1960.
No EBCDIC so utilizados pela primeira vez 8 bit - 1 byte - para
codificar um estado existindo assim a possibilidade de codificar
256 estados diferentes.

ASCII
ASCII (acrnimo para American Standard Code for Information Interchange,
que em portugus significa "Cdigo Padro Americano para o Intercmbio de
Informao", mas comumente utilizamos a sigla em ingls para referencia direta)
uma codificao de caracteres de sete bits baseada no alfabeto ingls. Cada
sequencia de cdigos na tabela ASCII corresponde a um caractere, comumente
representados pelos 8 bits (equivalente a um byte), sendo que o oitavo bit (da
direita para a esquerda) serve como um bit de paridade, utilizado para deteco
de erro. Os cdigos ASCII representam texto em computadores, equipamentos de
comunicao, entre outros dispositivos que trabalham com texto. Desenvolvida a
partir de 1960, grande parte das codificaes de caracteres modernas a herdaram
como base.
A codificao define 128 caracteres, preenchendo completamente os sete bits
disponveis em 27=128 sequncias possveis. Desses, 33 no so imprimveis,
como caracteres de controle atualmente no utilizveis para edio de texto,
porm amplamente utilizados em dispositivos de comunicao, que afetam o
processamento do texto.

Representao de Caracteres
Esta tabela define os caracteres de 0 a 127
Os caracteres de 128 a 255 so extras
Cada pas implementou a sua extenso, para os
seus acentos, chamada codepage
Isso criou muita confuso e, ento, criaram os
padres mundiais UNICODE
Os tipos comuns so UTF-8, UTF-16 e UTF-32

Representao de Caracteres
UTF: Unicode Transformation Format
UTF-8: 256 caracteres
UTF-16: 65536 caracteres
UTF-32: 4 bilhes de caracteres

UTF-8 compatvel com ASCII


(Apenas os 128 primeiros caracteres do ASCII)

UTF-16 compatvel com UTF-8


UTF-32 compatvel com UTF-16

Unicode
Unicode um padro que permite aos computadores
representar e manipular, de forma consistente, texto de
qualquer sistema de escrita existente. Publicado no livro
The Unicode Standard1 ,2 o padro consiste de pouco mais
de 107 mil caracteres3 , um conjunto de diagramas de
cdigos para referncia visual, uma metodologia para
codificao e um conjunto de codificaes padres de
caracteres, uma enumerao de propriedades de caracteres
como caixa alta e caixa baixa, um conjunto de arquivos de
computador com dados de referncia, alm de regras para
normalizao, decomposio, ordenao alfabtica e
renderizao.

Unicode
um alfabeto em 16 bits compatvel com o
ASCII e com o conjunto de caracteres Latin-1.
Como a codificao bsica do unicode e de 16
bits, ele possui capacidade de codificar a maioria
dos caracteres usados em cada linga no mundo,
tambm define uma extenso que permite a
codificao de um milho de caracteres
adicionais.
O espao de codifocao Unicode de 5 partes;

Você também pode gostar