Escolar Documentos
Profissional Documentos
Cultura Documentos
TECNOLOGIAS DA INFORMAÇÃO
Unidade II – Representação da
Informação em Computadores
Carro
Representação simbólica
Objeto, (codificação, linguagem)
Conceito
(representação do
objeto no
pensamento)
Representação
por imagens
001100011100011010100010110001011101001011001010011111010100100010100001110001001010001000101
001100011100011010100010110001011101001011001010011111010100100010100001110001001010001000101
:: Um byte numa cadeia de bits pode representar qualquer coisa
caracter
inteiro “U” som
“21”
• Formato aberto
– uma especificação publicada para armazenar
dados digitais e livre de limitações legais no uso
• é mantida geralmente por uma organização de padrões
não-proprietária
– Ex: HTML, XML, JPEG, GIF, ODF, PDF, TIFF
Formatos de arquivo
• Formato proprietário
– exclusivo de um fabricante
– Geralmente é um formato fechado
– Ex: DOC (fechado), XLS (fechado), PDF e TIFF
(abertos)
• Formato não proprietário
– Não é exclusivo de um fabricante
– São sempre abertos
– Geralmente representantes de várias instâncias são
envolvidos na criação da especificação do formato
– Em termos de garantia de disponibilidade por longo
prazo, especificações produzidas por órgãos
normatizadores são as mais seguras;
11
– Ex: ODF, HTML, XML
Formatos de
arquivos
Nome do contato
Empresa
“hardware”
“Software”- Programa
(interpreta um padrão
– formato - específico
de bits)
Arquivo
10011000100111101101101000010010011100101010001001010001
(string de bits)
Documentos digitais
• Definição (provisória)
• : documentos que só adquirem
legibilidade ou só podem ter seu
conteúdo acessado intermediados pela
tecnologia de informação
Legibilidade
“Software”
“Hardware”
Evolução
tecnológica
Formato
Mídia
Preservação do suporte (mídia)
011000111000110101000101100010111010010110010100111110101010
Representação de conteúdos no computador
Representação simbólica – uso da
LINGUAGEM, caracteres são codificados –
códigos ASCII e EBCDIC, formatos textuais:
.DOC, .HTML, .XML, .PDF, .TXT, etc.
Código ASCII
Cada caracter é representado
por um código de 8 bits,
ver:http://www.ascii-code.com/
011000111000110101000101100010111010010110010100111110101010
MEMÓRIA
01100001
Do teclado para a memória ...
011000111000110101000101100010111010010110010100111110101010
Caracteres codificados permitem a busca por
um padrão de bits “0s” e “1s”
… a palavra “BRASIL”
01000010-01010010-01000001-01010011-01001001-01001100
B R A S I L
Representação de caracteres
Unicode
Representação por Imagens
MAPA-DE-BITS
VETORIAIS
y = ax + b
y = ax2 + bx + c
Arquivos em formato vetorial
• Assim, de modo simplificado, o objeto abaixo
(imagem vetorial) poderia ser definido da
seguinte maneira:
– Tipo de Curva = Circunferência
– Raio = 1 cm
– Preenchimento = amarelo
– Contorno = azul
Arquivos em formato vetorial
• Ainda, pensando nessa linha, se
decidíssemos aumentar o raio para 3 cm,
apesar de gastarmos mais espaço de tela,
não gastaríamos mais espaço no disco.
Afinal, o círculo (os pixels que o
compõem) não será gravado no disco.
Apenas os atributos para gerá-lo!:
– Tipo de Curva = Circunferência
– Raio = 3 cm
– Preenchimento = amarelo
– Contorno = azul
Arquivos em formato “mapa de bits”
Arquivo “mapa-de-bits”
0000000000 0000000000 0000000000 0111111110 0100000010 0100000000
0100000000 0100000000 0100000000 0100000000 0100000000 0100000000
0100000000 0100000000 0100000000 0100000000 0000000000 0000000000
0000000000 0000000000
Não confunda!
• A imagem de uma letra com a
representação dessa letra através
de um formato de codificação
30
Arquivos em formato “mapa de
bits”: como reconhecer um
caracter?
A a Aa A a a
a A ?????
Processo de digitalização
CAMERAS
DIGITAIS
Ver: http://computer.howstuffworks.com/scanner.htm
Processo de digitalização
Imagens são formadas por pontos
Quanto maior a profundidade de cor, mais cores ou escalas de cinza podem ser representadas.
Quantos bits eu
?
preciso para
descrever essa cor
E essa tonalidade
de cinza ?
Processo de digitalização –
Profundidade de cor ou de bit
Imagens são formadas por pontos
Bitonal ou preto-e-branco:
1 bit por pixel:
pontos pretos: “1”
pontos brancos: “0”
Monocromático: preto-e-branco com diversas intensidades – 4 bits, 6
bits, 8 bits, por pixel)
Colorido
8 bits por pixel: 256 cores
12 bits por pixel : 4096 cores
24 bits por pixel : 16.800.000 cores (“true color”)
Processo de digitalização
RESOLUÇÃO - aplicação da digitalização em
DOCUMENTOS
• Corresponde à
capacidade de
detalhamento de uma
imagem, quanto maior a
resolução da imagem,
maior será a sua
capacidade de exibir
detalhes.
RESOLUÇÃO
Resolução total
(Falcão, 2003)
NORMAS, PADRÕES PLANEJAMENTO DA
OBJETO DIGITAL DIGITALIZAÇÃO COLEÇÃO DIGITAL SCANNERS
PROTOCOLOS, FORMATOS DIGITALIZAÇÃO
Imagens em preto e Imagens em escala de Imagens de cor são 8 bits (256 e 24 bits (16 milhões de
branco exigem só 1-bit cinza precisam de 8 bits exibidas usando 4 cores) cores) chamada True Color
para indicar qual pixels para exibir 256 bits (16 cores), ou Cor Verdadeira.
são brancos e quais graduações diferentes de
são pretos. cinza.
PLANEJAMENTO DA
OBJETO DIGITAL FORMATOS DE ARQUIVO DIGITALIZAÇÃO COLEÇÃO DIGITAL SCANNERS
DIGITALIZAÇÃO
OCR/texto
Backups
Para impressão
Armazenamento
seguro
TIFF
PLANEJAMENTO DA
OBJETO DIGITAL FORMATOS DE ARQUIVO DIGITALIZAÇÃO COLEÇÃO DIGITAL SCANNERS
DIGITALIZAÇÃO
A a A a A a a A a,
a
Registro de um banco de
dados: pontos de acesso para
recuperação
Formatos Textuais X Mapa-de-bits
• Formatos Textuais – codificação do carácter
(8 bits - ASCII, 16 bits - UNICODE) UNICODE