Você está na página 1de 50

Disciplina

TECNOLOGIAS DA INFORMAÇÃO
Unidade II – Representação da
Informação em Computadores

Prof. Carlos Henrique Marcondes


marcon@vm.uff.br

2º. Semestre de 2016


Representação de conceitos
Carro
Representação e magia

Pinturas pré-históricas, grutas de


Altamira (Espanha) e Lascaux (França)
Representação de conceitos no
computador
Realidade Representação
computacional

Carro
Representação simbólica
Objeto, (codificação, linguagem)
Conceito
(representação do
objeto no
pensamento)
Representação
por imagens
001100011100011010100010110001011101001011001010011111010100100010100001110001001010001000101
001100011100011010100010110001011101001011001010011111010100100010100001110001001010001000101
:: Um byte numa cadeia de bits pode representar qualquer coisa

caracter
inteiro “U” som
“21”

cadeia de bits: 01011100000000101010000000001000001111101001

número real Um mapa de bit


“1.3125” “não, não, não,sim
imagem
não, sim, não, sim”

copiado de Jeff Rothenberg


Scientific American – Jan. 1995
Representação de informações
no computador - FORMATOS

• Representação por IMAGENS – formatos


“mapa-de-bits” (bitmap): .BMP, .PCX,
.GIF, .TIFF, .JPEG
• Representação simbólica – uso da
linguagem, caracteres são
CODIFICADOS – códigos ASCII e
EBCDIC
– Cada caracter é representado por um código
de 8 bits
FORMATOS para representação
de informações
• Um FORMATO é um específico arranjo de
informações, formando um arquivo digital
• Um FORMATO contém informações voltadas para
pessoas (conteúdo) e informações voltadas para os
programas que processam estes conteúdos
• Ex: formato WINWORD (.DOC)
– Conteúdo – - o caráter “A”
– Informações para o programa - tipo de fonte
- cor
- normal, negrito ou itálico
- etc, etc, etc
Formatos de arquivo
• Formato fechado
– sua especificação não está disponível publicamente,
ou até se encontra disponível mas seu reúso é
limitado (ex: por copyright).

• Formato aberto
– uma especificação publicada para armazenar
dados digitais e livre de limitações legais no uso
• é mantida geralmente por uma organização de padrões
não-proprietária
– Ex: HTML, XML, JPEG, GIF, ODF, PDF, TIFF
Formatos de arquivo
• Formato proprietário
– exclusivo de um fabricante
– Geralmente é um formato fechado
– Ex: DOC (fechado), XLS (fechado), PDF e TIFF
(abertos)
• Formato não proprietário
– Não é exclusivo de um fabricante
– São sempre abertos
– Geralmente representantes de várias instâncias são
envolvidos na criação da especificação do formato
– Em termos de garantia de disponibilidade por longo
prazo, especificações produzidas por órgãos
normatizadores são as mais seguras;
11
– Ex: ODF, HTML, XML
Formatos de
arquivos
Nome do contato

Empresa

#NJoão da Silva Email


#EPetrobras
#Mjoao@petrobras.com.br
## Separador de registros
#NMaria da Conceição
#EBanco do Brasil #N, #E, #M e ## são informações para
##maria@bb.com.br programas;
##
João da Silva, Petrobras e
joao@petrobras.com.br são informações
para pessoas
Tela
(como o
arquivo é
visto pelo
usuário)

“hardware”
“Software”- Programa
(interpreta um padrão
– formato - específico
de bits)

Arquivo
10011000100111101101101000010010011100101010001001010001
(string de bits)
Documentos digitais
• Definição (provisória)
• : documentos que só adquirem
legibilidade ou só podem ter seu
conteúdo acessado intermediados pela
tecnologia de informação
Legibilidade

“Software”

“Hardware”
Evolução
tecnológica
Formato

Mídia
Preservação do suporte (mídia)
011000111000110101000101100010111010010110010100111110101010
Representação de conteúdos no computador
Representação simbólica – uso da
LINGUAGEM, caracteres são codificados –
códigos ASCII e EBCDIC, formatos textuais:
.DOC, .HTML, .XML, .PDF, .TXT, etc.

Representação por IMAGENS


- formatos “mapa-de-bits” (bitmap)
imagens representadas ponto a ponto:
.BMP, .PCX, .GIF,.TIF, .JPEG
- formatos “vetoriais” (raster): imagens
representadas por vetores ou fórmulas
matemáticas

- Outras formas de representação: som,


imagem em movimento, animações, etc.
- Formatos .MP3, .MP4, .WAV, .ZIP, Flash,
Shockwave
011000111000110101000101100010111010010110010100111110101010
Possibilidades de codificação de
informações em função do conjunto de bits
– código ASCII

- 1 bit : 0 - 21=2 - 3 bits: 000 - 23=8


1 100
010
- 2 bits: 00 - 22=4
001
10 110
01 101
11 011
111
8 bits=1 byte=256 combinações

Códico ASCII ->


FORMATOS TEXTUAIS

Código ASCII
Cada caracter é representado
por um código de 8 bits,
ver:http://www.ascii-code.com/
011000111000110101000101100010111010010110010100111110101010

MEMÓRIA

01100001
Do teclado para a memória ...
011000111000110101000101100010111010010110010100111110101010
Caracteres codificados permitem a busca por
um padrão de bits “0s” e “1s”

… a palavra “BRASIL”

01000010-01010010-01000001-01010011-01001001-01001100

B R A S I L
Representação de caracteres

Unicode
Representação por Imagens

MAPA-DE-BITS

VETORIAIS

y = ax + b

y = ax2 + bx + c
Arquivos em formato vetorial
• Assim, de modo simplificado, o objeto abaixo
(imagem vetorial) poderia ser definido da
seguinte maneira:
– Tipo de Curva = Circunferência
– Raio = 1 cm
– Preenchimento = amarelo
– Contorno = azul
Arquivos em formato vetorial
• Ainda, pensando nessa linha, se
decidíssemos aumentar o raio para 3 cm,
apesar de gastarmos mais espaço de tela,
não gastaríamos mais espaço no disco.
Afinal, o círculo (os pixels que o
compõem) não será gravado no disco.
Apenas os atributos para gerá-lo!:
– Tipo de Curva = Circunferência
– Raio = 3 cm
– Preenchimento = amarelo
– Contorno = azul
Arquivos em formato “mapa de bits”

• Mapas de bits - Bitmaps:


– utilizam um método de armazenagem bem
diferente do sistema vetorial
• Para entender
o princípio básico
dos arquivos mapas
de bits podemos fazer
uma comparação
com os mosaicos
Arquivos em formato “mapa de
bits”:

Correspondência Arquivo “mapa-de-
bits”, imagem na tela do computador
Imagem na Tela 10 X 20

Arquivo “mapa-de-bits”
0000000000 0000000000 0000000000 0111111110 0100000010 0100000000
0100000000 0100000000 0100000000 0100000000 0100000000 0100000000
0100000000 0100000000 0100000000 0100000000 0000000000 0000000000
0000000000 0000000000
Não confunda!
• A imagem de uma letra com a
representação dessa letra através
de um formato de codificação

30
Arquivos em formato “mapa de
bits”: como reconhecer um
caracter?

A a Aa A a a

a A ?????
Processo de digitalização

A digitalização é o processo de transformar


documentos em papel em arquivos digitais
de imagem tipo ¨mapa-de-bits¨

Nos arquivos de imagem tipo “mapa-de-bits”


cada ponto de um documento, cada ponto de
cada caracter de um documento é
desenhado e não representado por um
código como no conjunto de caracteres
ASCII
Dispositivos de captura
ESCANERS

CAMERAS
DIGITAIS

Ver: http://computer.howstuffworks.com/scanner.htm
Processo de digitalização
Imagens são formadas por pontos

Profundidade de Cor ou Profundidade de Bit


Define o número máximo de tonalidades de cinza e/ou de cores num arquivo de imagem digital;
Isso é dado pelo número de bits usados para descrever a cor de cada pixel.

Quanto maior a profundidade de cor, mais cores ou escalas de cinza podem ser representadas.

Quantos bits eu

?
preciso para
descrever essa cor

E essa tonalidade
de cinza ?
Processo de digitalização –
Profundidade de cor ou de bit
Imagens são formadas por pontos

Pixel - (Picture Element) É o menor ponto de luz cuja cor e luminosidade


podem ser controladas na tela. As imagens são formadas com a
combinação de grande número de pixels. O termo é usado para referir-se
a resolução de uma placa de vídeo ou monitor (ex: 800 x 600 pixels).

Pixels são representados por 1 ou mais “bits”

Bitonal ou preto-e-branco:
1 bit por pixel:
pontos pretos: “1”
pontos brancos: “0”
Monocromático: preto-e-branco com diversas intensidades – 4 bits, 6
bits, 8 bits, por pixel)
Colorido
8 bits por pixel: 256 cores
12 bits por pixel : 4096 cores
24 bits por pixel : 16.800.000 cores (“true color”)
Processo de digitalização
RESOLUÇÃO - aplicação da digitalização em
DOCUMENTOS

Arquivos de imagens ( de documentos) com


baixa resolução são POUCO LEGÍVEIS
(abaixo de 50 dpi)
Acima de 800 dpi a vista humana NÃO
DISTINGUE MAIS MELHORAS DE
LEGIBILIDADE
Quanto maior a resolução de uma imagem,
maior o tamanho do arquivo que vai
armazena-la
Resolução razoável para documentos: 300 dbi
Processo de digitalização -
RESOLUÇÃO

• Relação entre número de


pontos de uma imagem
(Pixels) / Área
• Unidade: “dpi” (“dots per
inch”) pontos por
polegada quadrada
• A resolução é uma
medida da
LEGIBILIDADE de uma
imagem
Processo de digitalização -
RESOLUÇÃO

• Corresponde à
capacidade de
detalhamento de uma
imagem, quanto maior a
resolução da imagem,
maior será a sua
capacidade de exibir
detalhes.
RESOLUÇÃO
Resolução total

256 x 256 pixels 128 x 128 pixels 64 x 64 pixels


65536 pixels 16384 pixels 4096 pixels

(Falcão, 2003)
NORMAS, PADRÕES PLANEJAMENTO DA
OBJETO DIGITAL DIGITALIZAÇÃO COLEÇÃO DIGITAL SCANNERS
PROTOCOLOS, FORMATOS DIGITALIZAÇÃO

CAPTURA DE IMAGENS - especificações


RESOLUÇÃO | PROFUNDIDADE DE COR | COMPRESSÃO

Imagens em preto e Imagens em escala de Imagens de cor são 8 bits (256 e 24 bits (16 milhões de
branco exigem só 1-bit cinza precisam de 8 bits exibidas usando 4 cores) cores) chamada True Color
para indicar qual pixels para exibir 256 bits (16 cores), ou Cor Verdadeira.
são brancos e quais graduações diferentes de
são pretos. cinza.
PLANEJAMENTO DA
OBJETO DIGITAL FORMATOS DE ARQUIVO DIGITALIZAÇÃO COLEÇÃO DIGITAL SCANNERS
DIGITALIZAÇÃO

OBJETO DIGITAL MATRIZES E DERIVADAS DERIVADAS


Para acesso internet
Carta de Pero Vaz de Caminha JPEG, JPEG 2000
ícone
MATRIZES
ORIGINAL GIF
Para acesso internet

MATRIZ DIGITAL PDF


TIFF
Digitalização

OCR/texto
Backups

MATRIZ DIGITAL COM


PROCESSAMENTO DE
IMAGEM

Para impressão
Armazenamento
seguro

TIFF
PLANEJAMENTO DA
OBJETO DIGITAL FORMATOS DE ARQUIVO DIGITALIZAÇÃO COLEÇÃO DIGITAL SCANNERS
DIGITALIZAÇÃO

CAPTURA DE IMAGENS NIVEIS DE DIGITALIZAÇÃO

NIVEIS DE FORMATO DE ARQUIVO USADA PARA OBSERVAÇÔES


DIGITALIZAÇÃO
Formato: TIFF Armazenamento de Não deve ser alterada,
Compressão: sem ou sem perdas longo prazo e redimensionada nem
Resolução de captura: 600 ppi, RGB (300 ppi
para dimensões maiores que 8,5” x 11”)
impressão comprimida
MATRIZ DIGITAL
Cor: 8 bits escala de cinza ou 24 bits

Formato: JPEG Para exibição Derivada da Matriz Digital, é


Compressão: 10:1 para escala de cinza; e 20:1 alterada para permitir
IMAGEM (derivada) para cores
transmissão e apresentação
DE ACESSO Resolução espacial: 600, 1500, 3000 pixels ao
longo na Web e outros usos
Cor: 8 bits escala de cinza ou 24 bits

Formato: GIF Para exibição em Derivada da imagem de


Compressão: nativa do GIF tela acesso, tamanho reduzido,
ICONE (derivada) Resolução espacial: 100-200 ao longo ou 72 ppi
Cor: 4 bits escala de cinza ou 8 bits
nas não alterada

Formato: PDF ou TIFF Compressão sem Para impressão


perdas para o TIFF (LZW para materiais B&W)
IMPRESSÃO Cor: 8 bits escala de cinza ou 24 bits
(derivada)
IMAGEM DE Formato: JPEG Ilustrar detalhe,
Compressão: 10:1 para escala de cinza; e 20:1
SERVIÇO para cores restauração, etc.
Resolução espacial: 600, 1500, 3000 pixels ao
longo
Cor: 8 bits escala de cinza ou 24 bits
RECOMENDAÇÕES PARA
DIGITALIZAÇÃO DE DOCUMENTOS
ARQUIVÍSTICOS PERMANENTES
CONARQ : abril 2010
http://www.conarq.arquivonacional.gov.br/im
ages/publicacoes_textos/Recomendacoes
_digitalizacao_completa.pdf
Processo de digitalização
• Como não existe um código único para
cada caracter, as imagens dos caracteres
são desenhadas!

A a A a A a a A a,
a

• nos arquivos “mapa-de-bits” não é


possível fazer busca por conteúdo
Processo de digitalização
• Os sistemas de gerenciamento de imagens
eletrônicas de documentos – GED - associam a cada
arquivo de imagem, um registro de uma base de
dados com conteúdos textuais codificados, para fins
de busca.

• Estes sistemas são a combinação das tecnologias de


bancos de dados com a digitalização de documentos
através do uso de escaners Imagem
digitalizada de
um documento
Tipo | Num. | Setor | Data | Assunto |

Registro de um banco de
dados: pontos de acesso para
recuperação
Formatos Textuais X Mapa-de-bits
• Formatos Textuais – codificação do carácter
(8 bits - ASCII, 16 bits - UNICODE) UNICODE

• Formatos Mapa-de-bits – codificação do


pixel
– 1 bit (preto e branco)
– 4 bits (16 cores ou 16 tons
de cinza)
- 24 bits por pixel : 16.800.000
cores, “true color”)

Você também pode gostar