Escolar Documentos
Profissional Documentos
Cultura Documentos
So Paulo 2006
_____________________________
_____________________________
_____________________________
A Beatriz.
Agradecimentos
Resumo
Abstract
Sumrio
INTRODUO ....................................................................................................................................... 8
1. FUNDAMENTOS DA TEORIA DA INFORMAO..................................................................... 14
1.1. ASPECTOS BIOGRFICOS E DO PENSAMENTO DE SHANNON ............................................................ 15
1.2. ORIGEM DO CONCEITO DE ENTROPIA USADO POR SHANNON .......................................................... 25
1.3. FUNDAMENTOS DE TEORIA DA INFORMAO ................................................................................. 28
1.4. APLICAES E VERIFICAO EXPERIMENTAL ................................................................................ 36
2. ENTROPIA E TEORIA DA INFORMAO .................................................................................. 42
2.1. CONTEXTO HISTRICO.................................................................................................................... 43
2.1.1. O Rdio .................................................................................................................................. 43
2.1.2. A Mquina Enigma ................................................................................................................ 51
2.1.3. Alan Turing ............................................................................................................................ 54
2.1.4. Telecomunicaes e Geopoltica............................................................................................ 57
2.2. BOLTZMANN E A ENTROPIA NA TEORIA DO GS ............................................................................. 61
2.2.1. O Teorema-H.......................................................................................................................... 66
2.2.2. Crtica Fenomenologia ........................................................................................................ 69
2.2.3. A Transio para o Estado Mais Provvel.............................................................................. 70
2.3. SHANNON E A TEORIA MATEMTICA DA COMUNICAO ............................................................... 73
2.3.1. O Problema de Engenharia..................................................................................................... 75
2.3.2. Modelo de um Sistema de Comunicao ............................................................................... 76
2.3.3. Entropia de Fontes Discretas.................................................................................................. 78
2.3.4. Codificao Eficiente, Redundncia e Compresso ............................................................... 82
2.4. WIENER E A ENTROPIA NA CIBERNTICA ........................................................................................ 89
2.5. O DILOGO CONFLITUOSO ENTRE A TI E A FSICA ......................................................................... 94
3. NOVAS PERSPECTIVAS E CONCLUSES ................................................................................ 101
3.1. ANTECEDENTES CONCEITUAIS E OUTRAS CORRELAES ............................................................. 102
3.1.1. Antecedentes no Pensamento Econmico ............................................................................ 104
3.1.2. Relaes com a Psicologia ................................................................................................... 108
3.2. CONCLUSES ................................................................................................................................ 111
BIBLIOGRAFIA ................................................................................................................................... 114
ICONOGRAFIA .................................................................................................................................... 119
ANEXOS................................................................................................................................................. 120
1. METODOLOGIA DA VERIFICAO EXPERIMENTAL........................................................................... 121
2. ALGORITMO DE GERAO DE ARQUIVOS COM DISTRIBUIO EQUIPROVVEL DE SMBOLOS ........ 123
3. CONTEDO DO CD-ROM ................................................................................................................ 124
Ilustraes
Introduo
Num grau menor que a Mecnica Quntica, o que acontece com a Teoria
da Informao: inicialmente destinada a resolver problemas de engenharia de
telecomunicao, ganhou aceitao quase que imediata das comunidades
tecnolgica e acadmica onde militava Claude Shannon, seu autor mais
influente. Desde ento, parece ter se tornado um modismo cientfico, tendo
influenciado outras reas como a Fsica, Qumica, Biologia e Economia. A
situao se propagou de tal forma que provocou a interveno de Shannon,
poucos anos aps a publicao de sua obra que causou tamanho furor, a Teoria
Matemtica da Comunicao. Num editorial publicado no principal peridico
de engenharia eltrica da poca, Shannon declarou-se surpreso com as
repercusses da Teoria, que estaria gerando contribuies significativas em
outras reas, mas alertou para o uso inconseqente dos conceitos e descobertas
que poderiam advir do modismo (bandwagon). A advertncia, como se sabe,
no foi completamente eficaz, o que parece ter contribudo para o afastamento
de Shannon da Teoria. Obviamente, a interao da Teoria da Informao com
outros saberes no nem imprpria nem indesejvel. De fato, tal interao tem
produzido trabalhos interdisciplinares interessantes, inclusive no Brasil1.
Talvez a Teoria da Informao trilhe o caminho da popularizao entre o
pblico leigo: bastaria a adeso de um punhado de celebridades cientficas e
algum apoio dos veculos de comunicao (atravs do jornalismo cientfico e dos
peridicos de divulgao cientfica). Vemos sinais desta tendncia ao
encontrarmos artigos de cientistas da estatura de Stephen Hawking e Leonard
Susskind sobre a possibilidade de um buraco negro consumir informao. De
Isaac Epstein, (Universidade Metodista de So Paulo) e Norbert Fenzl (Universidade Federal do Par)
produziram obras interessantes que sero citadas no devido tempo.
10
2
3
11
12
13
14
Este fenmeno pode ser atribudo popularidade de algumas de suas obras, em especial a Teoria
Matemtica a Comunicao. De fato, a Teoria da Informao teve grande repercusso na mdia em
geral, chegando a ser considerada mais importante que a Teoria da Relatividade na edio de
Dezembro de 1953 da revista Fortune. Para detalhes, consultar: O. Aftab et alii, Information Theory
after Shannon's 1948 Work, pp. 6-7.
15
5
6
7
16
9
10
11
R. Price, A conversation with Claude Shannon: one mans approach to problem solving, p. 124.
Citao no original: My first getting at that was information theory, and I used cryptography as a way
of ligitimizing the work.
Ibid., pp. xxiii.
Ibid., pp. xxii-xxvi. Citao no original: Working that out was a lot of fun. I think I had more fun
doing that than anything else in my life, creatively speaking.
Esta opinio compartilhada por alguns especialistas. Para mais detalhes, consultar: M. Waldrop,
Reluctant Father of the Digital Age, pp. 66-7; consultar tambm: UCSD-TV, Claude Shannon, Father
of the Information Age, depoimento de Andrew Viterbi.
17
12
13
14
15
Para uma anlise contextualizada sobre a longa transio da computao analgica para a digital,
consultar: P. Edwards, The Closed World: computers and the politics of disclosure in Cold War
America, pp. 66-70.
A este respeito, existem relatos de que na dcada de 1950 a Teoria da Informao era levada to a srio
a ponto de ser quase que como uma religio no M.I.T e em outras universidades norte-americanas. Os
adeptos da TI julgavam estar vivenciando um momento de transformao no qual diversos problemas
cientficos seriam resolvidos pela nova abordagem oferecida pela Teoria da Informao. Para mais
detalhes, consultar J. Gleick, Caos, a Criao de Uma Nova Cincia, pp. 245-7.
A. Liversidge, in C. E. Shannon, Collected Papers, p. xxx.
Ibid., p. xxviii.
18
16
17
18
19
20
O pensamento de Boltzmann a este respeito ser abordado mais adiante neste captulo, e com maior
profundidade no captulo 2.
M. Waldrop, op. cit., p. 71.
A. Liversidge, in C. E. Shannon, Collected Papers, p. xxviii. Segundo o entrevistador, Marvin Minsky
teria dito que todos os teoremas importantes da Teoria da Informao j tinham sido provados.
Ibid., p.71. Citao no original: ...I just developed different interests.
O Grupo Profissional da Teoria da Informao (PGIT) foi criado pelo Instituto de Engenheiros de
Rdio (IRE) para estimular a difuso, o debate e o desenvolvimento da Teoria da Informao.
19
21
22
23
24
O termo bandwagon empregado no sentido de modismo (ou, para usar um termo mais antigo e
direto, de coqueluche), ou seja, uma atividade qual indivduos se lanam simplesmente porque
outros tambm o fazem. O editorial, publicado no IRE IT Newsletter de Dezembro de 1953, pedia que
os assuntos fossem abordados com mais rigor matemtico e preferencialmente em aplicaes de
engenharia, embora reconhecesse que a Teoria da Informao pudesse contribuir noutras reas de
conhecimento. O estilo do texto elegante e conciliatrio, mas deixa clara a posio de Shannon em
favor da limitao da abrangncia da teoria.
O. Aftab et alii, Information Theory after Shannon's 1948 Work, pp. 8-12.
P. Edwards, op. cit., p. 189.
Ibid., pp. 203-4.
20
25
Ibid., p. 191.
21
26
27
28
22
29
30
Segundo observa Verd, Chomsky discorda que as estatsticas das linguagens naturais podem ser
aproximadas to bem quanto se queira ao modelo das Cadeias de Markov. Para mais detalhes sobre
este comentrio, consultar: S. Verd, Fifty Years of Shannon Theory, in S. Verd & S. McLaughlin,
orgs., Information Theory 50 Years of Discovery, pp. 26-7. Para mais detalhes sobre a
argumentao e as propostas de Chomsky em questo, consultar: N. Chomsky, Three models for the
description of language, pp. 113-24.
P. Edwards, op. cit., p. 229. Miller sugere que Chomsky tenha se aproveitado da notoriedade da Teoria
da Informao para divulgar sua Gramtica Gerativa Transformacional. Para detalhes sobre esta
opinio no contexto da histria das Cincias Cognitivas, consultar: G. Miller, The cognitive
revolution: a historical perspective, p. 142.
23
31
24
estudar
as
propriedades
macroscpicas
da
matria
pelas
32
25
33
34
35
Como explica Penrose, para mapear posies e momenta necessrio um espao de fase de dimenso
6n, onde n o nmero de partculas. Para mais detalhes, consultar: R. Penrose, The road to reality: a
complete guide to the laws of the universe, pp. 217-21, 690-1.
Ibid., pp. 119-20.
L. Boltzmann, Lectures on Gas Theory, p. 36.
26
36
37
38
27
39
40
41
42
28
43
44
45
46
Ibid., p. 31. Citao no original: Frequently the messages have a meaning; that is they refer to or are
correlated according to some system with certain physical or conceptual entities. These semantic
aspects of communication are irrelevant to the engineering problem.
Extrair o significado de uma mensagem uma tarefa complexa que ainda no tem uma soluo
adequada: uma conseqncia disto o desempenho insatisfatrio dos softwares de traduo de textos,
e mesmo dos de correo ortogrfica.
A respeito das limitaes da linguagem escrita, consultar D. Olson, O mundo no papel: as implicaes
conceituais e cognitivas da leitura e da escrita, pp. 107-30.
C. Shannon, apud P. Edwards, op. cit., p. 204. Citao no original: if a person receives something
over a telephone, part of which is useful to him and part of which is not, and you want to call the useful
part the signal, that is hardly a mathematical problem.
29
47
48
30
49
50
C. Shannon, The Mathematical Theory of Communication, in C. Shannon & W. Weaver, op. cit.,pp.
33-5.
Ibid., pp. 50-1.
31
51
52
53
Ibid., p. 56.
Ibid.
Ibid., pp. 39-40.
32
54
55
56
Ibid., pp. 40-4. Shannon prope um processo de gerao de mensagens baseado em probabilidades de
ocorrncias de letras e de palavras que demonstra a transio de um texto sem sentido para um texto
com algum sentido.
Ibid., pp. 59-61.
Ibid., pp. 65-6.
33
57
58
59
34
35
60
61
62
63
Para mais detalhes sobre a influncia da Teoria da Informao nas tcnicas de deteco e correo de
erros, consultar: http://en.wikipedia.org/wiki/Error_correcting_code.
CRC o acrnimo de cyclic redundant code e designa uma classe de algoritmos que geralmente
empregam equaes polinomiais na deteco e correo de erros. Para mais detalhes, consultar:
http://en.wikipedia.org/wiki/CRC-32.
RAID acrnimo de redundant array of independent disks e designa uma classe de sistemas de
tolerncia a falhas, que usa um conjunto de discos operando de forma sincronizada, e que permite a
continuidade do funcionamento em caso de falha de um dos discos. Para mais detalhes, consultar:
http://en.wikipedia.org/wiki/Redundant_Array_of_Independent_Disks.
Na verdade, usa-se uma variante ou extenso do padro ASCII. Existem outras formas de codificao,
como o EBCDIC, ainda empregada em redes privadas que usam computadores ditos de grande porte
(mainframe). Os padres ASCII e EBCDIC codificam o alfabeto latino e sinais grficos comuns;
outras lnguas necessitam de conjuntos diferentes. A despeito das origens independentes e
36
64
37
WinZip
WinRAR
Variao
Mdia (%)
Contedo
Consequncias
Verificadas
Texto1.txt
1152
1152
602
1, 2
Texto2.txt
1152
1152
602
1, 2
Texto3.txt
2185
2185
623
1, 2
Texto4.txt
2708
2708
639
1, 2
Texto5.txt
492.641
492.553
485.997
1, 3
Texto6.txt
665.995
665.571
667.227
Texto7.txt
1.052.672
1.048.854
1.048.650
Texto8.txt
292.291
291.249
246.019
1, 3
1, 3
1, 4
65
38
66
67
68
39
69
70
71
importante notar que o algoritmo que gerou o arquivo Texto8.txt no garante que a freqncia de
todos os smbolos do repertrio equiprovvel em termos estritos: para obter-se tal condio, seria
necessrio garantir que a contagem de cada smbolo do repertrio resultasse num mesmo nmero.
Nestes termos, as freqncias dos smbolos gerados so muito prximas, mas no necessariamente
iguais. Um algoritmo que garante que a contagem de cada smbolo seja igual pode ser encontrada no
anexo 2.
Ibid., p.111. Shannon fornece como exemplo dados experimentais sobre a sensibilidade da audio
humana em relao s caractersticas das ondas sonoras: com relao fase, praticamente
insensvel; com relao amplitude e freqncia, aproximadamente logartmica.
A compactao com perdas aceitvel nestes tipos de contedo porque o objetivo final deles a
apreciao humana. A capacidade cognitiva dos seres humanos faz com que consigamos lidar com
informaes imprecisas e parciais (o que, como se sabe, um dos fundamentos da Psicologia Gestalt).
40
reproduzido), sem que haja perda significativa na percepo que ele provoca no
ouvinte quanto executado.
Em se tratando de imagens, outras tcnicas so possveis, como, por
exemplo: 1) reduzir a quantidade de cores, o que corresponde a uma reduo do
repertrio; 2) usar algoritmos de suavizao na imagem inteira ou em parte
dela, que aproximam a cor de cada ponto da imagem em funo das cores dos
pontos adjacentes, o que faz com que as freqncias de ocorrncia das cores
aumentem pela convergncia imposta pelo algoritmo, resultando numa entropia
menor, ao mesmo tempo em que reduz o repertrio pela eliminao de cores
no mais usadas.
41
42
2.1.1. O Rdio
Nos cinqenta anos anteriores ao aparecimento da rdio-difuso, surgiu e
se disseminou a transmisso pblica de mensagens por telgrafo. Uma rede
43
72
73
74
P. Hugill, Global Communications since 1844: Geopolitics and Technology, p. 2. Citao no original:
It was Britain that first constructed a global submarine telegraph system and Britain kept (just) one
step ahead of its competitors in all forms of civil and military telecommunications until 1945.
A inveno do rdio, entendido como o uso de ondas eletromagnticas a transmisso de informaes
sem a utilizao de cabos, disputada por Nikola Tesla, Guglielmo Marconi e Alexander Popov, entre
outros. Neste trabalho, que no tem como objetivo discutir a inveno do rdio, no nos
posicionaremos a favor de Marconi apesar de ele ser reconhecido como o inventor do rdio pelas obras
de referncia pesquisadas. Entretanto, ele ser amplamente citado devido a seus bem-sucedidos
esforos em estabelecer uma indstria a partir de suas invenes.
Ibid., p. 92. Citao no original: From de beginning Marconi understood the importance of radio for
international communication. Unlike other inventors, he therefore went to considerable lengths to
control patents, both his owns and those originated by others. His individual competitors were never
able to control as many patents as he did. In the geopolitical struggle for international radio three
techniques were developed to block Marconi from developing an effective monopoly: the international
agreement; manipulation of domestic politics; and patent pooling.
44
75
76
77
Ibid., p. 83.
S. Singh, The Code Book: the Science of Secrecy from Ancient Egypt to Quantum Cryptography, pp.
101-2.
A idia de que era necessrio haver mtua visibilidade entre transmissor e receptor no absurda. De
fato, grande parte das telecomunicaes necessita de visada, como o caso de algumas transmisses
por satlites, como nas transmisses de TV e de dados: a antena receptora precisa estar apontada para
o satlite para que a reflexo das ondas no disco parablico as faa convergir para um ponto focal,
ampliando a intensidade do sinal, grandemente diminuda pela longa distncia percorrida, uma vez
que tais satlites geoestacionrios orbitam a Terra a cerca de 40.000 km de altura. Para mais detalhes,
consultar: http://en.wikipedia.org/wiki/Satellite_television.
45
78
A histria da primeira transmisso transatlntica por Marconi foi questionada recentemente, embora
no haja dvida de seu sucesso numa segunda transmisso realizada um ano depois. Para mais
detalhes, consultar: http://en.wikipedia.org/wiki/Ionosphere .
46
79
47
80
81
82
Ibid., p. 204.
S. Singh, op.cit., p. 102.
Existem outras tcnicas de sigilo, como a Esteganografia, que busca esconder a existncia de uma
mensagem secreta dentro uma mensagem aparentemente inocente. Para mais detalhes sobre
terminologia e tcnicas bsicas de criptografia, consultar D. Kahn, The Codebreakers: the story of
secret writing, pp. xv-xvii.
48
85;
e outro em 1916 do
83
84
85
86
Ibid., p. 141.
D. Kahn, op. cit., p. 268.
Ibid., p. 269.
Ibid., p. 273.
49
87
Ibid., p. 277.
50
51
Ibid., p.138. Citao no original: The German military were equally unenthusiastic, because they were
oblivious to the damage caused by their insecure ciphers during the Great War.
52
90
91
92
93
53
94
95
96
97
98
54
99
100
101
102
103
55
104
105
Ibid., p. 250. Citao no original: In intellectual depth it was Shannon who was Alans opposite
number, and they found a good deal in common.
Ibid., p. 250. Citao no original: A ban of weight of evidence made something ten times as likely; a
binary digit or bit made something twice as definite.
56
106
107
108
109
Ibid., p. 250. Citao no original: Shannon wants to feed not just data to the Brain, but cultural
things! He wants to play music to it!.
S. Singh, op.cit.,p. 187.
Ibid., p. 189.
P. Hugill, op.cit., p. 2. Citao no original: If information is power, whoever rules the worlds
telecommunications system commands the world.
57
Fig. 6 C&W Great Circle Map, cortesia de Cable & Wireless Archive, Porthcurno.
110
Ibid., p. 49.
58
no
impediu
sua
disseminao,
tendo
ainda
propiciado
111
112
Ibid., p. 50. Citao no original: One measure of the retention of British power is that not until late
1943 did the American government have access to a transatlantic teleph cable that did not pass
through Britain.
Ibid., p. 144. Citao no original: The British attached more importance to Ultra than to any other
aspect of World War II. Although they shared the technologies of centimetric radar and the jet engine
with America during the 1940 Tizard Mission, well before official American entry into war, it was May
1943 before they fully shared Ultra.
59
113
interessante notar que as mesmas questes sobre poder e dominao ocorrem atualmente nos
debates a respeito da internacionalizao do controle da internet (que est sob o controle de um rgo
do governo norte-americano).
60
de
Entropia
influenciou
pesquisadores
do
sculo
XX
no
114
Boltzmann tinha sade frgil e sofria de neurastenia. Seu temperamento causou-lhe diversas
inimizades no meio acadmico e mesmo o afastamento de amigos, como Ostwald. Sofreu oposio
continuada de Mach e seus partidrios, que alegavam que a existncia de tomos seria metafsica por
ser um fato no observvel e, portanto, incompatvel com temas cientficos. Mais informao a
respeito da vida, obra e polmicas de Boltzmann pode ser obtida em D. Lindley, Boltzmanns Atom:
the great debate that launched a revoltuion in physics.
61
115
116
117
118
62
119
120
Ibid., p.30.
Ibid., p. 30.
63
121
122
64
123
124
65
2.2.1. O Teorema-H
O Teorema-H se inicia com a declarao de seu objetivo: provar que um
gs que tenha atingido a distribuio de velocidades de suas molculas de
acordo com a lei de Maxwell permaneceria neste estado indefinidamente, sendo
que as colises entre as molculas no mais alterariam a distribuio de
velocidades. Boltzmann parece t-lo chamado de Teorema do Mnimo quando
de sua publicao, mas o nome pelo qual a demonstrao passou a ser
referenciada e conhecida leva o nome da grandeza que mede a desordem
molecular de um gs (nas condies j apresentadas). O autor utiliza a letra H
para nomear uma grandeza que soma um aspecto particular de todas as
molculas do gs:
Devemos agora calcular a soma H de todos os valores das funes
logartmicas correspondentes num dado momento a todas as
molculas-m e molculas-m1 contidas num elemento de volume125.
Boltzmann emprega as equaes formuladas at ento para somar as
variaes em H decorrentes dos 3 tipos de colises possveis: o das molculas-m
entre si (que ocorre em dos casos), o das molculas-m1 entre si (que tambm
ocorre em dos casos), e entre as molculas-m e molculas-m1 (que ocorre em
1/2 dos casos). Ele verifica que a frmula resultante composta por elementos
que tm sempre o mesmo sinal e que sempre aumentam quando seus
argumentos aumentam. Desta forma, a quantidade H, por somar 3 termos de
sinal negativo que sempre aumentam, s pode diminuir. Esta grandeza poderia
permanecer constante ao longo do tempo caso o gs estivesse em estado
estacionrio. Conclui, finalmente, a partir da assuno de que o estado de
125
Ibid., p. 50.
66
fsico
da
quantidade
H,
incluindo
algumas
questes
126
127
67
128
129
Ibid., p. 443.
Ibid., p. 443-4.
68
130
131
Ibid., p. 445-6.
J. Uffink, Boltzmann's Work in Statistical Physics.
69
70
idia, numa posio que pode ser sintetizada na conhecida frase de Einstein
manifestando sua crena de que Deus no joga dados132. De qualquer forma, a
cincia contempornea parece cada vez mais ligada incerteza inerente dos
modelos probabilsticos, o que se pode verificar pela crescente popularizao do
conceito em textos cientficos, inclusive de divulgao133. Atualmente, a
Entropia calculada pela frmula de Boltzmann-Planck:
S = k ln P
onde k igual a 1,38 x 10-16 erg/C (chamada de constante de Boltzmann) e P a
quantidade de configuraes discretas possveis134.
A nova abordagem introduzida por Boltzmann no estudo dos gases foi uma
importante
influncia
na
Fsica
do
sculo
XX
pela
introduo
da
132
133
134
135
A origem da controvrsia decorre da interpretao formulada por Niels Bohr e Werner Heisenberg,
conhecida como Interpretao de Copenhagen. Mais detalhes (inclusive sobre a retrica utilizada no
debate, com a resposta de Bohr a Einstein para que ele no dissesse a Deus o que fazer), consultar:
http://en.wikipedia.org/wiki/Copenhagen_interpretation. Para uma breve introduo ilustrada aos
fenmenos em discusso, consultar: http://en.wikipedia.org/wiki/Bohr-Einstein_debates. Para
conhecera opinio de Schenberg sobre alguns aspectos paradoxais da interpretao estatsca, consulta:
M. Schenberg, op.cit., pp. 161-2.
Como se sabe, a fsica quntica e a cosmologia lanam mo de recursos como o colapso da funo de
onda para exprimir probabilidades em todos os nveis, de partculas subatmicas ao universo. A
popularizao do conceito em obras de divulgao pode ser constatada em S. Hawking, O universo
numa casca de noz, pp. 106-29, em M. Kaku, Hyperspace, pp. 254-65 e em J. D. Barrow, Theories of
Everything, pp. 86-92.
L. Brillouin, op. cit., pp. 119-20.
M. Schenberg, op.cit., p. 146. Schenberg lembra que Boltzmann escreveu a Planck aconselhando-o a
considerar a descontinuidade na soluo de problema do corpo negro, sem a qual seria impossvel
resolve-lo. Aceitando o conselho, Planck chegou soluo do problema, e mais tarde utilizou o mesmo
princpio na criao da mecnica quntica.
71
72
136
137
C. Shannon, The Mathematical Theory of Communication, in C. Shannon & W. Weaver, op. cit., p.
31.
Ibid., p. 81.
73
138
139
140
141
142
74
143
144
UCSD-TV, Claude Shannon, Father of the Information Age, depoimentos de Jack Keil Wolf, ndices
de tempo 08:20 a 09:03 e 12:20 a 13:00.
Ibid.
75
145
C. Shannon, The Mathematical Theory of Communication, in C. Shannon & W. Weaver, op. cit., p.
31.
76
Partindo deste modelo, Shannon inicia pelo Canal Discreto Sem Rudo por
ser o caso geral que servir de base para o estudo dos demais casos146.
Shannon define Capacidade de transmisso de um canal como a
quantidade de sinais transmitidos durante um intervalo de tempo. Ora, a
quantidade de sinais depende da base de representao e da quantidade de
smbolos do repertrio, o que resulta em
146
Ibid., p. 35.
77
147
148
78
149
150
79
151
152
80
153
81
Ibid., p. 58-61.
82
que as menos provveis sero codificadas por nmeros mais longos, o que
provocar o encurtamento da transmisso. A expanso ser realizada pelo
Receptor, que realizar o processo inverso. Obviamente, necessrio que tanto
o Transmissor como o Receptor tenham capacidade de armazenamento de
sinais (memria) para que a compresso e a expanso possam ser
realizadas155. Shannon nota que a codificao dos sinais em funo distribuio
de freqncias de suas ocorrncias numa determinada lngua j foi empregada
de forma limitada quando da criao do Cdigo Morse: a letra E, que a mais
freqente na lngua inglesa, codificada por apenas um ponto, enquanto que
letras menos freqentes como Q, X e Z so representadas por seqncias mais
longas de pontos e traos. O autor prossegue, lembrando que a idia de
economizar tempo e capacidade de canal (bem como pagar menos pelas
transmisses telegrficas) levou ao uso de abreviaes de palavras ou frases
mais comumente transmitidas156. O assunto ser retomado adiante, ao
aprofundarmos a anlise das abreviaes e compresses sintticas.
Shannon afirma que impossvel a reconstruo fidedigna das mensagens
transmitidas num canal ruidoso, uma vez que a ocorrncia de rudos aleatria
e no h como saber quais partes do sinal foram afetadas. Ele formula, na
seqncia, o conceito de Equivocao (ou Entropia condicional), definindo-a
como a ambigidade mdia do sinal. A nica forma de eliminar a equivocao
a introduo intencional de redundncia157. Ele descreve um algoritmo criado
por outro pesquisador para deteco e correo de erros, embora reconhea
suas limitaes, uma vez que este mtodo introduz de 3 bits de redundncia
155
156
157
83
158
159
160
Ibid., p. 80.
Cyclic Redundancy Check um algoritmo baseado em diviso binria polinomial. Para mais detalhes,
consultar http://en.wikipedia.org/wiki/Cyclic_redundancy_check.
Este nmero foi obtido por Shannon, que alega ter chegado ao mesmo resultado que outros
pesquisadores obtiveram por diferentes mtodos empricos, como pode ser verificado em C. Shannon,
The Mathematical Theory of Communication, in C. Shannon & W. Weaver, op. cit., p. 55-7.
Entretanto, Kahn calcula que a entropia da lngua inglesa de cerca de 75%. Para mais detalhes,
consultar: D. Kahn, op. cit., pp. 759-62.
84
(gays,
lsbicas
simpatizantes),
IPI
(imposto
sobre
produtos
161
162
163
164
Neste caso, as ambigidades so eliminadas pela anlise do contexto das frases. Uma breve descrio
do sistema de escrita da lngua hebrica pode ser encontrada em:
http://www.jewishvirtuallibrary.org/jsource/Judaism/alephbet.html.
D. Olson, op. cit., p. 99.
Ibid.
U. Eco, Como se faz uma tese, p. 166.
85
165
86
166
167
168
87
ENTROPIA
Autor
Boltzmann
Shannon
Objeto
Gases
Informao
Conceito
Desordem Molecular
Quantidade de Informao
Medida
Variao
Tendncia
Maxwell-Boltzmann)169.
169
170
Devem-se considerar as restries do modelo terico adotado por Boltzmann, bem como as limitaes
do mtodo de clculo.
O resultado esperado deve considerar as restries do modelo adotado por Shannon, que assume que
os textos produzidos na lngua inglesa so adequadamente descritos como processos ergdicos.
importante notar que, na prtica, os sistemas de comunicao no transmitem apenas texto na lngua
inglesa (tambm transmite, por exemplo, por exemplo, nmeros codificados e dados analgicos
digitalizados) o que tende a desviar os resultados reais da distribuio terica.
88
171
N. Wiener, Cybernetics, or control and communication in the animal and the machine, pp. 8-9.
Citao no original: The message is a discrete or continuous sequence of measurable events
distributed in time precisely what is called a time series by the statisticians.
89
172
173
174
Ibid., p. 10.
Ibid., pp. 10-1.
Ibid., p. 11. Citao no original: Just as the amount of information in a system is a measure of its
degree of organization, so the entropy of a system is a measure of its degree of disorganization: and the
one is simply the negative of the other.
90
175
176
91
Ora, a entropia de
177
178
179
180
Ibid., p. 61. Citao no original: What is information, and how is it measured? One of the simplest,
most unitary forms of information is the recording of a choice between two equally probable simple
alternatives, one or the other of which is bound to happen.
Ibid., pp. 61-2.
Ibid., p. 64. Citao no original: [the] amount of information is essentially a negative entropy.
L. Brillouin, Life, Thermodynamics, and Cybernetics, in H. Leff & A. Rex, orgs., op. cit., pp. 101-2.
92
93
181
94
182
183
184
95
185
186
187
188
189
190
96
191
192
193
194
Penrose acredita que existe subjetividade uma vez que o mtodo aproximativo usualmente empregado
no clculo, conhecido como coarse graining, prope a diviso do espao de fase em pequenas reas
contendo partculas cujos estados macroscpicos sejam indistinguveis, e um estado macroscpico
indistinguvel para um observador pode no o ser para outro. Para mais detalhes sobre esta
argumentao, consultar: R. Penrose, op. cit., p. 691.
Denbigh, K. How subjective is entropy?, in H. Leff & A. Rex, orgs., op. cit., pp. 109-11.
Ibid., p. 113.
Ibid., p. 112-5.
97
195
196
197
198
S. Hawking, op. cit., p. 63. Para uma descrio mais detalhada do problema em termos acessveis ao
pblico no-tcnico, consultar: Ibid., pp. 121-3.
Para mais detalhes, consultar: http://www.newscientist.com/article.ns?id=dn6151.
J. Preskill, On Hawkings Concession. Citao no original: According to quantum mechanics,
although physical processes can transform the information that is encoded in a physical system into a
form that is inaccessible in practice, in principle the information can always be recovered.
L. Susskind, Buracos negros e o paradoxo da informao, pp. 18-23.
98
de informao199. Ainda, Susskind sugere uma nova analogia, desta vez com a
teoria das cordas, que faria com que a superfcie do horizonte de eventos de um
buraco negro se assemelhasse a uma gigantesca trama de cordas expandidas:
Cada segmento de corda, medindo 10-33 cm de comprimento,
funciona como um bit. Assim, as cordas permitem que a superfcie do
buraco negro preserve a imensa quantidade de informao que ele
engoliu ao longo do tempo200.
Aparentemente, cada autor emprega os conceitos de Teoria da Informao
de acordo com suas necessidades. Neste debate convivem interpretaes
diferentes de um mesmo fenmeno, fenmenos distintos com a mesma
nomenclatura, e correlaes da unidade de informao com diversos tipos de
partculas fsicas: no parece haver sinais de que um consenso est sendo
construdo. Por outro lado, pode ser um indcio de que a TI fornece uma
abordagem flexvel para abordar diversos tipos de fenmenos, sendo que suas
associaes com fenmenos fsicos seriam na forma de analogias ou metforas,
e no como igualdades ou equivalncias. De fato, Schenberg acredita que a
ainda no se chegou a um consenso:
Mas pode ser que esteja faltando algum elemento essencial na nossa
viso total do Universo. Muita gente acha que o Universo no seja s
a matria. Acreditam que exista outro elemento, e que seria a
informao, ou alguma coisa obtida da informao. Mas, pelo menos
at o momento atual, a Fsica no conseguiu esclarecer esta
questo201.
Uma vez que as principais semelhanas entre as entropias de Boltzmann e
de Shannon j foram apontadas, e tendo introduzido os principais argumentos
199
200
201
Ibid., p. 21.
Ibid., p. 23. O tempo se dilataria progressivamente at a parada total ao se atingir o horizonte de
eventos: os segmentos de cordas, que so a unidade elementar de matria na teoria-M, deixariam de
vibrar e se dilatariam at atingir dimenses da ordem do comprimento de Planck (aproximadamente
1,6 x 10-35 m). Preskill julga desnecessria a invocao de outra teoria para explicar fenmenos da
mecnica quntica ( semelhana de Denbigh a respeito da termodinmica com relao ao demnio de
Maxwell). Uma anlise mais detalhada a respeito de alternativas de soluo do paradoxo da
informao pode ser obtida em: J. Preskill, Do black holes destroy information?.
M. Schenberg, op.cit., p. 154.
99
202
Mesmo em se adotando uma postura filosfica idealista que postule que a matria uma construo
da mente, poder-se-ia argumentar que mesmo assim suas naturezas difeririam uma vez que os
smbolos codificados numa mensagem seriam meta-construes.
100
101
de
informao
conceitos
matemticos
decorrentes
de
102
203
204
205
206
207
N. Fenzl & W. Hofkirchner, Emmergence and Interaction of natural systems: the role of information,
energy and matter in the perspective of a Unified Theory of Information, p. 6.
A fim de se manter consistncia conceitual, procurar-se- estabelecer relaes utilizando-se critrios
objetivos, como j foi feito nos captulos anteriores. Assim sendo, preo (medida objetiva verificvel)
ter precedncia sobre valor (conceito subjetivo). Quando isto no ocorrer, ser por respeito a
citaes originais dos autores, ou para efeito de exemplificao.
I. Epstein, Quando um fato se transforma em notcia no jornalismo e na cincia.
Ibid.
K. Popper, apud I. Epstein, Quando um fato se transforma em notcia no jornalismo e na cincia.
103
104
208
209
105
correlao entre oferta, procura e preo que ele formula colocada em funo
da procura. Uma de suas proposies baseadas nesta premissa a Lei das
Vontades Saciveis ou da Utilidade Decrescente, a qual declara que o benefcio
obtido pela aquisio de um bem se dilui medida em que se obtm mais que o
necessrio:
... o benefcio adicional que uma pessoa obtm de um dado aumento
em seu estoque de um coisa [uma mercadoria], diminui a cada
aumento do estoque [desta mercadoria] que ela j tem210.
Marshall reconhece as limitaes de uma lei com esta generalidade, entre
as quais esto: fatores que variam no longo prazo, como a mudana dos gostos
do consumidor ou de sua psicologia; e nos casos em que o consumidor no
obtm quantidade suficiente de uma mercadoria para satisfazer suas
necessidades211. Neste cenrio ideal, a diminuio da utilidade da mercadoria
em funo de sua abundncia parece ter relao direta com a diminuio da
auto-informao dos smbolo medida que suas freqncias aumentam numa
mensagem. De fato, quanto maior o excesso de estoque de determinada
mercadoria, menor ser sua utilidade mdia; da mesma forma, quanto mais um
smbolo ocorrer em textos de determinada lngua, menor ser sua autoinformao.
De formas diferentes, tanto Smith como Marshall expressam relaes
econmicas que tm similaridades com conceitos da Teoria da Informao. A
abundncia de uma mercadoria determinaria a diminuio de seu preo no
mercado ou de sua utilidade mdia daquele que a possui: estas proposies
guardam interessantes semelhanas com os conceitos da Teoria da Informao,
210
211
106
212
107
213
214
108
estes
princpios,
possvel
estabelecer
algumas
relaes
215
216
217
109
218
219
110
3.2. Concluses
A definio de entropia, formulada na termodinmica clssica, est
relacionada com o grau de desordem de um sistema fsico. Desde ento,
diversas interpretaes matemticas e fsicas foram propostas para mensurar
esta grandeza e descrever adequadamente suas decorrncias. Boltzmann
empregou uma abordagem estatstica na tentativa de expressar os conceitos de
ordem e desordem de um sistema fsico: a distribuio das velocidades das
molculas de um gs contido num recipiente o que determina seu estado,
sendo que o estado ordenado seria aquele em que houvesse concentrao das
velocidades ao redor de determinados valores, enquanto que o estado
desordenado seria aquele no qual no houvesse tais concentraes. Boltzmann
adotou a premissa de que a matria seria composta por unidades discretas (no
que foi duramente criticado, pois esta no era a concepo dominante na
poca), introduzindo uma viso descontnua dos fenmenos fsicos que seria o
fundamento da Mecnica Quntica do sculo XX.
A abordagem discreta de Boltzmann, entretanto, no favoreceu o
desenvolvimento de uma frmula para a entropia que fosse efetivamente
calculvel, uma vez que ele assumiu que as velocidades das molculas seriam
continuamente variveis. Planck props que o clculo da entropia considerasse
um nmero finito de intervalos de velocidades, transformando-o num processo
contvel. Gibbs, todavia, considerava que as frmulas propostas (inclusive sua
prpria) seriam analogias de entropia: a entropia seria um princpio fsico
definido na Termodinmica, e a Mecnica Estatstica proveria interpretaes
111
112
113
Bibliografia
AFTAB, O., P. Cheung, A. Kim, S. Thakkar, & N. Yeddanapudi. Information
Theory after Shannon's 1948 Work. Project History, Massachusetts
Institute of Technology, 2001; http://mit.edu/6.933/www/Fall2001/
Shannon2.pdf, agosto de 2005.
ALFONSO-GOLDFARB, A. M. O que histria da cincia. So Paulo,
Brasiliense, 1994 (Col. Primeiros Passos, Vol. 286).
ALFONSO-GOLDFARB, A. M. & M. H. R. Beltran, orgs. Escrevendo a histria
da cincia: tendncias, propostas e discusses historiogrficas. So Paulo,
Educ/Editora Livraria da Fsica/FAPESP, 2005.
_____., orgs. O laboratrio, a oficina e o ateli: a arte de fazer o artificial. So
Paulo, Educ/FAPESP, 2002.
BARROW, J. D. Theories of everything. Nova Iorque, Fawcett Columbine, 1991.
BOLTZMANN, L. Lectures on gas theory. Trad. inglesa de G. S. Brush. Nova
Iorque, Dover Publications, 1995.
BRILLOUIN, L. Science and Information Theory. Nova Iorque, Academic Press
Inc, 1956.
CHOMSKY, N. Three models for the description of language. IEEE
Transactions on Information Theory, IT-2 (Sept. 1956): 113-24.
CSISZR, I. Applications of Information Theory in Probability and Statistics.
EEE Information Theory Society Newsletter, Special Golden Jubilee Issue
(Summer 1998): 9-11.
DAY, R. The modern invention of information: discourse, history and power.
Carbondalle, Southern Illinois Press, 2001.
DEVLIN, K. Logic and Information. Cambridge, Cambridge University Press,
1991.
ECO, U. Como se faz uma tese. So Paulo, Perspectiva, 1997.
_____. The language of Mathematics: making the invisible visible. Nova
Iorque, W. H. Freeman/Owl, 1998.
EDWARDS, P. The closed world: computers and the politics of discourse in
Cold War America. Cambridge, The MIT Press, 1996.
114
115
116
117
118
Iconografia
Fig. 1 - Claude Shannon, 1995.
Cortesia de Lucent Technologies.
Fig. 2 - Claude Shannon e Theseus.
Cortesia de Lucent Technologies.
Fig. 3 - A Reflexo das ondas eletromagnticas em funo de suas freqncias.
Fonte: P. Hugill, Global Communications since 1844: Geopolitics and
Technology, p. 87.
Fig. 4 - Patente Norte-Americana da Mquina Enigma, concedida em 1928.
Fonte: D. Kahn, The Codebreakers: the story of secret writing, p. 423.
Fig. 5 - Um exemplar da Mquina Enigma.
Autor: Declan McCullagh
Copyright Declan McCullagh/mccullagh.org, all rights reserved.
Fig. 6 - Cable&Wireless Great Circle Map.
Autor: MacDonald Gill, 1945.
Courtesy of Cable & Wireless Archive, Portchurno.
Fig. 7 - Diagrama Esquemtico de um Sistema de Comunicao
Fonte: C. Shannon, The Mathematical theory of communication, p. 34.
Fig. 8 - Variao da Entropia no caso de duas possibilidades com probabilidades
p e (1-p)
Fonte: C. Shannon, The Mathematical theory of communication, p. 50.
119
Anexos
120
Sub GerarArquivos()
'
'
'
'
121
Parmetros:
Arquivo$ = nome do arquivo a ser gerado
Tamanho = quantidade de caracteres a gravar
Texto$
= texto a ser reptido dentro do arquivo
TamTex = Len(Texto$)
Gravados = 0
Parmetros:
Arquivo$
Tamanho
Texto1$
Texto2$
=
=
=
=
FaixaIni = Asc(Texto1$)
FaixaExt = Asc(Texto2$) - FaixaIni
Gravados = 0
Parmetros:
Origem$ = nome do arquivo a ser lido
Destino$ = nome do arquivo a ser gerado
Tamanho = quantidade de caracteres a gravar
Gravados = 0
122
Sub Equiprobabilidade()
'--- gerao da base de todos os caracteres
Todos$ = ""
For i% = 0 To 255
Todos$ = Todos$ + Chr$(i)
Next
Open "C:\Entropia\Equiprob.txt" For Output As #1
For i% = 1 To 4096
'--- introduo de permutaes aleatrias:
'--- para cada posio, sorteia-se outra para que
'--- os caracteres contidos nelas sejam permutados.
For j% = 1 To 256
'--- j% = posio corrente
'--- k% = posio que permutar contedo com a posio j%
k% = 1 + Int(Rnd() * 255)
'--- execuo da permuta
TrocaJ$ = Mid$(Todos$, j%, 1)
TrocaK$ = Mid$(Todos$, k%, 1)
Mid$(Todos$, k%, 1) = TrocaJ$
Mid$(Todos$, j%, 1) = TrocaK$
Next
Print #1, Todos$;
Next
Close #1
End Sub
123
3. Contedo do CD-ROM
124