Teoria Dos Jogos e Da Cooperacao para Filosofos

TEORIA DOS JOGOS E DA COOPERAO PARA FILSOFOS Por Antnio Rogrio da Silva ndice
I parte Teoria dos Jogos e da Cooperao Captulo 1: Histria e Conceitos Bsicos 1.1 A Estrutura do Jogo: Conceitos e princpios 1.2 Estratgias Dominantes, Maximin, Mistas e Noo de Equilbrio 1.3 A Irracionalidade do Agente Racional Captulo 2: O Papel da Comunicao 2.1 Informao Perfeita, Ameaas e Outros Conceitos. 2.2 Jogos com Comunicao e seus modelos. 2.3 A Razo Comunicativa x Estratgica. Captulo 3: A Evoluo da Cooperao 3.1 A Centopia, Induo Reversa, o Papel do Tempo. 3.2 Problemas com o Modelo Padro. 3.3 Estratgias Vitoriosas nas Variantes do Modelo Padro. 3.4 Rudo, Alternncia e Evoluo. II parte Modelos de Jogos Captulo 4: DPI 4.1 As Simulaes dos Principais Jogos e suas Consequncias 4.2 O Dilema dos Prisioneiros Iterado 4.3 Os Torneios e a Estratgia TIT FOR TAT. 4.4 Uma Famlia Campe. 4.5 Condies para Cooperao. Captulo 5: Bens Pblicos 5.1 O Bem de Todos. 5.2 O Carona Free-rider. 5.3 Punio e Estado. 5.4 A Cooperao nos Bens Pblicos. Captulo 6: Ultimato 6.1 Um Teste de Thomas Schelling 6.2 A Busca do Homem Econmico 6.3 A Emerso da Equidade Captulo 7: Novos Campos Interdisciplinares 7.1 Computadores X Estudos Acadmicos 7.2 A Construo de Jogos e sua Utilizao Prtica 7.3 As Diversas Disciplinas que Empregam os Modelos de Jogos 7.4 Uma Nova Viso da tica 7.5 Concluso Bibliografia 89 90 91 93 98 102 107 109 113 118 123 128 135 139 144 149 151 157 161 166 172 176 2 9 18 27 36 45 52 57 66 69 74 78 83
Teoria dos Jogos e da Cooperao
I parte Teoria dos Jogos e da Cooperao

Captulo 1: Histria e Conceitos Bsicos
Jogos de tabuleiro, dados, cartas ou, em geral, jogos de salo divertem a humanidade desde a formao das primeiras civilizaes. Escavaes feitas em stios arqueolgicos localizados na regio do Oriente Mdio conhecida como Mesopotmia encontraram, em tmulos de nobres e membros da famlia real que dominaram a antiga cidade de Ur - importante centro da civilizao sumria, por volta de 3000 a.C. -, um jogo de tabuleiro que foi batizado como Jogo Real de Ur - provvel ancestral da srie de jogos que evoluram at o gamo moderno. A se acreditar nas lendas indianas, a atividade ldica, alm de entreter seus praticantes, tambm serviria como simulao alegrica de batalhas ou deliberaes que as pessoas tm de fazer ao longo de sua vida cotidiana - o xadrez e o j mencionado gamo seriam exemplos disto. Por colocar as pessoas em situaes nas quais vencer ou perder dependem das escolhas feitas adequadamente logo no incio das partidas, os jogos se mostraram como excelente ferramenta para o desenvolvimento da personalidade e da inteligncia das crianas. Entretanto, apesar desse aspecto pedaggico, os jogos raramente eram considerados objetos de estudo srio. Foi a curiosidade do nobre Cavaleiro de Mr e inveterado jogador, Antoine Gombaud (1607-1684), que, em 1654, incentivou o filsofo francs Blaise Pascal (1623-1662) a iniciar correspondncia com outro brilhante matemtico francs, Pierre de Fermat (1601-1665), no intuito de solucionar com maior rapidez o problema dos pontos, num jogo de dados que fora interrompido, e cujo dinheiro das apostas teria de ser dividido justamente de acordo com as probabilidades iguais de ganho de cada jogador, caso o jogo tivesse continuado at o final. A resposta fornecida por ambos ao problema de Gombaud revelou as regras matemticas que subjazem aos jogos de azar, desenvolvendo a teoria da probabilidade que de um modo independente, outro genial matemtico e famoso trapaceiro, o italiano Girolamo Cardano (1501-1576), havia iniciado antes. Contudo, a soluo encontrada por Pascal e Fermat s foi publicada mais tarde atravs do primeiro livro exclusivo sobre teoria da probabilidade, chamado Sobre o Raciocnio em Jogos de Azar, do fsico e astrnomo holands Christian Huygens (1629-1695), lanado em 1657. Isso porque, na metade do sculo XVII, mesmo a matemtica era considerada uma atividade amadora de eruditos que no deveria ter consequncias srias para as vidas dos demais mortais. No obstante, alm dos jogos de azar - dados e roleta -, que foram cruciais para o desdobramento da teoria da probabilidade, jogos de estratgia, aqueles que no dependem apenas da sorte, mas oferecem alternativas para que os jogadores possam escolher qual a melhor linha de ao que deve adotar para atingir um resultado esperado, tendo em mente o que a outra parte far - pquer e damas -, tambm so passveis de formalizao matemtica por intermdio de simplificaes que permitem a simulao de cada tipo de jogo, constitudo por regras bem definidas. A Teoria dos Jogos trata, portanto, de sistematizar matematicamente, atravs dos modelos de jogos, as situaes que envolvem duas ou mais pessoas, cujas decises por uma estratgia de ao adequada influenciaro o resultado da interao e o comportamento subsequente das partes interessadas. Em 1730, a matemtica j havia alcanado um respeito considervel, devido ao sucesso dos trabalhos do filsofo ingls Isaac Newton (1642-1727). Nesta poca, o
suo Daniel Bernoulli (1700-1782), membro de uma ilustre famlia de matemticos, j podia ser visto como um solucionador de problemas profissional, contratado para ensinar sua matria em diversas cortes europias. Em So Petersburgo, Rssia, ele pde conceber a noo de utilidade como um valor de incremento inversamente proporcional quantidade inicial. Isto , tendo em vista o comportamento dos jogadores, haveria uma medida subjetiva de satisfao que explicaria a reao das pessoas em situaes de risco, nos termos de maximizao de sua utilidade. Circunstncia que s dois sculos depois, receberia uma formulao moderna pela mo do matemtico francs mile Borel (1871-1956), na forma do teorema minimax. Usando a noo de estratgias mistas - que aplicam as estratgias puras a uma taxa de variao proporcional aos ganhos -, em 1927, Borel conseguiu resolver jogos com duas pessoas que tivessem at cinco opes de estratgias a sua escolha. Uma soluo geral, entretanto, s viria a ser alcanada pelo matemtico hngaro John Von Neumann (1903-1957), em 1928, consolidando as bases de uma moderna Teoria dos Jogos, em que o conceito de utilidade fundamental. Outro conceito chave dessa teoria comeou a ser trabalhado pelo filsofo e economista francs Antoine Augustin Cournot (1801-1877). Em suas anlises sobre os casos de duoplio, Cournot formalizou uma verso restrita do conceito de equilbrio que iria ser generalizada, no sculo seguinte, por John Forbes Nash Jr. em trabalhos que tornaram a Teoria dos Jogos pertinente a situaes em que um lado pode vencer, sem precisar, necessariamente, derrotar o adversrio. Cenrios que filsofos como o ingls Thomas Hobbes (1588-1679), o escocs David Hume (1711-1776) e o suo JeanJacques Rousseau (1712-1778) descreveram de modo intuitivo em suas respectivas obras: Leviat (1651), Tratado da Natureza Humana (1739) e Discurso sobre a Origem e os Fundamentos da Desigualdade entre os Homens (1755). Hobbes descreveu, de modo bastante criativo, a soluo cooperativa a qual podem chegar agentes racionais motivados apenas pelas satisfao imediata de seus interesses, em conflito no estado de natureza. Dada a simetria e fragilidade de cada um dos que se enfrentam na natureza, apenas a busca da cooperao poderia atender os anseios de todos os envolvidos, preservando a paz necessria para realizao de seus projetos pessoais. Contudo, de modo espontneo, ningum abriria mo de lutar pela posse de todos os meios indispensveis para sua sobrevivncia se seus potenciais rivais no fizessem o mesmo1. Hume, por sua vez, imaginou a situao vivida por dois fazendeiros que vem ameaadas as suas safras pela dificuldade de convencerem um ao outro a colaborar nas suas respectivas colheitas, considerando que ambos so naturalmente egostas e no nutrem simpatias mtuas2. Enquanto Rousseau imaginou o contexto de caadores que dependem da atuao de vrios participantes, a fim de que se obtenha caa suficiente para todos, embora seja provvel esperar a desero daqueles que tenham a oportunidade de, individualmente, capturar uma presa menor, mas que os satisfizesse a ponto de estimular o abandono do grupo3. Inspiraes como estas no so exclusivas da literatura moderna ou contempornea, ou de uma concepo de indivduo tpica apenas da modernidade. No tempo em que Hammurabi (sculo XVIII a.C) reinava sobre toda Mesopotmia, a coleo de sentenas que este rei babilnico mandou gravar em estelas de pedra negra e publicar em frente a seus monumentos, a fim de difundir sua noo de direito, fundada
. Veja HOBBES, Th. Leviat, I part., cap. XIV, pp. 78/9. . Veja HUME, D. Treatise of Human Nature, III, part. II, se. V, pp. 287/8. 3 . Veja ROUSSEAU, J. J. Discurso sobre a Origem e os Fundamentos da Desigualdade entre os Homens, II part., p. 261.
2 1
na reciprocidade, que ainda hoje serve de lastro s leis contemporneas. Suas clebres sentenas "olho por olho; dente por dente"4 esto subjacentes s tradies judaicas, crists e todas as demais que propuseram variaes da Regra de Ouro (fazer ao outro o que se quer que faa a si mesmo). Sobre outro aspecto, em A Vida dos Doze Csares (c. 120), Caio Suetnio Tranquilo (69-141) narrou uma atitude que frequentemente Caio Jlio Csar (101-44 a.C.) tomava para evitar a desero de seus soldados. Csar, quando pressentia que uma batalha seria difcil de prever a vitria, afugentava todos os cavalos, incluindo o seu prprio, com o objetivo de impedir a fuga dos menos corajosos, obrigando todos a lutarem com afinco, j que no teriam outra opo disponvel5. Soluo semelhante a que Hernn Corts (1485-1547) tomou quando fez destruir os barcos que poderiam servir de meio para fuga de seus soldados, antes da iniciativa de derrubar o imprio asteca, forando os descontentes a se unirem a ele, pois estavam inferiorizados, em territrio hostil, sem qualquer outra sada. Mas antes de todos, o estrategista chins Sun Tzu (sc. V a.C.) j recomendava em seu manual A Arte da Guerra (500 a.C.): Lance suas tropas em situaes das quais no h sada; seus homens preferiro enfrentar a morte a desertar. E, uma vez que estiverem prontos para morrer, voc no poder tirar menos do que o mximo de seus oficiais e soldados (SUN TZU. A Arte da Guerra, cap. 11, p. 91). Em ocasies como estas, onde sempre pode haver conflito de interesses entre duas ou mais partes capazes de deliberarem sobre uma ao que implique numa reao recproca consequente, a Teoria dos Jogos tenta encontrar uma formulao passvel de ser tratada de modo to rigoroso quando possvel, com objetivo de apontar respostas factveis. Concorrncia At que John von Neumann e Oskar Morgenstern (1902-1977) publicassem o livro que deu origem a esse novo ramo da matemtica, diversos outros economistas e matemticos, alm dos j mencionados, contriburam com conceitos e teoremas que mais tarde foram incorporados, como por exemplo a regra de Thomas Bayes (17021761) para calcular a probabilidade de um evento ocorrer a partir de uma informao dada e o teorema de Ernst Zermelo (1871-1953) sobre a existncia de uma estratgia vitoriosa em jogos de informao perfeita e soma zero (em que um s ganha se outro perde). Essa distribuio inicial dos conceitos espalhada por vrios pases e autores ao longo da histria moderna dificultou a identificao de um marco histrico ntido para fundao da Teoria dos Jogos. Os quatro artigos que Borel publicou no incio do sculo passado, introduzindo a noo de estratgias mistas e soluo minimax, serviram ento para reivindicao desta prerrogativa, por parte de autores franceses, em favor de seu ilustre compatriota6. No obstante, o polmata Herbert Alexander Simon (1916-2001), por sua vez, embora tenha preparado a verso preliminar de seu Comportamento Administrativo (1945) antes de surgir Theory of Games and Economic Behavior (1944), abriu mo de qualquer mrito de ter descoberto um novo conceito de jogos estratgicos, abordado em
Veja BOUZON, E. O Cdigo de Hamurabi, 196 a 200, pp. 181/2. . Veja SUETNIO TRANQUILO, C. A Vida dos Doze Csares, p. 38. 6 . Em Games and Decisions, Luce e Raiffa citam o economista Maurice Frchet como um dos autores desta proposta. Veja LUCE, R.D. & RAIFFA, H. Games and Decisions, cap. 1, p. 2.
5 4
seu livro sob a tica do homem administrativo, ao invs do homem econmico enfocado por von Neumann e Morgenstern. Segundo Simon, o carter administrador procuraria "'contemporizar' ao invs de 'maximizar', (...) [realizando] suas escolhas sem precisar de examinar previamente todas as possveis alternativas de comportamento, e sem ter de certificar-se de que essas so de fato todas as alternativas que se lhe oferecem"7. Se a verso do homem administrativo, lanada por Simon tivesse prevalecido, no seria necessrio levar em conta todas as relaes dos objetos envolvidos para deliberao, como quer a Teoria dos Jogos. Bastaria apenas o apoio regras empricas simples que no sobrecarregassem o clculo para uma escolha razovel, ao invs de uma forte formao matemtica que, por vezes, alvo de crticas de psiclogos e antroplogos. Para a Teoria dos Jogos que prevaleceu, entretanto, todo processo de deliberao parte da noo de um agente cuja racionalidade instrumental mnima, tpica do homem econmico, visa to somente maximizar os ganhos de seus esforos, encarando o mundo real em toda sua complexidade de relacionamento. Em Theory of Games and Economic Behavior, von Neumann e Morgenstern estabeleceram, como parmetros de sua teoria, os jogos de duas pessoas com soma zero, em geral, cooperativos, isto , quando jogados com mais de dois jogadores e com a permisso de transferncia de utilidade interna s coalizes que forem constitudas. Por conta disso, produziram uma consistente axiomatizao da teoria da utilidade que foi amplamente aplicada nos diversos domnios econmicos e fora destes. No entanto, por mais inspirada e detalhada que fossem a prova do teorema minimax e a formalizao dos jogos de soma zero, a Teoria dos Jogos surgiu incompleta, ao deixar em segundo plano os jogos de soma varivel e os nocooperativos. Cedo, matemticos brilhantes trabalharam para preencher as lacunas deixadas. John Nash procurou generalizar o teorema de minimax de von Neumann para todo tipo de jogo - soma zero ou varivel, com n-pessoas. A soluo encontrada foi batizada de "ponto de equilbrio", como se fosse um repouso natural nas ocasies em que nenhum jogador poderia melhorar sua posio, mudando de estratgia, sem que piorasse os resultados dos demais envolvidos. Nash conseguiu provar que, para qualquer tipo de jogo, existe pelo menos um ponto de equilbrio que pode ser encontrado usando estratgias mistas, como uma variao na proporo em que so aplicadas as estratgias originais, puras. Com isso, ao lado do teorema minimax, o equilbrio de Nash tornou-se um dos alicerces fundamentais da Teoria dos Jogos, pois permitiu que os jogos no-cooperativos, que envolvem cooperao e competio pudessem ser tratados, alm dos chamados cooperativos - aqueles em que os jogadores podem usar a comunicao e fazer acordos que forcem a colaborao dos demais. A elegncia e preciso das provas matemticas de von Neumann e Nash, apesar de formarem uma base terica slida, levaram os pesquisadores interessados em obter contra-exemplos que consolidassem a Teoria dos Jogos, a prepararem experimentos laboratoriais que pudessem ou no confirmar na prtica aquelas teses duras acerca da racionalidade dos agentes. Em janeiro de 1950, os laboratrios da corporao estadunidense Rand tinham em seus quadros matemticos astutos do porte de Melvin Dresher e Merrill Flood que prepararam uma experincia que se tornou histrica, a fim de verificar se pessoas de "carne e osso" seriam capazes de encontrar as estratgias em equilbrio previstas pela teoria. Por cem vezes, realizaram os testes com a participao do matemtico John Williams, chefe de departamento da Rand, e do economista Armen
7
. SIMON, H. A. Comportamento Administrativo, pp. XXVIII-XXIX.
A. Alchian, da UCLA, que interagiam entre si. Entretanto, em vez de buscarem suas estratgias dominantes e pararem num ponto de equilbrio, eles optaram por cooperar mais vezes, do que trair o outro. Este famoso experimento ficou conhecido, depois, como Dilema dos Prisioneiros, graas histria contada pelo canadense Albert William Tucker (1905-1995) - que fora orientador de Nash - em um seminrio para psiclogos, na Universidade de Stanford8. Na verso de Tucker, dois suspeitos de terem cometido um crime grave so presos e interrogados separadamente. Na tentativa de incrimin-los, o inspetor encarregado da investigao, de modo reservado, oferece a cada um as opes de confessar o delito e entregar o comparsa, ou ficar calado. Caso um dos suspeitos denunciasse o outro que ficasse calado, o denunciante obteria a liberdade, por colaborar com a justia, enquanto seu colega arcaria sozinho com a pena mxima. Se ambos permanecessem em silncio, pegariam uma sentena mais branda pelo crime leve que os levaram priso em flagrante. Contudo, se os dois se delatassem mutuamente seriam punidos com uma mesma condenao: menor do que a mxima, mas maior do que a pena leve. Por conta disto, a nica estratgia que domina todas as outras a da confisso mtua, uma vez que, independente da reao do outro, o melhor que cada um faria por si mesmo confessar o crime grave, ao contrrio de se expor possibilidade de ficar mais tempo na cadeia pagando a maior pena. Tal previso, contradita pela experincia na Rand, mostrava a existncia de algum problema no tipo de racionalidade concebida, pois, em vez de buscar resultados mais favorveis para si, os jogadores tendiam a escolher a cooperao para maximizar seus ganhos, sem buscar, aparentemente, o equilbrio Nash. Ao saber disso, Nash atribuiu a falha na experincia ao fato dos jogadores interagirem em "um grande jogo de movimentos mltiplos", lamentando a ineficincia deles em comportarem-se mais racionalmente9. Por outro lado, o conceito de utilidade - que no exclusivo da Teoria dos Jogos, mas pertence ao domnio prprio da economia - foi alvo de fortes questionamentos em dois aspectos: primeiro, devido a suposta impossibilidade de se medir coisas incomessurveis; depois, pela duvidosa manuteno de uma racionalidade capaz de preservar a intransitividade e substituio das preferncias, bem como a ateno s probabilidades objetivas em detrimento das subjetivas. O economista francs Maurice F. Charles Allais, em seu artigo "Le Comportement de L'Homme Rationnel Devant Le Risque" (1953), atacou a manuteno rgida do conceito de racionalidade para todo tipo de situao. Em sua pesquisa, Allais constatou que, diante do risco e ou incerteza, os agentes racionais assumiam uma perspectiva subjetiva da probabilidade de um evento acontecer, sem atentar para estatsticas objetivas. Alm do mais, no preservavam a independncia de suas escolhas, quando na substituio de alternativas irrelevantes. Fatores psicolgicos que influenciavam decisivamente os processos deliberativos, virtualmente, impediam qualquer tentativa de formalizao. Em verdade, as crticas relevantes de Allais, embora fossem direcionadas noo de utilidade adotada pela teoria econmica estadunidense, atingiram tambm a Teoria dos Jogos, que tem elementos comuns a esta. Nesse contexto, os ataques diretos que a Teoria dos Jogos comeava a receber, em parte, arrefecera o entusiasmo inicial da primeira metade do sculo XX. Testes empricos mostravam que aspectos psicolgicos impunham algumas restries e exigiam novas tcnicas de abordagem aos especialistas.
8 9
. Veja NASAR, S. Uma Mente Brilhante, cap. 12, p. 147. . NASAR, S. Op. cit, cap. 13, p. 149.
Limites e Superao Enquanto problemas prticos persistiam, outros autores ajudavam a desenvolver e aplicar a Teoria dos Jogos em diversos setores do conhecimento. Em 1955, Richard Bevan Braithwaite (1900-1990) lanou o primeiro livro de filosofia a tratar desta teoria, chamado Theory os Games as a Tool the Moral Philosopher, onde props um princpio equitativo, segundo orientao fornecida por uma "fronteira de eficincia". Anos depois, outros filsofos, como o canadense David Gauthier que desenvolveu toda uma teoria contratualista da moral fundada na Teoria dos Jogos, em Morals by Agreement (1986), reconheceram o novo instrumento de anlise que lhes surgia. Martin Hollis (19381998), por sua vez, com o auxlio da Teoria dos Jogos procurou atacar a noo limitada que v a razo instrumental incompatvel com a confiana, buscando na reciprocidade e no bem comum as bases iluministas de racionalidade e identidade comprometidas com o relacionamento local e o universalizvel10. Nos anos que se seguiram II Guerra Mundial, os modelos matemticos de jogos serviram de orientao para o desenvolvimento e teste de estratgias militares empregadas durante a Guerra Fria. O que fez com que Von Neumann e outros "tericos dos jogos" inspirassem o caricato personagem principal do filme Dr. Strangelove (Dr. Fantstico, 1963), de Stanley Kubrick (1928-1999), interpretado por Peter Sellers (1925-1980). O apelo anti-militarista da maioria da populao mundial, naquela poca, somado aos problemas inerentes teoria emergente, mas incompleta, lanou uma sombra sobre os propsitos nebulosos dos pesquisadores desta rea. Apesar de sua "mfama", diversos novos conceitos foram criados no sentido de aproximar a teoria da realidade vivida pelas pessoas nos seus conflitos cotidianos. Estudos de jogos repetitivos, com vrias rodadas seguidas; estocticos, cujos pagamentos sofrem variao numa porcentagem fixa; novos modelos de jogos, como a Batalha dos Sexos; e as representaes de jogos na forma extensiva, de rvores com ns e ramos que esquematizam os movimentos tomados, e estratgica, com matrizes onde figuram a lista de estratgias de cada jogador e seus resultados cruzados em clulas individuais, so alguns exemplos dos muitos aspectos desenvolvidos depois de 1950. Em 1960, Thomas C. Schelling descreveu os efeitos da comunicao implcita e do chamado ponto focal para deliberao em jogos de motivao mista, intermedirios competio irrestrita e pura colaborao. Mais uma vez, destacou-se os aspectos psicolgicos e culturais que no eram passveis de uma abordagem meramente matemtica. Ao longo dessa dcada, outros dois autores - que, em 1994, dividiriam o prmio Nobel de economia com John Nash -, Reinhard Selten e John C. Harsanyi (1920-2000), propuseram, respectivamente, o conceito de perfeito equilbrio de subjogo como refinamento do equilbrio de Nash e uma distino precisa dos compromissos, onde eles so obrigatrios e quando no so plenamente factveis; bem como a teoria dos jogos de informao incompleta, para jogadores que tm de se valer da probabilidade, a fim de encontrarem uma soluo. Em 1972, John Maynard Smith (1920-2004), bilogo evolucionista ingls, introduz a idia de estratgias evolutivamente estveis (EEE, ou ESS, sigla de evolutionarily stable strategy) em uma teoria dos jogos evolucionrios que transformou a biologia em uma das disciplinas que mais empregam a teoria dos jogos na anlise dos problemas trabalhados. Em 1979, Daniel Kahneman - psiclogo israelense que ganhou o prmio Nobel de economia de 2002 -, ao lado de seu colega e compatriota, Amos
10
. Veja HOLLIS, M. Trust within Reason, cap.8, p. 162.
Tversky (1937-1996), publicou a Teoria das Perspectivas (Prospect Theory) como uma resposta aos desafios e crticas feitos por Allais, anos antes, sobre os aspectos psicolgicos dos conceitos de utilidade e racionalidade adotados pela Teoria dos Jogos. Os problemas que Nash havia percebido nos jogos repetidos foram aprofundados na teoria de Maynard Smith, cujo principal livro, Evolution and the Theory of Games, fora lanado em 1982, e na Teoria da Cooperao de Robert Axelrod, iniciada em 1984 no seu The Evolution of Cooperation. Da em diante, a Teoria dos Jogos deixa de ser assunto exclusivo de economistas e matemticos, passando a ser discutida abertamente por cientistas das mais diversas reas do conhecimento. A biologia evolutiva destacouse, mas tambm a psicologia, a neurologia e alguns filsofos mais avanados foram atrados pelos jogos e sua capacidade de modelar o comportamento de agentes (racionais ou no) envolvidos numa interao e interessados nos resultados que os favoream preferencialmente. Estgio Atual Muitas correntes, alm daquelas apontadas aqui, derivaram da Teoria dos Jogos e no exagero dizer que milhares de artigos nos mais diversos campos tm sido publicados todos os anos. Depois que Axelrod popularizou os torneios com simulaes de estratgias para o Dilema do Prisioneiro Iterado (DPI), uma nova abordagem completamente diferente da tradio filosfica surgiu para avaliar a cooperao e o modo de interao entre agentes com um grau mnimo de racionalidade. Desde ento, comeou-se analisar como a cooperao, paradoxalmente, poderia emergir mesmo entre sujeitos egostas, interessados, primeiro, em satisfazer seus desejos imediatos de sobreviver e reproduzir. Qualquer que fosse o cenrio, determinista ou indeterminista, simultneo ou alternado, se constatou que o entendimento mtuo poderia ocorrer, desde que aplicada a estratgia adequada para cada situao. Outros modelos de jogos criados mostraram isso mais de perto. No jogo conhecido como Ultimato, pode-se perceber com nitidez a necessidade da atuao do comportamento equitativo para a soluo alcanada. N'outro modelo, chamado de Bens Pblicos, o papel da punio e de um agente institucional so detectados no sentido de fazer valer os compromissos estabelecidos. A tais atributos equidade e funo do Estado -, que so centrais na filosofia poltica e na tica, acrescenta-se ainda o elemento discursivo, que em alguns jogos falados, no cooperativos, podem refinar a soluo, quando vrios equilbrios so acessveis. A simulao por meio de jogos tornou-se ainda um elemento essencial na concepo de um programa de pesquisa, chamado Vida Artificial, que amplia as fronteiras da Inteligncia Artificial a todo sistema de interao dos seres vivos. Do comportamento dos vrus a grandes imprios da histria, o ciclo de "origem-escaladaapogeu-declnio" reproduzido vrias vezes em computadores, com objetivo de desvendar o programa que subjaz evoluo, de um modo geral. Tamanha diversidade de aplicaes impede que o assunto tratado por este livro adote uma postura exaustiva e detalhada que mereceria o fenmeno interdisciplinar da Teoria dos Jogos. De acordo com os propsitos adotados, pretende-se enfatizar a apresentao nos conceitos e princpios bsicos da Teoria dos Jogos e da Cooperao, nos pontos de interesse direto aos filsofos prticos (tica e poltica), destacando, na primeira parte, o papel da comunicao e, na segunda, o mtodo da simulao e os jogos onde se emerge a equidade e o papel de instituies, como o Estado.
1.1
A Estrutura do Jogo: Conceitos e princpios
A palavra "jogo", que d nome teoria, foi alvo de diversos malentendidos desnecessrios. Muitos consideravam a Teoria dos Jogos como algo frvolo, pouco srio, ou simplesmente no-cientfico, dada sua origem em estudos de jogos de salo, como pquer, xadrez ou "pedra, papel e tesoura". Por ter sido gerada num ambiente predominante de homens e antes dos movimentos sociais exigirem do mundo acadmico a colocao de expresses "politicamente corretas", a teoria est povoada por conceitos cujos termos fazem referncias "batalha dos sexos", "conversa barata" (cheap talk), "blefe" e "pato" (sucker), entre outros jarges menos chocantes. Tecnicamente, no entanto, essa m impresso desfaz-se quando se percebe que a aparente simplificao das relaes entre indivduos fornecida pela formalizao matemtica da teoria permite analisar com uma preciso at ento desconhecida nas cincias sociais o comportamento dos agentes "racionais", humanos ou no. Para a Teoria dos Jogos, um jogo definido por um conjunto de regras que estabelece seus cinco elementos constitutivos11: 1. o nmero de participantes; 2. as aes ou estratgias possveis; 3. os resultados de cada jogador; 4. a funo que permite a cada parte combinar suas estratgias e 5. a relao de preferncias de cada um diante dos resultados. Alm disso, as regras delimitam o grau de informao permitido aos agentes. Os jogos so representaes simplificadas de situaes onde pelo menos uma pessoa age no sentido de maximizar a utilidade de suas aes levando em conta as reaes de outros agentes. Trata-se, portanto, da descrio formal de uma situao interativa estratgica em que as partes devem resolver qual a melhor deciso a ser tomada, segundo o ponto de vista de um agente capaz de computar quais meios sero necessrios para obteno do fim esperado. Por conseguinte, um jogador possui como requisito mnimo uma racionalidade instrumental ou estratgica. Jogos com apenas uma pessoa so considerados jogos contra a natureza (ou Sorte) - nico agente considerado no-racional, mas que pode gerar indeterminao aos resultados, que passam a ser influenciados pela lei da probabilidade. A rigor, no h empecilhos formais para o estudo de jogos com um nmero infinito de participantes, embora seja mais frequente a pesquisa dos casos que envolvem duas partes, cuja visualizao pode ser feita facilmente na forma dita normal, ou estratgica, e na forma extensiva. Na sua representao normal, os jogos so exibidos em matrizes nas quais as estratgias de cada jogador so listadas respectivamente nas linhas e colunas. Em cada clula da tabela aparecem os ganhos que cada uma das partes obter caso realize as aes s quais ambas esto vinculadas. Os ganhos do jogador da linha so grafados na primeira posio, esquerda do par ordenado, e os do jogador da coluna vm aps a vrgula que os separa, direita. A figura 1.1 traz a tabela geral da forma estratgica: As matrizes so tabelas que servem para apresentar de forma compacta as respostas que podem ser esperadas em funo das aes escolhidas simultaneamente. Aqui a ordem em que os jogadores atuam irrelevante ao resultado. Tambm so
11
Para um jogo de forma normal, ou estratgica, apenas os trs primeiros elementos so necessrios definio, mas para jogos no cooperativos os dois ltimos itens so relevantes, com ensina WERLANG, S.R.da C. Jogos de Informao Incompleta, p. 2.
10
desconsideradas a quantidade de vezes que os jogos se repetem, sendo a sntese de todos jogos possveis em suas rodadas infinitas, ou indeterminadas. A matriz concentra as informaes disponveis a cada jogador por igual. Por outro lado, dificulta a incluso de um nmero muito grande de jogadores. Acima de dois jogadores, a representao deixa de ser bidimensional e passa a ser tridimensional, com trs participantes, ou multidimensional, para mais de quatro jogadores.
Figura 1.1 Matriz Geral de Estratgias Puras 1 2 : : x1 : : xm Coluna 1 f(1, 1) 2 .... y2 .... yn
f(1, 2) .... f(1, y2) .... f(1, yn)
Linha
f(2, 1) f(2, 2) .... f(2, y2) .... f(2, yn) : : : : : : : : f(x1, 1) f(x1, 2) .... f(x1, y2) .... f(x1, yn) : : : : : : : : f(xm , 1) f(xm , 2) .... f(xm , y2) .... f(xm , yn)
Jogos em que os detalhes omitidos pela forma estratgica so relevantes ficam melhor representados na descrio completa fornecida pela forma extensiva, desenhada no modelo estrutural de "rvores". No esquema de rvores, a ordem deliberativa de cada jogador observada, bem como o conjunto de informaes de cada um. Os pontos apresentados - ou "ns" - so as decises disponveis e os traos - ou "ramos" - as alternativas de movimento e as aes que levam de um n a outro, desde o ponto inicial - ou "raiz" - at o resultado final em cada terminal ou folha. O caminho traado, da raiz folha, delineia todas as estratgias que podem ser realizadas. Motivo pelo qual as rvores s devem ser empregadas em jogos finitos. A forma extensiva permite uma anlise direta da situao, j que apresenta toda estrutura das jogadas e das informaes disponveis de uma vez. Observando os ns e ramos da rvore, podem ser percebidos o nmero de jogadores, suas opes nos pontos de deciso, as posies intermedirias ou movimentos - at os pontos terminais e a quantidade de jogadas a cada passo executado12. O conjunto de informao de cada jogador limitado em cada rodada por uma linha que circunda os ns de deciso. Quando o jogador tem certeza em qual n se encontra, este conjunto de informao unitrio. Cada n e conjunto de informao rotulado com o nmero ou letra de cada jogador, enquanto os ramos so rotulados com as alternativas de ao que partem de cada n. As rvores so apropriadas para os jogos sequenciais, onde os agentes se movimentam numa ordem predeterminada (figura 1.2). No exemplo da figura 1.2, v-se a raiz, representada pelo ponto aberto "a", corresponder ao conjunto unitrio de informao inicial do jogador I, que tem duas linhas de ao a sua escolha, 1 ou 2. O jogador II dever na sequncia escolher tambm entre suas opes 1 ou 2. Contudo, dependendo do n em que se localize, "b" ou "c", poder levar com que a natureza, jogador 0, venha executar o prximo movimento, caso sua alternativa 1 seja adotada a partir do n "b". Assim, haveria a probabilidade dos resultados de "R1" a "R3", ocorrerem nas propores que nomeiam seus respectivos ramos. De outro modo, se II selecionasse a estratgia 2, desde o ponto de deciso "c", o jogador III entraria em cena para optar por uma de suas trs aes que conduzem aos ganhos de "R8" a "R10". Do contrrio, as demais alternativas retornam a I a chance de escolher entre "R4" e "R5", decidindo a partir de "e", ou "R6" e "R7", saindo de "f". Todos
12
. Veja SHUBIK, M. Teora de Juegos en las Ciencias Sociales, III.3.1 a III.3.3, pp. 48-53.
11
os dez resultados possveis deste exemplo distribuiriam, ao final, os pagamentos devidos aos trs jogadores envolvidos (I, II, III), j que a natureza (0), embora possa atuar como um agente irracional gerador de incerteza, no obtm nenhum ganho das aes empreitadas.
Figura 1.2
A definio mais geral da forma extensiva para jogos com n-pessoas foi estabelecida por Harold W. Kuhn, em 1953, no artigo "Extensive Games and the Problem of Information", ampliando a verso apresentada por John von Neumann, em 1928. A chamada rvore de Kuhn atende a sete condies: i. Um conjunto de n jogadores; ii. Estrutura de rvore enraizada, chamada rvore do jogo; iii. Partio do conjunto de ns em diversos subconjuntos, entre os jogadores; iv. Distribuio de probabilidade rotulando cada ramo brotado de um n do subconjunto da natureza, jogador 0; v. A formao de conjunto de informaes para cada subconjunto de ns de um jogador deve respeitar (a) o mesmo nmero de ramos correspondentes, saindo de cada n diferente, e (b) cada caminho, partindo da raiz folha, s pode cruzar um conjunto de informao uma nica vez; vi. Cada folha contm, ao final, os pagamentos resultantes a cada jogador; vii. E, por fim, a descrio completa da rvore de conhecimento comum a todos jogadores. Ou seja, cada um sabe o que os outros tambm sabem13. Tantos os jogos cooperativos como os no-cooperativos - duas das principais divises dos modelos de jogos tericos que so abordadas a seguir - podem ocorrer em condies cujas tomadas de decises dos participantes so feitas simultaneamente, em sequncia ou a cada vez que os jogos so repetidos. Os jogos simultneos so aqueles em que as escolhas das estratgias acontecem ao mesmo tempo, sendo de preferncia representados por matrizes. Quando a ordem de atuao influencia o seu desenvolvimento, os jogos so chamados sequnciais. Nos jogos sequenciais finitos, a melhor forma de representao se d por meio do esquema de rvores. Por fim, os jogos repetidos exigem que as mesmas opes de estratgias sejam exibidas em rodadas sucessivas, nas quais os jogadores tm de decidir novamente se mantm suas escolhas
. Veja HART, S. "Games in Extensive and Strategic Forms", in AUMANN, R. & HART, S. Handbook of Game Theory with Economic Application, vol. 1, cap. 2, 1, pp. 22/5.
13
12
anteriores ou trocam de alternativa. A iterao que ocorre nesse ltimo tipo de jogo faz surgir misturas de estratgias que no poderiam levar a uma soluo equilibrada, quando jogadas de uma nica vez, na condio pura do jogo base apresentado na primeira rodada. Jogos repetitivos tambm so chamados de superjogos. Nos superjogos, a memria exerce um papel crucial na construo de um equilbrio que se torna muito difcil quando as aes dos jogadores no so plenamente recordadas ou so perturbadas pelo acaso. Os superjogos servem de base aos modelos de simulao utilizados em larga escala pela biologia, cincia da computao e demais cincias. Informaes Conforme a possibilidade ou no de comunicao e a quantidade de informao acessvel, os jogos podem ser divididos em cooperativos ou no-cooperativos, de informao completa ou incompleta, perfeita ou imperfeita. Jogos cooperativos so aqueles em que a comunicao prvia permitida entre os jogadores, antes de decidirem a estratgia que adotaro durante o jogo. Com isso, acordos irrevogveis e automotivantes so passveis de estabelecimento. Para ser eficaz, a comunicao precisa ser livre de distoro e sem qualquer custo para os falantes, isto , a emisso de mensagens no implica em uma alterao direta da matriz original do jogo. Entretanto, embora a comunicao, primeira vista, parea facilitar a realizao de contratos, tambm abre espao para imposio de coalizes, ameaas e blefes que perturbam a produo dos melhores resultados para uma das partes. Uma viso mais abrangente do papel da comunicao ser discutida de perto no prximo captulo, dedicado a esse tema importante para a Teoria dos Jogos. Jogos no-cooperativos probem que a comunicao prvia seja estabelecida, apesar de haver situaes em que a sinalizao acontece, bem como o encontro de convenes que ajudam a coordenar as aes dos agentes, com base no conhecimento comum partilhado pela cultura, convvio social ou capacidade cognitiva dos jogadores. Nestas ocasies, um efeito chamado de "telepatia" emerge como forma de comunicao implcita entre falantes de uma mesma lngua ou habitantes de uma mesma regio ou grupo social, dotados de mentes semelhantes e conhecimento comum. De todo modo, sendo ou no implementada a comunicao, quando os jogadores tm pleno conhecimento do nmero de participantes, da posio que cada um ocupa em cada etapa do jogo e dos resultados que todos podem obter, diz-se que o jogo de informao completa. Na falta de um desses elementos informativos, o jogo de informao incompleta e as caractersticas sobre o tipo dos jogadores deixam de ser de conhecimento comum, quebrando a simetria entre eles. Em jogos de informao perfeita, por meio de induo reversa, os jogadores podem conhecer toda histria do jogo, antes mesmo de tomarem suas decises. Todos conjuntos de informao de uma rvore de jogo de informao perfeita so unitrios. O que vale dizer que cada parte sabe em qual n de um jogo sequencial est. Caso contrrio, o jogo chamado de informao imperfeita. Os participantes que se lembram, a cada rodada, de todos os lances anteriores efetuados desde o incio do jogo possuem memria perfeita, enquanto nos jogos em que no possvel ter toda essa informao do passado so chamados de memria imperfeita. Uma maneira de trabalhar a falta de informao na modelagem dos jogos introduzir a natureza como uma parte atuante em alguma jogada. Assim, as incertezas dos demais jogadores, em relao definio das regras, podem ser interpretadas como probabilidades subjetivas, que a psicologia dos jogadores trata de estabelecer. Em
13
diversos textos do final dos anos 1960 - onde se destaca "Games with Incomplete Information Played by 'Bayesian' Players" (1967-68) -, John Harsanyi sistematizou essa situao tratando os agentes como jogadores "bayesianos", isto , aqueles cujas incertezas podem ser operadas atravs de uma distribuio da probabilidade subjetiva conjunta partilhada por todos14. Embora a aplicao destas idias seja dficil de ser observada por humanos e outros animais no seu dia-a-dia, o modelo de Harsanyi serviu para descrever as circunstncias em que a informao assimtrica, quando algum dispe de um conhecimento privilegiado sobre os ingredientes do jogo que no de domnio dos outros envolvidos na mesma situao dos jogos chamados de informao incompleta. De uma certa forma, tambm foi uma resposta proposta feita por Thomas Schelling no segundo apndice de The Strategy of Conflict para o abandono da simetria na Teoria dos Jogos. A adoo desta sugesto trazia algumas dificuldades para a teoria, uma vez que o equilbrio de Nash tinha como condio a simetria entre os jogadores, apesar da maioria dos casos interessantes envolver movimentos assimtricos. A soluo de Harsanyi produziu, ento, equilbrios Bayes-Nash para cada tipo de jogador que maximiza os valores esperados de acordo com as estratgias seguidas pelos outros, subentendendo a incerteza quanto ao tipo do outro jogador, que pode ser diferente tendo em vista a crena subjetiva na probabilidade prvia de distribuio desses tipos na natureza15. A crena prvia comum a expectativa que todos jogadores tm sobre o modo da natureza produzir alternativas de forma aleatria. Tal crena nada mais , portanto, que o conhecimento comum da probabilidade estimada de que um tipo de jogador venha fazer parte do jogo. De posse dessas informaes os jogadores podem avaliar suas escolhas a partir de probabilidades predeterminadas de que esteja enfrentando um tipo diferente ou semelhante de respectivos oponentes. Toda essa discusso, entretanto, depende da maneira que a comunicao tratada, tema que ser mais desenvolvido, como j foi prometido, no segundo captulo. Soma Zero ou Varivel Jogos no-cooperativos incluem, entre outras, uma categoria de confronto de interesses que definida como estritamente competitiva. So situaes extremas nas quais para um jogador ganhar, o outro tem necessariamente de perder, ou ento as partes terminam o jogo sem saldo algum. Nos assim chamados jogos de soma zero, no h possibilidade de cooperao entre dois agentes egostas, j que seus interesses so totalmente opostos. Contudo, com mais de duas pessoas, coalizes de jogadores podem ser formadas contra a outra parte, motivo pelo qual os jogos passam a ser considerados
14
. Harsanyi aplicou em trs artigos sucessivos chamados Game with Incomplete Information Played by Bayesian Players (Jogos com Informao Incompleta Jogados por Jogadores Bayesianos, 1967-68) a estatstica bayesiana em jogos em que os participantes no so totalmente informados e tm incerteza quanto aos resultados obtidos, com intuito de achar uma soluo racional para esses casos. A contribuio de Thomas Bayes (1702-1761), neste caso, resume-se ao seu mtodo de encontrar a probabilidade de ocorrncia de determindas causas, antes do evento qualquer ser observado. Pelo teorema de Bayes, a probabilidade (P) de uma hiptese (h), ou informao, dada a sua evidncia (e), ou evento, igual ao produto das probabilidades da hiptese e da evidncia dividida pela hiptese, sendo o resultado uma frao da probabilidade da evidncia, ou P(h|e) = [P(h) P(e/h)] P(e). A frmula de Bayes um mtodo algbrico til para determinao dos valores quando o esquema de rvore tem muitas alternativas que tornam sua construo muito complexa. 15 . Veja SCHELLING, Th. C. The Strategy of Conflict, ap. B, pp. 277 e ss; VARIAN, H. R. Intermediate Microeconomics, cap. 15, 15.12-13, pp. 279/82 e FIANI, R. Teoria dos Jogos, cap. 7, pp. 175 e ss. para introduo ao assunto.
14
cooperativos, admitindo a influncia da comunicao prvia. No obstante, a soma dos resultados de todos os jogadores envolvidos nessa interao sempre igual a zero. Na matriz de jogos de duas pessoas e soma zero, por conveno omite-se os relativos coluna, que passam a ser inferidos a partir do resultado expresso para a linha, multiplicado por menos um (figura 1.3).
Figura 1.3 Matriz de Coluna Jogo de Soma Zero Estratgias Pedra Papel Tesoura Pedra 0 -1 1 Linha Papel 1 0 -1 Tesoura -1 1 0
De acordo com o teorema de Zermelo, publicado em 1913, no artigo "ber eine Anwendung der Mengenlehre auf die Theorie des Schachspiels" (Sobre uma Aplicao da Doutrina Mista Teoria do Jogo de Xadrez), jogos finitos de soma zero com informao perfeita so estritamente determinados. Qualquer um dos jogadores tem a sua disposio uma estratgia capaz de garantir a vitria, ou ao menos o empate, a despeito de como o adversrio atuar. Tal pressuposto pode ser demonstrado por contradio: ao admitir-se que um jogo soma zero finito, com informao perfeita, no estritamente determinado, deve-se supor que nenhum jogador possui uma linha de ao que, desde o incio do jogo lhe traga a vitria, posto que, do contrrio, o oponente no poderia encontrar outra que o permitisse vencer. Assim, o primeiro lance do jogo no ser uma posio vitoriosa, qualquer que seja a posio inicial. Caso houvesse, o primeiro jogador mover-se-ia imediatamente para l. Alm disso, tal posio tambm no ser vitoriosa para o adversrio, pois se fosse assim teria desde o incio condies de ganhar o jogo. Por conseguinte, se a primeira jogada no assegura vitria, a segunda tambm no a garante, muito menos as demais, at o infinito. Contudo, se o jogo finito, tem de haver uma posio final, na qual um dos jogadores alcance a vitria ou o empate. Logo, a condio da finitude do jogo contradiz a afirmao de que o jogo no estritamente determinado, demonstrando, ento, a validade do Teorema16. Pedra, Papel ou Tesoura no um jogo estritamente determinado por ser simultneo e, portanto, de informao imperfeita, pois, qualquer estratgia que venha a ser adotada pode ser vencida por uma outra adequada do adversrio17. Ambos escolhem suas aes ao mesmo tempo, sem saber qual ser a deciso do outro, o que torna impossvel uma soluo usando apenas as estratgias puras. No h, como se ver mais adiante, uma estratgia dominante, ponto de sela, ou equilbrio entre as opes dos jogadores nessa circunstncia. J o xadrez, tal como o jogo da velha, estritamente determinado. Os jogos de soma zero tiveram sua anlise esgotada em Theory of Games and Economic Behavior, de John von Neumann e Oskar Morgenstern. E durante o curto perodo que antecedeu a tese de John Nash, mesmo os jogos de soma diferente de zero poderiam ser tratados como de soma zero, bastando para tanto, introduzir um jogador a mais que assumisse as perdas da totalidade ganha pelos outros jogadores. Como propunham Von Neumann e Morgenstern, esse jogador "no teria influncia direta no
16 17
. Veja DAVIS, M. Teoria dos Jogos, cap. 2, apndice, p. 32/4. O tradicional Pedra, Papel ou Tesoura (originrio do Japo) um tpico jogo simultneo de soma zero. Quem escolhe a estratgia "pedra" (mo fechada) quebra "tesoura" (dedos indicador e mdio abertos), empata com "pedra" e perde de "papel" (mo aberta). "Papel" cobre a "pedra", empata com "papel" e perde de "tesoura". Esta, por fim, corta "papel", empata com "tesoura" e perde de "pedra".
15
curso do jogo"18. Seu papel, embora fictcio, muitas vezes poderia ser associado funo exercida pela natureza, ou o tesouro nacional de um pas qualquer, nos jogos de uma ou mais pessoas em que os recursos naturais ou monetrios so partilhados pelos jogadores que tomam a deciso de dividir esses bens entre si. Nesses casos, a natureza ou o tesouro assumiriam os prejuzos ou absorveriam os excedentes gerados pela interao dos demais jogadores. Muitos autores consideram a reduo dos modelos de jogos soma zero de pouca utilidade para as cincias sociais, pois, como lembra Silvia Nasar, "at mesmo na guerra h, quase sempre, algo a ser obtido da cooperao"19. No obstante essas opinies, reconhecer jogos de soma zero, numa escala mais ampla, ajuda a entender melhor os problemas ambientais, na perspectiva da tragdia dos comuns apresentada pelo bilogo Garrett Hardin (1915-2003) no artigo The Tragedy of the Commons, de 1968. Hardin imaginou a situao de pecuaristas que mantm a maior quantidade de gado possvel em terras devolutas, sem dono, mas de uso comum. Tudo vai bem enquanto o crescimento vegetativo da populao fica abaixo da capacidade da terra se recuperar. Porm, paradoxalmente, quando as metas de bem estar social conseguem tornar prsperas as vidas das pessoas, o nmero crescente de gado no pasto, acaba por levar runa os criadores que buscam maximizar o seu ganho com a venda de carne ou leite, uma vez que o custo de manuteno de cada animal no pode mais ser suportado pelos recursos "gratuitos", mas limitados da natureza20. O mesmo acontece com o crescimento populacional, a poluio, a devastao das florestas e todo tipo de ao que vise tirar proveito das externalidades dos bens pblicos. No obstante, jogos que no so estritamente competitivos permitem aos participantes preferirem opes que no esto em total oposio entre eles. Um jogador pode desejar obter um resultado que o favorea, sem necessariamente causar prejuzo ao outro. O que no possvel em jogos de duas pessoas e soma zero. Ademais, jogos de soma variante, diferente de zero, ao serem repetidos vrias vezes podem promover a cooperao, apesar de nenhuma comunicao prvia ter ocorrido. Atravs de vias indiretas, como a sinalizao, convenes ou encontro de pontos focais, tacitamente, as escolhas de estratgias favorveis entre as partes acontecem assim que uma soluo nica se mostre ntida a todos de modo semelhante. Ao contrrio dos jogos de soma zero, onde uma soluo direta passvel de ser encontrada por meio de estratgias minimax, ou maximin - abordadas no prximo ponto -, os de soma varivel apresentam caractersticas de competio e cooperao que dificultam bastante a busca de uma soluo que seja aplicvel a todos os casos. Sem embargo, a abordagem ampla de jogos no estritamente competitivos e de soma diferente de zero s foi possvel depois de John Nash ter descoberto para os jogos nocooperativos uma soluo geral que abrangeu tambm os cooperativos. Enquanto nos jogos cooperativos os acordos obtidos tornavam obrigatria sua execuo, nos jogos no-cooperativos no fica claro se os contratos possveis sero cumpridos, em parte ou em sua totalidade, como ocorre quando se defrontam seres egostas, dotados de racionalidade instrumental, que usam de qualquer meio para satisfazerem seus interesses imediatos. A prova da existncia de um ponto de equilbrio, do qual nenhum jogador poderia fugir unilateralmente sem afetar o resultado do outro, serviu no s para
18 19
.VON NEUMANN, J. & MORGENSTERN, O. Theory of Games and Economic Behavior, p.506. . Veja NASAR, S. Uma Mente Brilhante, cap. 9, p. 120. 20 . Veja HARDIN, G. "The Tragedy of the Commons".
16
resolver os problemas formais restritivos da Teoria dos Jogos cooperativos, mas fez com que as cincias sociais pudessem aplicar esse tipo de ferramenta de anlise fora dos domnios da economia e da matemtica. De qualquer maneira, todos os jogos proporcionam a oportunidade de avaliar formalmente a relao das listas de preferncias manifestas, de duas ou mais pessoas. Contudo, durante o desenrolar das partidas, aspectos psicolgicos esto a todo momento ameaando a manuteno da racionalidade estratgica pressuposta pela Teoria da Utilidade adotada no modelo de jogos. Utilidade um dos diversos termos da teoria que causam confuso entre os filsofos, uma vez que a moderna teoria da utilidade traada por Von Neumann e Morgenstern difere em muitos pontos da antiga noo de utilidade que subjaz, principalmente, ao Utilitarismo dos seguidores de Jeremy Bentham (17481832) - sobretudo o carter moral que obrigaria aos governos maximizar a utilidade da maioria da populao, sem considerar os ganhos individuais em primeiro lugar21. Utilidade Tudo que Von Neumann e Morgenstern pretendiam construir com o livro de 1944 era um mero procedimento matemtico que pudesse servir como instrumento de anlise de situaes em que se pode comparar as utilidades das pessoas envolvidas. Em outras palavras, o problema da comparao das utilidades era visto como uma tentativa de avaliar o conjunto de possibilidades de atuao de um agente (indivduo ou grupo), com objetivo de maximizar ou minimizar a sua satisfao ou frustrao, segundo uma lista de preferncias. O que no quer dizer que a maximizao da utilidade tenha de contemplar apenas interesses mesquinhos ou egostas, no sentido de exclusividade. Irm Dulce (1914-1992) ou a Madre Teresa de Calcut (1910-1997), ao buscarem fornecer o mximo de recursos aos pobres e miserveis, no Brasil e na ndia, respectivamente, estavam tambm, do ponto de vista da teoria dos jogos, maximizando seus prprios interesses. Como diria o psiclogo e matemtico canadense Anatol Rapoport, "no h contradio entre esse impulso de caridade e a maximizao da utilidade"22. A seleo da linha de ao que ser adotada faz-se sob condies de certeza, risco, incerteza ou, como Luce e Raiffa acrescentaram, luz de evidncias empricas que misturam risco e incerteza23. Num cenrio de certeza, sabe-se que cada ao conduzir invariavelmente a um resultado especfico. Sob risco so tomadas as decises cujas aes levam a um dos possveis resultados esperados a uma taxa de probabilidade conhecida - como os 50% de chances de sair ou cara ou coroa no lanamento de uma moeda ao ar. A incerteza diferencia-se do risco pelo fato da probabilidade no ter uma proporo fixa predeterminada - as chances de chover amanh, por exemplo. Para que as escolhas sejam plausveis, um conjunto de axiomas propostos por Von Neumann e Morgenstern e sustentado por vrios autores postula, em geral, que haja pelo menos: a. ordenamento das alternativas; b. transitividade das preferncias; c. continuidade;
21
. O que no impediu o psiclogo Daniel Kahneman de tentar uma aproximao entre os dois conceitos no artigo "Experienced Utility and Objective Happiness" (2000), includo na coletnea KAHNEMAN, D. & TVERSKY, A. Choice, Values and Frames, bem como Harsanyi de defender a validade do utilitarismo frente a outras teorias morais, com base na teoria dos jogos (em HARSANYI, J. "Game and Decision Theoric Models in Ethics"). 22 . RAPOPORT, A. Lutas, Jogos e Debates, part. II, cap. VI, p. 97. 23 . De acordo com LUCE, R. D. & RAIFFA, H. Games and Decisions, 2.9, p. 37.
17
d. combinao e substituio delas por chances de obteno de um ganho ao qual se indiferente. O ordenamento das preferncias, ou indiferena, exige que o jogador prefira uma oportunidade a outra ou seja indiferente s duas. Assim, para o terico dos jogos no haveria coisa alguma que no fosse passvel de comparao com outro objeto, alvo de crena ou desejo. Na comparao entre objetos, a probabilidade de obteno de um outro qualquer, sorteios compostos, nos quais se passa de um sorteio para o outro, podem ser reduzidos a uma simples loteria em que a probabilidade final de alcanar um resultado incorpora as chances de cada ramo que traa o caminho que leva at o n terminal. A transitividade das preferncias e indiferenas das coisas e loterias uma relao que evita a circularidade e inconsistncia que tornariam praticamente intratvel a teoria da utilidade. Pois, se algum prefere "A" a "B" (A > B) e "B" a "C" (B > C), conclui-se que tambm prefira "A" a "C" (A > C), ou seja indiferente caso haja indiferena entre "A" e "B" (A = B) e "B" e "C" (B = C). Se a probabilidade de ganhar algo desejado for indiferente posse de um outro objeto de ganho certo, o jogador dever arriscar-se ao sorteio sempre que existir um nmero racional entre 0 e 1 ao qual se esteja indiferente entre uma loteria que envolva o objeto mais querido e a posse de outra coisa inferior. O que, em resumo, equivale a dizer haver uma continuidade na lista de preferncias de um agente e um ponto em que se possa estabelecer comparaes entre elas: "tudo tem seu preo". Por conseguinte, exige-se que um sorteio possa ter um de seus prmios substitudo por outro, permanecendo as demais alternativas inalteradas, sem que se mude as preferncias do jogador entre o prmio original e o substituto, de modo que a primeira loteria e a nova sejam indiferentes. Ou seja, um jogador que se mostrar indiferente entre um prmio novo e o anterior, tambm dever s-lo quanto s duas loterias propostas nas mesmas condies. Assim, se uma substituio provocar uma melhoria na premiao, a loteria modificada dever ser melhor que a original. Tal pressuposto conhecido ainda como a hiptese de independncia das alternativas relevantes, ponto crucial na discusso que o economista francs Maurice Allais estabeleceu em 1953. Afinal, havendo a possibilidade de mais de um sorteio ocorrer, aquele cuja probabilidade de obteno de algo que seja melhor for maior dever ser o escolhido, de acordo com uma ltima condio chamada monotonicidade. A funo de utilidade, portanto, faz a associao de nmeros s preferncias e s circunstncias em que a sorte leva a resultados finais almejados. Ela permite a comparao das utilidades de diferentes pessoas como medidas intervalares de escalas diferentes ou mesmo desconhecidas. Como explica Rapoport, o ponto zero e a unidade das escalas podem ser arbitrrios, bastando apenas a determinao da proporo de cada par de diferenas da utilidade, do mesmo modo que se comparam as escalas de temperatura, seja em graus Celsius, Fahrenheit ou Kelvin24. Entretanto, a pretenso de quantificar qualquer objeto que seja alvo do interesse de um agente, incluindo sentimentos subjetivos, abriu espao para diversas especulaes, apoiadas em experimentos laboratoriais e de campo. Allais argumentou que indivduos, em geral, no consideram as probabilidades objetivas em suas decises, mas adotam probabilidades subjetivas, representaes psicolgicas, quando defrontados a situaes de risco. Na prtica, isso poria abaixo os axiomas de independncia forte ou substituio. Entre escolhas de ganhos certos e indeterminados como neste exemplo em que a...
. Veja RAPOPORT, A. Op. cit., part. II, cap. VI, pp. 98 e ss. para conhecer essa passagem e os detalhes do exemplo esclarecedor da temperatura.
24
18
A. certeza de receber 100 milhes ou a B. probabilidade de 10% de ganhar 500 milhes e 89% de ganhar 100 milhes e 1% de nada obter; ...a maioria das pessoas prefere a opo "A" mais do que "B" (A > B). Contudo, quando o quadro muda e so oferecidas as chances de... C. ganhar 100 milhes a 11% e 89% de nada ganhar ou D. 10% de ganhar 500 milhes e 90% de obter zero ...agora a maior parte responde preferir "C" a "D" (C > D), embora o valor de cada alternativa seja respectivamente: 100 milhes para "A"; 139 milhes a "B"; 11 milhes a "C" e 50 milhes a "D". O que significa que a relao de preferncias entre esses resultados no preserva os mesmos valores em circunstncias objetivamente semelhantes, pois o desejo pelo ganho certo que a maioria das pessoas manifesta, quando indica "A > B", no se repete na variao presente em "C > D", cuja diferena de 39 milhes igual nas duas loterias25. Este exemplo fornecido por Allais apontou para uma forte deformao provocada pelos valores psicolgicos sobre a expectativa de resultados, cuja pretenso de satisfao absoluta da utilidade, atravs de escolhas aleatrias, se mostrou invivel, devido aos desvios empreendidos s estratgias preferidas na presena de fatores de risco. Os componentes psicolgicos, que tanto influenciam as decises corretas, tiveram ento de serem melhor avaliados pelos psiclogos e tericos dos jogos que, embora reconhecessem as dificuldades de formalizao do processo amplo de deliberao que envolve os sentimentos emersos de cenrios incertos, percebiam que suas principais falhas recaam sobre a descrio da condio natural do agente e no sobre o mtodo de axiomatizao, propriamente dito, empregado na teoria. As tentativas de Harsanyi ou Kahneman e Tversky, para citar apenas os laureados com Nobel, ajudaram a traar com maior preciso a maneira adequada de se chegar a uma soluo com o uso do clculo das probabilidades e com a percepo dos efeitos da averso e busca do risco nos casos de ganhos e perdas, respectivamente. 1.2 Estratgias Dominantes, Maximin, Mistas e Noo de Equilbrio
Aps estabelecer a lista ordenada de suas preferncias e relacion-las a uma funo de utilidade, os agentes devem estar aptos agora para preencherem as matrizes e os esquemas de rvores, segundo as linhas de ao disponveis. Os valores que cada parte receber com o encontro dessas estratgias depender das escolhas que fizer individualmente. Por princpio, supe-se que todos busquem maximizar seus resultados e, ainda que no consigam, se empenhem para que isto ocorra. A Teoria dos Jogos tem instrumental suficiente para analisar jogos de azar - dados e roleta, por exemplo -, mas vai alm da simples teoria dos jogos de azar que tem sua sustentao na teoria da probabilidade. Enquanto no jogo de azar, a natureza o nico jogador com o qual se tem que defrontar, bastando apenas apurar a utilidade esperada com base no clculo das chances de um resultado acontecer, nos jogos de estratgias - desde o jogo da velha ao xadrez, passando pelos jogos de cartas como pquer, bridge ou sueca - presume-se que haja mais de um jogador racional, cujas deliberaes levam em conta, recursivamente, aquilo que o adversrio far em consequncia de seu raciocnio pressuposto. Ademais jogos de estratgias que envolvem habilidade dos jogadores - como o duelo e os
25
. Veja ALLAIS, M. F. Ch. "Le Comportement de l'Homme Rationnel Devant le Risque", p. 527.
19
esportes olmpicos, em geral - tambm so passveis de estudos semelhantes aos feitos por Martin Shubik em Teoria dos Jogos nas Cincias Sociais, de 1982, onde se avalia o momento exato de se realizar as melhores estratgias disponveis, com as chances adequadas de se acertar o alvo. Para no sobrecarregar demais esta introduo Teoria dos Jogos e da Cooperao, nos concentramos nos jogos de estratgia entre dois jogadores que disponham de duas estratgias (2 x 2) que, embora faam forosas simplificaes, servem de modelo explicativo para um vasto espectro de situaes cotidianas em que os interesses dos jogadores podem coincidir ou divergir em parte. Na perspectiva dos jogos, estratgias so programas que instruem qual linha de ao um jogador adotar durante toda partida, antes mesmo dela comear, dependendo do que o adversrio far. Em termos de jogos extensivos, uma estratgia descreve o caminho que um jogador percorrer desde o seu primeiro lance at o n terminal. Quando o jogo ou a interao entre mais de um agente interessado em satisfazer ao mximo sua utilidade acontece em mais de uma etapa de deciso, as estratgias devem traar um plano de escolhas para cada ponto de deciso, formando uma sequncia completa de movimentos, atravs dos conjuntos de informaes disponveis, tendo em vista os melhores valores oferecidos no final. H uma forte interdependncia das decises que os adversrios tomaro em suas expectativas recprocas do comportamento do outro. O processo de deliberao que visa maximizar os ganhos finais tem, portanto, de compreender adequadamente a capacidade do oponente reagir a suas aes, conforme a conduta esperada entre seres semelhantes, nem sempre racionais de todo. Cada jogador dispe de um conjunto de estratgias puras que podem ser misturadas entre si e combinadas com as dos outros agentes. De acordo com a combinao especfica para as estratgias de diferentes jogadores, os resultados finais para cada indivduo corresponder um ganho prprio que relacionado ou no com a soluo do jogo. Na matriz simples, desenhada na figura 1.4...
Coluna Figura 1.4 Estratgias Linha Alto Baixo Esquerda 1, 1 0, 1 Direita 1, 0 0, 0
...no difcil para as partes coordenarem suas aes em direo ao resultado do alto, esquerda. Pois ambos possuem estratgias dominantes que se encontram naquela clula da matriz 2 x 2. Para Linha, Alto a estratgia que domina Baixo, qualquer que seja a escolha que a Coluna faa. Isto , garante-lhe o melhor ganho (1) caso Coluna jogue Esquerda ou Direita, frente aos ganhos de Baixo (0). Por sua vez, Coluna tem em Esquerda a sua dominante, j que a nica a lhe fornecer um a mais do que o zero da Direita, a despeito do que Linha jogue. Assim, (1, 1) ser o par de recompensas que soluciona facilmente interaes desse tipo entre agentes racionais, sem muitos sustos, graas dominncia de suas estratgias mtuas. Os interesses de ambos convergem para o alto, esquerda. At aqui, nenhum problema em relao aos aspectos psicolgicos da outra parte poder afetar os ganhos esperados de um jogador racional. Coisa diferente enfrentam as pessoas quando uma pequena mudana nos ganhos da matriz passa a comprometer uma eficiente coordenao das aes. A figura 1.5 apresenta dois resultados conjuntos que favorecem ambos jogadores. Agora no h uma estratgia dominante a orientar as escolhas dos dois. No entanto, preciso que os atores cheguem a um acordo sobre quais
20
de suas estratgias conjuntas, (alto, esquerda) ou (baixo, direita), ambos adotaro a fim de maximizar suas utilidades esperadas. Na ausncia de qualquer meio de comunicao ou de uma dica que indique uma regra de coordenao, os jogadores precisam buscar um ponto focal que sirva como sinal para o encontro no lugar adequado. Esse sinal deve estar oculto de tal modo que permita sua localizao de forma rpida, mas no to fcil como no jogo da figura 1.4. A soluo desse enigma s possvel se estiver ao alcance da capacidade racional dos agentes. Alguma experincia comum prvia dever ter sido partilhada antes pelos jogadores, para facilitar o estabelecimento de uma conveno que, na ausncia de uma outra "cola", ser adotada tacitamente pelos participantes de uma mesma cultura. Por exemplo, membros da cultura ocidental, que desde a infncia so acostumados a iniciar a escrita da esquerda para a direita e de cima para baixo, poderiam concordar em selecionar as estratgias "alto-esquerda". Contudo essa dica poderia ser confusa caso "baixo, direita" viesse grafada com letras maisculas ou um mediador confivel sugerisse sua escolha. Segundo Thomas C. Schelling, para situaes como essas a Teoria dos Jogos deveria incorporar habilidades ao agente que vo alm da mera racionalidade estratgica, tais como restries estticas, casusticas e geomtricas que eliminassem as ambiguidades que perturbam os acordos tcitos26.
Figura 1.5 Linha Estratgias Alto Baixo Coluna Esquerda Direita 1, 1 0, 0 0, 0 1, 1
Tanto "alto-esquerda", como "baixo-direita", no constituem a rigor uma soluo para jogos do tipo da figura 1.5. De fato, no sentido que Duncan Luce e Howard Raiffa deram soluo no estrito senso, para ocorrer em jogos no-cooperativos seria preciso: 1. existir um par em equilbrio entre os conjuntos de pares de estratgias admissveis; e 2. que todos os pares em equilbrio admissveis fossem ambos intercambiveis e equivalentes 27 Desde John Nash, um ponto de equilbrio todo aquele que seja o encontro das estratgias timas de cada jogador com as dos adversrio28. Por exemplo, "altoesquerda" est em equilbrio nas Figuras 1.4 e 1.5, enquanto "baixo-direita" apenas na segunda matriz. Entretanto, na Figura 1.4, s "alto-esquerda" uma soluo no estrito senso, embora no seja na Figura 1.5, bem como "baixo-direita". Pois, neste caso, no se pode trocar as estratgias da linha pelas da coluna de modo a formar outros pares equivalentes, ou seja: "alto-esquerda" (1, 1) e "baixo-direita" (1, 1) no so intercambiveis, porque "alto-direita" (0, 0) ou "baixo-esquerda" (0, 0) no formam os mesmos resultados em equilbrio. Para soluo de jogos onde os interesses dos participantes coincidem, a comunicao pode vir a resolver satisfatoriamente, promovendo a cooperao e coordenando as aes. Contudo, em jogos tcitos, quando ela no possvel explicitamente, as dificuldades tcnicas podem ser superadas por normas culturais, convenes ou pontos focais partilhados e pela simetria que assegura um comportamento semelhante aos agentes em jogos cooperativos. Assim que a estratgia comum percebida, no h porque desviar do consenso, sem perdas mtuas.
26 27
. Veja SCHELLING, Th. C. The Strategy of Conflict, ap. C, p. 295. . LUCE, R. D. & RAIFFA, H. Games and Decisions, 5.9, p. 107. 28 . NASH, J. "Non-Cooperative Games", p. 287.
21
Se nenhum acordo implcito previsto, s se pode esperar que o resultado alcanado seja a mdia dos pares em equilbrio, no caso da figura 1.5, meio para ambos jogadores. Ao transformar a matriz da figura 1.5 em jogo de soma zero, como na figura 1.6:
Figura 1.6 Linha Mximo Mnimo Coluna Estratgias Esquerda Direita Alto 1, -1 0, 0 Baixo coluna coluna 0, 0 1 -1 0 0 -1, 1 Mnimo linha 0 -1 0 0 Mximo linha 0 1
Desaparece o interesse por uma soluo que vise coordenar as escolhas conjuntas, uma vez que cada um procura jogar sua estratgia dominante alto e direita, respectivamente, para a Linha e Coluna. O encontro dessas duas estratgias resulta em zero para ambos jogadores, em "alto direita". Um ponto de equilbrio que corresponde ao chamado ponto de sela dos jogos de soma zero. Este representa, para Linha, o mximo dos ganhos mnimos em suas linhas e o mnimo dos mximos de suas colunas. De modo inverso, para Coluna, o mnimo dos mximos em suas linhas e o mximo dos mnimos de suas colunas. Em outras palavras, do ponto de vista da Linha, o ganho menor em uma linha que seja o maior na mesma coluna (maximin); ou, da perspectiva da Coluna, o maior ganho de uma linha que tambm o menor da coluna. Trata-se de uma posio em que cada um dos jogadores procura fazer o melhor para si tendo em vista a oposio do outro, diminuindo ao mnimo suas perdas esperadas. Aqui, a comunicao em nada ajuda a melhorar o resultado final do jogo, pois os interesses so totalmente opostos: para Linha escolher "alto" a nica soluo admissvel, j que se optasse por "baixo", Coluna, ao selecionar "direita", lhe proporcionaria o pior resultado (-1), ao passo que permanecendo no "alto", o mnimo que ganharia seria zero. Por outro lado, Coluna tambm sabe que, se escolhesse "esquerda", poderia perder -1, enquanto "direita" lhe garante ao menos zero29. No jogo de soma zero, o encontro de duas estratgias dominantes correspondem a um ponto de sela. Entretanto, quando no h uma dominncia entre as estratgias, pode haver mais de um ponto de sela ou mesmo nenhum. A existncia de pontos de sela significa que h possibilidade de uma soluo minimax, ou maximin, como fora previsto por Von Neumann e Morgenstern30. Sempre que houver mais de um ponto de sela, todos os resultados sero iguais. No caso desses resultados serem intercambiveis, o jogo ter ento uma soluo no estrito senso, como nos jogos de soma varivel. Estratgias Mistas Embora a soluo maximin parea razovel para jogos de soma constante, quando no h uma um ponto de sela ou a soma diferente de zero, ser necessrio fazer uma mistura que diminua os riscos de perdas ou promova outro ponto de equilbrio que no pode ser alcanado apenas como recurso de estratgias puras ou estritas - aquelas que so listadas nas matrizes bsicas. Quando os interesses no so totalmente opostos ou coincidentes, possvel achar estratgias mistas que ofeream um melhor saldo para ambos jogadores, em equilbrio de Nash. Na prxima matriz, figura 1.7, as
29
. Os detalhes tcnicos dos pontos de sela podem ser apreciados diretamente em VON NEUMANN, J. & MORGENSTERN, O. Theory of Games and Economic Behavior, 13.4.1 a 3, pp. 93-5. Para uma explicao informal, veja RAPOPORT, A. Lutas, Jogos e Debates, part. II, cap. VII, pp. 104 a 109. 30 . Veja VON NEUMANN, J. & MORGENSTERN, O. Op. cit., 17.6, pp. 153-155.
22
circunstncias no so plenamente competitivas ou de mera coordenao das aes. Os agentes devem buscar um consenso sobre qual dos resultados mostrados eles se encontraro, a fim de evitar os piores resultados.
primeira vista, uma rodada de comunicao prvia poderia solucionar o problema, no fosse a tentao de um deles ameaar jogar sua estratgia favorita, cortando, em seguida, a ligao entre os dois. Linha, por exemplo, caso falasse primeiro, afirmaria a disposio de jogar "alto", e ponto final! Sem deixar Coluna outra opo alm de seguir pela "esquerda", pois ganhar um seria melhor do que nada. Imaginar o inverso disso faria com que Coluna dissesse "direita", obrigando Linha jogar "baixo". Tem-se, ento, a situao interpretada por Luce e Raiffa como uma "Batalha dos Sexos", onde um casal teria de decidir qual programa para a noite: ir ao bal ou assistir uma luta de boxe31. A senhorita Linha prefere ir ao Bal com o senhor Coluna, em primeiro lugar. Sua segunda preferncia ir ao Boxe com ele. Ao contrrio, o senhor Coluna prefere esta ltima possibilidade antes de tudo, sendo seu "plano B" ir ao Bal com ela. Na Batalha dos Sexos, nenhuma estratgia pura garante uma soluo para o jogo. Ainda que algum ameace seguir sua estratgia favorita, no raro a retaliao do outro ocorre na escolha de sua prpria estratgia preferida, com intuito de preservar a reputao de pessoa firme que no se curva a ameaas. S o recurso a uma mistura de suas estratgias estritas permite encontrar um resultado que parea satisfatrio para ambos os jogadores. O teorema minimax, ou maximin, ofereceu como soluo para essas circunstncias a aplicao das estratgias disponveis segundo uma taxa de frequncia determinada32. A fim de obter-se a melhor mistura, que garanta, ao menos, o mais alto ganho entre os piores, o mtodo simples para jogos 2 x 2, descrito por Rapoport33 consiste em encontrar a diferena entre as notaes das duas estratgias Alto e Baixo, para o jogador da linha, fazendo depois a razo da segunda diferena em relao primeira. Na figura 1.7, para descobrir sua mistura minimax, a Linha deve subtrair zero de um na estratgia "Alto" e zero de dois na estratgia "Baixo", cuja razo em relao primeira produz 2:1, o que leva a uma proporo de (2/3 Alto, 1/3 Baixo). Por sua vez, Coluna diminui zero de dois e zero de um, esquerda e direita, gerando 1:2 e, em consequncia, (1/3 Esquerda, 2/3 Direita). Agora, ambos jogadores podem calcular o valor esperado para a situao em que se encontram. Linha multiplica a proporo de Alto com a probabilidade da Coluna fornecer-lhe dois ou zero, somando a proporo de Baixo e multiplicando as chances de obter zero ou um, do seguinte modo:
v(l) = 2/3(1/3 2) + 2/3(2/3 0) + 1/3(1/3 0) + 1/3(2/3 1) = = 2/3 2/3 + 1/3 2/3 = = 4/9 + 2/9 = 6/9 = 2/3
E conclui que seu valor ser de 0.66 util (unidade padro da utilidade, na teoria dos jogos; pural utiles). Menos do que um util certo que ganharia em Baixo-Direita. Fazendo as contas de seu valor, Coluna chega concluso semelhante, simetricamente:
31 32
. Em LUCE, R. D. & RAIFFA, H. Op. cit., 5.3, pp. 90 e ss. . Veja RAPOPORT, A. Lutas, Jogos e Debates, cap. IX, pp. 122 e ss. 33 . Em RAPOPORT, A. Op. cit., cap. IX, p. 123.
23
v(c) = 1/3(2/3 1) + 1/3(1/3 0) + 2/3(2/3 0) + 2/3(1/3 2) = = 1/3 2/3 + 2/3 2/3 = = 2/9 + 4/9 = 6/9 = 2/3
Por causa da simetria do jogo, as misturas de estratgias minimax ou maximin garantem aos dois jogadores os mesmos resultados conjuntos (0.66, 0.66), nesta verso da Batalha dos Sexos34. O sucesso que a minimax oferece em jogos de soma zero, ao reduzir ao mnimo as perdas de cada parte, nem sempre garantia de boa escolha em jogos de soma variante. A Batalha dos Sexos no um jogo de soma constante e solues melhores podem ser encontradas, como se ver quando os jogos falados forem analisados na segunda unidade deste curso. Quando se trata de ganhar ou perder, a mistura minimax pode vir a ser o nico conselho a sugerir, como na figura 1.8, montada por Rapoport35.
Figura 1.8 Linha Estratgias Alto Baixo Coluna Esquerda Direita -1 5 3 -5
Semelhante Batalha dos Sexos, aqui no h um ponto de sela que represente a maximin das estratgias puras. A estratgia mista maximin da Linha chega ao valor de 5/7 util com a proporo (4/7 Alto, 3/7 Baixo), da mesma forma que mistura maximin da Coluna (5/7 Esquerda, 2/7 Direita). Com isso, Rapoport conclui que seria prejudicial aos jogadores fugir da aplicao das estratgias mistas, pois, a longo prazo, essa seria a melhor probabilidade para as partes envolvidas nessas circunstncias e outra alternativa seria desvantajosa. Inferncia que Morton Davis contestou em sua introduo notcnica intitulada Teoria dos Jogos, de 1970. Por ser um jogo de soma zero, no haveria porque se acreditar que o uso da mistura maximin seria desvantajosa ou vantajosa para ambos oponentes, pois um ter necessariamente de ganhar ou perder ao realizar suas aes, o que inviabilizaria por contradio a bem sucedida aplicao da estratgia mista pelas partes, ao mesmo tempo. Optar por esta linha de ao seria atraente, graas suposta segurana oferecida de obter aquele resultado. Porm, para Davis isso no passa de "uma questo de gosto pessoal" pela segurana36, uma vez que, ao buscarem outras estratgias, jogadores audazes, amantes do risco tornariam imprevisvel qualquer resultado factual. Apenas um vencer com certeza. S no se sabe quem!? Em razo do teorema minimax, o jogo geral de duas-pessoas, somazero, tem boa base terica. Mas, sendo jogo de informao perfeita, raramente surge na prtica. A dificuldade est no requisito de o jogo ser soma-zero. A presuno essencial sobre que se assenta a teoria a oposio de interesses de dois jogadores. Na medida em que a presuno no seja
34
. A rigor a verso original deste jogo, criado por Luce e Raiffa, proporciona os resultados negativos (-1, -1) para as estratgias Alto-Direita e Baixo-Esquerda; enquanto David M. Kreps constri sua matriz de um modo mais realista assim:
Coluna Estratgias Esquerda Direita Alto 5, 4 1, 1 Linha Baixo 0, 0 4, 5
Para explorar as consequncias destas mudanas, veja 29 e KREPS, D. M. Games Theory and Economic Modelling, cap. 4, pp. 39 e ss. 35 . Veja RAPOPORT, A. Idem, cap. IX, pp. 125 e ss. 36 . DAVIS, M. Teoria dos Jogos, cap. 3, p. 56.
24
vlida, a teoria ser irrelevante e desorientadora. Frequentemente, a presuno parece estar satisfeita, mas, em realidade no o est. (...) (DAVIS, M. D. Teoria dos Jogos, cap. 3, p. 57). Em jogos cuja soma dos resultados diferente de zero, a estratgia mista maximin37 no a nica soluo existente, nem mesmo a melhor. Na Batalha dos Sexos, apesar da comunicao gerar oportunidades de ameaas, em uma rodada prvia isolada, quando se busca a coordenao, a troca indeterminada de mensagens poderia fornecer melhores resultados que a estratgia maximin mista, ampliando o espao de resultados originais at a fronteira de eficincia conhecida como timo de Pareto, na qual nenhum agente obter melhor resultado sem diminuir os ganhos da outra parte, como sugeriram Luce e Raiffa, na possibilidade de comunicao, as partes poderiam concordar em aceitar um mecanismo equnime que permitisse a mesma escolha das estratgias "Alto-Esquerda" ou "Baixo-Direita" na mesma proporo meio a meio. Com isso, cada um obteria 3/2 - somando os ganhos (2, 1) e (1, 2), dividindo-os, depois, por dois, achando (3/2, 3/2) -, bem acima dos 2/3 anteriores38. Equilbrio de Nash O emprego de estratgias mistas recomendvel sempre que as estratgias puras no indicarem uma estratgia dominante, uma soluo em ponto de sela, ou em um ponto de equilbrio. A noo de ponto de equilbrio, em termos da Teoria dos Jogos, foi formalizada por John Nash como uma generalizao da soluo maximin para jogos no-cooperativos de vrias pessoas e soma varivel, no se restringindo somente aos cooperativos de duas pessoas e soma zero. O ponto de equilbrio, nas palavras de Nash, o conjunto de resultados opostos que maximiza os ganhos de cada jogador em face da melhor estratgia do outro39. Nash mostrou que embora pudesse haver jogos em que as estratgias puras no apontassem para ponto de equilbrio, o recurso mistura de estratgia sempre produziria um novo ponto de equilbrio em jogos finitos.
Coluna Figura 1.9 Estratgias Linha Alto Baixo Batalha dos Sexos Esquerda l 2, 1 c 0, 0 Direita 0, 0 l 1, 2 c
Um equilbrio de Nash, ou ponto de equilbrio, portanto, uma combinao de estratgias da qual nenhum jogador pode aumentar seu ganhos unilateralmente, ao mudar de estratgia. Para localizar um ponto de equilbrio em uma matriz, existem alguns mtodos prticos e simples. O jogador deve descobrir a clula na qual o ganho
37
. Em tempo, nos jogos de soma zero as estratgias maximin e minimax so equivalentes, entretanto, nos de soma variante podem haver diferenas. Em todo caso, a mistura maximin sempre corresponde proporo encontrada para as estratgias da Linha ou da Coluna tendo em vista a diferena de seus respectivos resultados, enquanto a minimax calculada em funo dos ganhos recprocos dos oponentes. Veja, por exemplo, LUCE, R. D. & RAIFFA, H. Idem, 6.11, pp. 145 a 150. 38 Nesse caso, as estratgias correlacionadas permitem o encontro de um equilbrio correlacionado no qual cada jogador aceita empregar um mecanismo distribuidor de probabilidades entre os equilbrios de Nash observados, ampliando a utilidade dos jogadores, dentro do conjunto de resultados possveis. Veja AUMANN, R.J. Correlated Equilibrium as an Expression of Bayesian Rationality, pp. 1-18. 39 . Veja nota 27.
25
seja, simultaneamente, o mximo da Linha nas devidas colunas e o da Coluna nas suas linhas. Visualmente, isto pode ser feito com o recurso de setas ou de letras que marquem os mximos da Linha (l) e da Coluna (c), sendo equilbrios de Nash as clulas que contenham as marcas de ambos jogadores ou seja a convergncia das setas. Na matriz da Batalha dos Sexos, descrita h pouco, os equilbrios surgem assim: o encontro das estratgias (alto, esquerda) e (baixo, direita) indicam a existncia de dois pontos de equilbrio que impedem a escolha de uma nica soluo usando s as estratgias puras, motivo pelo qual a mistura de estratgias se faz necessria. Quando um jogo apresenta apenas um ponto de equilbrio pela combinao de estratgias puras sinal que houve o cruzamento de duas estratgias dominantes. Ou seja, estratgias que dominam as outras estratgias de cada jogador, fornecendo o melhor ganho, independente do que o outro faa. Assim, no modelo desenhado na figura 1.10, tambm conhecido como "Dilema dos Prisioneiros", as estratgias "baixo" e "direita" superam as respectivas estratgias "alto" e "esquerda", da Linha e da Coluna. Contudo, a dominncia e a perfeio deste ponto de equilbrio espanta a todos que se defrontam com este quadro pela primeira vez. A soluo que dois agentes instrumentalmente racionais acabam por encontrar nunca a melhor para ambos, no contexto do Dilema dos Prisioneiros, pois o ponto de equilbrio (1, 1) subtimo em relao a (2, 2), que poderiam obter se adotassem a estratgia dominada. Porm, um agente racional, quando possui uma estratgia dominante, nunca escolhe outra que no esta. Note que a combinao de estratgias dominantes conduz sempre a resultados que so equilbrio de Nash, mas nem todo ponto de equilbrio formado por pares dominantes, como mostrou a Batalha dos Sexos, onde h dois equilbrios de Nash em estratgias puras que no so dominantes.
Coluna Figura 1.10 Estratgias Linha Alto Baixo Dilema dos Prisioneiros Esquerda 2, 2 l 3, 0 Direita 0, 3 c l 1, 1 c
Todas essas tcnicas de solucionar um jogo, cooperativo ou no, esto apoiadas numa concepo de racionalidade que, apesar da aparente preciso, geram resultados paradoxais do ponto de vista filosfico, como no caso do Dilema dos Prisioneiros e nestes dois outros apresentados por Mrio Henrique Simonsen (1935-1997) em sua inacabada introduo Teoria dos Jogos. Para atacar a fragilidade da suposio de racionalidade entre os participantes, Simonsen montou a matriz da figura 1.11 40.
Coluna Figura 1.11 Estratgias Linha Alto Baixo Esquerda l 3, 3 c 2, 2 c Direita -3, 3 c l 1, 1
Alto-esquerda constitui o nico equilbrio de Nash desta matriz, sendo esquerda a estratgia dominante de Coluna. Tendo em mente, o pressuposto de racionalidade da
40
. Para os prximos exemplos veja SIMONSEN, M.H. Teoria dos Jogos, 1.5, pp. 25-26.
26
teoria, Linha no tem porque se preocupar em escolher a estratgia Alto, uma vez que a dominante de Coluna lhe garante trs de ganho. Entretanto, Esquerda domina fracamente a direita, pois se Linha escolher Alto, Coluna nada perderia mudando de dominncia para a direita, amargando seu adversrio -3 de perda. Sem saber as reais intenes de Coluna, Linha pode refletir que o melhor seria reduzir ao mnimo suas perdas seguindo a sua maximin localizada em Baixo. Assim, Linha obteria um, pelo menos, e Coluna o seu pior resultado, caso viesse a jogar Direita. Simonsen, ento, advertiu que poderia "ser extremamente imprudente escolher estratgias conducentes a um tal equilbrio sem a garantia de que todos os demais jogadores faam o mesmo"41. Alm do mais, os equilbrios de Nash podem estar em combinaes totalmente opostas como neste segundo exemplo fornecido por Simonsen e que foi adaptado figura 1.12. De novo, um problema de coordenao surge entre os participantes, mas agora ambos preferem ganhar 2, fazendo com que o outro assumisse o prejuzo de -2. Contudo, se jogarem suas estratgias favoritas acabariam pior do que no Dilema dos Prisioneiros, obtendo o resultado mais baixo possvel (-3, -3). Para fugir deste destino, a nica soluo seria adotar mais uma vez suas respectivas estratgias maximin, que evita o pior e neste caso garante (1, 1) para as partes. O apoio na racionalidade forte exige a aceitao de respostas que transformam o agente estratgico em um homo conomicus caricatural, posto que pessoas que no fossem to "racional" poderiam alcanar um patamar mais vantajoso do que as que agem de modo estritamente racional e egosta, como o defendido pela teoria. Isto revela uma certa ambiguidade na concepo de racionalidade defendida pelo equilbrio de Nash, que nem sempre corresponde aos melhores resultados possveis. De fato, testes em laboratrios provaram que a maioria das pessoas, formadas ou no em economia ou matemtica, procuram solues que sustentem ganhos prximo a uma distribuio justa para todos envolvidos.
Coluna Figura 1.12 Estratgias Linha Alto Baixo Esquerda -3, -3 l -2, 2 c Direita l 2, -2 c 1, 1
Na complexidade do contexto social, onde vrios agentes racionais atuam no sentido de maximizar suas utilidades, satisfazendo seus desejos, no se pode esperar tranquilamente que uma "mo invisvel" acomode todos interesses atravs do encontro das melhores escolhas em equilbrio. O Dilema dos Prisioneiros, entre outros, representa as situaes nas quais a disputa entre agentes econmicos redunda em tragdia como a dos comuns, esboada por Garrett Hardin. Solues, como as propostas por Nash, so construdas com base em conhecimento a posteriori e no podem servir idealmente a priori para determinar, em todas circunstncias, as decises racionais, seja l o que isto signifique. Para evitar o pior, faz-se necessrio olhar com maior ateno a maneira pela qual as pessoas deliberam em meio a influncias emocionais ou culturais. Uma observao que valeu o Nobel a Daniel Kahneman.
41
. SIMONSEN, M.H. Op.cit., p. 25.
27
1.3
A Irracionalidade do Agente Racional
As diversas crticas recebidas pela Teoria dos Jogos, em sua forosa simplificao da forma matemtica do trato social, concentraram-se principalmente na concepo de agente racional adotada e a consequente construo artificial das situaes estudadas. Alguns filsofos apontaram para insuficincia da viso econmica do mercado livre, onde as relaes de troca sobressairiam a despeito da simpatia, do esprito de equipe e da confiana necessrios ao convvio social42. Outros atacaram a restrio da anlise aos contextos competitivos que nem sempre surgem como tal no cotidiano, bem como as solues insatisfatrias sugeridas aos jogadores na condio do Dilema dos Prisioneiros e outros modelos abordados43. Houve ainda alguns, como Jrgen Habermas, que consideraram a adoo do ponto de vista das relaes de troca nas esferas pblicas uma das aplicaes do modelo de jogos - uma das fontes de patologias sociais que desequilibram a interao das sociedades modernas, que deveriam ser apoiadas de forma justa na solidariedade, no dinheiro e no poder administrativo44. Todas essas objees filosficas sucederam s observaes feitas, na primeira hora, pelo economista francs Maurice F. Charles Allais, laureado com o Nobel de Economia de 1988. Allais combatia a excessiva formalizao matemtica que, na primeira metade do sculo XX, teve seus principais marcos terico nas obras dos economistas italiano Vilfredo Pareto (1848-1923) e estadunidense Paul Anthony Samuelson, prmio Nobel de 1970. Chamava ateno, sobretudo, para o problema da subjetividade, deixado de lado pela escola neoclssica em economia, que nos anos 1950, predominava nos Estados Unidos. Para Allais, as consideraes sobre a cardinalidade das preferncias individuais, isto , a observao da intensidade da preferncia de um sujeito por um determinado objeto, independente do seu ordenamento numa escala sequencial de utilidade, da maior para a menor, deveria ter um peso expressivo, a fim de explicar com mais naturalidade o comportamento racional diante do risco ou incerteza. Aos adeptos do formalismo metodolgico que dominou o incio da Teoria dos Jogos, somente a relao ordinal de todas preferncias e suas combinaes possveis para cada indivduo tornaria possvel a comparao e anlise da utilidade entre pessoas de gostos e culturas diferentes45. Contudo, os paradoxos apontados pelos experimentos de Allais indicaram que tal ordenamento no era suficiente para explicar a atitude dos agentes, ditos racionais, frente a opes de sorteio. A avaliao subjetiva das probabilidades entre duas loterias objetivamente semelhantes revelou a dificuldade de se manter a transitividade das preferncias, um dos axiomas da teoria da utilidade adotada pelos tericos dos jogos. Perdas e ganhos absolutos mostraram suas influncias nas escolhas em arranjos diferentes que conduziam aos mesmos resultados. Em geral, quanto maior fosse o ganho visualizado, maior era a averso ao risco, e, como de frente ao espelho, quanto maior a perda, maior a busca do risco. Efeitos dos Defeitos
42 Veja HOLLIS, M. Trust Within Reason, cap. 8, p. 162 e MACINTYRE, A. C.Dependent Rational Animals, cap. 9, pp. 114-118. 43 . Veja BLACKBURN, S. Ruling Passions, cap. 6, pp. 161-198. 44 . Veja HABERMAS, J. "Concepes de Modernidade", in Constelao Ps-Nacional, p. 195. 45 . Veja SAMUELSON, P. A. Fundamentos da Anlise Econmica, p. 156.
28
Daniel Kahneman, com a colaborao de Amos Tversky, analisou diversos resultados obtidos em cenrios diferentes, onde as pessoas eram submetidos a escolhas como nas experincias de Allais e pde detectar os efeitos cuja existncia reflete a maneira pela qual os agentes racionais deliberam antes de desempenharem uma linha de ao. Os fenmenos observados na reao de estudantes de universidades israelenses e dos Estados Unidos chocavam com alguns pilares da teoria da utilidade. Empiricamente, constatou-se que as pessoas superestimavam resultados que so considerados certos - o chamado efeito de certeza -, em face daqueles que para serem obtidos envolveriam o clculo das probabilidades. Cerca de 82% de 72 estudantes entrevistados escolheram (Loteria I)... A. ganhar $2.400 certos, enquanto os restantes 18% preferiam a loteria que pagava... B. $2.500, com probabilidade de 33%; $2.400, com probabilidade de 66% e nada com probabilidade de 1%. apesar desta oferecer nove utiles acima da opo A. Contudo, ao se depararem com outra situao (Loteria II) entre A. a chance de 33% de ganhar $2.500 ou B. $2.400 com probabilidade de 34%, a maioria de 83% optou pelo sorteio "A" que era nove utiles acima da segunda loteria, violando o axioma da substituio, como advertira Allais. Pelo axioma da substituio, se a probabilidade de ganhar a mais em "A" preferida a de "B", deveria ser preservada a mesma preferncia em outro quadro, onde a certeza de um ganho oferecido em "A" fosse menor que a chance de obter o mesmo resultado anterior, agora em "B"46. O efeito da certeza foi observado em perspectivas que no preocupavam os agentes com perdas ou resultados negativos. Os casos que envolviam prospectos negativos, por sua vez, apresentavam outro fator virtualmente invertido em comparao ao de certeza, chamado efeito de reflexo. Como em um espelho, as respostas oferecidas pelos entrevistados refletiam uma ordem reversa das preferncias para perdas, em contraste com as preferncias por ganhos. Assim, entre 95 estudantes, 20% preferiram a loteria (Loteria III) cujo prmio era... A. $4.000, com probabilidade de 80%, ao passo que, B. $3.000 garantidos eram escolhidos pelos outros 80%. Situao completamente diferente da seleo feita por 92% desses mesmos 95 que optaram depois pelo sorteio (Loteria IV) com... A. perda de $4.000 a 80% de chance, enquanto 8% aceitaram... B. perder imediatamente $3.000. Os ganhos positivos provocaram nos agentes averso ao risco, enquanto os quadros de expectativas negativas estimulavam, ao contrrio, a busca ao risco. Nessas ocasies, os mesmos "equvocos" provocados pelo efeito de certeza foram notados em ambos os aspectos, positivo e negativo, com a busca pelo ganho seguro, mas de utilidade menor e preferncia por resultados negativos incertos, embora de maior perspectiva, do que a
46 . Veja KAHNEMAN, D. & TVERSKY. A. "Prospect Theory", pp. 265 e 266. Observe que o diagrama de fluxo de deciso que constitui a forma extensiva do modelo de rvore na Teoria da Deciso, na qual se inscreve a Teoria das Perspectivas, tem como n de deciso de um jogador o simbolo de um quadrado e n do acaso, o crculo ou ponto aberto, que representa a raz na rvore de Kuhn. Aqui usa-se o padro geral do modelo de Kuhn, anotando o zero que denota a natureza no respectivo n de onde partam ramos com probabilidades de ocorrncia, sem prejuzo compreenso geral.
29
perda absoluta. Por conseguinte, o efeito de reflexo eliminou a averso pela incerteza nos sorteios negativos, como consequncia paradoxal ao efeito de certeza, passando a incrementar a averso por perdas e o desejo de ganhos imediatos47.
Figura 1.13
Figura 1.14
A maneira pela qual os cenrios eram montados, seja com loterias de resultados positivos ou negativos, gerou atribuies de valores diferentes pelos participantes aos sorteios. Isso ficou ainda mais evidente quando se detectou o efeito de isolao em arranjos feitos com resultados obtidos a partir de probabilidades equivalentes. Para facilitar a escolha, com frequncia as pessoas deixavam de separar adequadamente os componentes semelhantes e distintos, nas situaes propostas. Em decises que tinham de ser tomadas em duas etapas sucessivas, como no seguinte exemplo (figura 1.13), onde havia a possibilidade de nada ganhar imediatamente e 25% de passar ao segundo estgio, no qual teria de escolher entre $4.000, com 80% de chance, ou obter $3.000 de uma vez, nas escolhas feitas antes do jogo comear, 78% preferiram a ltima opo dois porcento a menos do que na Loteria III. Entretanto, quando defrontados com outra perspectiva, de ganhar $4.000 com 20% de probabilidade ou $3.000 com 25% (Loteria VI - figura 1.14), a primeira alternativa era selecionada por 65% dos entrevistados, apesar desta ser equivalente a primeira alternativa da situao anterior (Loteria V), j que 1/4 de 80% seria a taxa de 20% associada aos $4.000 daquela. De fato, os participantes interpretaram o jogo de dois estgios, como o da Figura 1.13, na perspectiva da formulao padro da Loteria III e no a da Figura 1.14, devido o enfoque isolado da deciso tomada no segundo estgio da Loteria V48. As deliberaes feitas em mais de uma etapa levam em conta a correspondncia entre as projees sem risco e a arriscada, a despeito da mudana objetiva das respectivas probabilidades ou resultados, tendo em vista todo caminho a ser percorrido. Ou seja, a sequncia de sorteios em estgio permitiria, na viso dos envolvidos, descartar as perdas dos valores oferecidos antes, em uma nica perspectiva a partir do seu ponto de deciso, como na formulao sequencial da figura 1.13, ao invs de duas situaes isoladas da figura 1.14, na qual os resultados estavam vinculados a probabilidades de ganho, separadamente. Tal modo de compreenso viola a hiptese de que a seleo de loterias deveria ser determinada pela probabilidade final dos resultados, recando a escolha sempre pelo maior ganho provvel. O isolamento das projees indicou que a certeza contingente de ganhos fixos atrai as pessoas para este resultado, mesmo depois de uma sequncia de movimentos na qual a sorte interviu, ao contrrio do que acontece em loterias com opes separadas, mas com chances idnticas a de outro quadro que tenha sido posto frente do agente, embora em quadro diferente. Na Teoria das Perspectivas que desenvolveram para explicar a maneira pela qual os indivduos deliberam sob risco, Kahneman e Tversky atriburam muitas das
47 48
. Veja KAHNEMAN, D. & TVERSKY. A. Op. cit., pp. 268 e 269. . Veja KAHNEMAN, D. & TVERSKY. A. Idem, pp. 271 e 272.
30
anomalias detectadas fase de "edio" das perspectivas, quando muitas operaes que transformam os resultados e probabilidades so feitas - a saber: ordenao (coding) dos ganhos e perdas; combinao das probabilidades de resultados idnticos reduzida a uma s probabilidade; separao dos componentes sem risco dos incertos e cancelamento dos elementos comuns de uma mesma oferta, em loterias com mais de um movimento. Tudo em funo das projees oferecidas. Neste instante, as ofertas so editadas de diversas maneiras, segundo o contexto em que surgem. Assim, pequenas diferenas so eliminadas e componentes comuns cancelados por simplificaes, provocando as inconsistncias observadas depois. Ganhos com probabilidades extremamente baixas so descartados, amide, na fase de edio, enquanto as chances muito altas tornam os resultados "certos". Por outro lado, em um fenmeno atribudo a uma funo de pesagem (weighting function), as pessoas preferem loterias que ofeream altos valores com baixa probabilidade de ganhos, ao invs de valores pequenos e certos, como em $5.000 com 0,1% de chance, em lugar de $5 garantidos. Embora, aceitem pagar estes mesmo $5 a se arriscarem ao prejuzo de $5.000 com 0,1% de probabilidade. Alm disso, a diferena entre pequenos montantes parece maior do que aquela variao de valores entre quantias maiores, como o incremento que notado facilmente na passagem de 100 para 200, mas, na elevao de 1100 para 1200, quase ignorado49. Essas distores oriundas da fase de edio levam a simplificaes que so orientadas pelo princpio de escolha da perspectiva de valor superior. Ao mostrar isso, a Teoria das Perspectivas passou a ser considerada a tentativa mais precisa de descrever o comportamento de agentes racionais em cenrios de risco ou incerteza. Pde-se, ento, saber o porque das mudanas das preferncias pessoais nessas circunstncias precrias. Notou-se tambm que a experincia prvia de cada um para situaes semelhantes influenciam fortemente o momento de tomada de deciso. Pequenas mudanas na forma de apresentao das alternativas perturbam as escolhas, ainda que os resultados finais se mantenham os mesmos. A condio psicolgica dos agentes racionais, portanto, pde ser incorporada pela Teoria dos Jogos como um de seus elementos cruciais, agora que seus conceitos assumiam carter formal de trato matemtico. A probabilidade subjetiva e a cardinalidade das preferncias voltavam a merecer uma maior ateno por parte dos economistas e matemticos, no instante de projetar os modelos de jogos que se seguiram a essas descobertas. A Interpretao Cardinal de Harsanyi A falta de consistncia das preferncias, empiricamente observadas, abalavam no s o aspecto preditivo do modelo de racionalidade econmica, mas descartavam a possibilidade da teoria ser considerada com algum valor normativo. Sobre esse ponto, John Harsanyi argumentou que, em algumas condies motivacionais especficas, era possvel defender a normatividade da utilidade de Von Neumann e Morgenstern. Ningum duvida da validade normativa da aritmtica, apesar da maioria das crianas no poder resolver problemas aritmticos de qualquer complexidade sem treino especial (HARSANYI, J.C. "Normative Validity and Meaning of von Neumann-Morgenstern Utilities", p. 307).
49
. Veja KAHNEMAN, D. & TVERSKY. A. Ibidem, pp. 274 e 281.
31
Assim, o problema principal para sustentao da normatividade da funes de utilidade assentava na necessidade dos agentes racionais passarem a tomar atitudes orientadas adequadamente pelo resultado, ao invs de aterem-se exclusivamente utilidade do processo. Nesta tica, as escolhas devem ser feitas com base apenas na avaliao da possibilidade dos vrios resultados disponveis. Todo nervosismo do envolvimento com uma atmosfera estimulante de aposta, bem como outras experincias psicolgicas deste tipo, por outro lado, deveriam ser deixados fora do processo de deliberao. No entendimento de Harsanyi, as atitudes orientadas pelo resultado devem ser guiadas somente por suas utilidades resultantes que so assinaladas a cada loteria e por suas respectivas probabilidades50. Deste modo, os axiomas da teoria que garantiriam a monotonicidade (a loteria preferida ser aquela que for a de maior ou igual probabilidade de fornecer a alternativa preferida) e a indiferena entre probabilidades equivalentes poderiam preencher os requisitos da racionalidade normativa, embora no fossem adequados para pessoas orientadas pela utilidade do processo51. Nos termos de Harsanyi, pessoas orientadas pelo processo assumem uma atitude intrnseca de gostar ou no gostar da situao da aposta, dependendo da utilidade positiva ou negativa a ela associada, enquanto pessoas orientadas pelo resultado tm uma atitude instrumental em relao s probabilidades subjetivas ligadas aos possveis resultados, segundo o gosto pelos ganhos esperados52. Para poder lidar com esses casos, preciso agora que a funo de utilidade seja entendida como uma funo cardinal e no s ordinal. Isto porque, a cardinalidade permitiria a comparao no s do nvel de utilidade entre os indivduos, mas tambm a utilidade de diferenas entre loterias para o prprio agente, o que facilitaria a observao das intensidades ou importncias atribudas por cada um a tais sorteios. Formalmente, algum que prefira, por exemplo, A > B e C > D, quando defrontado s seguintes loterias: L1 = (A, 1/2; D, 1/2) ou
L2 = (B, 1/2; C, 1/2)
...preferir a L1 com mais intensidade do que L2, caso prefira L'2 = (A, 1/2; C, 1/2) mais do que L''2 = (B, 1/2; D, 1/2), indicando a intensidade e importncia dada pelo agente relao A > B, quanto maior for a diferena entre A e B em comparao existente entre C > D. Em outras palavras, qualquer loteria que "A" estivesse em jogo seria prefervel sobre aquelas outras possveis em que estivesse ausente. Assim, a utilidade cardinal aferida poderia conduzir, daqui utilidade dos resultados de quem adotasse corretamente uma atitude instrumental frente aos riscos, na observao adequada dos valores em jogo, enquanto que a atitude intrnseca limitaria o alcance das escolhas das pessoas que gostassem ou no de apostas. Dessa forma, Harsanyi chamou ateno para o fato de incluir uma interpretao cardinal dos pagamentos nas anlises das escolhas sob incerteza, ao invs de uma concentrao exclusiva com a relao ordinal dos ganhos. A despeito de economistas e matemticos rigorosos atacarem a cardinalidade, influenciando at mesmo a base terica empregada pelo filsofo canadense David Gauthier que, em Morals by Agreement , se ateve apenas concepo ordinal dos ganhos e das preferncias. A importncia de observar os ganhos cardinais est na possibilidade de se estabelecer
.Veja HARSANYI, J.C."Normative Validity and Meaning of von Neumann-Morgenstern Utilities" p312. 51 . Veja HARSANYI, J. C. Op.cit., idem. 52 . Veja HARSANYI, J. C. Idem, p. 314.
50
32
estratgias mistas apoiadas em valores contnuos de intensidade que podem variar em grau numa escala intervalar de resultados. O que no vivel quando se toma s a ordem de valores e a posio dos resultados numa escala de preferncias que no leva em conta o peso de cada preferncia, mas apenas que uma prefervel a outra em uma lista ordenada de resultados, no importando qual valor mais preferido do que outro53. Irracionalidade Humana e Racionalidade Fora da Espcie Uma postura pela interpretao normativa da racionalidade da teoria da utilidade, como a proposta por Harsanyi, deixa de lado crticas que poderiam ser feitas quanto ao carter descritivo da teoria, pouco precisa ou incua para seres vivos, que nem sempre agem de modo racional ou sequer possuem um aparato cognitivo desenvolvido para a realizao desses clculos todos. Quem defende o valor normativo do modelo de jogos argumenta que, embora os primeiros ancestrais humanos no tenham desenvolvido uma habilidade especfica para realizao rpida dos clculos exigidos para adoo dos seus efetivos interesses informados, posto que nunca teriam se defrontado com problemas que exigissem um mtodo eficiente de escolha instintiva, nas condies atuais da complicada vida em sociedade, sugere Harsanyi que o treinamento no uso de modelos matemticos poderia "esclarecer substantivamente muitos problemas da tica"54. Certo que a formalizao matemtica implica numa capacidade racional que excede a da maioria dos seres humanos, mesmo depois de solucionado o ltimo Teorema de Fermat. Entretanto, isso no impede que organismos dos mais simples pudessem ser interpretados como "agentes" dotados de aptido reativa suficiente para poderem seguir as estratgias analisadas pela Teoria dos Jogos. Claro que para os casos dos seres no humanos o conceito de racionalidade empregado sofreu profunda transformao, a ponto de permitir a concepo de uma racionalidade mnima e intencionalidade capaz de incluir at bactrias e vrus55. Para a Teoria dos Jogos, um jogador considerado racional se est motivado a maximizar seu prprio ganho, ou seja sua utilidade, sendo ainda hbil para calcular os resultados estocsticos (probabilsticos) de cada ao. Quando bilogos evolucionistas contemporneos passam a utilizar modelos retirados desta teoria, no intuito de explicar o comportamento de determinadas espcies, esto interpretando essa racionalidade
. Um exemplo de arbitragem - jogos com trs jogadores, sendo o terceiro um mediador que no recebe nenhum ganho - adaptado de RAIFFA, H. El Arte y la Ciencia de la Negociacin, III parte, cap. XVI, p. 240-242 esclarece como o peso que os indivduos atribuem aos mesmos ganhos pode variar de intensidade entre eles. A negociao da diviso de $100 entre ricos e pobres revela o poder de barganha que permite ao mais poderoso arriscar mais do que o fraco na implementao de uma estratgia mista. A averso ao risco conduz uma pessoa carente de bens primrios a aceitar valores menores do que a mdia razovel de $50, quando se defrontam com um sorteio com a probabilidade de 0,5 de ganhar os $100 ou nada. Nestas circunstncias, o pobre poderia contentar-se em receber $20 seguros, enquanto o rico arriscar-se-ia, possivelmente, loteria, abrindo mo de $80 certos. Do ponto de vista de um mediador imparcial que fosse responsvel pela diviso do prmio entre os dois jogadores, seria injustificvel racionalmente proceder a uma distribuio diferente de $50 para cada um, embora o ganho cardinal deste seja diferente individualmente. Isto , para o pobre, metade de util, o que corresponderia na soluo sem arbitragem ao ganho de $20. J para o rico seria o mesmo que $80, devido intensidade do desejo de possuir o bem em disputa. O pobre precisa mais do dinheiro, e por isso qualquer quantia seria bem vinda, mas o rico, que j tem muito, pode se dar ao luxo de arriscar a ganhar mais, sem comprometer sua psicologia. 54 . HARSANYI, J. C. "Game and Decision Theoretic Models in Ethics", p. 671. 55 . Neste sentido, muito contribuiu o trabalho do filsofo Daniel C. Dennett com textos sobre conscincia que foram lanados a partir de Brainstorms (1978) e que culminam com Tipos de Mentes (1996).
53
33
instrumental, agora, como uma capacidade de reunir informao e reagir em conformidade a esta. Ou seja, uma habilidade computacional do trato da comunicao que pode ocorrer mesmo no processamento de informao realizado por seres vivos atravs de reao de meras substncias qumicas. Pombos, falces, bactrias ou vrus presentes em modelos virtuais ou em experimentos reais de laboratrios esto aptos a tomarem parte de um Dilema dos Prisioneiros Iterado, que se repete por vrias vezes, graas a sua capacidade computacional de trabalhar as informaes de entrada e reagirem com uma resposta adequada56. Muitos bilogos, depois de Maynard Smith ter estabelecido uma "teoria dos jogos dinmicos evolucionrios" (o marco o livro Evolution and the Theory of Games de 1982), passaram a aplicar os novos recursos de anlise matemtica em pesquisas sobre linguagem, justia (fairness) e direito de propriedade que at ento ficavam restritos especulao filosfica em suas diversas sub-reas. Pela teoria dos jogos evolucionrios, as escolhas das aes seriam determinadas no pelo agente racional clssico, mas por estratgias especficas, cujo sucesso implicava no nmero maior de descendentes na futura gerao. A partir desta concepo, uma estratgia evolutivamente estvel (EEE, ou ESS, do ingls evolutionarily stable strategy) poderia gerar condies de equilbrio nos casos em que o indivduo portador dessa estratgia no conseguiria incrementar sua capacidade reprodutiva, caso pudesse a trocar por outra estratgia ou nenhum mutante portador de estratgia rival diferente fosse capaz de invadir a populao estabelecida, onde a primeira estratgia prevalecesse57. Para uma estratgia ser considerada EEE, deve atender a duas condies quanto ao equilbrio: seus resultados devem ser equivalentes aos pontos de equilbrios estritos ou seja, so as melhores respostas obtidas atravs de estratgias puras - e, por outra, a condio de estabilidade tambm deve ser satisfeita, isto , as diferentes respostas s melhores estratgias dos outros so correspondentes as melhores respostas do agente58. Por conseguinte, estendida a um grupo vivente, de acordo com Richard Dawkins, uma EEE a estratgia inata adotada pela maioria da populao que no pode ser superada por uma outra estratgia invasora59. Da perspectiva evolutiva, no h necessidade de se considerar tais estratgias conscientes, basta as compreender como "programas de comportamento inconscientes estabelecidos pelos genes"60. Tal concepo abrange desde o vrus Influenza e bactrias Escherichia coli at humanos (Homo sapiens). Desse modo, o sucesso da Teoria dos Jogos Evolucionrios permitiu explicar o comportamento de insetos e vertebrados, sem apelar para uma hiptese de racionalidade forte, cujos testes de campo abalavam a tradicional teoria esttica dos jogos. A partir do instrumental estruturado na teoria dos jogos original, a biologia evolutiva conseguiu analisar e prever as escolhas feitas por humanos dotados tambm desse tipo de racionalidade fraca que busca em primeiro lugar garantir a sobrevivncia dos indivduos e promover sua reproduo nas geraes futuras. As diferenas entre as espcies poderiam, a partir de ento, ser discriminadas tendo em vista a diferenciao de estratgias adotadas por cada grupo de genes que compem determinado organismo, variando desde os maximizadores irrestritos aos "altrustas" maximizadores restritos.
56 57
. Veja LEWIN, R. Complexidade, cap. 7, pp. 167-169. . Veja ROSS, D. "Game Theory", 6. 58 . Veja HAMMERSTEIN, P. & SELTEN, R. "Game Theory and Evolutionary Biology", pp. 939-940. 59 . Veja DAWKINS, R. O Gene Egosta, cap. 5, p. 94. 60 . DAWKINS, R. Op. cit., cap. 10, p. 206.
34
Maximizador Local e o Global Durante os dois milnios e meio que constituem a histria da filosofia, os filsofos se ocuparam em definir os seres humanos como seres racionais, divergindo aqui e ali sobre o grau e a categoria de raciocnio que este ente poderia exercer. Mas todos estavam de acordo que a racionalidade era algo que distinguia a espcie humana dos outros animais. Com a teoria dos jogos evolucionrios essa distino cai por terra, restando apenas o refinamento das estratgias como diferenciao entre agentes maximizadores irrestritos "egostas" e aqueles capazes de restringir suas aes imediatas em funo de um ganho maior no futuro. A irracionalidade humana passa a ser considerada um componente real a ser considerado, como nos outros seres vivos, que torna todos passveis de erros sem que as fronteiras das espcies sejam uma barreira natural a definir quem quem cognitivamente. Trata-se afinal de genes que disputam o direito de continuarem existindo e se replicando por maior perodo de tempo possvel, abordo de "mquinas vivas", fazendo uso dos mais diversos tipos de estratgias. Estratgias rotuladas como do "trapaceiro" ou do "rancoroso" - nos termos utilizados por Dawkins em O Gene Egosta (1976) - podem alcanar estabilidade em meio a uma populao de seres que usem a estratgia do "tolo". Imagine, como Dawkins fez, que os trapaceiros - seres que no cooperam nunca - invadam uma populao tola, que coopera sempre, incondicionalmente. Qualquer que seja a quantidade de trapaceiros, desde que seja maior que um, ir prosperar e se multiplicar, explorando o trabalho dos tolos, at a exausto destes, sem nada oferecer em troca. Tal estratgia ser considerada evolucionariamente estvel ainda que leve a populao de tolos extino, embora, em um territrio restrito, a morte do ltimo tolo venha eliminar o prprio sustento dos trapaceiros, quando estes dominarem todo lugar, impedindo que outros seres portadores de outras estratgias entrem em cena. Motivo pelo qual se considera a estratgia do trapaceiro imune invaso. Diferente dos tolos, a estratgia "rancorosa", apesar de cooperar sempre que a outra parte coopera, capaz de retaliar o adversrio, desertando, caso este no retribua com um ato de cooperao. Em meio aos tolos, os rancorosos prosperam tanto como estes em razo da cooperao mtua entre eles, passando mesmo despercebidos por um observador externo. Contudo, ao contrrio dos tolos, os rancorosos so robustos o suficiente para repelirem a invaso de trapaceiros, posto que reagem contra a desero destes, impedindo que proliferem em seu meio. Num ambiente em que convivam as trs estratgias citadas, os rancorosos conseguiro manter-se em nmero razovel, enquanto os trapaceiros levam os tolos extino. Apesar da baixa na quantidade inicial de indivduos, em funo da explorao inicial sofrida, os rancorosos continuariam multiplicando-se, graas cooperao mantida entre eles. No instante em que sobressassem to somente trapaceiros e rancorosos, os primeiros passam a conhecer a decadncia e o gosto amargo da ingratido, ao passo que os segundos comeam a recuperar suas perdas colaborando entre si e discriminando os trapaceiros. Deixados a sua prpria sorte, os trapaceiros lutaro uns contra os outros at a morte ou, se possvel, fugiro do local, que passa a ser dominado, afinal, pelos rancorosos61. Pela teoria dos jogos evolucionrios, a caracterizao do agente racional independe de sua configurao fsica ou ontolgica. O que est em jogo entre os seres vivos, racionais ou no, a capacidade de seguir uma regra, por em prtica uma determinada estratgia que pode ter sido herdada ou adquirida pela experincia. Esta
61
. Para os detalhes dessa bela fbula, veja DAWKINS, R. Idem, idem, pp. 206-208.
35
noo de agncia aproxima-se muito da concepo dennettiana de postura intencional para "sistemas que modulam informaes e buscam objetivos"62. Quanto mais simples esses sistemas, mais prximos das macromolculas orgnicas aptas auto-replicao. Aumentando o grau de organizao e complexidade, maiores so as chances desses sistemas intencionais poderem selecionar as melhores alternativas disponveis. Seres humanos, portanto, devido ao seu alto grau de complexidade orgnica, diferenciam-se de outros viventes por sua capacidade de antever acontecimentos futuros, com maior nitidez, ao invs de estarem presos apenas aos fenmenos presentes. Na definio conveniente do socilogo noruegus Jon Elster, humanos podem ser considerados como mquinas maximizadoras globais prontas a usarem estratgias indiretas. Em outras palavras, so capazes de esperar por um momento mais favorvel, no futuro, para tomarem decises corretas, ao invs de optarem imediatamente por um resultado vantajoso momentneo. Ao contrrio das mquinas maximizadoras locais - os demais seres vivos -, os humanos no teriam de esperar por uma mutao gentica aleatria para trocar de estratgia. Poderia perfeitamente escolher entre um elenco variado de linhas de ao cultivadas por grupos sociais diversos no seio da espcie e armazenada em sua memria histrica, alm de contar com aquelas embarcadas no seu cdigo gentico ao longo da evoluo. Por conseguinte, uma caracterstica marcante da "racionalidade" humana est no trato estratgico do cenrio em que se encontra, povoado por seres semelhantes que tambm podem reagir em funo da avaliao das expectativas de ao dos demais atores relevantes, tambm dotados de conhecimento comum. Ao passo que um comportamento tipicamente paramtrico - como das outras espcies - adotaria a postura do indivduo como sendo um nico agente apto a variar seu comportamento em um meio constante que, serve de parmetro fixo para suas aes63. A teoria dos jogos evolucionrios chamou ateno para alguns aspectos vitais da caracterizao dos agentes racionais. Ao lado da teoria psicolgica das perspectivas, desenvolvida por Kahneman e Tversky, traa um panorama realista da condio humana, ignorado historicamente pelos filsofos e economistas. Juntas, essas teorias alertaram, sobretudo, para o fato de que humanos, como qualquer ser vivo, esto irremediavelmente vinculados aos princpios biolgicos fundamentais de sobrevivncia e reproduo. Alm disso, sustentou como vlida a postura terica de um individualismo metodolgico que deve partir de suposies egostas, devido s limitaes biolgicas e restries de recursos naturais, para s depois explicar o comportamento "altrusta" e a cooperao em grupos sociais. Por conta disso, a unio entre Biologia Evolutiva e o modelo de jogos trouxe um maior poder descritivo teoria dos jogos original. O continente, antes habitado apenas por inmeras variantes de Robinson Cruso, tornou-se mais rico em diversidade de agentes racionais. O sentido de racionalidade ganhou, ento uma verso mais precisa ao detectar as imperfeies psicolgicas, cognitivas e morais dos sistemas intencionais. E a importncia da aprendizagem ficou ainda mais clara para a espcie humana.
62
. DENNETT, D. C. Tipos de Mentes, cap.1, p.31. . ELSTER, J. Ulises y las Sirenas, I, . 3 e 4, pp. 23-40.
63
36
Captulo 2: O Papel da Comunicao
At aqui, foram apresentados apenas os principais conceitos e alguns problemas relativos aos assuntos especficos da teoria da utilidade e da racionalidade dos jogadores. Mal foram abordados os pontos relacionados com jogos de mltiplos agentes e os leiles que so partes importantssimas da teoria geral dos jogos64. Por "amor simplicidade", como costume se dizer quando se procura explicar a teoria, esses e muitos outros aspectos especficos so aqui deixados de lado. Embora se reconhea a relevncia destes temas, uma forosa simplificao -se obrigado a fazer quando em uma primeira introduo a qualquer assunto de interesse filosfico. Para oferecer o sabor da pesquisa detalhada e da aplicao da Teoria dos Jogos em outras reas do conhecimento que se falou da Teoria das Perspectivas, dos psiclogos Daniel Kahneman e Amos Tversky, e da Teoria dos Jogos Evolucionrios, da qual se destacou o trabalho do bilogo John Maynard Smith. Neste captulo, outro campo particular da teoria ser abordado com maior ateno. Os jogos com comunicao ou aqueles em que a comunicao exerce um papel crucial, pela sua presena ou ausncia, so vistos mais de perto. A Teoria dos Jogos no foi a primeira, nem a ltima abordagem acadmica a tentar elucidar a influncia da comunicao sobre o comportamento humano. Muitos filsofos de vrias reas de investigao - na lgica, na lingustica, epistemologia e mesmo na tica - procuraram antes, durante e depois de Thomas C. Schelling explicar o fenmeno da comunicao. Para isso, diversos conceitos foram formulados e alguns princpios lanados, a fim de descrever com maior preciso os atos de fala e a linguagem humana. Apesar de poder-se encontrar estudos de filsofos precursores - a grosso modo, voltados para compreenso da linguagem em Plato, Santo Agostinho, Jean-Jacques Rousseau, entre outros -, a comunicao por ela mesma s veio a ocupar o foco das investigaes no sculo XX, sobretudo depois do advento da radiodifuso e meios eletrnicos de massa - rdio e cinema, no incio; televiso, a partir dos anos 1950; e a rede mundial de computadores, no final do sculo passado. Em 1916, a publicao
64
. Apenas como exemplo do alcance destas diversas classes de jogos que exigiriam um livro para cada uma delas, vale a pena citar rapidamente o jogo que Martin Shubik chamou de "O Leilo de Dlar". Em um leilo ascendente no qual as partes pagam os seus lances, ganha o dlar quem oferecer a maior quantia, devendo tambm as inferiores serem pagas pelos demais participantes ao leiloeiro. Caso ningum faa um lance, o dlar ficar com o leiloeiro. Se os interessados puderem comunicar-se, a cooperao forma-se em torno dos lances de US$ 0,01 e zero, quando dois jogadores enfrentarem o leiloeiro, que obrigado a vender o dlar por um centavo ao jogador que, supostamente, repartir os 99 centavos restantes com seu colega. Assim, o leilo termina logo no primeiro lance. Contudo, se a coalizo for proibida e o jogo desenvolvido em rodadas sucessivas indeterminadas, Shubik destaca que h dois pontos de equilbrio em estratgia pura se um de cada oferecer um dlar enquanto o outro no fizer lance, respectivamente. De outro modo, as quantias positivas que forem feitas podero levar o jogo a uma escalada sem fim, com a soma subindo muito acima do dlar oferecido. Algum que oferea um dlar poder ser superado por US$ 1,05 de quem antes tivesse proposto 95 centavos. Deste modo, o segundo jogador reduziria as perdas dos 95, para apenas cinco centavos. Entretanto, o primeiro poderia retrucar, superando esse lance para evitar perder um dlar, e assim por diante. No "mundo real", um macabro jogo de escalada ocorreu durante a Guerra Fria (1945-1989), quando Estados Unidos e a antiga Unio Sovitica aumentavam seus arsenais nucleares acima da capacidade de extinguir a vida no planeta. O "cu o limite", neste tipo de jogo! Descries acessveis sobre ele podem ser encontradas em SHUBIK, M. Teora de Juegos en las Ciencias Sociales, cap. IX, IX.4.1, p. 282 e em RAIFFA, H. El Arte y la Ciencia de la Negociacin, cap VI, pp. 90-94. Alm da comunicao, o papel do tempo e a psicologia dos agentes so fatores para saber quando parar em um ponto de equilbrio que sirva de limite natural.
37
pstuma do Curso de Lingustica Geral, do suo Ferdinand de Saussure (1857-1913), procurou estabelecer um campo limitado para a lingustica, associando-a semiologia, linha de pesquisa que o prprio Saussure reservou para o estudo dos signos e seu uso social. Em seu domnio especfico, caberia lingustica definir a funo da lngua no conjunto dos fenmenos semiolgicos, em geral comunicativos65. A semiologia buscou, ento, delinear a estrutura da linguagem a partir do signo, seu significado e significante, inaugurando o estruturalismo lingustico que abriu espao a um melhor entendimento do processo comunicativo. O conjunto dos signos lingusticos constituiria a lngua, um sistema de hbitos consolidados no tempo pelas foras sociais que permite aos indivduos a compreenso mtua. Ao lado da fala, a lngua formaria, por fim, a linguagem como um fenmeno mais abrangente. No esquema proposto por Saussure, a linguagem era subdividida em fala e lngua, sendo esta ltima, por sua vez, dividida em parte sincrnica - que trata das relaes lgicas e psicolgicas dos termos em um sistema reconhecido pela coletividade - e diacrnica - onde as relaes entre os termos intercambivel, sem a forma de um sistema percebido pelo coletivo66. Essa tendncia esquemtica influenciou alguns autores, dos quais se destacou o linguista russo Roman Jakobson (1896-4982), cujos trabalhos sobre fontica definiram os conceitos de emissor, receptor, mensagem, cdigo e canal. Desde Jakobson, que, no processo de comunicao, se entende o emissor como aquele que, de posse de um cdigo - traos distintos que podem ser combinados segundo regras -, transmite uma mensagem - um conjunto de elementos portador de informao - atravs de um canal meio ou veculo pelo qual trafega a informao - para um receptor, aquele que recebe uma mensagem e a relaciona com um cdigo comum ao emissor, decodificando e interpretando a informao67. O modelo de comunicao de Jakobson influenciou todos os campos de pesquisas que, a partir de 1962, de alguma maneira trataram do assunto, da antropologia teoria matemtica da informao, ainda que no adotassem plenamente o ponto de vista estruturalista. Jakobson incentivou a generalizao dos seus conceitos para domnios alm da viso antropocntrica da linguagem. Paralelo ao desenvolvimento da lingustica, o desenvolvimento de mquinas inteligentes capazes de tratar a informao levou o estadunidense Norbert Wiener (1894-1964) a definir um novo ramo, em 1948, chamado por ele de ciberntica - termo derivado do grego kybernetike, a arte da pilotagem, ou governo. A ciberntica investiga o controle e a comunicao nos animais (incluindo os seres humanos) e as mquinas. Ao transmitir uma mensagem, o processo comunicativo ciberntico exigiria que um sinal de retorno (retroalimentao) fosse recebido pelo emissor, a fim de permitir a correta compreenso de que a mensagem enviada, uma comunicao ou comando, fora adequadamente entendida e executada pelo receptor. A informao, aqui, representa o contedo trocado pelo emissor com o mundo exterior que o faz se ajustar a este de modo perceptvel. A troca de informao seria, ento, um processo de ajuste de quem se comunica "s contingncias do meio ambiente e (...) efetivo viver nesse meio ambiente"68. Em Uma Introduo Ciberntica (1956),
. Veja SAUSSURE, F. Curso de Lingustica Geral, introduo, cap. III, 3, p. 24. . Veja SAUSSURE, F. Op. cit., I part., cap. III, 9, pp. 115-116, para descrio detalhada de seu sistema. 67 . Todos esses conceitos esto definidos em JAKOBSON, R. Fonema e Fonologia, I part., se. I, 4, p. 60; 7 e 7a, p. 78 e II part., p. 115. 68 . WIENER, N. Ciberntica e Sociedade, I, pp. 17 e 18, para essa citao e toda descrio feita da ciberntica.
66 65
38
William Ross Ashby (1903-1972) apresentou alguns esclarecimentos sobre o propsito da ciberntica. Esta seria uma teoria dos modos como todas mquinas possveis comportam-se, sendo, assim "essencialmente funcional e comportamental"69. Vinculada teoria matemtica da informao, a ciberntica permitiu ampliar a discusso sobre o alcance da comunicao em horizontes no restritos aos seres humanos. A comunicao passou a ser concebida tambm independente do aparato transmissor, embora no totalmente, a ponto de prescindir de um estado orgnico que lhe preservasse o significado: as ordens de comando por via das quais exercemos controle sobre nosso meio ambiente so uma espcie de informao que lhe transmitimos. Como qualquer outra espcie de informao, essas ordens esto sujeitas desorganizao em trnsito. Geralmente, chegam a seu destino de forma menos coerente (...) do que quando foram emitidas. Em comunicao e controle, estamos sempre em luta contra a tendncia da natureza de degradar o orgnico e destruir o significado; a tendncia (...) de a entropia aumentar (WIENER, N. Ciberntica e Sociedade, cap. 1, p. 17). Alm das questes sintticas e semnticas da estrutura da linguagem e da comunicao, a ciberntica chamou ateno para aspectos funcionais e do comportamento retroalimentado, que na filosofia da linguagem tm paralelo com a perspectiva pragmtica e de ao social. O mbito no qual o austraco Ludwig Josef Johann Wittgenstein (1889-1951) definiu o conjunto da linguagem como sendo jogos de linguagem, ou seja "todo processo de uso das palavras" em que algum age de acordo com as palavras que o outro pronuncia70. Essa nova viso, estimulou autores como o britnico John Langshaw Austin (1911-1960) e John Richard Searle a considerarem que os falantes de uma lngua, em todos aspectos da comunicao, exercem aes lingusticas. Toda essa produo e emisso de frases corresponderia a uma funo distinta - ameaas, promessas, nomeao etc. -, regida por um elenco de regras respectivas71. A vinculao do estudo da linguagem a sua funo comunicativa proporcionou a abordagem de outras questes ligadas ao comportamento de quem se comunica. Ao debate sobre a comunicao, somou-se os esforos de Karl-Otto Apel e Habermas em tentar caracteriz-la como campo apropriado para o estabelecimento de normas vlidas moralmente, alargando ainda mais a compreenso que se tinha sobre o papel da comunicao na vida de todos72. Nesse contexto de rica discusso acadmica sobre a comunicao, a Teoria dos Jogos se insere como um instrumento a mais para ajudar esclarecer pontos que ficaram obscuros em uma abordagem ou outra e ajudar estabelecer contatos que aparentemente eram, de incio, vistos como incompatveis entre ramos de investigao opostos - por exemplo a Teoria Crtica da chamada Escola de Frankfurt e a Teoria da Escolha Racional. Depois que a comunicao passou a ser entendida como uma ao que visa transmitir informaes entre duas ou mais partes e que tem uma estrutura prpria e um
. ASHBY, W. R. Uma Introduo Ciberntica, cap. 1, 1.2, p. 1. . WITTGENSTEIN, L. Investigaes Filosficas, 7, p. 12. 71 . Alguns critrios foram lanados por AUSTIN, J. L. Quando Dizer Fazer, V conferncia, pp. 57-65 e SEARLE, J. R. Os Atos de Fala, I part, cap. 3, pp. 73-95. 72 . Sobre o contedo moral da discusso argumentativa particularmente esclarecedora a leitura de HABERMAS, J. Erluterungen zur Diskursethik (Esclarecimentos sobre a tica do Discurso) que j possui traduo em portugus.
70 69
39
fim que no se esgota no entendimento do significado da mensagem, mas exige a realizao de seu contedo lingustico, para ser mantida, seus fins instrumentais puderam ser formalmente tratados tendo em mente que uma ao comunicativa pretende afinal mudar o estado do mundo em favor de quem comunica, em primeiro lugar. Comunicao na Teoria dos Jogos Quando Wittgenstein, desconhecendo completamente a Teoria dos Jogos, chamou o processo de uso das palavras, que envolveria desde a denominao dos objetos, a aprendizagem da lngua materna e at a repetio ostensiva dos termos pronunciados, de jogos de linguagem, sua interpretao pragmtica deste conceito ressaltava o papel comunicativo do processo lingustico, dependente da interao entre parceiros que agem de acordo com o que fora pronunciado. Tal acordo, para ser fiel a Wittgenstein, faria parte da forma de vida dos participantes, capazes de entender as regras adequadas s diversas maneiras em que a linguagem pode ser "jogada". Este aspecto interativo que torna a linguagem uma atividade comum aos falantes partilhado tambm pela Teoria dos Jogos, na sua definio bsica de jogos estratgicos como sendo aqueles em que as aes exercidas so escolhidas em funo da reao esperada da outra parte envolvida. Diz respeito tambm ao ponto crucial da comunicao na viso da ciberntica, onde a resposta adequada do ouvinte, retroalimentando o processo comunicativo, permite o controle do emissor sobre a justeza da informao transmitida. Em suma, em todo o processo comunicativo, a "audio" da voz do outro o ponto central para que o "jogo da linguagem" seja bem sucedido na sua concepo mais ampla. A comunicao, do ponto de vista pragmtico da linguagem e da Teoria dos Jogos, tem portanto uma tarefa decisiva para soluo dos problemas dos falantes. Entretanto, convm lembra que embora a classificao dos jogos em cooperativos e no-cooperativos dependa por definio da comunicao, como j foi destacado no primeiro captulo, jogos de soma zero com informao perfeita, entre duas partes, podem dispensar por completo o seu emprego. Isto porque, aquele jogador que encontrar primeiro sua estratgia vitoriosa fatalmente a usar contra o seu adversrio obtendo a vitria, ou pelo menos o empate (isto zero util), posto que em jogos de soma zero entre dois jogadores um deve vencer e o outro perder, caso contrrio ambos nada ganham ao final. No texto inaugural da teoria dos jogos contempornea, Von Neumann e Morgenstern enfocavam sobretudo os jogos de soma zero com n-jogadores, sob o argumento de que os jogos de soma varivel poderiam ser transformados em soma constante pela simples adoo de um jogador a mais que absorvesse as perdas ou os ganhos em jogo. Admitiam tambm que a comunicao fosse partilhada naturalmente em jogos com mltiplos participantes que poderiam, ento, cooperar uns com os outros na formao de coalizes que imputassem uma soluo aos jogos. Nos jogos cooperativos, a coalizo mais forte venceria a mais fraca segundo uma distribuio adequada dos ganhos entre os membros desta coalizo. O que no quer dizer que uma coalizo tivesse de ser formada necessariamente por jogadores fortes e poderosos. Uma coalizo vencedora poderia ser aquela que tivesse como participante o elemento mais fraco, desde que se conformasse em receber uma parte conveniente dos ganhos. A abordagem sugerida por Von Neumann e Morgenstern desde 1944, define soluo como uma imputao na qual a distribuio dos bens garante pelo menos a cada integrante da associao o recebimento de um mnimo equivalente ao que conseguiria se agisse por conta prpria, sem tomar parte da unio. Um conjunto de imputaes uma
40
soluo quando nenhuma distribuio de pagamentos interna domina a outra e, alm disso, nenhuma imputao externa preferida em relao ao conjunto formado73. Para ilustrar isso, vem a calhar um exemplo esclarecedor de Rapoport. O conjunto de imputaes:
S=[(50, 50, 0); (50, 0, 50); (0, 50, 50)],
que distribui $100 por trs jogadores uma soluo, pois nenhuma imputao entre elas preferida ou pode ser dominada por outra de fora - como (60, 0, 40), que seria preterida por (0, 50, 50), a preferida pelos segundo e terceiro jogadores74. Aqui, a comunicao levaria dois jogadores a repartirem igualmente entre si o montante oferecido, deixando de fora o terceiro elemento que nada ganha, posto que o pouco que ganhe ter de ser retirado de algum outro jogador da coalizo majoritria que, por princpio, no abrir mo de seus $50. De um modo geral, nos jogos cooperativos com muitos jogadores, a comunicao exerce a funo de coodenadora das aes, a fim de que as coalizes sejam formadas, dentro do conceito de soluo, como conjunto de imputaes, embora no defina qual coalizo ser a vencedora. Da maneira que fora posta por Von Neumann e Morgenstern, a partir de 1944, a comunicao era tida como caracterstica distintiva dos jogos cooperativos, onde uma rodada de troca de informaes prvia era permitida. Em jogos no cooperativos e estritamente competitivos (soma zero), entre dois jogadores, sua presena seria, de fato, totalmente desnecessria quando a informao fosse perfeita - xadrez, velha, damas etc. Nos jogos de informao imperfeita, por sua vez, seu papel restringir-se-ia ao uso do blefe, isto fazer passar ao outro a falsa impresso de fora ou fraqueza, no intuito de induzir o oponente a desistir de executar uma determinada estratgia por causa dessa informao confusa. Neste sentido, a comunicao atuaria como uma sinalizao de um falso comportamento que visaria gerar incerteza e, por conta disso, limitar as escolhas do adversrio. Vale dizer que a comunicao no serviria como fonte de solues, mas de ardil restrito aos jogos de informao imperfeita, e que somente uma mistura de estratgia adequada, como a maximin representa uma resoluo para tais tipos de jogos entre duas pessoas75. As coalizes que surgem nos jogos cooperativos com n-pessoas, indicam a necessidade de negociao para que haja um efetivo encontro de um conjunto de imputaes que constituam a soluo do jogo. No caso de apenas dois jogadores, a soluo cooperativa ser aquela que encontrar o par de ganhos que garanta a cada uma das partes ao menos aquilo que elas poderiam assegurar jogando sozinhas. Chegar-se-ia a este resultado depois de descartados todos os outros pares que no atendessem a esse requisito mnimo. Contudo, como afirmaram Luce e Raiffa, achar o melhor resultado em um conjunto de negociao com muitos pontos possveis depende de aspectos psicolgicos, relevantes no contexto de uma barganha, e que esto fora da matemtica76. Problemas de Barganha
. Veja Von NEUMANN, J. & MORGENSTERN, O. Theory of Games and Economic Behavior, cap. VI, 30.1.1, p. 264. 74 . Veja RAPOPORT, A. Lutas, Jogos e Debates, cap. XII, p. 156. 75 . Uma anlise detalhada do blefe, em uma variante de pquer simplificada, pode ser encontrada em Von NEUMANN, J. & MORGENSTERN, O. Op. cit., cap. IV, 19.1 a 19.16, p. 186-219, que uma resposta ao problema original tratado por BOREL, . "Le Jeu du Poker", in Trait du Calcul des Probabilits, et de ses Applications, vol. IV, 2, cap. 5. 76 . Veja LUCE, R. D. & RAIFFA, H. Games and Decisions, cap. 6, 6.2, p. 118.
73
41
Uma tentativa de solucionar matematicamente o problema da barganha foi elaborada por John Nash, em 1950, nos artigos "The Bargaining Problem" e "Noncooperative Games". Nash partiu da suposio de que se poderia reduzir os jogos cooperativos (com comunicao prvia) forma no cooperativa. Para isso, bastaria que fosse contrudo um modelo em que a negociao prvia teria suas etapas transformadas em um jogo no-cooperativo com uma quantidade infinita de estratgias puras que representariam toda situao. A soluo obtida para este jogo "alargado", por conseguinte, corresponderia ao valor obtido em um jogo cooperativo equivalente77. Pelo "programa de Nash", a soluo de um jogo no-cooperativo, quando houvesse, seria um par de equilbrio nico, considerando que cada indivduo deseja maximizar sua utilidade; que o acordo obtido se torna obrigatrio por no poder ser superado por nenhum outro alternativo, dentro do mesmo conjunto de negociao compacto e convexo, geometricamente; e que ambos jogadores tenham a mesma habilidade de barganha. A soluo de Nash, em jogos com barganha, equivale ao ponto de equilbrio que corresponde ao mximo de todos produtos de utilidade maiores que zero. Na diviso de $100 entre dois jogadores, por exemplo, a soluo de Nash (50, 50), desde que a utilidade seja assumida como linear, do mesmo modo que o dinheiro. Nenhum outro par de coordenadas, dentro da regio de resultados possveis desenhada no grfico da Figura 2.1, pode oferecer um produto de suas utilidades que seja superior a 2500.
Figura 2.1
Matematicamente, a justeza do programa de Nash indiscutvel. Entretanto, a maneira pela qual o conceito de barganha definido pode ser discutida. Sua suposio de que, em uma negociao, os indivduos sejam "altamente racionais, possam comparar detalhadamente seus desejos pelas coisas, sejam igualmente capazes de negociar e tenham pleno conhecimento dos gostos e preferncias do outro"78 restringe o contexto da barganha a situaes de informao completa onde haja o pleno conhecimento comum das preferncias por parte dos jogadores. Barganhas com informao incompleta permanecem um desafio para os tericos. Outro modelo de negociao lanado nos anos 1980 por Ariel Rubinstein permitiu analisar a troca de ofertas alternadas entre os jogadores, levando em conta o grau de impacincia dos jogadores (o desejo destes anteciparem o final do jogo). Isto , em um jogo sequencial - quando os jogadores tomam decises em rodadas sucessivas e em determinada ordem de movimentos - a alternncia de ofertas chegar a uma soluo se esta representar um equilbrio perfeito em seus subjogos. Um subjogo qualquer parte de um jogo na forma extensiva que se inicia em um nico n de deciso e forma um conjunto completo de ns e ramos que sucedem a este n. Eventualmente, um subjogo
77 78
. Veja NASH, J. "Non-cooperative Games", in Essays on Game Theory, p. 295. . NASH, J. "The Bargaining Problem", in Essays on Game Theory, p. 155.
42
apresenta um n terminal em equilbrio de Nash, cuja combinao de movimentos que leva ao ponto de equilbrio no apenas em todo jogo estendido, mas tambm em cada subjogo existente na rvore original. Quando isto acontece o ponto considerado de equilbrio perfeito em subjogos. Um jogo de negociao simplificada para diviso dos $100, sob o modelo de Rubinstein, ilustra como esse equilbrio seria encontrado entre dois jogadores pacientes ou com graus diferentes de impacincia. Ambos devem resolver essa diviso no mximo em trs rodadas, sendo que o primeiro tem um grau de impacincia "l" e o segundo "c", que devem descontar os ganhos futuros como uma taxa para cada rodada. Alm disso, caso um jogador tenha um ganho igual nas opes oferecidas em um determinado ponto de deciso, ele preferir a alternativa que oferecer maior ganho para o adversrio, do contrrio, se no houver acordo, ambos nada ganharo. A figura 2.2 mostra como esse jogo finito de ofertas alternadas com impacincia, registra na primeira rodada a aceitao da oferta, como equilbrio de Nash perfeito.
Figura 2.2
Pelo modelo de negociao de Rubinstein, possvel analisar diversas situaes variantes desde quando jogado em apenas uma etapa at um jogo infinito com um nmero indeterminado de rodadas. Na verso de uma etapa, tambm conhecida como jogo do Ultimato, testes empricos mostraram que a maioria das ofertas do primeiro jogador (Linha) aproximam-se da oferta justa (50, 50), que seria a soluo no modelo de negociao de Nash. Em geral, as ofertas menores do que 30% arranhavam a reputao do segundo jogador (Coluna) que prefere a recusar ao invs de aceitar uma proposta indecorosa. A previso terica, no entanto, baseada na suposio de agentes egostas, seria de que qualquer oferta, por mais nfima que fosse deveria ser aceita por parte de Coluna, tal como o esprito da interpretao que sugere ser a opo por (100, 0) preferida sobre (0, 0), como qualquer quantia muito pequena oferecida prxima de zero, semelhante a um centavo para Coluna e $99,99 para Linha79. Num jogo extensivo finito, o equilbrio de Nash buscado atravs de induo reversa, tambm conhecida como algoritmo de Zermelo em jogos sequenciais com informao perfeita, ou ainda pelo nome pomposo de procedimento padro de
79
. Para ser justo com Rubinstein, KREPS, D. M. Game Theory and Economic Modelling, cap. 5, pp. 125-126 lembra que em seu artigo de 1982 ("Perfect Equilibria in a Bargaining Model"), Rubinstein observara que jogos de negociao com alternncia de ofertas que tenham muitos equilbrios de Nash, h um nico equilbrio livre de ameaas que est prximo da diviso meio a meio.
43
programao dinmica. Partindo das "folhas" - pontos terminais - at a "raiz" - ponto inicial -, em cada "n" - ponto de deciso - de um jogador, escolhe-se o "ramo" movimento - que leva ao subjogo que lhe oferea o maior ganho. Uma vez encontrado o ponto de equilbrio que represente uma soluo para o subjogo original e todos os outros na mesma rvore, ter-se- achado o equilbrio de Nash perfeito dos subjogos. Assim, a diviso dos $100 em trs lances de oferta, contra-oferta e oferta final faz com que Linha pronha ficar com tudo ou nada para ambos como sua ltima proposta. Considerando o grau de impacincia da Linha que varia entre 0 e 1, Coluna, sabendo que na ltima etapa ele corresponder a 1 (o total em jogo), prefere ganhar 1 - l e oferecer l a Linha, que na penltima etapa seria um pouco menor que um (devido taxa de desconto), a ficar sem nada no final. Contudo, para evitar chegar nessa fase, Linha pode preferir explorar a impacincia de Coluna, oferecendo-lhe de imediato c - algo maior que 0 e menor que 1 multiplicado pelo que ganharia depois (1 - l). Destarte, considerando a impacincia dos dois, a negociao entorno dos $100 os dividiria a uma proporo que desse 1 - c(1 - l) para Linha e c(1 - l) Coluna, logo no primeiro lance80. Em uma variante mais ampla da barganha, para chegar-se ao equilbrio perfeito de subjogos em negociaes com infinitas alternncias de ofertas, no possvel se recorrer induo reversa. Nestes casos, o modelo de Rubinstein prev que o equilbrio perfeito ficaria na proporo da diviso oferecida pelo primeiro jogador (Linha) que propusesse para o segundo jogador (Coluna)
c(1 - l)/1 - cl
e o prprio ofertante ficasse com

1 - c/1 - cl
desde que seus graus de impacincia estivessem entre 0 e 1, sendo ambos indiferentes a aceitar ou rejeitar uma oferta feita81. Tudo isso e mais alguma coisa que no foi dita, mas ser apresentada no momento oportuno, o que acontece nas negociaes tendo em vista os modelos de Nash e Rubinstein. Contudo, embora a comunicao seja um elemento chave da barganha, no plenamente considerada nesses contextos que apenas a supem. Os efeitos da comunicao na negociao comeam a aparecer com maior destaque quando se observa um jogo sugerido por Thomas Schelling que prope a diviso dos $100 simultaneamente por dois jogadores, mas sem a possibilidade de troca de informao. Caso a soma das pretenses dos dois viesse a ser menor ou igual a $100, ambos ganhariam a respectiva quantia acertada. De outro modo, nada receberiam82. Nestas circunstncias, Schelling revela que 36 das 40 pessoas que participaram do teste, nos anos 1950, decidiram ficar com $50. A resoluo do problema de coodenao da diviso dos $100 levou a busca pela nica resposta que entre outras tantas poderia servir como coordenadora, mesmo que os interesses divergentes de ambos fosse uma dificuldade quase intransponvel para o encontro de uma soluo "justa", numa barganha explcita. A ausncia de comunicao, tacitamente gerou a diviso equilibrada por meio de linhas de ao comuns entre os agentes. De fato, como interpreta Schelling, o foco na diviso meio-a-meio deveria ser creditado a padres ticos, opinio pblica ou
80 81
. Veja VARIAN, H. R. Microeconomia, cap. 29, 29.7, pp. 573 e ss. . Duas apresentaes didticas diferentes do mesmo resultado de Rubinstein podem ser encontradas respectivamente em FIANI, R. Teoria dos Jogos, cap. 5, p. 132 e VARIAN, H. R. Op. cit., cap. 29, 29.7, pp. 575. 82 . Veja SCHELLING, Th. C. The Strategy of Conflict, cap. 3, p. 61.
44
algum mecanismo precedente partilhado em comum pelos jogadores83. Elementos aos quais tambm podem ser creditados os resultados prximos oferta "justa" que ocorrem no Jogo do Ultimato - quando a barganha deve ser decidida em uma etapa de oferta. O conceito de ponto focal foi defendido por Schelling como principal ferramenta na barganha tcita e um dos principais na negociao explcita, onde os participantes precisam convergir suas expectativas. "Pontos focais" serviriam como sinais claros que pudessem ser lidos sem ambiguidade. Alm da Negociao Muitos outros conceitos, alm daqueles trabalhados na barganha, foram elaborados por tericos dos jogos que se debruaram sobre o papel da comunicao na soluo de desafios estratgicos. De um modo geral, jogos com comunicao foram definidos como sendo aqueles em que, alm das opes de estratgicas puras especificadas na estrutura do jogo, possvel aos jogadores fazer uso de uma srie de alternativas implcitas que permitem a comunicao entre eles. As partes no precisam sequer assinar contratos, bastando apenas que possam falar84. Instrumentos como mediador, sinalizao, credibilidade, neologismo, conversa barata (cheap talk), entre outros conceitos podem ser decisivos para a anlise correta desse tipo de jogo. A partir dos testes realizados por Schelling, percebeu-se que os movimentos dos jogadores pelos ramos de um jogo na forma extensiva no eram suficientes para descreverem a riqueza de possibilidades que a comunicao pode produzir quando os jogadores entram em contato uns com os outros. A insero da comunicao em suas estratgias implcitas permitiu modelar jogos cujo estudo apresentaram em detalhes os efeitos das ameaas e promessas - quando so crveis ou no, bem como as respostas plausveis que as evitem ou tornem vinculantes -, alm do refinamento dos equilbrios para coordenao de expectativas. Neste contexto, merecem detaque os trabalhos de Robert J. Aumann (Nobel de economia em 2005), Roger B. Myerson, Joseph Farrell, David M. Kreps e Joel Sobel, entre outros que ajudaram a construir uma Teoria dos Jogos capaz de tratar dos problemas da comunicao altura das tradicionais teorias acadmicas sobre o assunto. A ponto de servir como uma ponte entre concepes de racionalidade estratgica e comunicativa, na filosofia. Por outro lado, a concepo naturalista da comunicao, por sua vez, demanda que esta possa ser entendida como um desenvolvimento biolgico que trouxe algum tipo de vantagem em termos de sobrevivncia e reproduo para o indivduo. A comunicao no poderia, ento, existir sem que fatores materiais evidentes concoressem para isso. Entendida como uma ao que visa transmitir informaes entre duas ou mais partes, a comunicao tem uma estrutura prpria e um fim que no se esgota no entendimento do significado da mensagem, mas exige a realizao de seu contedo lingustico, para ser mantida. O que vale dizer que a ao comunicativa se estende a seus fins instrumentais: mudar o estado do mundo em favor de quem comunica. Essa uma das extenses do sentido de controle e comando apontado pela ciberntica como essencial ao processo comunicativo, pois, para que o emissor saiba que sua informao foi corretamente compreendida pelo ouvinte, se requer que este o responda, executando uma ao correspondente85. Assim, a matria sobre a qual a
83 84
. Veja SCHELLING. Th. C. Op. cit., cap. 3, pp. 66 e ss. . Ver MYERSON, R. B. "Communication, Correlated Equilibria and Incentive Compatibility", p.828. 85 . Veja WIENER, N. Op. cit., cap. 1, p. 16.
45
comunicao trabalha depende dos interesses individuais, que no se reduzem ao emprego correto de "pressupostos pragmticos" - como quer a Teoria do Agir Comunicativo da qual se falar adiante. Para que tenha significado e credibilidade se faz necessrio um "conhecimento comum" perene do jogo de linguagem praticado. A seguir, toda essa discusso ser observada mais de perto, comeando pela apresentao dos conceitos utilizados durante na pesquisa em torno dos jogos com comunicao. 2.1 Informao Perfeita, Ameaas e Outros Conceitos
A formalizao matemtica dos modelos de negociao de Nash e Rubinstein, alm de suas variantes e dos modelos de Harsanyi-Zeuthen86, s foi possvel depois que o prprio John Nash se props interpretar a capacidade de negociar de uma maneira diferente da que havia sido traada por Von Neumann e Morgenstern. Antes, as dificuldades percebidas para a descoberta de um resultado nico para um processo de barganha decorria do fato de se considerar impondervel a capacidade de negociao dos agentes. Por causa disso - como conta Ken Binmore, na introduo aos Essays on Game Theory, de John Nash87 -, a soluo para os jogos cooperativos estava voltada para formao de coalizes em um conjunto de resultados que representassem a distribuio dos ganhos entre os participantes. O que significa que, do ponto de vista dos jogos cooperativos, neste tipo de imputao, os jogadores atuariam no sentido de descartar todos os pares de pagamentos conjuntos que fossem dominados por outro ou ao menos o que cada um pudesse obter sem participar da cooperao, ficando a soluo entendida como o conjunto das imputaes que no podem ser dominadas internamente, entre si, nem externamente, por uma outra escolhida fora do conjunto88. Os jogos cooperativos pressupem que os jogadores possam coordenar seus planos, se ameaarem e fazerem promessas, em um processo de barganha fora das regras formais do jogo. Neste sentido, Luce e Raiffa destacaram que a seleo de um resultado entre a multiplicidade de pontos em um conjunto de negociao dependeria de "certos aspectos psicolgicos dos jogadores que so relevantes para o contexto de barganha"89. Von Neumann e Morgenstern pensavam estar fornecendo a primeira abordagem matemtica apropriada para a sistematizao das condies psicolgica do problema da barganha, quando tratavam a negociao a partir da perspectiva dos jogos cooperativos. Entretanto, Nash no se satisfez com a constatao de que a soluo para o problema da barganha fosse indeterminada e imaginou que os jogadores poderiam ser dotados de tcnicas de negociao que fossem as melhores para a situao em que eles se achavam, ao invs de esperar que um negociador racional idealmente fosse mais habilidoso do que um outro. Desse modo, a soluo cooperativa de Von Neumann e
. Uma introduo acessvel aos modelos de barganha no-cooperativa pode ser encontrada em BINMORE, K., OSBORNE, M. J. & RUBINSTEIN, A. "Noncooperative Models of Bargaining", in AUMANN, R. J. & HART, S. Handbook of Game Theory, vol 1, cap. 7, pp. 181-225. Outros que propuseram modelos de negociao tendo por base a teoria dos jogos cooperativa foram KalaiSmorodinsky e Maschler-Perles. Descrio sumria dos modelos de Kalai-Smorodinsky e MaschlerPerles pode ser lida em SHUBIK, M. Teora de Juegos en las Ciencias Sociales, VII, 6.1 e 6.2, pp. 192-196. Muitos detalhes, como desconto, risco, pagamentos laterais, negociao com mltiplos agentes, entre outros, no podero ser discutidos aqui. 87 . Veja BINMORE, K. "Introduction", in NASH, J. F. Essays on Game Theory, p. XIII. 88 . Veja VON NEUMANN, J. & MORGENSTERN, O. Theory of Games and Economic Behavior, cap. 1, 4.5, pp. 39-40. 89 . LUCE, R. D. & RAIFFA, H. Games and Decision, cap. 6, 6.2, p. 118.
86
46
Morgenstern passou a ser interpretada sob a tica dos mesmos fins bsicos que subjazem teoria dos jogos cooperativos e no-cooperativos, embora nem sempre a viso da negociao como jogo no-cooperativo possa ser reproduzida na realidade. Por sua vez, Ken Binmore, Martin Osborne e Ariel Rubinstein consideram que tanto a teoria dos jogos cooperativos como a dos no-cooperativos podem ser compreendidas como complementares, pois, por ser mais ampla, a interpretao cooperativa da negociao apresentaria o conjunto de solues que, apesar de indeterminado e genrico, permitiria ao modelo da barganha no-cooperativa apontar especificamente em quais contextos o conceito de soluo aplicvel90. O que de certo modo, permite Shubik argumentar que o uso dos termos "cooperativos" ou "nocooperativos" inadequado, uma vez que a descrio das situaes por regras formais no traz imanente a cooperao ou no-cooperao91. A despeito dessa diversidade de opinies, em Two-Person Cooperatives Games (1950), Nash procurou mostrar como se poderia reduzir o jogo cooperativo a um jogo no-cooperativo, onde a comunicao das etapas de negociao ocorresse em movimentos sequenciais, representados na forma extensiva. Para tanto, cada jogador teria de possuir informao completa da estrutura do jogo e da funo de utilidade de seu oponente, sendo ambos indivduos plenamente racionais. O que vale dizer que todos jogadores sabem que cada um tem o conhecimento comum (informao partilhada pelos envolvidos) de todas as suas respectivas estratgias e ganhos, durante todo o desenrolar do jogo. Assim, cada um sabe quantos participam do jogo, as decises que podem tomar e as suas recompensas esperadas92. Alm disso, na evoluo do jogo, cada jogador tem a informao perfeita sobre qual ponto de deciso, n do jogo extensivo, se encontra, isto , na sua vez de escolher o que fazer o agente sempre sabe o que os outros fizeram at aquele momento.
Figura 2.3
A perfeio e completude das informaes disponveis permitem aos jogadores racionais encontrar por meio do procedimento da induo reversa o equilbrio perfeito do jogo, antes mesmo de executarem suas aes. O Jogo da Centopia - desenhado na figura 2.3 - serve como exemplo de revelao dos efeitos desses conceitos quando analisados sob este mtodo. Partindo do ltimo movimento, a melhor escolha de Coluna
90 91
. Veja BINMORE, K., OSBORNE, M. J. & RUBINSTEIN, A.Op. cit., vol 1, cap. 7, pp. 181-182. . Veja SHUBIK, M. Op. cit., IX.1, p. 232, n. 1. 92 . Veja NASH, J. F. "Two-Person Cooperative Games", in Essays on Game Theory, pp. 129-130.
47
seria "esquerda" que lhe proporciona um util a mais do que a "direita". Contudo, Linha prevendo que isto poderia acontecer na penltima rodada, dobraria "esquerda", garantindo 99 para ambos. Porm, antes que isso viesse ocorrer Coluna j teria desviado "esquerda" que lhe pagaria 100, ao invs de se arriscar aos 99. Descendo assim a rvore, a centopia chegaria s primeiras etapas, onde, seguindo sempre pela "direita", se voltaria raiz no momento em que Linha j sabendo de tudo que iria se desenrolar, decide escolher a estratgia da "esquerda", de modo que em vez de conseguirem (100, 100) os jogadores da centopia acabam por conseguirem apenas (1, 1). A perplexidade diante do paradoxo da centopia mais uma entre tantos paradoxos apresentados pela Teoria dos Jogos e decorre das premissas de racionalidade e maximizao da utilidade que foram apontadas antes. Mas outros fatores contribuem para sua previso terica afronte as intuies do cotidiano. Desde quando Robert W. Rosenthal apresentou o primeiro estudo sobre a "centopia" - no artigo "A Model in which an Increase in the Number of Sellers Leads to a Higher Price" ("Um Modelo no qual um Incremento no Nmero de Vendedores Leva ao Preo Superior", 1980) -, vrios testes empricos indicaram que raramente o primeiro jogador escolhe o equilbrio perfeito descoberto atravs da induo reversa93. O conhecimento comum que todos os jogadores partilham entre si das informaes relevantes sobre o outro, somado ao prazo finito da interao e a plena conscincia das informaes que estam em jogo faz com que, teoricamente, a busca pelo menor risco leve a um resultado mnimo, mas seguro, na perspectiva de quem tem uma reputao a preservar. Na prtica, entretanto, a imperfeio da informao pode levar a resultados melhores, na Centopia, devido incerteza quanto ao final do jogo ou sobre a personalidade do oponente. A informao imperfeita evitaria assim que a induo reversa pudesse ser aplicada. Como foi dito no ponto anterior, a induo reversa o mtodo mais prtico para se encontrar em um jogo extensivo - uma rvore de Kuhn - o equilibrio perfeito de um subjogo que vale para todos os outros subjogos e para toda rvore original, ao se descobrir a folha que representa o par de ganhos em equilbrio para os jogadores, sendo o resultado superior daquele que fez o ltimo movimento correspondente a sua subrvore. No jogo da Centopia, o equilbrio perfeito recai sobre (1,1) logo no primeiro movimento do primeiro jogador que d incio a ele. As maneiras pelas quais se pode ter acesso s alternativas melhores na Centopia e os modelos de jogos dessa famlia sero expostos no terceiro captulo. Por enquanto, outros conceitos relacionados com a comunicao precisam ser introduzidos. Os Conceitos dos Jogos com Comunicao Embora o modelo de negociao de Nash seja formal ao extremo de praticamente ignorar a cooperao gerada pela comunicao prvia - lembre-se que ele reduziu os jogos cooperativos aos no-cooperativos em seu programa -, teve de incorporar as trocas de ameaas, como dispositivo necessrio para alcanar o nico ponto de equilbrio da negociao. Ameaas e promessas constituem compromissos ou aes que os agentes poderiam dispor para restringirem suas escolhas ou as dos outros no futuro, de maneira que no possam mais voltar atrs94. Na viso de Nash, algum ameaa o outro quando o convence de que caso no atue conforme sua exigncia, ento o ameaador ser obrigado a agir no sentido que havia proposto, ainda que isto seja algo
93 94
. Veja KREPS, D. M. Game Theory and Economic Modelling, cap. 4, pp. 77-82. . Veja BINMORE, K., OSBORNE, M. J. & RUBINSTEIN, A.Idem, vol 1, cap. 7, 4, p. 197.
48
que o prprio agente no quisesse fazer95. Uma definio para ameaa mais curta dos que as cinco regras semnticas que Searle props para indicar esta funo ilocucional na teoria dos atos de fala, a saber: 1. Uma ameaa deve ser emitida por uma frase, cuja emisso predica um ato futuro do falante, caso o ouvinte no aja segundo a demanda do falante; 2. A ameaa deve ser emitida se o ouvinte prefere que o falante no a realize e est em condies de fazer o que o falante quer, sabendo este disto; 3. A ameaa ser enunciada se no for bvio para os agentes que ser executada no decurso normal dos acontecimentos; 4. Ao enunciar a ameaa o falante tem realmente a inteno de faz-la, caso o ouvinte no faa o que este quer; 5. E sua emisso vale como uma obrigao de realizao da ao por parte do falante, se o ouvinte no agir como ele deseja96. De qualquer forma, trata-se da situao que pode ser claramente representada na matriz montada por Luce e Raiffa, em Games and Decisions, reproduzida na figura 2.4. O par (0, 100) mostra o equilbrio que resulta do encontro das estratgias puras dominates alto e esquerda, respectivamente para Linha e Coluna. Sem a possibilidade de comunicao e jogado simultaneamente de uma nica vez, previsvel que Coluna v receber 100 e Linha zero. Entretanto, se for permitida a comunicao prvia entre os jogadores, Linha ter a oportunidade de impor um acordo a Coluna, ameaando jogar "baixo", ainda que viesse sofrer a perda de -1, caso seu oponente mantivesse a posio da "esquerda" e no aceitasse abrir mo dos 100 em seu favor, pelos resultados produzidos atravs das aes "alto-direita". Do ponto de vista de um agente egosta, esse tipo de comportamento, da parte da Linha seria impensvel, posto que qualquer perda, ainda que pequena, deve ser evitada pela racionalidade estratgica, presumida. Contudo a possibilidade de ameaa est aberta pela via da comunicao e se Coluna prefere fazer valer sua expectativa de ganho, deve evitar de todo modo entrar em contato com Linha, mantendo o jogo na categoria no-cooperativa e preservando o curso "natural" das coisas. Por sua vez, Linha, caso queira perseguir os 100, deve procurar de todas as maneiras levar Coluna mesa de negociao, onde demonstraria todo seu poder de barganha. Neste caso, Coluna poderia contra atacar ameaando "direita" se Linha jogar "baixo". Porm, o prejuzo que teria seria maior do que os -40 impostos ao primeiro, j que o prprio perderia 100 a mais do que em sua dominante. A ameaa de Coluna, portanto, teria pouca credibilidade em relao a da Linha97.
Figura 2.4 Linha Estratgias Alto Baixo Coluna Esquerda Direita 0, 100 100, 0 -1, -200 -40, -300
Para que a comunicao da ameaa surta algum efeito, preciso que o oponente no perceba que haja qualquer incentivo da parte de quem ameaa para mentir. Desde modo, o grau de credibilidade que o contedo desta informao pode alcanar depende da coincidncia dos interesses dos jogadores em um ponto de equilbrio vivel. Mas ainda assim, uma completa previso do que pode acontecer depende de um entendimento detalhado da anlise econmica e psicolgica dos agentes, posto que entra
. Veja NASH, J. F. Op. cit., p. 130. . Tentativa de estabelecer as regras semnticas da ameaa tendo por base a teoria exposta por SEARLE, J. R. Atos de Fala, cap. 3, 3.4, pp. 86-95. 97 . Veja LUCE, R. D. & RAIFFA, H. Op. cit., cap. 6, 6.3, pp. 119-120.
96 95
49
em jogo tambm a reputao de cada um e sua disposio em preserv-la. A troca de ameaas em uma negociao visa promover a dissuaso entre as partes. Nesse sentido, agir como uma mquina do juzo final torna-se um recurso muito eficaz em situaes extremas. Por outro lado, paradoxalmente, cortar as comunicaes pode vir a ser a melhor atitude de quem tenha vantagem se o jogo for disputado de uma s vez na forma no-cooperativa, sem conversaes prvias. Alm disso, um dos fatores que contribuem para reforar a credibilidade das aes o custo de realizao das ameaas. Quanto maiores eles forem e quanto mais abrangentes as suas consequncias, maiores so as dvidas de que possam vir a ser desempenhadas, tal como a possibilidade de destruio nuclear, depois da Guerra Fria. Esse detalhe sobre o custo da ameaa para o falante permite que a interpretao desse tipo de ato de fala, seja mais abrangente, atravs da Teoria ds Jogos do que apenas pela Filosofia da Linguagem, uma vez que vai mais longe que a viso analtica, semntica, ou at pragmtica, comum a essa rea da filosofia, e amplia os estudos da compreenso do comportamento lingustico, incorporando os interesses expressos na funo de utilidade dos agentes falantes. Outro aspecto lingustico importante que pode ser tratado pela teoria dos jogos falados diz respeito ao significado que no pode ser entendido apenas por anlise de conceitos. As mensagens que so empregadas para formao de equilbrio e precisam ser enviadas dependem do conhecimento comum da lngua partilhado pelos falantes de uma comunidade. Mensagens que sejam consideradas neologismos, inesperadas para o contexto em que esto sendo usadas, no permitem que pontos de equilbrios possam ser encontrados, exceto quando seu significado literal considerado. De tal sorte, que a interpretao do significado fornecida por Joseph Farrell corrobora a concepo wittgensteiniana de que o uso uma das principais maneiras de conferir significado aos termos da lngua98. Mesmo que problemas de comunicao possam impedir a troca de informaes entre os jogadores, prejudicando a compreenso do significado, modelos de situaes onde se busca a coordenao, mostram que pontos focais podem ser descobertos por agentes que partilhem interesses comuns e convivam sob convenes semelhantes. Seguindo Thomas Schelling, de um modo geral jogos de coordenao so aqueles em que situaes de negociao tcita podem transformar o conflito de interesses na escolha por uma ao coordenada promovida por um consenso em torno de um resultado que corresponda mesma interpretao de algum sinal que sirva de foco para o encontro das trajetrias traadas. Tais pontos focais precisam ser ntidos e restringirem os possveis resultados. Jogos de coordenao podem surgir entre pessoas com interesses divergentes, como na diviso meio-a-meio dos $100 ou podem aparecer como "pura coordenao" na matriz da figura 2.5.
Figura 2.5 Linha Estratgias Alto Centro Baixo Esquerda 10, 10 0, 0 0, 0 Coluna Centro 0, 0 9, 9 0, 0 Direita 0, 0 0, 0 10, 10
Embora (9, 9) no oferea o melhor pagamento entre os pontos de equilbrio, o nico resultado que permite o encontro sem confuso entre os jogadores, na ausncia de comunicao, pois prov uma dica ou "cola" que orienta as escolhas comuns feitas por
98
. no artigo FARRELL, J. "Meaning and Credibility in Cheap-Talk Games", 5, p. 519 que a aproximao entre a Teoria dos Jogos e a Teoria da Linguagem de WITTGENSTEIN, L. Investigaes Filosficas aparece de uma forma explcita.
50
agentes racionais. Pontos focais, nem sempre fornecem a melhor soluo para os indivduos, no sentido estrito da teoria dos jogos, mas so uma indicao de que, em contextos empricos, sinais e convenes devem ser apreciados para que uma escolha recaia em solues racionais fora de "uma formulao dos jogos puramente matemtica"99. Na coordenao das aes, a comunicao leva ao encontro de um equilbrio mais refinado para os agentes, principalmente quando o timo de Pareto est disponvel. Porm, ainda que uma comunicao direta no seja possvel a simples presena de um rtulo ou mediador (humano ou mquina) pode ajudar os jogadores a se comunicarem ou sugerir estratgias que levem aos melhores resultados. Sua atuao fica evidenciada, por exemplo, em jogos de multi-estgios como o da figura 2.6. A tarefa do mediador de procurar uma ao recomendvel para cada jogador, que pode ser uma probabilidade, e apresent-la confidencialmente a cada um. Tais aes so calculadas a partir de relatrios fornecidos pelos jogadores, e sua preciso depende da honestidade dos relatos e da obedincia s recomendaes.
Figura 2.6
De acordo com a interpretao fornecida por Roger B. Myerson, este jogo de multi-estgios faz com que o primeiro jogador, a Linha, tenha um momento em que pode decidir se escolhe a ao "A", onde um equilbrio de Nash aguarda em (2,2), ou "a", arriscando obter (5,1) como um outro ponto de equilbrio que poderia ser alcanado se Coluna fosse para "E" depois de Linha ter jogado "C". Contudo, apenas um mecanismo gerador de probabilidade poderia tornar isto factvel, uma vez que o conjunto de informao de Coluna no permitiria que este decidisse pela estratgia pura "E", sabendo que poderia ganhar (1,5), seguindo "D". Se um meio de comunicao pudesse garantir que a probabilidade 0,5 seria assinalada para ambos resultados (C, E) e (B, D), ento, cada um poderia receber a expectativa de ganho de pagamento (3, 3), como uma mistura dessas duas estratgias. Porm, este novo ponto de equilbrio s estaria disponvel se Linha abrisse mo de ir para "A", estratgia que domina "B", por lhe fornecer dois seguros e no apenas o incerto um. Neste instante, a presena de um mediador facilita-lhe as coisas ao recomendar que Linha v para "a", a fim de maximizar sua utilidade esperada. No segundo estgio, o mediador imparcial faz suas recomendaes depois de lanar uma moeda, cujos lados estariam vinculados respectivamente s estratgias conjuntas (C, E) e (B, D). Sua orientao no ser desobedecida enquanto um jogador esperar que o outro obedea s instrues. Tentar fugir unilateralmente dessa situao, tem como punio zero de recompensa. Tal exemplo, ilustra o modo como a comunicao em multi-estgios, feita em qualquer
99
. SCHELLING, Th. The Strategy of Conflict, apndice C, pp. 302-303.
51
etapa do jogo extensivo, pode gerar novos equilbrios com a interveno de um mecanismo de mediao adequado100. Sinalizao e "Conversa Barata" Todas as situaes em que a comunicao foi apresentada at agora foram montadas de maneira que a troca de mensagens e a transmisso de informaes, de um modo geral, no representavam nenhum custo para o emissor, falante ou ouvinte. Quando isso acontece, significa que o simples fato da conversao ter sido permitida no alterou os valores da matriz de pagamentos dos jogadores envolvidos. Uma conversa barata, alm do custo zero de implementao, s pode ser compreendida quando a comunicao plena, sem mediadores e sem compromissos vinculantes anteriores. Em uma "conversa barata", os jogadores simplesmente falam, embora nem sempre os jogadores confiem na verdade do que dito ou acreditem na palavra de quem fala. No obstante, ainda que no modifique diretamente os pagamentos, as respostas dos ouvintes ao que dito afetam decisivamente o resultado do jogo. O que significa que em deternimados cenrios a conversao plena pode gerar a confiana e a crena que motivem os jogadores cooperao101. Desde que Luce e Raiffa criaram a "Batalha dos Sexos", sabe-se que a presena da comunicao proporciona resultados melhores, na fronteira do timo de Pareto, aos jogadores. O segundo estgio do exemplo fornecido por Myerson uma variante da "batalha" original na sua forma extensiva. Nestes casos, um mecanismo de mediao gera a confortvel aplicao de suas estratgias mistas. Entretanto, uma autntica conversa barata no lana mo de tais recursos. Se for permitido que um dos jogadores, como a Linha, tenha a primazia de transmitir uma mensagem antes de Coluna anunciar sua deciso, a escolha por sua estratgia favorita obrigar o segundo a seguir esse programa, sob pena de ambos nada obterem. Para que o jogo de conversa barata, tambm chamado de Jogo Falado102, tenha efeitos positivos sobre as pretenses dos jogadores de modo simultneo, preciso que se constitua uma loteria em que ambos troquem mensagens ao sabor da sorte at que uma estratgia coordenada surja em primeiro lugar. Assim, uma longa conversa barata soluciona o problema de coordenao em jogos onde haja conflitos de interesses, como na Batalha dos Sexos, ao permitir que a troca de informaes seja feita, durante vrias rodadas indeterminadas, at que uma opo em equilbrio surja entre os falantes. No entanto, existem razes para estar ctico quanto eficincia dos jogos falados que sero tratadas a seguir. Em geral, no jogo falado, as mensagens que esto sendo utilizadas no influem nos ganhos dos jogadores, pois seus significados so de conhecimento comum. Os equilbrios obtidos dependem apenas do contedo da informao que est sendo enviada e das aes tomadas a partir disso. As mensagens passam a determinar os resultados quando a informao incompleta para os jogadores, isto , um jogador (o emissor) sabe de alguma coisa relevante que o outro (o receptor) desconhece. Nesta circunstncia, a transmisso de um sinal eficaz passa a ter importncia decisiva nos jogos chamados de sinalizao, aqueles que na sua descrio cannica correspondem ao jogo simples de duas pessoas, desenrolado em dois estgios, no qual o Emissor (E) detm uma informao privada com um tipo de valor (t ) que deve ser transmitida por
. Tudo isso est em MYERSON, R. B. "Multistage Games with Communication", 2, pp. 325-327. . Veja FARRELL, J. & RABIN, M. "Cheap Talk", p. 104 e AUMANN, R. J. & HART, S. "Long Cheap Talk", pp. 1 e 2. 102 . Para a explicao que se segue, veja AUMANN, R. J. & HART, S. Op. cit., p. 14.
101 100
52
uma mensagem ou sinal (s), tirada do repertrio (S), ao Receptor (R). Este, por sua vez, embora desinformado, possui crenas, baseadas no conhecimento comum, sobre o tipo da informao de E que ser transmitida com uma distribuio de probabilidade qualquer (p), em relao ao conjunto de tipos possveis (T). Ao receber o sinal, R escolhe de sua lista de estratgias compatveis (A) a ao (a) mais adequada a ser tomada. Os ganhos de ambos jogadores obtido por uma funo que envolve os conjuntos (T, S, A) para cada um. Ao passo que, em uma "conversa barata", os resultados dos falantes so atingidos pelas funes de (T, A), j que a mensagem no acarreta nenhum custo para ambos. Sobre outro aspecto, as mensagens que no so usadas para formar equilbrios so chamadas de neologismos. Apesar de inesperados, os neologismos podem, entretanto, vir a ter significado e credibilidade, quando o conhecimento comum for rico o suficiente para permitir uma compreenso literal do enunciado. Sua credibilidade tambm pode ser resgatada em situaes em que as mensagens so auto-sinalizantes, quando E deseja que R acredite que o sinal corresponde precisamente a t , sabendo que isso s ser possvel se a mensagem for verdadeira. Nesses casos, R poderia dar crdito ao neologismo, interpretando subjetivamente, com razovel probabilidade, que sua crena na verdade de t correta103. Um exemplo tpico de sinalizao ocorre nas vendas, em geral, onde o vendedor (E) de carros ou imveis procura levar o consumidor (R) a se decidir pela compra do produto ou servio. O produto pode estar em perfeito estado ou conter algum vcio oculto (T) e o vendedor sabe qual o seu verdadeiro tipo. Na dvida, o comprador atribui uma certa probabilidade (p) para o estado do objeto. Sem ter como apresentar diretamente a qualidade do produto, o vendedor deve oferecer uma garantia que ser transmitida por um sinal. O comprador decide, com base nesta mensagem, por pagar um preo que varia de acordo com a amplitude da garantia (A). Algumas variaes desta situao admitem mais de um comprador ou ainda ofertas do tipo pegar ou largar, quando o vendedor junto com a garantia estipula um preo fixo para venda, demonstrando que tem pleno domnio da negociao104. Esses so os principais conceitos empregados na Teoria dos Jogos na hora de analisar os modelos de situaes em que a comunicao exerce a sua influncia. Muitos outros surgem para explicar os detalhes eventuais ao longo da investigao. A seguir, ver-se- como eles podem ser mobilizados nos modelos que j se tornaram clssicos, enquanto a comunicao transformar jogos no-cooperativos em cooperativos, e viceversa, desmanchando os limites tradicionais e apresentado os jogos falados como uma nova categoria, com suas complexidades e dificuldades prprias. 2.2 Jogos com Comunicao e seus Modelos
At o incio dos anos 1980, ainda no havia sido feita uma formalizao que permitisse a tericos dos jogos tratar formalmente modelos de jogos com palavras, gestos e sua eventual ambiguidade. Tericos talentosos, como Shubik, viam dois problemas de difcil resoluo a serem enfrentados na modelagem dos jogos falados. O
. Veja FARRELL, J. Op. cit, 2 a 6, pp. 516-521. . Para descrio do modelo cannico e da sinalizao de mercado, queira ver KREPS, D. M. & SOBEL, J. "Signalling", in AUMANN, R. & HART, S. Handbook of Game Theory with Economic Application, vol. 2, cap. 25, pp. 851-852.
104 103
53
primeiro referia-se codificao das palavras e o segundo descrio do grau de compromisso assumido pelos falantes105. Desde Von Neumann e Morgenstern, que se imaginava ser a forma extensiva a melhor maneira de incorporar a comunicao como parte das estratgias disponveis. Entretanto, as situaes onde a possibilidade de comunicao fosse muito ampla colocava enormes complicaes formais. Roger Myerson explica que a simples comunicao de uma palavra entre dois jogadores obrigaria ao ouvinte ter como conjunto de informao nada mais, nada menos do que todos os verbetes de um dicionrio da mesma lngua do falante106. Tudo isso porque, em teoria dos jogos, os modelos so construdos ostensivamente para atender casos gerais sem privilegiar a realizao de um evento particular. Ao invs de proceder como o principio geral de jogos extensivos, talvez fosse melhor considerar que as chances de comunicao esto de fato implcitas nas estratgias explcitas dos modelos de jogos. Myerson props ento que jogos com comunicao fossem definidos como aqueles em que alm das opes de estratgias descritas especificamente na estrutura do jogo, fossem adicionadas uma ampla faixa de opes tcitas para comunicao entre os jogadores. Para tanto, bastaria que os agentes fossem capazes apenas de falar, sem que se precisasse assumir que eles tenham qualquer habilidade para firmar contratos107. A comunicao implcita, ou tcita, foi tratada intuitivamente por Schelling em sua anlise dos jogos de coordenao, onde possvel encontrar pontos focais que representem uma soluo para as circunstncias em que a comunicao direta no possvel nem desejvel por uma das partes. Isto foi em 1960, a partir da edio do clssico The Strategic of Conflict . Entretanto, a modelagem da comunicao pouco avanou no perodo entre este lanamento e as observaes de Shubik, at que Vincent P. Crawford e Joel Sobel dessem um segundo passo na formalizao de modelos de jogos com emissor e receptor108. No jogo de emissor e receptor entre dois participantes, o emissor possui uma informao privada, mas depende da escolha de uma ao por um receptor desinformado. Ento o emissor envia um sinal ao receptor, que, por ser sujeito a rudo, exige uma interpretao estimada de seu significado a partir da qual ser tomada a deciso sobre uma ao a seguir. (...) Cada agente responde otimamente escolha estratgica de seu oponente, levando em considerao as implicaes luz de suas crenas probabilsticas e maximizando a expectativa de utilidade sobre suas possveis escolhas estratgicas (CRAWFORD, V. P. & SOBEL, J. "Strategic Information Transmission", sec. 2, p. 1433). Uma instncia desse tipo de situao apresentada na figura 2.7 montada por Joseph Farrel e Matthew Rabin109. Dois pontos de equilbrio so encontrados quando os pares de estratgias puras (alto, esquerda) e (baixo, direita) acontecem. Para Linha, seria melhor que Coluna
. Veja SHUBIK, M. Teora de Juegos en las Ciencias Sociales, IX, 4.2, p. 284. . Veja MYERSON, R. "Communication, correlated equilibria and Incentiva Compatibility", in AUMANN, R. J. & HART, S. Handbook of Game Theory, vol.2, cap. 24, p.828. Imagine-se na condio de turista em um pas do qual no conhece o idioma, a procura de uma palavra no seu dicionrio de bolso, para traduzir o que um nativo lhe dissera h pouco! 107 . Veja MYERSON, R. Op. cit., idem. 108 . Veja CRAWFORD, V. P. & SOBEL, J. "Strategic Information Transmission", in Econometrica, vol 50, n 6, pp. 1431-1451. 109 . Veja FARRELL, J. & RABIN, M. "Cheap Talk", p. 106.
106 105
54
esquecesse sua mo direita em casa e escolhesse esquerda. Entretanto, Coluna sabe que baixo domina fracamente alto e caso essa dominante venha ser a escolha efetiva de Linha o melhor que faria seria escolher direita. S Linha sabe quais so suas reais intenes, mas para influir na escolha de Coluna, envia-lhe uma mensagem dizendo que vai jogar "alto". Cabe agora Coluna decidir se vai para esquerda ou para direita. Se acreditar na informao e decidir pela Esquerda, corre o risco de se decepcionar quando receber zero, depois que Linha for para Baixo, optando por ganhar ao menos um, caso Coluna v para Direita.
A falta de um sinal que seja evidente por si mesmo, quer dizer, o tipo de estado que Linha pretende informar a Coluna pode no ser o mesmo que ela realmente est, faz com que a transmisso da informao feita sem custo, nestas circunstncias, no tenha qualquer credibilidade. Para enfatizar sua mensagem teria o emissor de fornecer alguma garantia que lhe fosse custosa, a fim de que os custos pelo no cumprimento da promessa compensassem os riscos do receptor em acreditar na palavra do falante. Caso contrrio, tudo o que o primeiro jogador disse poderia at ter significado, mas nenhum crdito para o tomador de deciso. Tal estrutura subjaz a contextos da vida cotidiana como a busca por emprego em uma firma. O candidato vaga pode querer ocupar um cargo que pague mais, mas que exija alta capacidade, embora saiba que possui habilidade baixa. Sem ter como verificar prontamente a que tipo pertence o candidato a empresa se v obrigada a destin-lo a um cargo inferior. Assim como prevem Farrell e Rabin no artigo "Cheap Talk"110. Uma rodada prvia de conversa barata em nada ajudaria a uma pessoa nessas circunstncias. Quem recebe a informao tem motivos para desconfiar de sua veracidade. Tudo por causa de uma distribuio de valores desfavorvel apreciao da verdadeira condio do falante. Essas situaes so aquelas em que h margem para mentira, uma vez que o emissor teria mais a ganhar ocultando seu tipo real. Ocupar um alto cargo com uma capacidade no correspondente lhe traria um maior ganho do que se houvesse uma paridade na correlao entre o tipo e o sinal transmitido. Pense nos custos de adquirir uma alta capacidade de desempenho. Contudo quando a distribuio dos ganhos na matriz diferente, como na figura 2.8, j no h incentivo nem qualquer vantagem para o falante informar algo que no correponda ao que de conhecimento privado.
Agora, se Linha informar que vai para o Alto, no resta a Coluna outra alternativa a no ser acreditar na mensagem e ir para a esquerda, e vice-versa. A "conversa barata" pode ento exercer plenamente a funo de transmitir um sinal sobre o tipo real do agente. As escolhas das estratgias so ento facilmente coordenadas. o mesmo quadro visto no modelo tradicional da Batalha dos Sexos, com a soluo correspondendo a um dos dois pontos de equilbrios puros existentes.
110
. Veja FARRELL, J. & RABIN, M. Op. cit., pp. 105-107.
55
Comunicao e Interesses No jogo de emissor e receptor apenas uma rodada prvia de comunicao permitida e o sinal segue uma nica direo, sem possibilidade de retroalimentao. Em um conversa mais prolongada a simetria dos papis, de um modo geral, e na Batalha dos Sexos, mais especificamente, poderia servir para esclarecer confuses ou rudos que possam ocorrer desde a primeira transmisso, quando se busca coordenar as aes. Entretanto se os interesses divergentes podem geram conflitos, os ganhos potenciais podem desaparecer na discusso sobre o que se deve cooperar. Na ausncia de um mecanismo de controle da comunicao, o encontro de um ponto focal pode ser a melhor alternativa a uma conversa barata. A comunicao direta desempenha um papel importante, na medida em que os fins dos agentes tenham um relacionamento mais prximo. A perfeio da comunicao depende completamente da coincidncia dos interesses dos participantes, como sugerem Crawford e Sobel, na concluso de seu artigo111. A comparao entre os efeitos do ponto focal, ou conveno, e os de uma conversa barata ilustram essa questo. Linha e Coluna resolvem fazer as pazes e marcar um jantar. Tm quatro opes possveis, sendo indiferentes s trs primeiras que so preferidas em relao quarta - um restaurante ruim, mas prximo dos jogadores. Suas recompensas so expressas na figura 2.9.
Figura 2.9 Restaurantes Um Um 3, 3 Dois 0, 0 Trs 0, 0 Quatro -2, 0 Coluna Dois Trs 0, 0 0, 0 3, 3 0, 0 0, 0 3, 3 -2, 0 -2, 0 Quatro 0, -2 0, -2 0, -2 1, 1
Linha
O par em equilbrio formado pelo encontro das estratgias que levam ao Restaurante Quatro o menos eficiente, muito longe do timo de Pareto. Entretanto, esse ser o ponto focal que atrair as partes caso no seja possvel nenhuma comunicao direta. Se ao menos um nico sinal pudesse ser transmitido ao outro, todos fariam o esforo de comunic-lo e interpret-lo da maneira mais evidente possvel, marcando o encontro em um dos trs primeiros restaurantes. O pior dos mundos seria algum achar que seu sinal fora corretamente compreendido, enquanto o outro ignorando o tipo verdadeiro se encaminha para o Restaurante Quatro. Para evitar tal confuso, a retroalimentao se faz necessria, ou uma conversa um pouco mais estendida capaz de evitar qualquer dvida ou malentendido, com respeito ao destino de ambos. Em todo caso, esse exemplo de pura coordenao esclarece a fora da comunicao direta frente ao ponto focal quando se trata de otimizar os resultados112. Situaes de pura coordenao, como essas, facilmente permitem encontrar uma soluo que seja auto-sinalizante e auto-compromitente. O que ocorre quando Linha, por exemplo, afirma que ir ao Restaurante Trs. Essa sinalizao mostra-se digna de credibilidade para Coluna, uma vez que Linha s expressaria essa vontade de ir a Trs se, de fato, quisesse ir l - seu tipo ser, ento, evidente por si mesmo. Alm disso, Linha tem incentivo para realmente realizar a sua vontade expressa, pois obter na resposta adequada de Coluna o maior ganho disponvel. Acompanhando Farrell e Rabin, "uma mensagem que ao mesmo tempo auto-sinalizante e auto-compromitente, parece
. Veja CRAWFORD, V. P. & SOBEL, J. Op. cit., vol 50, n 6, pp. 1450. . O exemplo do Restaurante foi apresentado e analisado por FARRELL, J. & RABIN, M. Idem, pp. 110-112.
112 111
56
altamente crvel, (...) no h problemas para que faa sentido"113. Do ponto de vista da teoria dos jogos, significado, credibilidade e compromissos surgem do interesse pessoal de cada um em realizar uma ao que corresponda quilo que foi dito, como sua verdadeira inteno. De outro modo, uma coordenao que no envolva compromissos ou contratos explcitos, sem comunicao direta, s possvel encontrar uma soluo equitativa quando pontos focais ou convenes esto disponveis. Contudo, nem sempre essa soluo a mais eficaz, como mostra a matriz dos quatro restaurantes. Por outro lado, a aplicao da comunicao direta a modelos onde os interesses no esto plenamente alinhados, ou esto em conflito iminente, como o Dilema dos Prisioneiros, se torna ineficaz quando o jogo de uma s rodada e simultneo. De nada adianta um dos prisioneiros prometer ficar calado se o outro tambm ficar, pois sua estratgia estritamente dominante est na desero. Apenas quando rodadas sucessivas do Dilema dos Prisioneiros so permitidas que a comunicao poderia servir para alinhar os interesses divergentes em torno da cooperao mtua, mas isso envolve outros fatores tpicos da iterao do jogo que sero abordados na prxima unidade. No Dilema dos Prisioneiros, a comunicao pode ajudar a emergir a cooperao, sem a necessidade de firmar acordos, apenas pela implementao de aes de reciprocidade. Sistemas de Comunicao A transmisso de informao, eventualmente, pode ser realizada por meio de um sistema de comunicao que sirva de canal de ligao entre emissor e receptor. Quando a mensagem emitida por via direta os relatos so trocados pelos prprios jogadores, sem o risco de distoro. Entretanto, a presena de rudo obriga a considerao da probabilidade da mensagem chegar corretamente a seu destino. O clculo da probabilidade tambm ocorre sempre que houver a interveno de uma mediao que faa uso de mecanismos aleatrios para recomendao de uma ao como no exemplo de mediao de jogos de multi-estgios descrito antes. Um sistema de comunicao abrange de um modo geral todas os modos de comunicao, sendo a transmisso direta, sem rudo ou mediao, um caso particular desta classificao. O recurso a um mediador permite que os jogadores possam partilhar uma informao entre eles. Esse mecanismo empregado a fim de permitir a melhoria na expectativa de ganhos maiores. O que no poderia ser alcanado de outra forma.
Nessa matriz - adaptada de Roger Myerson -, sem comunicao existem apenas dois pontos de equilbrio no encontro das estratgias puras (alto, esquerda) e (baixo, direita) que conferem, respectivamente, (5, 1) e (1, 5). A mistura das estratgias proporciona um terceiro equilbrio com ganhos (2.5, 2.5). Para atingir o resultado equitativo (4, 4), seria necessrio o estabelecimento de um contrato vinculante entre as partes, j que ele no est em equilbrio114. Ao recorrer a um mediador, ambos jogadores poderiam esperar obter um resultado auto-obrigatrio (self-enforcing), sem precisar apelar para um acordo que os amarrassem, como um contrato. Bastaria apenas que seguissem a recomendao do mediador de adotar as estratgias conjuntas (alto,
113 114
. FARRELL, J. & RABIN, M. Ibidem, p. 112. . Veja MYERSON, R. Op. cit., idem.
57
esquerda), (baixo, esquerda) e (baixo, direita) 1/3 das vezes. Seguindo esta orientao, cada um teria a expectativa de resultado equivalente a (3 1/3, 3 1/3), superior estratgia mista. Para isto o mediador deve informar apenas parcialmente a cada jogador qual estratgia ele tem de seguir, sem revelar como o outro fora instrudo. Procedendo assim, os jogadores no teriam outra alternativa seno obedecer suas recomendaes, que passam a ser auto-obrigatrias. Do contrrio, se a estratgia recomendada pelo mediador fosse de conhecimento comum, um poderia explorar a submisso do outro, trocando a estratgia recomendada por outra que a dominasse recaindo na situao do jogo original. Nesse sentido, o mediador atua tambm como um tipo de instrumento que limita a transmisso de informao a uma quantidade que seja a mais adequada para as partes, dada as circunstncias. Robert Aumann e Sergiu Hart descreveram um outro tipo de mecanismo que torna rodadas sucessivas de conversao prvia - longas conversas baratas - capaz de melhorar o desempenho dos falantes. A padronizao oferecida por eles para os Jogos Falados composta por trs fases: na fase de informao, um jogador possui uma informao privada que dever ser transmitida ao outros; na fase de conversao, os jogadores tm um nmero de rodadas indeterminadas em que as mensagens so trocadas simultaneamente entre os jogadores; por fim, na fase de ao, decidem tambm ao mesmo tempo qual estratgia iro executar115. Posto desta maneira, o procedimento de uma conversao sem custo pode ser simulado em um computador com um teclado cujas letras ou comandos representam sentenas, frmulas ou instrues contidas em uma "macro", ou simplesmente "a" ou "b". Em cada estgio de fala os jogadores enviam suas mensagens contendo as estratgias que pretendem adotar na fase da ao. Ao trocarem suas mensagens ao mesmo tempo, os jogadores reproduzem um dispositivo de loteria conjunta controlado que, na concepo de Aumann e Hart, fundamental para construo de compromissos entre as partes. As rodadas consecutivas de troca de mensagens simultneas restrigem o compromisso dos agentes ao primeiro par de estratgias idnticas comunicado. Ao atingir tal equilbrio, nenhum dos falantes teria motivos para abandonar a escolha conjunta, sem uma consequente perda ocasionada pelo desvio, com ganhos abaixo do valor oferecido pela loteria conjunta116. Diversos outros aspectos da comunicao e sua dinmica foram desenvolvidos por tericos dos jogos interessados no assunto e no possvel esgotar toda a questo nesta apresentao sumria. Limitaes e solues para diversos impasses que existiam antes dos jogos falados serem formalizados foram descobertas, enquanto no campo filosfico uma outra concepo do papel da comunicao na deliberao dos agentes racionais era adotada por pesquisadores ligados teoria crtica da Escola de Frankfurt. Na sequncia deste captulo, os pontos comuns e divergentes a ambas teorias sero abordados, a fim de observar as contribuies que so oferecidas para o esclarecimento dos efeitos da comunicao sobre a busca de solues cooperativas consistentes com uma concepo plausvel de indivduos que pretendem satisfazer seus interesses pessoais. 2.3 A Razo Comunicativa x Estratgica
115 116
. Veja AUMANN, R. & HART, S. "Long Cheap Talk", 3. p. 12. . Veja AUMANN, R. & HART, S. Op. cit., 3. pp. 13-14.
58
Entre os filsofos, sobretudo aqueles ligados teoria crtica da Escola de Frankfurt e os interessados na obra de Max Weber (1864-1920), comum distinguir-se razo instrumental ou estratgica de outras formas de racionalidade. Isso no chega a ser uma inovao frankfurtiana. Na tradio moderna, outros autores como Thomas Hobbes e Immanuel Kant (1724-1804) j destacavam a razo calculadora, a hipottica, a pura ou a prtica117. Trata-se, de fato, de variaes do modo pelo qual a mente humana procura resolver problemas metafsicos ou epistemolgicos (razo pura), ticos (prtica) e teleolgicos (instrumental ou estratgica). H ainda uma racionalizao da linguagem (razo comunicativa) que visa encontrar um entendimento mtuo sobre aquilo que est sendo enunciado. Esse tipo de racionalidade foi defendido inicialmente por Habermas em vrios textos desde "Tcnica e Cincia como Ideologia", de 1968. A teoria dos jogos privilegia anlises sobre as escolhas racionais das estratgias mais adequadas realizao de uma ao que atinja os fins almejados. Nesse sentido, o modelo de jogos enquadra-se em parte na definio de trabalho ou racionalidade teleolgica feita por Habermas, em meados do sculo XX. (...) A ao instrumental orienta-se por regras que se apoiam no saber emprico. Essas regras implicam em cada caso prognoses sobre eventos observveis, fsicos ou sociais. (...) O comportamento da escolha racional orienta-se por estratgias que se baseiam num saber analtico. (...) A ao racional teleolgica realiza fins definidos sob condies dadas; mas, enquanto a ao instrumental organiza meios que so adequados ou inadequados segundo critrios de controle eficiente da realidade, a ao estratgica depende apenas de uma valorao correta de possveis alternativas de comportamento, que s pode obter-se de uma deduo feita com o auxlio de valores e mximas (HABERMAS, J. Tcnica e Cincia como Ideologia, III, p. 57). Na concepo de Habermas, so apontados aspectos axiolgicos que os tericos dos jogos no assumem explicitamente, mas que esto ligados maneira como os agentes listam suas preferncias em utilidades. No obstante essas sutilezas, guarda a teoria dos jogos uma estreita vinculao com a racionalidade teleolgica, cuja ao correspondente orientada para a realizao de determinados fins. Alm disso, essa teoria traz tambm elementos de interao, na maioria dos modelos de jogos, que se aproximam da racionalidade comunicativa elaborada por Habermas, quando se tem em vista os jogos com comunicao, por exemplo. (...) [E]ntendo por ao comunicativa uma interao simblica mediada. Ela orienta-se segundo normas de vigncia obrigatria que definem as expectativas recprocas de comportamento e que tm de ser entendidas e reconhecidas, pelo menos, por dois sujeitos agentes. As normas sociais so reforadas por sanes. O seu sentido objetivase na comunicao lingustica quotidiana. Enquanto a realidade das regras e estratgias tcnicas depende da validade de enunciados empiricamente verdadeiros ou analiticamente corretos, a validade das normas sociais s se funda na intersubjetividade do acordo acerca de
117
. Veja HOBBES, Th. Leviat, I part., cap. V, p. 27 e KANT, I. Crtica da Razo Prtica, prefcio, A3, p. 11.
59
intenes e s assegurada pelo conhecimento geral das obrigaes (...) (HABERMAS, J. Op. cit., III, p. 57/8). J aparecem nessas primeiras definies de razo comunicativa algumas divergncias que afastam a realidade estratgica dos jogos da vinculao estrita com a instrumentalidade que contrasta com a ao comunicativa. Isso porque, embora seus enunciados possam ser interpretados de forma analtica - como na filosofia da linguagem, dotadas de valores de verdade ou falsidade -, as diversas estratgicas disponveis aos agentes contam como sendo factveis, passveis de serem realizadas e, nesse sentido, todas so empiricamente verdadeiras. Por outro lado, a formulao matemtica que feita para anlise de uma determinada situao no est livre de contextualizao, uma vez que procuram descrever como se deve escolher as melhores estratgias, levando-se em conta os fatores determinantes das circunstncias simplificadas nos modelos de jogos. Por isso, fazem tais descries uma simulao hipottica do desempenho dos agentes, conforme as condies iniciais relevantes para interpretao da interao. Ademais, a teoria dos jogos procura delinear as condies estruturantes de uma interao em seu nvel mais bsico. Para usar uma metfora da linguagem dos computadores, a teoria dos jogos trabalha na "interface de mquina" dos dados e operaes manipulados por "unidades de processamento", no intuito de extrair a soluo logicamente inferida das proposies apresentadas. O "cdigo fonte" dos programas executados em ambientes diferentes pelos diversos agentes. Sua "interface humana" so as narrativas, contos e histrias criadas pelas pessoas: o "dilema dos prisioneiros", a "batalha dos sexos", o "bem pblico", ou o "ultimato" que nada mais so do que parbolas para jogos montados em matrizes, rvores e frmulas matemticas. Ao perceber-se a teoria dos jogos dessa perspectiva formal - como instrumento de anlise de interaes -, no s a ao teleolgica pode ser melhor compreendida, mas tambm a razo comunicativa tem revelada suas limitaes de aplicao, permitindo, assim que se proceda a uma crtica da razo comunicativa que resta por fazer. Os modelos de jogos com comunicao proporcionam uma excelente ferramenta de avaliao da eficcia da comunicao ao realizar seus fins, sejam emancipatrios ou de dominao. Desse modo, possvel compreender como a presena ou ausncia de elementos especficos podem facilitar a coordenao das aes - fomentando a cooperao - ou apenas permitir que ameaas ocorram no sentido de impor determinada linha de ao em detrimento de outra. Em todo caso, os exemplos mostrados antes servem para indicar que a comunicao, embora seja um fator importante do relacionamento entre seres vivos, tm um campo de atuao restrito pelo modo como a interao montada. Nos jogos de soma zero e informao perfeita, dispensvel. Nos de soma variante, tem um uso problemtico quando a matriz induz o recurso de ameaas e promessas. No obstante, mesmo que tais circunstncias dificultem o uso pleno da comunicao - segundo seus pressupostos pragmticos idealizantes118 -, elas decorrem da concepo egosta dos agentes racionais adotada pela teoria. Esse tipo de objeo pode ser facilmente contornada se compreender-se os sujeitos deliberantes como entes que possuem apenas os elementos constitutivos
. Desde HABERMAS, J. "Notas Programticas para a Fundamentao de uma tica do Discurso", in Conscincia Moral e Agir Comunicativo os pressupostos pragmticos de uma situao ideal de fala passaram por vrias reformulaes at chegarem a forma condensada de HABERMAS, J. "Racionalidade do Entendimento Mtuo", in Verdade e Justificao.
118
60
mnimos e necessrios para uma tomada de deciso: a motivao que se resume a crenas e desejos que compem seus interesses pessoais. Todas as outras formas de racionalidade podem ser descartadas de um agente racional, menos a sua razo teleolgica. Sem esta, simplesmente no haveria atuao passvel de ser motivada. Posto que faltariam os itens indispensveis para relao entre princpios e fins119. Por deixar de fora do discurso argumentado todos valores moldados pelo convvio social, a tica do Discurso - para citar um exemplo de teoria que eliminou a motivao da deliberao - tornou-se uma proposta cuja aplicao invivel nos contextos concretos do dia-a-dia, onde a comunicao se exerce em funo de provocar no s o entendimento mtuo, mas um efeito no ouvinte que o leve a agir em consequncia do que foi dito - o chamado efeito perlocucionrio da fala120. Estratgia e Dominao A razo instrumental foi classificada como uma faculdade que seleciona os meios adequados para alcanar determinado fim, orientada por regras empricas de controle eficiente da realidade121. Esse aspecto dominador da razo teleolgica (estratgica e instrumental) constitui o principal empecilho para considerao da competncia estratgica no confronto da vontade contra a influncia das inclinaes representadas pelos interesses particulares de um indivduo ou pelos bens privilegiados de uma cultura especfica. S o agir comunicativo atuante numa relao mediada pela linguagem, seria capaz de orientar os agentes conforme normas de vigncia obrigatria internalizadas e admitidas intersubjetivamente. Ao invs de tentar ampliar o poder tecnolgico de um determinado grupo ou indivduo, a linguagem proporcionaria a reflexo necessria em torno do interesse emancipatrio da espcie humana122. Os dois tipos de racionalidade o dirigido a fins (instrumental e estratgico) e o de uma comunicao livre de coero disputariam o fornecimento de solues para as questes tericas e prticas. Entretanto, s quando a razo teleolgica declinasse da substituio e restrio da linguagem, durante a formao da vontade, que o potencial de libertao poderia se constituir de vez. Livre de qualquer limitao e ameaa, a discusso pblica avanaria em direo a um consenso geral, contribuindo para o desenvolvimento da autonomia dos indivduos123. O prevalecimento do agir estratgico, na tradio da teoria crtica, reproduz a dominao ideolgica da tecnologia sobre a sociedade e a natureza. Sua funo simplesmente privilegiar os interesses restritos de quem detm o poder, a despeito de interesses mais abrangentes. A competncia estratgica representaria, portanto, um obstculo quase intransponvel ao projeto emancipatrio da modernidade. Mas este no o nico problema inerente na ao voltada para o sucesso de determinados fins. A Teoria dos Jogos tambm detectou uma srie de limitaes dessa forma de pensar as solues nos problemas da escolha.
. Em DAMSIO, A. O Erro de Descartes so apresentados exemplos dramticos da necessidade de motivao para que as escolhas por aes sejam adequadamente feitas. 120 . Em tempo, no artigo HABERMAS, J. "Racionalidade do Entendimento Mtuo", in Verdade e Justificao, o autor tentou fazer uma nova distino entre os tipos de racionalidade, mas sua descrio imprecisa das condies em que uma ameaa ou um ato perlocucionrio podem ser eficazes demonstram que ainda ignora o uso da teoria dos jogos nas anlises dos jogos de comunicao. 121 . Veja HABERMAS, J. "Tcnica e Cincia como Ideologia", se. III, p.57. 122 . Veja HABERMAS, J. Op.cit., se. III, pp. 57 a 60; se.VI, p. 75 e VII, p.82. 123 . Veja HABERMAS, J. Idem, se. VIII, p.88.
119
61
Por prestar ateno apenas na satisfao de seus interesses, muitos so levados a resultados paradoxais desastrosos, quando prevalece uma postura paramtrica agir como se fosse o nico centro de deliberao e todo o resto ficasse inalterado frente s aes executadas. O choque de interesses, em consequncia, tornaria impossvel encontrar um ponto de equilbrio, a no ser por acaso. Mas ainda que se admitisse uma provvel reao contrria s aes implementadas, a existncia de mais de uma opo em equilbrio geraria embaraos ao agir estratgico, como demonstram jogos do tipo do Dilema dos Prisioneiros e a Batalha dos Sexos. Isto porque, ao escolher a estratgia maximizadora de sua utilidade esperada, os agentes racionais cairiam em resultados, cuja dominncia fornece ganhos abaixo do que considerado timo. Explicaes iniciais sugerem que a simplificao dos clculos induziriam agentes racionais adoo equivocada da posio paramtrica, que facilita a abordagem cognitiva dos detalhes da barganha pelas partes envolvidas. Noutras situaes, a ausncia de instrumentos adequados, como a comunicao, impediria o acesso a aes conjuntas que conduzissem aos melhores resultados. A incerteza e a indeterminao sobre os desdobramentos futuros seriam fatores cruciais para limitao do sucesso do agir estratgico. A incerteza aparece em jogos de soma varivel diferente de zero e nos de soma zero com informao imperfeita, nos quais um ou mais lances so executados pela natureza. Nessas ocasies, a probabilidade de uma ocorrncia influencia a tomada de deciso, impedindo que uma estratgia estritamente determinante seja encontrada. Somente o emprego de clculo probabilstico permite a projeo de estratgias mistas, onde os sorteios so preferidos de acordo com a maior chance de um resultado vir acontecer. Isso, no entanto, aumenta as dificuldades de uma clara percepo do porvir, perturbando o comportamento racional dos participantes. Encontrar uma soluo que represente uma imputao de resultados racionais esperados cada parte, passa a depender da sorte e da disposio dos agentes em aceitar os riscos acarretados pelas decises assumidas em tais circunstncias. A princpio, seres racionais so, por definio, aqueles que seguem as solues encontradas que lhes garantam o resultado timo. Mas, quando as solues ficam ao sabor do acaso, tal conduta fica prejudicada. Em outras palavras, assumindo-se que ser racional produzir os melhores resultados para o indivduo, uma racionalidade instrumental mnima exigida deve ser aquela que, alm de projetar as linhas de ao que maximizam a utilidade esperada, deve tambm poder prever o comportamento consequente mesmo em situaes em que elementos irracionais estejam envolvidos. Na ltima dcada do sculo XX, o refinamento da descrio de jogos estudados revelou a riqueza de solues que podem ser geradas quando pequenas modificaes so feitas nos modelos padres, seja pela repetio sucessiva de diversas rodadas, seja pela permisso de troca de informaes, ou ainda pela mudana do enquadramento da situao. A linha de pesquisa que avalia o papel da comunicao e do conhecimento comum dos participantes uma abordagem paralela ao agir comunicativo da teoria crtica j permite uma comparao entre os pontos coincidentes que antes eram apresentados com uma aparente divergncia, logo desfeita quando se nota sua compatibilidade. Mais Conversa A comunicao no se reduz aos aspectos estruturais de uma sintaxe e semntica lingustica, nem s ao mbito exclusivo de uma pragmtica da linguagem, voltada para o entendimento. Para ser entendida como um fenmeno natural em sua totalidade,
62
preciso levar em conta seus efeitos perlocucionrios e as modificaes que a ao comunicativa, de um modo geral, provoca nos seres vivos e, por conseguinte, no mundo. A eficcia da comunicao no se restringe a uma competncia lingustica, sendo como sua forma implcita ou explcita pode exercer a coordenao das aes dos agentes envolvidos numa interao, sem que sua funo instrumental seja considerada. O Dilema dos Prisioneiros s um dilema porque a comunicao entre eles est proibida. A Batalha dos Sexos tambm um problema s para os casais que no tm como falar entre si antes de decidir o que fazer. Nada que uma boa conversa no pudesse revolver. Pontos focais, telepatia, comunicao tcita so alguns nomes, cujo significado se reduz formao de um repertrio de smbolos constitudos por uma comunidade atravs de um convvio social e cultural partilhado por um grupo de pessoas ao qual pertenam os jogadores, em uma palavra: convenes. A funo exercida por tais mecanismos tem por objetivo fomentar o entendimento acerca das estratgias relevantes, para ento, possibilitar a seleo daquela que maximize a utilidade esperada. Ao revelar essa forma de comunicao subjacente a contextos de aparente isolamento, a Teoria dos Jogos ajudou a esclarecer o modo pelo qual comunicao e razo estratgia podem atuar de maneira complementar. Fatores comunicativos pertinentes ao jogo de interao social, que no esto explicitamente postos, induzem a escolha das estratgias puras disponveis que melhor atendam aos interesses de todos. O isolamento inibe o recurso a ameaas que poderiam distorcer os resultados em favor de um agente com posio privilegiada sobre o outro. Imunes coero ou controle externo, resta aos jogadores agir pela estratgia conjunta observvel com o melhor resultado factvel. Entretanto, a comunicao implcita muitas vezes impede o acesso a um equilbrio na fronteira do timo de Pareto (eficincia) aquela onde esto as estratgias conjuntas nas quais ningum pode obter mais sem diminuir o ganho do outro. Uma troca de informao explcita conhecida pela expresso conversa barata (cheap talk), quando permitida antes do incio do jogo, tem-se revelado como o meio mais eficiente, seno um dos mais, para atingir equilbrios timos de Pareto ou de Nash. Estudos desenvolvidos a partir dos anos 80 revelaram a tendncia para escolha de estratgias cooperadoras, sempre que se abre uma ou mais rodadas de comunicao antes da fase de ao do jogo iniciar124. Uma longa conversa barata pode transformar situaes de aparente conflito em pura coordenao, como mostra o exemplo da Batalha dos Sexos. Outros contextos, entretanto, exigem que algo mais seja dito. O Dilema dos Prisioneiros possui uma matriz cuja configurao traz maiores dificuldades. O significado e a credibilidade dos proferimentos ficam ameaados a ponto de tornarem a fala prejudicial busca do equilbrio. Em apenas uma rodada de conversa, a sinalizao e o comprometimento no conseguem se impor, pois uma mensagem do tipo farei assim e espero que voc tambm o faa no suficiente para garantir a credibilidade, embora o significado de todos os termos sejam compreensveis aos falantes de uma lngua natural qualquer que permita a construo de tal expresso. O que est em jogo no um mero entendimento sobre o significado da frase, mas a melhor distribuio dos saldos disponveis. Na Batalha dos Sexos, o equilbrio dado pela conversao mantm-se graas s perdas advindas de uma possvel desero, enquanto no Dilema dos Prisioneiros, o
124
. Veja AUMANN, R. J. & HART, S. Long Cheap Talk; FARRELL, J. Meaning and Creability in Cheap Talk Games e FARRELL, J. & RABIN, M. Cheap Talk.
63
contrrio acontece. Ao desertar, uma parte tem tudo a ganhar, se o outro seguir a estratgia cooperadora. Para todos envolvidos, a desero mtua permanece sendo uma opo superior ao resultado frustrante de uma atitude amigvel que no correspondida. A averso ao risco faz da estratgia maximin que maximiza os ganhos mnimos dominante sobre os pagamentos cuja multiplicao produz o maior resultado numa fronteira de eficincia, a cooperao mtua. Nesse cenrio, a comunicao exerceria uma funo nula e suprflua. As restries feitas troca de informaes visam, ento, impedir que ameaas sejam feitas entre os participantes. Contudo, experincias realizadas em laboratrio demonstram que o dilogo entre os agentes acaba por transformar esse dilema um jogo no cooperativo , num jogo de cooperao entre pessoas dispostas a correrem riscos moderados. Na prtica, rodadas que se prolongam com o tempo favorecem o surgimento da reciprocidade e a consequente confiana na colaborao125. As motivaes que concorrem para transformao do Dilema dos Prisioneiros em cooperao possuem, portanto, ingredientes de fundo psicolgico e cognitivo. Psicolgico, porque a proximidade dos agentes, a reciprocidade das respostas, um padro subjetivo de confiabilidade e a percepo do outro como uma instncia dotada de intenes semelhantes estimulam um comportamento cooperativo. Cognitivo, devido s inferncias que so feitas tanto para o entendimento do significado dos enunciados emitidos, como na aferio das maiores vantagens em continuar agindo em funo dos acordos estabelecidos, a despeito dos lucros imediatos de uma desero que, no entanto, acabariam por gerar prejuzos futuros, oriundos de uma retaliao esperada, por parte do outro. A comunicao, ento, requer a mobilizao de outros fatores alheios ao mbito da linguagem, tais como credibilidade, reciprocidade e convivncia prolongada. Arranjos tpicos do Dilema dos Prisioneiros servem para mostrar os problemas de aplicao de normas morais aceitas argumentativamente como vlidas. No basta apenas que se diga em unssono faa assim, que o farei tambm ou todos devem cooperar. O contexto em que a aceitao produzida fora o envolvimento e apresenta os desafios que as partes devem resolver mutuamente. Perante o balano dos danos e benefcios causados por uma empresa conjunta, os participantes vem surgir a dimenso moral a necessidade da concordncia do outro e o valor prtico universal da norma candidata lei, motivador do cumprimento dos contratos firmados. Nem todos jogos se prestam ao uso efetivo da comunicao. A permisso de uma conversa barata antes da escolha de uma linha de ao no acrescenta coisa alguma ao destino de jogos de soma zero com informao perfeita, onde sempre h uma estratgia estritamente determinada que garante a vitria ou ao menos o empate a um dos jogadores. A discusso tambm intil quando neologismos e o significado dos conceitos empregados no so entendidos pelos falantes, colidindo com um dos pressupostos pragmticos da argumentao. Some-se a isso que a falta de credibilidade torna vo os esforos empreendidos nos debates, por menos custosos que sejam. Todos poderiam, por hiptese, aceitar a validade dos 10 Mandamentos, do imperativo categrico, dos princpios de justia etc., numa situao de fala ideal. Entretanto, do ponto de vista instrumental, nenhum argumento racional impediria o homem econmico de seguir a maximizao irrestrita de sua utilidade esperada, a despeito de uma alegada contradio performativa, toda vez em que encontrasse uma estratgia que garantisse seus ganhos maiores. Apenas quando as informaes
125
. Veja AXELROD, R. The Evolution of Cooperation e AUMANN, R. & HART, S. Idem, se.5.2, p. 17.
64
individuais sobre os lances de um jogo so incompletas, ou h incerteza na obteno de algum resultado mais favorvel, a comunicao pode vir a desempenhar um papel decisivo, produzindo o entendimento no ouvinte de que o falante intenciona fazer algo cujo contedo o significado a ser compreendido. A comunicao, portanto, parte da inteno do falante de que o ouvinte compreenda o que se quer dizer quando a mensagem foi transmitida. Em sua forma direta, explcita, a troca de mensagens mais eficiente que o recurso aos pontos focais de uma comunicao tcita ou implcita. Ao invs de um encontro casual, influenciado por um conhecimento comum ou pela topologia ambiental, os falantes podem simplesmente indicar o lugar preciso onde estaro e resolver facilmente a Batalha dos Sexos ou modelos semelhantes. Noutras palavras, a conversa preliminar, sempre que possvel, conduz a resultados melhores do que a coordenao feita por convenes populares ou formais, desde que haja o uso pleno de mensagens compreensveis por todos126. Dom Natural A idia de uma racionalidade moldada pela evoluo natural das espcies admite que possa haver problemas no s para execuo perfeita de estratgias, mas tambm para a produo de um entendimento mtuo entre emissores e receptores interessados, principalmente, com sua sobrevivncia e reproduo. Se, por um lado, a razo estratgica perfeita ainda no foi alcanada e sofre com a incontinncia ou o conflito de diversos interesses individuais, o agir comunicativo, por sua vez, tem de enfrentar a falta de credibilidade e significado das expresses em certos contextos de aplicao. Na natureza, h exemplos de seres vivos que emitem informaes falsas sobre si mesmo mimetismo ou algum acontecimento a presena de um inimigo , obtendo assim chances de ganhar proteo ou maior quantidade de alimento127. Naturalmente, a comunicao pode ter surgido e sido mantida graas a sua potencial capacidade de promover o bem dos indivduos. Contudo o seu uso exclusivo em finalidades particulares restritas que poderiam prejudicar o outro tiveram origem, paradoxalmente, na eficcia desse processo comunicativo. Foi porque a troca de informao inspirava primeira vista a credibilidade de todos que captavam a mensagem, constituindo-se num meio efetivo de fomentar os interesses individuais na luta pela sobrevivncia, que espcies mutantes passaram a empregar tal mecanismo apenas em proveito prprio. Um Dilema dos Prisioneiros est em curso no desenvolvimento do agir comunicativo. Transmitir uma informao falsa pode trazer maiores vantagens para o emissor e prejuzos para o receptor. Entretanto, essa atitude, se costumeira, poder gerar a desconfiana que prejudica a todos quando uma mensagem perde sua credibilidade. Melhor seria, ento, transmitir sempre expresses vlidas que, embora gerassem um ganho menor para o emissor, manteriam o recurso comunicativo passvel de ser aplicado com sucesso no futuro. A percepo da necessidade de transmisso de enunciados verazes depende portanto de fatores extra-lingusticos os interesses dos indivduos na manuteno de um instrumento que auxilia na sua sobrevivncia que vo alm dos limites ilocucionrios.
126 127
. Veja FARRELL, J. & RABIN, M. Ibidem, p. 112. . Veja DAWKINS, R. O Gene Egosta, cap. 4, pp.87-89.
65
Na espcie humana, para a comunicao atingir o entendimento mtuo em torno de uma linha de ao comum a todos, faz-se necessrio o recurso a efeitos perlocucionrios de esclarecimento e convencimento do outro, que mostrem tambm as vantagens que se ter com a satisfao de seus interesses ao agir no sentido do contedo expresso na mensagem. Todos devem perceber o que tm a ganhar colaborando para formao e implementao do consenso, ainda que momentaneamente seja mais vantajoso para um deixar que o outro cumpra a sua parte sozinho, enquanto puder desfrutar das vantagens dessa explorao, sem nada fornecer em troca. Mostrar que a comunicao constitui a estratgia mais adequada para estabelecer normas teis para todos exige a compreenso de que a comunicao surgiu como um instrumento desenvolvido ao longo da evoluo natural e que se mantm devido a sua eficcia na promoo dos interesses vitais, aos quais ela se vincula. No h, pelo menos enquanto a espcie Homo s. sapiens for como tal racional, sensvel e mortal , um modo seguro de planejar uma deciso formal precisa que supere esses embaraos psicolgicos definitivamente. Nenhuma teoria moral sustentada to somente em pressupostos da razo (instrumental, prtica ou comunicativa) est livre das armadilhas psicolgicas e das presses ambientais. Estimativas que considerem as probabilidades de um evento acontecer esto sujeitas a equvocos desconcertantes, graas indeterminao natural dos fenmenos e tendncia em evitar o mal e perseguir o bem para si, seja l o que isso for: maximizar a durao da vida e a distncia da data fatal. A Teoria dos Jogos detecta tais armadilhas na intransitividade das preferncias que torna a funo de utilidade de von Neumann-Morgenstern impraticvel, na maioria dos indivduos desinformados. De forma semelhante, os problemas de aplicao enfrentados pela tica do Discurso decorrem da desconfiana sobre as motivaes inseridas num pano de fundo especfico. O que impede a desejvel efetivao de normas que poderiam ser respaldadas pelo consenso dos participantes numa situao de fala ideal. Na compreenso adequada do contexto real, aes estratgicas e comunicativas precisam atuar de maneira complementar no intuito de esclarecer os desvios cometidos pelas pessoas em suas deliberaes e apontar mecanismos auxiliares que promovam a cooperao em busca dos melhores resultados para todos.
66
Captulo 3: A Evoluo da Cooperao
Desde quando foi aplicado pela primeira vez - l pelos idos de 1950 -, o Dilema dos Prisioneiros causou estranheza aos seus inventores e ao prprio John Nash, cuja tese dos pontos de equilbrio era alvo principal dos problemas apresentados aos seus jogadores. Melvin Dresher e Merril Flood criaram esse modelo de jogo com a inteno de gerar uma situao paradoxal para a idia de que havia um ponto de equilbrio em jogos no-cooperativos. O Dilema dos Prisioneiros foi repetido por cem rodadas sucessivas entre duas pessoas racionais, mas que nunca tivessem ouvido falar em pontos de equilbrio. O resultado foi a emergncia da cooperao entre os agentes - que repartiam igualmente os prejuzos -, contrariando a previso de que deveriam aplicar suas respectivas estratgias dominantes - sempre desertar -, atingindo assim o ponto de equilbrio do jogo. Na poca, Nash j teria sugerido que o resultado contraditrio obtido devia-se ao fato dos jogadores estarem participando de um autntico superjogo, no qual vrios movimentos repetem a mesma condio de escolha das estratgia128. A previso da teoria dos jogos e do equlbrio de Nash era que agentes racionais egostas optassem sempre por sua estratgia dominante quando esta existisse, independente do que o outro fizesse. No Dilema dos Prisioneiros, as duas partes possuem estratgias desse tipo e o resultado esperado a desero mtua e a punio com a condenao dos dois presos pelo crime mais grave, ao invs de uma pena leve relativa ao delito pelo qual foram capturados. A partir da interface policial montada por Albert Tucker, logo se compreendeu que o Dilema dos Prisioneiros poderia ser a estrutura simplificada de uma srie de interaes entre pessoas, empresas e at mesmo naes, em larga escala. A despeito do jogo ter sido elaborado para refutar a teoria de Nash, o Dilema dos Prisioneiros Iterado logo se mostrou uma importante ferramenta de anlise da possibilidade de cooperao entre os agentes racionais egostas, sem que fosse necessria a interveno de uma autoridade exterior que impusesse um acordo entre as partes. Jogado em um s movimento, no haveria como os participantes colaborarem entre si, caso no tivessem tido a chance de combinarem uma conduta prvia - a mtica honra entre ladres, por exemplo. Para que isso acontecesse, teria de haver vrias rodadas de conversao anteriores fase de ao - conforme o modelo de longas conversas baratas, de Aumann e Hart129. Fato que alteraria a montagem do dilema, tranformando-o em um jogo falado, onde a comunicao exerce uma funo crucial130. Em sua formulao original, jogado apenas de uma vez, esse tipo esse tipo de serve como exemplo contrafactual hiptese de Adam Smith (1723-1790) de que uma "mo invisvel" conduziria a distribuio equilibrada dos bens necessrios vida, entre ricos e pobres131. Seres egostas e racionais agiriam, na verdade, como os fazendeiros imaginados por Hume e no colaborariam uns com os outros132. No obstante, experimentos iniciais com o Dilema dos Prisioneiros Iterado mostraram que a cooperao poderia surgir entre os participantes, ao longo de vrios lances repetidos.
. Veja NASAR, S. Uma Mente Brilhante, cap. 12, p. 149. . Veja AUMANN, R. J. & HART, S. "Long Cheap Talk". 130 . Por essa razo, no procede a interpretao insinuada em WILSON, E.O. Consilincia, cap. 11, p. 242, onde se pressupe que haja "honra entre bandidos". 131 . Veja SMITH, A. Teoria dos Sentimentos Morais, IV part., cap. I, p. 226. 132 . Veja HUME, D. A Treatise of Human Nature, liv. III, part. II, se. V, pp.286 e ss.
129
128
67
Evoluo da Teoria da Cooperao Em 1984, Robert Axelrod apresentou, no livro The Evolution of Cooperation, uma descrio da maneira pela qual o Dilema dos Prisioneiros Iterado, repetido por vrias rodadas, pode privilegiar a escolha da cooperao, mesmo em seres irracionais to simples como bactrias e, aparentemente, sem nenhum aparato lingustico. O projeto comeou tentanto responder a questo sobre quando as pessoas cooperam ou so egostas umas com as outras nas interaes entre elas. O Dilema dos Prisioneiros parecia ento ser um modelo que representava adequadamente tal possibilidade de interao. Para explorar em detalhes o comportamento estratgico que poderia ser adotado a, tericos ou especialistas de cinco disciplinas afins - matemtica, economia, cincia poltica, sociologia e psicologia - foram convidados a participar de um torneio de computador, programado para executar o Dilema dos Prisioneiros. Ao lado de uma regra randmica - que colabora ou deserta metade das vezes -, foram submetidas ao teste virtual 14 estratgias diferentes elaboradas por esses especialistas. A estratgia vencedora foi TIT FOR TAT (OLHO POR OLHO - OPO, ou o literal ISTO POR AQUILO, tambm traduzida como PAGAR NA MESMA MOEDA), um comando simples que comeava o jogo cooperando com o adversrio e repetindo depois a mesma ao que o outro jogador tivesse feito no movimento anterior. Aps o conhecimento desse resultado, Axelrod props um novo torneio ampliando a participao a todos os interessados, incluindo professores de biologia, fsica, cincia da computao e fanticos por jogos eletrnicos. Especialistas de seis pases participaram do segundo campeonato, apresentando 62 programas diferentes que disputavam com RANDMICA em cinco rodadas, cuja mdia de movimentos era de 151 lances, pois o jogo dessa vez no tinha um limite determinado para seu encerramento, que no mximo chegava a 308 movimentos. Mais uma vez, OLHO POR OLHO venceu a competio. O sucesso de OPO provocou o desdobramento da pesquisa para um cenrio evolutivo, onde se procurou interpretar a execuo das estratgias em contextos no cooperativos, com diversos tipos de rivais empregando suas respectivas linhas de ao, sendo que a melhor destas deveria ser resistente a invases em seu territrio. Das estratgias apresentadas, OPO mostrou-se passvel de ser adotada por aqueles minsculos organismos por causa de sua simplicidade e clareza. Mostrou-se tambm vitoriosa na maioria das circunstncias e no enfrentamento da maior parte das estratgias concorrentes, privilegiando a formao do equilbrio de Nash133. Os motivos para a tendncia cooperadora prevalecer num ambiente de pura competio, como a natureza, devem-se a certas condies circunstanciais que contribuem para o xito de OPO. A proximidade entre indivduos, ainda que egostas, e as interaes repetidas permitem que a reciprocidade das aes surja num segundo momento, desde que os organismos sejam dotados com aparelhos capazes de fazerem a marcao, rotulagem, e o posterior reconhecimento desses rtulos. Assim, possvel discriminar no instante seguinte aqueles que antes cooperaram ou no. A reunio de indivduos em grupos de cooperadores/retaliadores proporciona a formao de uma vizinhana resistente a invases de oportunistas/exploradores. Fenmeno to prximo de cada um que mal percebido: o sistema imunolgico composto por clulas que rotulam, identificam e atacam os vrus e bactrias que a todo momento invadem os corpos dos seres vivos134. OPO evita conflitos desnecessrios, enquanto todos agem de
133 134
. Veja AXELROD, R. The Evolution of Cooperation, cap. 5, pp. 88-105. . Veja BANCHEREAU, J. O Longo Brao do Sistema Imunolgico, p. 69.
68
modo recproco, respondendo de imediato s deseres no motivadas, mas logo esquecendo as provocaes passadas aps o retorno cooperao. A transparncia das intenes e, por conseguinte, a facilidade de identificao do padro de conduta dos agentes estimulam o cumprimento dos compromissos assumidos, assim, tacitamente, atravs de um consenso implcito135. A facilidade do reconhecimento e a simplicidade de execuo de estratgias recprocas, com caracterstica de gentileza (nice), retaliao, clemncia (forgiving) e clareza, fazem de comportamentos como os prescritos pela estratgia OPO uma linha de ao robusta, estvel e vivel em circunstncias onde a comunicao atua na sua forma mais rudimentar, na transferncia de informaes mnimas (bytes). Basta apenas que os agentes sejam capazes de reconhecer em contatos repetitivos as aes amigveis ou no e responder adequadamente cooperando ou desertando daqueles que no passado imediato foram rotulados como cooperadores ou desertores. A consolidao desse comportamento com o tempo acaba por gerar um processo de aprendizagem que nos seres irracionais se d com o sucesso evolutivo da proliferao em geraes futuras dos genes retaliadores, aqueles que sabem aplicar OPO e, por conta disso, sobreviveram em maior nmero de indivduos. Importante notar que os arranjos dos torneios originais que propiciaram a vitria de OPO permitiam somente lances em que cooperar (C) e desertar (D) eram escolhidas em estratgias puras, deterministas, isto , sem variao da probabilidade que promovesse estratgias mistas. Axelrod delineou os confrontos deixando de lado a ocorrncia de erros ou rudos na escolha entre C e D. Sups tambm que era indiferente as rodadas serem executadas de maneira simultnea ou alternada. De todo modo, a comunicao anterior aos lances estava vedada, sendo cada movimento realizado silenciosamente. Os jogadores tomavam conhecimento das escolhas de seus oponentes imediatamente aps elas terem sido feitas. A Teoria da Cooperao proposta por Axelrod baseou-se, ento, na investigao de como indivduos que visam satisfazem seus prprios interesses podem cooperar entre si, sem ajuda de uma autoridade central que os forassem a isto136. A tradio moderna tem no contrato social sua resposta ao modo como a cooperao poderia emergir. No entanto, o contratualismo precisa que haja um terceiro elemento entre as partes ao qual se possa recorrer, a fim de que os acordos sejam mantidos por todos envolvidos. Porm, h circunstncias onde, apesar de no existir uma entidade que possa mediar e resolver as divergncias, a cooperao deve surgir sob pena de todos terem de arcar com os prejuzos de uma competio generalizada. Assim, o comrcio internacional tem de solucionar seus problemas segurana, tarifas e pirataria com o emprego de estratgias adequadas que no exijam o apoio de elementos externos s relaes entre as partes concernidas. Em meio a um poder poltico autnomo, como o parlamento em sociedades democrticas, o conflito de interesses deve ser resolvido pelos membros de cada setor sem a interferncia de um outro poder constitudo - executivo ou judicirio, por exemplo. Nesses e em outros casos, necessrio que os agentes cooperem sob pena de obterem os piores resultados possveis. Dessa forma, o Dilema dos Prisioneiros veio a calhar como modelo de jogo que representava a situao em que o uso de estratgias dominantes pelas partes, ao
135 136
. Veja AXELROD, R. Op. cit., cap. 1, pp. 20-21. . Veja AXELROD, R. Idem, part. I, cap. 1, p. 6.
69
satisfazerem seus prprios interesses, resultassem em um ganho baixo a todos jogadores. Ademais, a estrutura do jogo no permitiria que nenhum mecanismo de ameaa ou promessa estivesse disponvel. a informao imperfeita tambm impedia que um jogador soubesse o que o outro viesse a fazer na sua vez de jogar. Todos participantes seriam hbeis para realizarem suas estratgias e no haveria como alterar os valores obtidos com pagamentos laterais (propinas), mudando tambm a funo de utilidade do outro. Com a repetio da interao entre os agentes, foi possvel notar os efeitos que a sombra do futuro pde exercer sobre o comportamento dos mesmos. medida que o jogo avana, a confiana entre as partes aumentava na mesma proporo em que a desconfiana, quando o final do jogo se aproximava. Tornar o final da partida indeterminado favoreceu a manuteno do comportamento cooperativo. Quanto maior fosse a distncia a ser percorrida no futuro, tanto maior a dependncia da escolha das estratgias, segundo a conduta adotada pelo outro. Uma estratgia de "retaliao permanente" - cooperar at que o outro deserte, ento sempre desertando em seguida -, por exemplo, poderia ser facilmente explorada por algum que conhecesse o prazo do trmino do jogo, sendo tentado a no cooperar nas ltimas movimentaes. Porm, esse estmulo no haveria se a data final fosse incerta e a expectativa de uma longa punio at o trmino da partida fosse grande. Outro fator que preponderou na escolha do Dilema dos Prisioneiros como matriz bsica da teoria da cooperao foi o fato de sua estrutura ser to simples que, a rigor, no era essencial que os participantes fossem racionais ou tivessem conscincia das escolhas que estavam fazendo. Nem sequer precisariam tentar maximizar suas recompensas, bastando apenas que fossem capazes de aplicar um padro de comportamento, procedimentos, hbitos, instintos ou imitao como faz a maioria dos seres vivos. Nesse sentido, as aes implementadas podem ser executadas sem que o processo deliberativo seja compreendido pelo agente. Assim, no mbito mais amplo, a teoria da cooperao poderia envolver pessoas, firmas, naes ou bactrias, em uma teoria geral dos jogos evolutivos, nos quais as estratgias vitoriosas so passadas s geraes futuras pelo sucesso de um programa gentico, ou no, que determine as aes dos indivduos137. Apoiada fortemente na reciprocidade, a teoria da cooperao de Axelrod chamou ateno para a importncia do conceito de evoluo na escolha de um equilbrio dentre infinitas possibilidades existentes em jogos repetidos vrias vezes. Aqueles aspectos cujos fatores ajudaram tambm a compreender melhor o papel da comunicao nesse processo evolutivo. 3.1 A Centopia, Induo Reversa, o Papel do Tempo Um dos problemas mais graves de jogos repetidos como Dilema dos Prisioneiros Iterado o efeito da jogada final sobre o comportamento dos jogadores. A forte tendncia para desero acontece quando se estabelece de antemo um prazo fixo para o trmino da partida. No primeiro torneio de computadores de Axelrod, essa dificuldade no foi determinante, graas ao fato de nenhum dos programas que participaram do
137
. Veja AXELROD, R. Ibidem, part. I, cap, 1, pp. 17 a 19.
70
evento terem explorado tal propriedade dos superjogos finitos. Quando h um momento que todos sabem ser o fim do jogo, a tendncia deste ser interpretado como o jogo bsico, onde as escolhas so feitas em funo do ponto de equilbrio original. No Dilema dos Prisioneiros, cuja matriz tem seu equilbrio de Nash na desero mtua, sua repetio finita levaria os jogadores a fazerem suas escolhas prximos rodada final de modo a obterem, contra suas vontades, como pagamento a indesejvel punio. Pelo menos isso o que prev a teoria dos jogos para agentes egostas racionais. Tudo porque em um jogo finito repetido vrias vezes, o nico equilbrio de Nash existente na matriz do jogo base tende a repetir-se nos subjogos subsequentes. Por exemplo, a partir da matriz do Dilema dos Prisioneiros, o jogo imediato a seguir desero mtua inicial somar os resultados decorrentes dessa primeira rodada aos da nova etapa produzindo a seguinte figura:
Coluna Figura 3.1 Estratgias Linha Cooperar Desertar DPI aps Punio da 1 rodada Cooperar 3, 3 l 4, 1 Desertar 1, 4 c l 2, 2 c
Quando a desero de linha e a cooperao da coluna so somadas matriz bsica, produz-se, em seguida, essa nova figura:
Coluna Figura 3.2 Linha Estratgias Cooperar Desertar DPI acumula P e Tentao de Linha Cooperar 6, 3 l 7, 1 Desertar 4, 4 c l 5, 2 c
A possvel retaliao da coluna e contrio da linha levaria ento figura abaixo:

Coluna Figura 3.3 Linha Estratgias Cooperar Desertar P, T de Linha e Coluna acumulados ao DPI Cooperar 6, 6 l 7, 4 Desertar 4, 7 c l 5, 5 c
71
Para finalmente, somarmos a cooperao mtua, gerando essa quarta figura:

Coluna Figura 3.4 Estratgias Linha Cooperar Desertar DPI com P, T e Recompensa somados Cooperar 8, 8 l 9, 6 Desertar 6, 9 c l 7, 7 c
Portanto, a cada nova etapa da repetio do jogo, apenas a desero mtua se mantm como o equilbrio perfeito nesse subjogo em todas as suas sucessivas etapas. Se a desero perptua (SEMPRE D), em jogos factuais e virtuais nunca a estratgia vitoriosa, a despeito do que prediz a teoria dos jogos, a explicao aparece em evidncia ao se examinar o jogo criado por Robert W. Rosenthal, em 1980, e que foi chamado de Centopia. O modelo da Centopia uma ferramenta adequada para exame desse tipo de comportamento. Isso porque diferente do Dilema dos Prisioneiros, trata-se de um jogo de informao perfeita e completa e sua soluo na aplicao da induo reversa. Em jogos de informao perfeita, a induo reversa funciona como mtodo prtico para deteco de um equilbrio perfeito nos subjogos de um jogo estendido. A partir do caminho principal, que as estratgias adotaram conforme as escolhas de cada um, retorna-se raiz passando por cada ponto de deciso (n em uma rvore). Desde as folhas dos ltimos ramos, segue-se em direo a sua raiz. Em cada n -se levado pelas melhores escolhas de um jogador at o n anterior do outro sucessivamente. Quando se chegar ao n unitrio que deu origem ao caminho seguido as demais alternativas podem ser eliminadas, restando apenas o conjunto dos movimentos feitos por uma determinada estratgia conjunta. Assim possvel ver qual ser o resultado final do jogo "retrospectivamente", antes mesmo de comear, j que todas as informaes esto postas desde o incio. A induo reversa requer que haja o conhecimento comum sobre a racionalidade dos agentes. Se forem racionais, a induo reversa mostrar que o primeiro jogador, na figura 2.3 da centopia, dever escolher logo o caminho da esquerda em sua escolha inicial. Todavia, se h a mnima probabilidade de um dos dois jogadores supor que o sucessor far uma confuso, acionando "o boto errado", o antecedente poderia fazer uma escolha diferente da prevista pelo paradoxo da induo reversa e racionalmente ir para a direita. A "mo trmula" (trembling hands) do adversrio poderia levar uma outra soluo aceitvel para a Centopia poder andar. Sendo ou no verdade que as pessoas apelam intuitivamente para a "mo trmula" - termo fixado para este tipo de soluo -, experimentos posteriores com a centopia raramente revelam uma jogada esquerda do primeiro jogador138. David M. Kreps promoveu vrias experincias com variantes de centopia que se chocaram com a previso fornecida pela induo reversa. Em geral, as respostas dos lderes indicavam o risco assumido por eles, uma vez que a perda do ponto inicial no significaria uma perda to grande, quanto possibilidade de um ganho maior caso o segundo jogador tambm tivesse ambio de chegar ao 101. Haveria como que uma aposta no "esprito" cooperador do outro participante. Mas essa crena no suficiente
138
. KREPS, D. "Game Theory and Economic Modelling", cap. 4, pp. 77-82.
72
para manter um equilbrio diferente daqueles do comeo. Pequenas mudanas nos valores pagos que aproximassem o jogo de uma situao real podem destruir tais crenas sobre a personalidade do outro. A incerteza sobre as caractersticas do adversrio levaria a situao dos fazendeiros de David Hume que se abstm da ajuda do outro em nome da segurana e da inconfidncia139. Variaes da Centopia Em Trust within Reason (1998), o filsofo ingls Martin Hollis (1938-1998) imaginou o jogo sequencial como a centopia para analisar a validade da forma de raciocnio que poderia estar por trs da induo reversa. No Jogo das Moedas, que ele preparou, um montante de seis moedas estaria disposio de dois jogadores que teriam a possibilidade de pegar na sua vez uma ou duas moedas. Caso pegasse uma moeda, o lder a reteria para si passando a jogada para o prximo jogador. Se pegasse duas moedas, o jogo encerrar-se-ia e as quatro moedas restantes reverteriam banca. Na sua forma completa, o jogo tem a rvore que aparece na figura 3.5.
Figura 3.5
Pela induo reversa, o melhor seria "A" pegar logo as duas moedas, ao invs de esperar por quatro da ltima rodada, ou trs, se quisesse parecer justo ao outro jogador. Sendo ambos agentes racionais vlido pensar que o jogo terminar em seu lance inicial. Contudo, ponderou Hollis, se "A" pega apenas uma moeda pode levar "B" a pensar que h uma algum equvoco na sua atitude ou que no procura maximizar sua utilidade, pondo tambm em dvida sua capacidade racional. Porm, uma iniciativa cooperadora como esta poderia levantar a suspeita de se tratar apenas de um ardil para chegar s quatro moedas no final, posto que nenhum agente racional preferiria trs ao invs de um ganho maior. Essa segunda linha de raciocnio religaria o paradoxo da induo reversa, fazendo com que "B" termine o jogo em seu primeiro movimento140. A concluso que Hollis chegou que a induo reversa no uma forma invlida de argumentar contra a cooperao entre agentes egostas racionais, mas uma maneira sutil de mostrar que no se pode determinar o comportamento de um agente com base apenas no conhecimento comum sobre sua racionalidade. Pessoas de "carne e osso" tem levado a cooperao at o final nesse tipo de jogo, repartindo meio a meio o total oferecido na maioria das vezes. Especulaes sobre tal conduta indicam que haveria algo mais a ser considerado fora do aparato da racionalidade pressuposta pela teoria dos jogos. No contexto cultural de uma sociedade, o hbito ou o costume de se levar uma interao at o final poderia estar na raiz da tendncia desse comportamento regular produzido pela vida cotidiana141. De outro modo, jogos mais curtos revelam que a formao de uma reputao poderia explicar que est em questo a maneira como os agentes querem ser
139 140
. Veja HUME, D. A Treatise of Human Nature, liv. III, part. II, se. V, pp.286 e ss. . Veja HOLLIS, M. Trust within Reason, cap. 3, pp. 55-57. 141 . Veja HOLLIS, M Op. cit., cap. 3, p. 57.
73
compreendidos no futuro. Assim, um jogo alternado, proposto pelo socilogo noruegus Jon Elster142, ajuda entender o papel do passado e futuro nas deliberaes (figura 3.6).
Figura 3.6
O lder tem a oportunidade de encerrar o jogo escolhendo "B", entretanto, por acreditar que II seja racional, deve arriscar-se a ganhar o mximo possvel, deixando que este decida ficar com um ou nada ganhar. A despeito de sua racionalidade - e talvez por ser um INVEJOSO MODERADO -, o segundo jogador emprega a induo reversa e verifica que se I tivesse escolhido "B", ambos obteriam a repartio justa de (2, 2). Nessa hora, sentimentos de indignao e ressentimento podem vir tona, fazendo que II tenha a chance de se vingar do lder, escolhendo (0, 0). Tericos dos jogos poderiam considerar irracional deixar-se levar por sentimentos morais como a indignao ou vergonha e buscar a vingana, abrindo mo de um ganho maior do que zero, nesses casos. Todavia, a tendncia experimental para uma diviso justa sinalizaria, sob o ponto de vista evolutivo, que, embora o jogo seja implementado em uma s rodada, sem repetio, a considerao da reputao de uma pessoa justa, que no aceita uma distribuio flagrantemente desigual, ou vingativa acompanha a deciso nesses modelos de jogos, apoiado em uma projeo no tempo, passado e futuro, da expectativa de comportamento por parte do outro, que no quer passar a imagem de quem aceita qualquer coisa em nome de sua racionalidade instrumental. Em casos extremos, quando h a possibilidade de comunicao prvia entre agentes, o ultimato pode vir acompanhado por uma chantagem do lder ao segundo jogador ou deste para o primeiro, a fim de que o outro procure favorecer os ganhos do prprio chantagista. Tal como Hollis, o filsofo ingls, Simon Blackburn, afirma que nas situaes empricas concretas, os tericos dos jogos no podem recomendar esta ou aquela maneira de jogar143. Em casos concretos, apesar das dificuldades de descrio das situaes com maior grau de complexidade, crticas como as de Blackburn no desautorizam as recomendaes da teoria dos jogos para circunstncias especficas que atendam as condies iniciais dos modelos tericos. Para evitar as ameaas, cortar as comunicaes parece ser um bom conselho geral. Para fazer crvel uma promessa bom ter construdo antes uma reputao de quem cumpre a palavra e assim por diante. Por muito paradoxais que sejam as descries e sugestes feitas pela Teoria dos Jogos, cada vez mais, bilogos evolutivos tm encontrado razes para consider-la um instrumento de anlise adequado, no sentido de explicar o processo de evoluo do comportamento cooperativo entre seres vivos, de um modo geral, e a emergncia de algumas propriedades relevantes a isso, em particular. Na filosofia, a aplicao dos modelos de jogos como Centopia e o Dilema dos Prisioneiros - em suas diversas verses, pelo que foi visto at aqui, permite examinar aspectos importantes da evoluo da cooperao e da equidade, bem como de sentimentos morais e da comunicao em sujeitos racionais egostas, sem apelar para
142 143
. Veja ELSTER, J. "Some Unresolved Problems in the Theory of Rational Behavior", p. 186. . Veja BLACKBURN, S. Ruling Passions, cap. 6, p. 172.
74
conceitos transcendentais ou metafsicos de qualquer ordem. Alm dessas caractersticas, outros problemas e instrumentos tm sido acrescentado, ampliando a rea de atuao da filosofia prtica e sua acuidade. Resta observar mais atentamente para onde a teoria dos jogos aponta ao invs de simplesmente recusar seus mtodos com argumentos precipitados sobre sua inadequao em relao tradio filosfica. 3.2 Problemas com o Modelo Padro
Outra dificuldade embaraosa para o Dilema dos Prisioneiros Iterado posta pelo chamado teorema popular (folk theorem). O teorema popular formaliza uma intuio partilhada pelo senso comum, entre os economistas, de que qualquer tipo de cooperao pode ser sustentada, em uma iterao, desde que haja a ameaa de punio aos transgressores. Tal punio seria mais eficiente na medida em que sua carga viesse se prolongar muito ao longo do tempo. O problema, ento, surge da dificuldade em se saber qual dos mltiplos equilbrios possveis deve ser recomendado para uma situao especfica, j que eles podem ser mantidos de muitas maneiras diferentes144. Pontos de equilbrios sempre so gerados quando os resultados conjuntos obtidos em superjogos superam os ganhos de um equilbrio existente no jogo base que deu origem iterao. Assim, no caso do Dilema dos Prisioneiros - modelo padro -, qualquer ganho distribudo para ambos jogadores acima do valor da punio para desero mtua (1,1), alcanados por uma repetio de fim indeterminado, podem estar em equilbrio de Nash145. Tantos equilbrios disponveis levam questo sobre qual deles seria o melhor a ser adotado e como chegar a ele efetivamente. Por outro lado, o conhecimento do teorema popular muito antes das concluses tiradas por Robert Axelrod, acerca da possibilidade da cooperao, j previa que estratgias como OLHO POR OLHO poderiam sustentar um ponto de equilbrio ao final de vrias repeties do Dilema dos Prisioneiros, bem como qualquer outra estratgia cooperadora que produzisse resultados acima do equilbrio primrio da punio mtua. O economista britnico Ken Binmore criticou a nfase que se dava a esse respeito na pesquisa de Axelrod, quando este procurava destacar as virtude da vitoriosa OPO ou do mecanismo do DPI, como sendo sua contribuio mais importante para a Teoria dos Jogos. Ao contrrio, o que havia de relevante no trabalho de Axelrod era o enfoque "na importncia da evoluo na seleo de um equilbrio em infinitas possibilidades de existncia, como no teorema popular"146. Binmore criticou as afirmaes de que a clemncia, a gentileza, a retaliao e a clareza fossem fundamentais para o sucesso de uma determinada estratgia em particular. Estratgias como GRIM TRIGGER (RETALIADOR PERMANENTE, RP), submetida no torneio inaugural pelo economista James W. Friedman, poderiam obter bons desempenhos em ambientes mais favorveis. O RETALIADOR PERMANENTE nunca o primeiro a deserta, mas jamais volta a cooperar com quem fez a primeira desero. Nesse sentido, uma vez comunicada sua forma de agir, RP capaz de sustentar a cooperao satisfatoriamente, por apresentar motivos suficientes para que se evite sua retaliao dura, como uma "mquina do juzo final" - no filme Dr. Strangelove - se esta fosse anunciada a tempo de evitar o ataque nuclear. Contudo, preciso destacar
144 145
. Veja KREPS. D.M. Game Theory and Economic Modelling, cap. 4, pp. 75-76. . Veja FIANI, R. Teoria dos Jogos, cap. 6, pp. 169-172. 146 . BINMORE, K. "Review: The Complexity of Cooperation", p. 2.
75
que sua eficcia depende que haja ao menos uma rodada prvia de conversao. RP no nem um pouco clemente. A gentileza, por sua vez, no um comportamento que seja inerente a estratgias evolutivas, pois mquinas que sempre cooperam camuflam comportamentos simplrios que esto sujeitos explorao de uma simples mutao que no coopere no primeiro encontro. No lugar da clareza, para que um programa reconhecesse o outro bastaria que fosse dotado de um dispositivo, uma marca distintiva das demais, que permitisse uma mutao perceber a presena de uma cpia de si mesma na populao, a fim de que ambas se envolvessem em uma cooperao. Um cdigo tal como o que permitiu estratgia SOUTHAMPTON estabelecer o conluio no campeonato comemorativo de 2004. Tampouco se requer que uma estratgia seja ela prpria capaz de retaliar, aspecto que s necessrio quando a interao se desenvolve apenas entre duas partes. Basta somente que haja um terceiro programa que seja o vingador daquela que fora injuriada, para que o desertor seja punido, em relaes multilaterais147. Novos torneios mostraram que numa descrio mais realista, onde erros ocasionais e lances alternados podem ocorrer, o resultado final da iterao favorece outros tipos de estratgias. Nessas circunstncias, a forma pura de OPO obtm pontuaes prximas s de estratgias RANDMICAS em que os lances so jogados aleatoriamente , sobretudo quando a probabilidade do rudo acontecer atinge 50%. Nos jogos simultneos com rudo, estratgias do tipo PAVLOV, como WIN-STAY, LOSESHIFT (EM TIME QUE EST GANHANDO NO SE MEXE) na qual os jogadores repetem os resultados vitoriosos da ltima rodada (Recompensa ou Tentao) e mudam quando perdem (Punio e Simplrio) , so superiores OPO, devido capacidade de corrigir um erro momentneo148. De outro modo, quando os movimentos dos participantes so alternados h troca de papis , uma variante de OPO chamada GENEROUS TIT FOR TAT (GENEROSO OLHO POR OLHO, GOPO) consegue alcanar os melhores desempenhos ao longo de vrias geraes. Isto porque, GOPO passa a usar a probabilidade de cooperar quando um lance equivocado de desero realizado pela outra parte149. Dez anos depois de publicar The Evolution of Cooperation, Axelrod promoveu novos torneios de computador. Dessa vez, cobriu as situaes em que o rudo interfere nas escolhas com uma chance inicial de 1% de provocar resultados opostos aos esperados. A seguir, avaliou tambm diversos nveis de rudos a cada 10%. Em todas escalas, foi constatada a superioridade das variantes generosas de OPO frente s estratgias PAVLOV. A generosidade permitiu a correo de erros cometidos por ambos jogadores em baixo nvel de rudo e quando as partes no estavam adaptadas possibilidade de erro. Outra verso de OPO, conhecida como CONTRITE TIT FOR TAT (CONTRITO OLHO POR OLHO, COPO) que evita responder a uma desero adversria, quando o
. Veja BINMORE, K. Op. cit., pp. 3 e 4. . As estratgias que mudam o comportamento do jogador de acordo com o resultado foram rotuladas de PAVLOV pelos matemticos David P. Kraines e Vivian Kraines desde o artigo Pavlov and Prisoners Dilemma, de 1989. A famlia de estratgia OPO, por sua vez, orienta-se segundo o comportamento do outro jogador. 149 . A GOPO continua cooperando sempre que o outro coopera (p=1) e deserta com a probabilidade q relativa proporo da diferena entre R e P sobre a diferena entre T e P (q=R-P/T-P). Veja NOWAK, M.A. & SIGMUND, K. The Alternating Prisioners Dilemma, in Journal of Theorical Biology, n 168, p. 224.
148 147
76
prprio jogador acabara de desertar, sem inteno, na rodada anterior , mostrou-se mais efetiva se o prprio jogador est adaptado ao rudo e a taxa de ocorrncia de equvoco alta. Nas populaes adaptadas estratgia mista, a auto-correo dos erros suficiente para dispor as partes a entenderem a eventualidade de modo adequado, restaurando a cooperao de pronto. Com isso, concluiu-se que as OPO modificadas permaneceram robustas nos ambientes ruidosos, em que as pessoas esto sujeitas a erros. As estratgias PAVLOV, por seu turno, tiveram bom desempenho apenas nos momentos em que ambos jogadores seguiam esse tipo de interao apoiada na manuteno de resultados positivos. Contra outros no pavlovianos, as pessoas ficaram vulnerveis permanente desero (SEMPRE D), com o pagamento do cenrio padro do primeiro torneio150. Apesar do otimismo de Axelrod quanto ao sucesso de estratgias reativas da famlia OPO, outros estudos tm indicado que a estratgia bem sucedida depende intrinsecamente do cenrio montado, da topografia da vizinhana e, sobretudo, da estratgia que o outro ir adotar difcil de se prever de antemo. Como afirmam os pesquisadores Martin Nowak, Robert May e Karl Sigmund, uma estratgia que vai bem num certo ambiente pode falhar miseravelmente em outros151. A Defesa de Axelrod A induo reversa no afeta o DPI quando este repetido infinitamente ou de maneira a tornar indeterminado o fim do jogo. Entretanto, para que a indeterminao do final anule os efeitos da reverso das jogadas, a "sombra do futuro" deve ser a mais longa possvel. O que vale dizer que a probabilidade de terminar a partida no prximo movimento seja maior do que zero. Quando as chances do jogo continuar se aproximam de zero, o DPI volta a sentir as influncias das estratgias dominantes da matriz bsica e o valor da desero cresce. A estratgia OPO, ento, s pode obter o pagamento mximo se ambos jogadores cooperarem a cada rodada. Contudo, o mesmo resultado poderia ser obtido se todos fossem cooperadores incondicionais - como props Kant, desde sua Fundamentao da Metafsica dos Costumes (1785). Sendo assim, no haveria uma caracterstica particular de OPO que lhe garantisse a indicao precisa para atuar tendo em mente apenas as consequncias de uma longa sombra do futuro. Para tornar mais plausvel a defesa da robustez de OPO, a competio simulada em computadores teve de incorporar detalhes mais realistas que dessem conta da possibilidade de erro ou confuso, na execuo ou percepo de um movimento especfico. A diferena entre lances simultneos e alternados tambm teve de ser considerada, a fim de tornar a descrio da interao ainda mais prxima da relaes reais. Tais mudanas viabilizaram o aparecimento de novas estratgias que se mostraram eficientes em um cenrio mais abrangente - como aqueles preparados por Nowak, Sigmund e outros pesquisadores. A teoria da cooperao chamou ateno de um nmero crescente de especialistas interessados na explicao mais precisa do comportamento cooperativo e das circunstncias que o fomentam, entre seres humanos ou no. Em suma, est em jogo a tnue convivncia entre indivduos que buscam de imediato o melhor para si, em
. Veja WU, J & AXELROD, R. How to Cope with Noise in the Iterated Prisoners Dilemma, in Journal of Conflict Resolution, n 39, pp. 183-189 e AXELROD, R. On Six Advances in Cooperation, in Analyse & Kritik ; jan. 2000. 151 . NOWAK, M. A. , MAY, R. & SIGMUND, K. The Arithmetics of Mutual Help, in Scientific American, jun. 1995, p. 78.
150
77
particular, e o bem do grupo, em geral, a longo prazo. Ao invs de supor uma racionalidade forte para deliberaes, a teoria da cooperao adotou a perspectiva de que os agentes procuram atuar sob regras prticas, sem efetivar um clculo rigoroso de tudo que necessrio para se encontrar uma soluo tcnica indicada. Destarte, a cooperao, apoiada na reciprocidade pde ser atribuda a pessoas, naes e organismos biolgicos, em geral. Tudo porque a simplicidade do Dilema dos Prisioneiros assim o permitia. Graas ao DPI e suas variantes, as simulaes em computadores puderam observar a eficincia das estratgias nos ambientes mais variados, incluindo os modelos biolgicos evolutivos. As diferenas entre os cenrios onde movimentos eram efetuados ora simultaneamente, ora alternadamente, no foram, na interpretao de Axelrod, suficientes para refutar de modo cabal as concluses bsicas da teoria da cooperao por reciprocidade, porque mantiveram os efeitos favorveis da presena da sombra do futuro sobre a expectativa de ganhos possveis e a dependncia da compreenso que a escolha das estratgias depende do que se espera que o outro faa. Se possvel que o outro jogador seja suficientemente responsvel, e os pagamentos e sombra do futuro so suficientemente favorveis, recomendar a estratgia recproca ainda parece ser conselho robusto (AXELROD, R. On Six Advances in Cooperation Theory, p. 18). Outros fatores, como a considerao da reputao, racionalidade, adaptao e inveja, revelaram o papel que os detalhes podem exercer em uma rede social ou quando se mostra a oportunidade de abandonar a interao. A troca de informao entre os participantes sobre seu comportamento passado permite que a reputao seja reconhecida, promovendo a cooperao mesmo se os jogadores nunca se encontraram antes, caso um deles seja um RETALIADOR PERMANENTE, por exemplo. Uma estrutura social adequada pode manter a cooperao sustentada na reputao, quando esta de conhecimento pblico152. Em resposta s crticas quanto clareza, como propriedade de uma estratgia vitoriosa, que sustentam que para uma mutao ou adaptao aprender um comportamento recproco, basta que seja capaz de aprender a regra por si mesma, Axelrod pondera que a mistura das escolhas de aes pode ser difcil de ser compreendida, ao se enfrentar vrias estratgias ao mesmo tempo. Sobretudo quando se tem tambm de avaliar as consequncias de cada um empiricamente. Para serem bem sucedidos, tais tipos de interaes precisam levar em conta o conjunto de estratgias envolvidas, indentificando aquelas cpias de si mesmas que se reproduzem corretamente, bem como suas principais mutaes. Em socorro a essas dificuldades, uma compreenso racional mnima procura cooperar sempre em funo do resultado satisfatrio, depois de se fazer a deliberao correspondente153. Isso conduz discusso sobre a justificao de um comportamento que pode ser afetado, em sistemas neurolgicos mais avanados, pelo sentimento de inveja, entendida como um pagamento to alto como o do outro jogador, ou o no desejo de ganha menos, ou ainda no aceitar que meios injustos permitam o favorecimento do desempenho do adversrio. Tal sentimento poderia estar na base de uma intuio primria de justia. Em ambientes sujeito a rudo, que podem provocar uma resposta equivocada ao comportamento do outro, OPO poderia ser transformada em uma estratgia INVEJOSA
152 153
. Veja AXELROD, R. On Six Advances in Cooperation Theory, pp. 21-23. . Veja AXELROD, R. Op.cit., p. 23.
78
MODERADA - cooperar se ganha uma vantagem extra -, sem deixar de ser robusta, desde que mantenha a reciprocidade entre os jogadores depois de uma eventual punio por esse ganho "indevido". Efetivamente, qualquer que seja a definio de inveja que se queira atribuir aos jogadores para fornecer maior nitidez psicolgica a esses replicantes, essa no parece ser uma legtima justificao para restringir as escolhas dos participantes na interao, sendo apenas uma interpretao relativa cultura em que se est inserido. Na prtica, OPO no se mostra como uma estratgia invejosa, sobretudo quando arrependida para ganhos no merecidos, em um cenrio ruidoso na estratgia derivada COPO154. Por fim, uma alternativa que evite a atuao de oportunistas modelada em jogos que permitem o abandono da interao se o relacionamento se mostrar insatisfatrio para uma das partes. Isso pode ocorrer quando a cooperao repentinamente rompida por uma desero, ocasio em que o jogador afetado imediatamente sai da partida. A possibilidade de sair s surge, ento, quando o outro no coopera. O efeito de sada avaliado adequadamente no contexto em que esto envolvidas mutaes e, por conseguinte, quando se est levando em conta a adaptao ao meio ambiente. Vale dizer que isso implica em investigar a populao de estratgias atuantes, a fim de saber qual produz os melhores resultados, segundo um histrico de confiabilidade, uma vez que o conjunto inicial influencia a comparao correta dos diversos cenrios montados. A sada rpida de uma desero pode diminuir em muito os prejuzos de estratgias gentis e aumentar as perdas das ms cooperadoras155. Embora a teoria da cooperao tenha apresentado alguma sensibilidade a mudanas nos ambientes onde as hipteses originais foram lanadas, de um modo geral, ela se mostrou apta para analisar a emergncia da cooperao nos mais diversos tipos de simulaes. Enfaticamente, percebeu-se que a conduta cooperativa pode surgir nas mais diferentes circunstncias. Alm de OPO, muitas outras estratgias cooperadoras foram apontadas como vlidas, desde que a rodada final estivesse indeterminada em um horizonte distante e as estratgias estivessem tambm prontas a se corrigirem, quando atingidas por desafios de comportamentos alternativos. Restries racionalidade dos agentes, que implementam os programas determinados nos torneios, abrem espao especulaes ou futura investigao, sobre o papel da escolha racional na formulao de algoritmos mais refinados que faam a distino precisa das condies mais favorveis cooperao. Conforme Robert Hoffmann indica em sua defesa da teoria da cooperao, a capacidade de aprendizagem durante o processo interativo pode ser a melhor explicao para saber como tais relaes estratgicas ocorrem na natureza156. 3.3 Estratgias Vitoriosas nas Variantes do Modelo Padro
Depois que Axelrod popularizou a simulao em computadores como mtodo de avaliao privilegiado das condies em que estratgias cooperadoras poderiam ser bem sucedidas, uma srie de variaes dos parmetros dos campeonatos originais foi testada, com o intuito de examinar a validade de suas hipteses iniciais. Para cada novo modelo, apareceram novas estratgias vitoriosas que se mostravam robustas a invases, enquanto corrigiam algumas vulnerabilidades percebidas nas verses anteriores. Pequenas
154 155
. Veja AXELROD, R. Idem, p. 25-29. . Veja AXELROD, R. Ibidem, pp. 29-31. 156 . Veja HOFFMANN, R. "Twenty Years On", 4.5.
79
mudanas na constituio primria do Dilema dos Prisioneiros Iterado poderiam favorecer linhas de ao que de outra forma no poderiam subsistir plenamente. Uma competio evolutiva do Dilema dos Prisioneiros, em que as partes apenas podem ou cooperar ou desertar entre si, isto reagem apenas de uma maneira determinada, sem ponderar os lances com uma taxa de probabilidade definida, mas respeitando apenas esses dois estgios de escolha, permitiu que algoritmos RP dominassem a maioria da populao remanescente, no final de um jogo evolutivo. Entre 26 participantes que concorreram nestas condies, 67% da populao passou a ser composta por RETALIADORES PERMANENTES, ressalvado o cenrio em que haveria a possibilidade de mutao entre as sucessivas geraes. Quando esta mutao atingia 1%, a vantagem de RP caia para faixa dos 50%157. A estratgia RP inclemente. Jamais coopera depois do outro jogador ter desertado primeiro no movimento anterior. Tambm RP extremamente sensvel ao erro. Qualquer desero equivocada pode levar a uma punio mxima por parte do retaliador. Sem embargo, nos torneios de Axelrod, onde no havia possibilidade de erro no desempenho dos algoritmos, RP obteve a stima colocao entre as 14 que participaram da primeira fase e a 52 posio entre as 63 concorrentes do segundo turno. Como o prprio Axelrod destacou, das 39 estratgias gentis - aquelas que comeam cooperando - do segundo campeonato, RP ficou com o pior lugar entre elas. Para que RP obtenha xito em um contexto verossmel, faz-se necessrio que seu agente seja capaz de comunicar corretamente a ameaa de uma severa retaliao, caso venha ser explorado por um desertor desavisado. S assim um RP passa a ser um incentivo mximo para manuteno da cooperao. Contudo, qualquer desateno pode ser fatal. Apesar das dificuldades de se manter a cooperao com RPs, sua resistncia em um ambiente evolutivo explica-se pela eficincia de cumprir suas ameaas ou promessas de lealdade. Um comportamento que transparece entre aqueles que se empenham passionalmente pela palavra empenhada. Punies severas surgem como preo de se tornarem verazes os compromissos assumidos. Nos seres vivos, emoes fortes, como a clera, a ira ou fria, emergem como modo de pela intimidao ser levado a srio. Quanto mais incontrolvel e intolerante a erros, maiores as chances de serem crveis suas ameaas158. Na ao poltica, isso explica, mas no justifica atos extremados de terrotistas suicidas. Na natureza, espcies RPs abrem espao para a sobrevivncia de organismos que se aproveitam da "fama de mau" daqueles de quem mimetizam a aparncia agressiva ou os seus padres de cores. Desta artimanha so exemplos espcies como a cobra-coral-falsa (Lampropeltis doliata), nativa do sudeste estadunidense, que usufrui da proteo extra por reproduzir as mesmas formas da verdadeira cobra coral (Micrurus nigrocinctus), que uma espcie venenosa distinta, e a borboleta Caligo beltrao (popular "corujo"), encontrada no sudeste brasileiro, cujo macho ostenta os olhos de uma sisuda coruja nas suas asas posteriores, afastando os predadores distrados. Fatores Psicolgicos Outro algoritmo a revelar aspectos psicolgicos importantes adquiridos na evoluo da cooperao foi vencedor de um campeonato alternativo realizado pelos
. Veja SIEBRASSE, N. "Generalized Win-Stay, Lose-Shift is Robust in the Repeated Prisoner's Dilemma with Noise Played by Multi-State Automata", p. 11. 158 Veja PINKER, St. Como a Mente Funciona, cap. 6, pp. 428-438.
157
80
bilogos matemticos Martin A. Nowak e Karl Sigmund, na poca em que o primeiro ainda estava na Universidade Oxford e o segundo na Universidade de Viena, em 1993. Na variante simultnea do DPI sujeita a erro, que eles montaram, a estratgia chamada WIN-STAY, LOSE SHIFT (EM TIME QUE EST GANHANDO NO SE MEXE) foi a vencedora. Historicamente, essa estratgia havia sido sugerida pela primeira vez por Anatol Rapoport e Albert M. Chammah no texto intitulado Prisoner's Dilemma, de 1965, com o estranho nome de SIMPLETON (TOLO). Mais tarde (1990) esse mesmo programa foi descrito por Jeffrey S. Banks e Rangarajan K. Sundaram como TAT-FORTIT (AQUILO POR ISTO, uma inverso de TIT-FOR-TAT), designao preferida por Binmore, devido ao comportamento semelhante ao de OPO na sua atuao original, mas que o inverte aps uma desero159.
Figura 3.7 - Jogo Simultneo com Rudo (erro) OPO 1 C C d C D C ... D d D D ... D c D C ... D C C C OPO 2 C C C D C D ... C D D D ... D D C D ... C c C C d = desero equivocada c = cooperao equivocada
Alm desses nomes, a linha de ao, que mantm o mesmo estado quando est ganhando e muda quando perde, foi tambm denominada PAVLOV. Um agente pavloviano permanece no seu movimento inicial se seu pagamento corresponder aos valores da tentao (T) ou da recompensa (R), trocando de opo toda vez que receba apenas a punio (P) ou ganho simplrio (S). Para os matemticos David P. Kraines e Vivian Y. Kraines, que renomearam a antiga SIMPLETON como uma homenagem ao histrico fisiologista russo Ivan Petrovich Pavlov (1849-1936), esse tipo de comportamento pode ser atribudo aos peixes-espinhos (Gasterosteus acaleatus), na natureza, quando estes inspecionam um territrio em busca de um predador160. Em um DPI simultneo com erro, pode ocorrer a algumas estratgias o efeito de "eco", como a OPO, caso, depois de uma primeira desero equivocada, o segundo jogador passe a retaliar e, aps retornar cooperao, em respostas defasadas aos comandos do outro. Pode acontecer ainda uma sequncia de mtua desero e, em seguida a um novo equvoco, ser refeito a repetio do "eco" com a fase invertida, que s depois de um outro movimento errado poder reinstalar a cooperao (figura 3.7). Ao invs de persistirem em uma sucesso de diversos erros para estabelecer a cooperao, dois jogadores "pavlovianos" poderiam recuper-la rapidamente sem maiores dificuldades, graas capacidade desse programa superar possveis enganos nas tomadas de deciso. Essa habilidade de recuperar o estgio inicial da interao em poucos movimentos demonstrou que PAVLOV era mais robusta em ambientes ruidosos do que OPO (figura 3.8).
Figura 3.8 - Jogo Simultneo com Rudo (erro) PAVLOV 1 C C C C D C C C PAVLOV 2 C C C d D C C C d = desero equivocada ... ...
Depois de saber desses resultados, Axelrod resolveu refazer a disputa de seu segundo torneio. Dessa vez, com a possibilidade de 1% de uma deciso ter sido tomada equivocadamente. A RP absolutamente desastrosa nesse tipo de ambiente. Todavia, a
. Veja BINMORE, K. "Review: The Complexity of Cooperation", p. 6. . Em 1987, Manfred Milinski associou o comportamento do peixe-espinho ao da estratgia OPO (veja MILINSKI, M. "Tit for Tat in Sticklebacks and the Evolution of Cooperation", entretanto, j admitia rever suas concluses, em 1993, considerando PAVLOV a maneira mais apropriada de descrever suas reaes diante de um possvel rival (veja MILINSKI, M. "Cooperation Wins and Stays").
160 159
81
variante generosa de OPO (GOPO) poderia sair-se melhor do que qualquer uma das 63 instrues submetidas no segundo campeonato. GOPO seria uma verso de OLHO POR OLHO que cooperaria 10% das vezes em que deveria agir desertando em funo da atitude no cooperativa da outra parte. "Isso previne que um simples erro ecoe indefinidamente", afirmou Axelrod, ao lado do chins Jianzhong Wu161. De fato, na variao alternada do DPI, realizada por Nowak e Sigmund, GOPO conseguiu regenerar a cooperao, a longo prazo, de uma forma mais eficaz do que PAVLOV, nas mesmas condies. Uma das concluses que foram tiradas dessa experincia foi que, por observar apenas os resultados obtidos, PAVLOV estaria mais apta a reagir em circunstncias onde no fosse necessria a percepo precisa do jogo feita pelo adversrio, que ignoraria suas intenes. Ao passo que, estratgias mimticas da famlia OPO conseguem se defender da explorao de quem nunca coopera, enquanto PAVLOV ficaria alternando suas aes entre P e S. Prestar ateno no que o outro faz a chance de atingir a melhor soluo estratgica no cenrio ruidoso de troca de papis entre os jogadores. Nesse sentido, enquanto OPO fora a estratgia mais eficaz para emergncia da cooperao, uma vez estabelecida as condies para manuteno desta atravs da seleo natural, a vertente GOPO seria a mais realista e robusta a invases de mutantes ou aes equivocadas162. Junto estratgia generosa de OPO, uma linha de ao chamada CONTRITO OLHO POR OLHO (COPO) pode ser considerada bem sucedida em ambiente ruidosos. COPO atua semelhante a OPO, mas procura evitar responder uma desero da outra parte, depois que o prprio jogador ter desertado equivocadamente na rodada anterior. Procedendo assim, do mesmo modo que GOPO tolerante com os erros cometidos pelos adversrios, COPO mostra arrependimento pelos prprios enganos. Deste modo, rapidamente as estratgias variantes podem restabelecer a cooperao depois de lances confusos de ambas as partes. COPO comea sempre cooperando e mantm-se satisfeito com a cooperao at que haja uma desero. Se esta foi provocada pela outra parte, passa a retaliar at que o retorno cooperao o deixe novamente satisfeito. Porm, quando a desero foi praticada pelo prprio jogador, acontece o arrependimento que admite uma retaliao adversria, que o obriga a cooperar em seguida. Enquanto GOPO produz um comportamento cooperativo satisfatrio quando a taxa de rudo vai at 1%, COPO consegue maior eficincia em nveis maiores do que este. Na verso ecolgica da segunda fase do torneio de Axelrod com rudo, COPO atingiu a liderana entre as seis melhores estratgias daquele campeonato, aps 2000 geraes. Contudo, em determinados confrontos, como os contra OPO original, essa estratgia vulnervel ao efeito de eco, quando aquela deserta por acidente. De acordo com Axelrod, apenas um novo engano poderia reparar a cooperao inicial. Tal ocorre porque COPO eficaz na reparao de seus prprios erros, mas no os do oponente, pois neste caso continua reagindo da mesma forma que OPO contra a explorao do adversrio. COPO s eficiente contra algoritmos adaptados situao de rudo163. A reao de quem aplica COPO identificada com a de quem opera a linha de ao do INVEJOSO MODERADO (IM), quando este ganha uma vantagem indevida. Na ausncia de rudo, IM joga como se fosse OPO. Do contrrio, no aceita que o outro jogador deserte mais do que ele mesmo. Destarte, um jogador invejoso que fosse capaz
161 162
. WU, J. & AXELROD, R. "How to Cope with Noise in the Iterated Prisoner's Dilemma", p.2. . Veja NOWAK, M. & SIGMUND, K. The Alternant Prisoner's Dilemma, 7, p. 226. 163 . Veja WU, J. & AXELROD, R. Op. cit. pp. 6 e 7.
82
de se arrepender de ter ganhos excessivos poderia evitar a explorao de desertores, ao mesmo tempo em que se mostra aberto a cooperao, depois de uma punio motivada. medida que o refinamento da descrio do Dilema dos Prisioneiros repetido foi se aproximando de um modelo mais realista da interao humana, novas competies foram sendo promovidas, a fim de reproduzir as condies em que a cooperao pode surgir em um ambiente tpico da seleo natural darwiniana. David e Vivian Kraines, em "Protocols for Cooperation" (2001), elaboraram uma disputa em torno de um Dilema dos Prisioneiros Alternado, ou sequencial, onde uma nova estratgia chamada TOUGH LOVE (AMOR BRUTO, AB) manteve a cooperao estvel ao punir o mau comportamento e esquecer rapidamente a reincidncia. No cenrio evolutivo, no qual os agentes eram capazes de recordar os quatro resultados anteriores, as caractersticas tolerantes de AMOR BRUTO foram cruciais para gerarem cooperao mtua com uma sequncia de movimentos trocados aleatoriamente. Nesse contexto, a cooperao no surge do altrusmo, mas da habilidade de lembrana dos resultados de alguns encontros passados. Assim, muitos grupos ABs podem ser formados, ficando sua sustentao garantida pela distino clara de certos protocolos e regras "culturais". Ou seja, membros de um grupo, que tenham seus prprios hbitos e procedimentos, seriam bem sucedidos se permanecessem no seio deste, ao invs de visitar outras associaes. Kraines & Kraines concluem que essa "diferena cultural entre cls estvel evolutivamente com respeito a outros cls"164. Quer dizer, saber distinguir adequadamente aqueles que fazem parte de seu grupo uma condio prioritria para manter a estabilidade de uma estratgia frente concorrente. A estratgia memoriosa de um Dilema dos Prisioneiros Alternado, AB, atua como um cooperador recproco que pune deseres imotivadas; contritamente cooperando depois de ter sido punido por uma desero que tenha cometido; e tolerando um oponente arrependido. Depois de uma desero acidental, AB coopera sem problemas com o adversrio. Comportando-se dessa maneira, AB evita os crculos viciosos de desero com seus pares, no explora agentes altrustas (SEMPRE C), retorna rapidamente a uma cooperao com os outros aps uma srie de erros confusos, sendo um parmetro apropriado para uma estratgia evolucionria estvel (EEE), com uma trajetria com pequenas mudanas aleatrias no nvel de rudo, estgios, quantidade inicial de agentes e ganhos esperados variveis165. No obstante, quando a memria dos participantes desse tipo de torneio seletivo chegava a quatro decises atrs, foi detectado que apenas 44% dos agentes envolvidos se tornaram cooperadores. A maioria da populao nunca se envolve com cooperao mtua nesse modelo. Ao invs disso ser uma falha do modelo, pode ser um reflexo acurado da evoluo no mundo real. Em poucas espcies, indivduos ordinariamente cooperam com outros, exceto pelos relativamente prximos. As espcies que desenvolvem cooperao recproca tendem a ser as mais inteligentes (grande memria), mas mesmo entre espcies altamente inteligentes, comportamento cooperativo no , em geral, resultado evolucionrio. Embora padres de comportamento cooperativos sejam geralmente mantidos entre lees, no h entre tigres. Ao invs de batalhas tipo perda-perda,
164 165
. KRAINES, D. & KRAINES, V. Protocols for Cooperation, 1, p. 3. . KRAINES, D. & KRAINES, V. Op. cit., 15 e 18, pp. 26 e 28-29.
83
muitas espcies que tomaram a trajetria evolucionria at SEMPRE D tambm aprenderam a evitar interaes (...) com outras espcies. Tigres tendem vida solitria e evitar um longo nmero de pagamentos perda-perda (KRAINES, D.& KRAINES, V. Protocols for Cooperation, 18, p. 28). Nas sociedades humanas, os confrontos eventuais tm sido superados por uma srie de normas e rituais que visam restabelecer a harmonia na sociedade, depois que algum ato veio a prejudicar a cooperao. Tais aspectos do comportamento social parecem corroborar a afirmao de que instituies surgiram ao longo de todo um aprendizado obtido no apenas no processo seletivo natural, nos moldes darwinianos, mas da diferenciao cultural que emerge nos grupos de estratgias que no se esquece facilmente do passado, em um modelo de Dilema dos Prisioneiros Alternados. Por razes genticas e culturais, sentimos prazer depois de fazer uma boa ao. Tambm ressentimos de quem tira vantagem de nossa boa vontade e retaliamos ou mantemos um sistema judicial para retaliar por ns. Ao passo que tendemos a esquecer aqueles que se desculpam e se arrependem. A emoo da culpa nos detm de explorar e logo retornamos a cooperar. Esses sentimentos correspondem aos que poderiam dirigir um agente AMOR BRUTO. Nossas respostas emocionais podem bem estar envolvidas em parte por obter interaes tpicas de um Dilema dos Prisioneiros (KRAINES, D.& KRAINES, V. Op. cit., 18, p. 29). 3.4 Rudo, Alternncia e Evoluo
Da mesma forma que os jogos de soma zero no eram suficientes para descreverem todo tipo de interao entre dois agentes racionais, o modelo padro do Dilema dos Prisioneiros Iterado apresentava muitas limitaes em sua representao das relaes sociais ou biolgicas, em um nvel mais profundo. Acrescentar elementos presentes em interaes reais, que por simplicidade foram inicialmente omitidos, tornaram a simulao mais precisa, apesar de sua complexidade. Afinal, rudos, equvocos, troca de papis e evoluo da posio dos agentes so frequentes nas relaes observada no dia-a-dia dos organismos vivos. Durante o perodo da Guerra Fria (1945-1989), no raro, enganos eram cometidos sob a suspeita de espionagem por partes dos dois blocos polticos rivais - soviticos e capitalistas. Lamentavelmente, alguns desses erros eram fatais. Houve casos de avies de passageiros terem sido abatidos por sobrevoarem prximos fronteira das regies mais conflitantes. Em 1983, 269 pessoas a bordo de um aparelho de uma empresa area sul koreana foram sacrificados em nome da segurana militar e suspeita de espionagem, quando o avio invadiu o espao areo da extinta Unio Sovitica. Erros so uma constante na vida de seres racionais imperfeitos. Apenas ignor-los pode custar mais caro do que tentar aprender com eles. Nesse sentido, elaborar simulaes que consideram a probabilidade de erros e estratgias capazes de aprender com eles, recuperando rapidamente a cooperao, ajuda a depurar a avaliao das condies que permitem a manuteno duradoura e bem sucedida de um empreendimento comum166.
166
. Veja WU, J. AXELROD, R. "How to Cope with Noise in the Iterated Prisoner's Dilemma", p.1.
84
Jogos simultneo, com ou sem erro, raramente acontecem no mundo real. Na maioria das vezes, as aes so efetuadas em resposta a uma atitude anterior executa. Alternar a sequncia de aes entre agentes permite descrever as relaes sociais de forma mais realista. Tendo em mente essas observaes triviais, desde que Martin Nowak e Karl Sigmund propuseram modelos de Dilema dos Prisioneiros alternativos, vrias estratgias factveis puderam ser moldadas. Isso proporcionou uma refinada descrio dos comportamentos cooperadores atravs de estratgias mais sofisticadas. Mtodos de Simulao Para poder incluir alternncia de movimentos e a probabilidade de erros no Dilema dos Prisioneiros repetido, uma forma mais precisa e compacta de apresentar os resultados e estratgias formulados foi proposta. A partir da matriz bsica do Dilema dos Prisioneiros e as condies de relacionar os ganhos (T > R > P > S e 2R > T + S). Os valores do modelo padro de Axelrod, T=5, R=3, P=1, S=0, foram alterados para atender a relao 1) c < a e
2) c - a > b - d;
onde "c" igual ao pagamento que o jogador recebe quando sua opo desertar; "a" significa o que ele recebe quando coopera; "b" o resultado do outro jogador ao cooperar e "d" quando deserta. Logo, para o lder - o primeiro a jogar -, em uma s rodada, desertar melhor que cooperar, enquanto para o outro, trivialmente a cooperao do lder melhor que a desero. Alm disso, a diferena entre a desero e a cooperao para o lder menor do que o ganho do oponente com sua cooperao em relao desero. Por conta dessas condies em que a simetria entre os jogadores quebrada no Dilema dos Prisioneiros alternado, enquanto ambos jogam "C", a recompensa ser "a" mais "b" (R = a + b); um "D" mtuo equivale a "c" mais "d" (P = c + d); mas se o lder coopera e o outro deserta, aquele receber "a" pela sua cooperao e "d" pela desero do outro (S = a + d); finalmente o desertor do cooperador recebe "c" e "b" ao qual tentado (T = c + b). O que vale dizer que existe uma equao em que T+S=P+R Entretanto, essa igualdade no satisfeita pela distribuio de valores de Axelrod, que leva ao seguinte resultado: 5 + 0 = 1 + 3. Contudo, os ganhos T=4; R=3; P=1 e S=0 satisfazem quela equao167. Com essa nova tabela pronta, as decises dos agentes foram restritas a informaes de umas poucas rodadas, a fim de tornar difusa a escolha entre "C" e "D" sobre as probabilidades das interaes baseadas em uma memria curta. Assim, os erros de avaliao das chances de uma determinada escolha poderiam ser considerados na aplicao de uma regra168. Em seguida, estabeleceu-se que os resultados R, S, T, e P de um jogador, na ordem em que aparecem na matriz, desde as opes "C" ou "D", seriam numerados respectivamente como 1, 2, 3 e 4, em um conjunto de aes para um participante, onde p1 igual ao resultado da recompensa para ambos na jogada anterior. Ento, a estratgia p'= (p'1, p'2, p'3, p'4) de um jogador passa a ser descrita por meio das escolhas entre 0 e
. T=3; R=2; P=1 e S=0, que foram utilizadas na figura 1.10 do DP do capitulo 1, tambm correspondem a essas condies iniciais. 168 . Veja NOWAK, M. & SIGMUND, K. The Alternating Prisoner's Dilemma, 2, 220-221.
167
85
1, para a probabilidade de cooperar. Desse modo, por exemplo, OPO pode ser instruda pela regra (1, 0, 1, 0) que manda cooperar sempre que o outro coopera (1) e desertar (0), quando tiver recebido "S" ou "P" na rodada anterior. Nos casos extremos, (0, 0, 0, 0) equivale a SEMPRE D e (1, 1, 1, 1), SEMPRE C. J RANDMICA a estratgia (0.5, 0.5, 0.5, 0.5), ou sempre jogar "cara ou coroa" para saber o que ir fazer a cada lance. PAVLOV, a estratgia vencedora na simulao simultnea com erro - ou rudo -, est contida em (1, 0, 0, 1), isto , manter a cooperao depois de receber "R" e a desero com "T"; trocando de posio depois de ganhar "S" e "P".No modelo alternado de Nowak e Sigmund, generosa OPO (GOPO) foi vitoriosa quando variava suas aes para punio em 2/3 das vezes (1, 0, 1, 2/3). Em sua verso pura, ou determinista, GOPO tambm conhecido por FIRM BUT FAIR (FIRME MAS JUSTO, FMJ) e joga como uma tolerante verso de OPO (1, 0, 1, 1). De fato, FIRME MAS JUSTO um hbrido de OPO e PAVLOV. Lembrar o Passado David Kraines e Vivian Kraines consideram que o Dilema dos Prisioneiros Alternado (DPA) com probabilidade de erro a representao mais fidedigna dos encontros entre dois agentes com interesses parcialmente conflitantes. Para ampliar tal simulao a seres inteligentes, incluram como artifcio a possibilidade de se recordar at quatro resultados anteriores. Agentes com memria de quatro lances prvios podem lembrar de duas escolhas atrs feitas por si e seu oponente. De tal modo, que a seleo das estrtgias poderia ser moldada como uma evoluo darwiniana169. Na maior parte das relaes entre indivduos, as decises e suas respectivas lies so encaradas alternadamente. A execuo sequencial do Dilema exemplificada por vrios modelos de interaes sociais como a retribuio de trabalho entre fazendeiros que colhem suas safras em temporadas defasadas. Ter uma memria que considera as decises passadas capacita os agentes a recordarem os resultados dos ltimos encontros ocorridos entre as partes. Cada uma destas tem de escolher entre cooperar ou desertar alternadamente, durante uma longa srie de movimentos indefinidos. Depois que o segundo jogador realizar sua ao, ambos recebem o ganho relativo ao resultado conjunto, como na figura 3.9.
Figura 3.9 - DPA170 Jogador I Jogador II Deciso 1 C ... 2 ... c 3 D ... 4 ... c 5 D ... 6 ... d 7 C ...
Resultados I II ... ... R R T S T S T S P P S T
As sries de deliberaes executadas de acordo com as escolhas anteriores do outro jogador podem variar, como uma estratgia mista, a uma taxa de probabilidade relativa sequncia ocorrida, enquanto agentes determinados cooperam ou desertam com probabilidade 0 ou 1. A confuso ou erro acontecem entre agentes falveis, que no
169 170
. Veja KRAINES, D & KRAINES, V. Protocols for Cooperation, 1, p. 1. . Tabela adaptada de KRAINES, D & KRAINES, V. Op. cit., 2, p. 4.
86
so capazes de cooperar ou desertar com segurana absoluta, precisam recorrer a clculos probabilsticos para terem reveladas a frequncia da cooperao171. Os pagamentos de cada jogador tambm variam conforme a probabilidade de cada um cooperar e obedecem a um estado de equilbrio de probabilidade, ou cadeia de Markov, que apresenta uma matriz com os possveis resultados para cada tipo de estratgia mista172. O modelo adaptativo dinmico utilizado partiu de uma populao inicial distribuda uniformemente que pratica uma mesma estratgia com grande nmero de descendentes com uma pequena variao em relao a seus pais. Esses sucessores sobrevivem e passam suas caractersticas principais prxima gerao medida que conseguem obter o maior ganho de sobrevivncia. De um a quatro passos, a capacidade de memorizao foi testada no DPA de Kraines e Kraines. A partir do terceiro nvel de memria, a estratgia tolerante AMOR BRUTO aparece entre as famlias mais bens sucedidas. AB uma combinao de PAVLOV com OPO. Na verdade, trata-se de uma variedade estocstica de GOPO, que toma decises variando conforme o padro (1 - E, E, 1 - E, 1 - E), onde E representa a possibilidade de erro entre 0 e 1 (0 < E < 1). Intuitivamente, um cooperador recproco que pune deseres imotivadas e esquece as deseres de um oponente contrito. Permanece firme na punio, quando ao menos trs lances anteriores no permitem identificar quem comeou a desero. Porm, ao contrrio de PAVLOV no capaz de explorar a generosidade do outro jogador, caso venha equivocadamente desertar, agindo sem remorso em favor da retomada da cooperao173. Nas condies de aleatoriedade de DPA, as caractersticas que favoreceram a procriao foram a aptido para cooperar com estratgias que so idnticas consigo, a capacidade de explorar cooperadores incondicionais e de resistir explorao de quem sempre deserta. Assim, a memria ampla de jogadores inteligentes permitiria o reconhecimento de seus semelhantes, com os quais cooperariam, atuando como SEMPRE C, enquanto rechaam todos exploradores contumazes. Memrias de quatro lances atrs, proporcionam a um cenrio com 1000 agentes iniciais, ao final de 4000 geraes, com E = 0.01, comportar a formao de grupos de estratgias que usavam protocolos e convenes prprias para restabelecerem a cooperao depois de uma desero errada. A diferena de protocolos levou cada grupo a sustentar ganhos altos entre aqueles que cooperam com seus pares do que com os de fora do grupo, por no agirem da mesma forma. Destarte, os grupos se tornaram resistentes a invasores, sendo AB uma das estratgias mais efetivas, por repelir os SEMPRE D e refazer a cooperao rapidamente com suas cpias, depois de movimentos defeituosos174.
171 172
. Veja KRAINES, D. & KRAINES, V. Idem, 3, pp. 4-6. . KRAINES, D. & KRAINES, V. Ibidem, 5, p. 8 e NOWAK, M. & SIGMUND, K. Op. cit., 3, p. 221 utilizam a seguinte matriz para reprensentar os possveis pagamentos de um jogador que usa a estratgia p, contra um outro que use p':
p1p'1 p2p'3 p3p'2 p4p'4 p1(1 - p'1) p2(1 - p'3) p3(1 - p'2) p4(1 - p'4) (1 - p1)p'1 (1 - p2)p'3 (1 - p3)p'2 (1 - p4)p'4 (1 - p1)(1 - p'1) (1 - p2)(1 - p'3) (1 - p3)(1 - p'2) (1 - p4)(1 - p'4)
. Veja KRAINES, D. & KRAINES, V. Ibidem, 8, p. 14, mas antes destes NOWAK, M. & SIGMUND, K. Op. cit., 4, p. 222 j adiantavam, sem nomear AB, que tal padro com baixo nvel de rudo, em geral, sempre surge como vencedor em uma corrida evolucionria. 174 . Veja KRAINES, D. & KRAINES, V. Ibidem, 10, p. 17.
173
87
Embora os jogadores com memria de at quatro lances tivessem apresentado resultados cooperativos avanados, alguns tipos de estratgias evoluam para estratgias generosas ou caam na pura desero, como aqueles que partiam do algoritmo PAVLOV. Nem sempre ter grande memria significou ser mais vantajoso para cooperao. Com duas memrias apenas, 30% da populao resultante se envolveu em cooperao, enquanto o dobro de memria avanou a cooperao apenas para 44%. A maioria dos sobreviventes no participavam em nenhuma cooperao no final da simulao DPA realizada por David e Vivian Kraines175. Modelando a Evoluo As tentativas de imitar a evoluo no computador no so exclusivas da teoria dos jogos ou da cooperao. Paralelo ao desenvolvimento dessas pesquisas, tericos do caos e dos sistemas dinmicos, na matemtica e na fsica, desde os anos 1970, vinham tentando descobrir um algoritmo que reproduzisse em mquinas a diversidade de organismos presentes na natureza. O prprio John von Neumann - que, alm da teoria dos jogos, foi um dos personagens principais do desenvolvimento dos computadores e da Inteligncia Artificial - j havia lanado as bases para a criao de "vrus" eletrnicos, pequenos programas que eram capazes de reproduo autnoma. Von Neumann, na dcada dos 1950, aplicou o conceito dos autmatos celulares, cujo modelo havia sido desenvolvido pelo seu colega matemtico, o polons Stanislaw Marcin Ulam (1909-1984), que pretendia criar um mecanismo automtico que simulasse a criatividade da evoluo176. Em termos da teoria dos caos, esses autmatos celulares formam um sistema dinmico complexo que se multiplica em uma rede quadriculada, como um infinito tabuleiro de xadrez. Cada quadrado reage com aqueles que lhe so adjacentes, seguindo uma regra simples. Os autmatos progridem em vrios estados sucessrios, conforme o comportamento de suas casas vizinhas e os seus prprios comandos internos. Ao longo do tempo, toda rede modifica sua configurao em consequncia da mudana constante de estado de suas clulas. As informaes contidas em cada autmato celular permite a criao de organismos complexos e dinmicos que avanam por toda rede e revelam uma estrutura global em parte dependente das regras de cada clula, mas que no pode ser estritamente determinada por estas177. Regras diferentes produzem padres diversificados em uma rede composta por autmatos celulares. A vida artificial, que podia surgir de jogos desenvolvidos a partir de 1970 - como o Jogo da Vida do matemtico britnico John Horton Conway -, progredia em pesquisas matemticas at encontrar-se em 1992, no segundo congresso de Vida Artificial - promovido por Christopher Gale Langton -, com o Dilema dos Prisioneiros Iterado, apresentado no artigo do fsico sueco Kristian Lindgren, que alm de simples trocas de estados internos trazia os ingredientes cruciais para interpretao da evoluo, que so competio e seleo178. Lindgren desenvolveu seu modelo tendo por base a interao entre indivduos iniciada por Axelrod. Axelrod tinha elaborado uma variante evolutiva do DPI com o intuito de testar a robustez de OPO. Construiu uma sequncia de torneios virtuais que
. Veja KRAINES, D. & KRAINES, V. Ibidem, 18, p. 28. . Veja DENNETT, D. A Perigosa Idia de Darwin, cap.8, 7, p. 231. 177 . Veja LEWIN, R. Complexidade, cap. 3, p. 63. 178 . Veja LINDGREN, Kr. "Evolutionary Phenomena in Single Dynamics", in LANGTON, Ch. G et al. Artificial Life II, pp. 295-311.
176 175
88
comeavam com populaes compostas pelas diversas regras participantes dos campeonatos fixos anteriores. As estratgias bem sucedidas continuavam presentes nas rodadas posteriores, ocupando cada vez mais o lugar daqueles que fracassavam nas etapas passadas. O nmero crescente de cpias das estratgias vitoriosas nas sucessivas geraes do torneio simulavam a procriao das espcies melhor adaptadas ao ambiente. (...) Suponha que as interaes tomem a forma de um Dilema dos Prisioneiros. Quando dois animais se encontram, podem cooperar entre si, no cooperar entre si, ou um animal poderia explorar o outro. Suponha tambm que cada animal pode reconhecer indivduos com os quais j tenha interagido e possa lembrar aspectos relevantes de sua inteno, tal como se o outro fosse usualmente cooperador. Uma rodada do torneio pode ento ser olhada como uma simulao de uma simples gerao de tal animal, com cada regra de deciso sendo empregada por um largo nmero de indivduos. (...) Um dado animal pode interagir com outro animal usando sua prpria regra de deciso, bem como pode aparecer um animal usando outra regra (AXELROD, R. The Evolution of Cooperation, cap. 2, p. 49). Na perpectiva ecolgica privilegiada por Axelrod, nenhuma mutao poderia ser introduzida, enquanto nos modelos evolucionrios propriamente ditos, realizados depois, permitiam o surgimento de novas regras de comportamento no ambiente das novas geraes. Jogos evolucionrios de DPI, como os promovidos por Nowak, Sigmund, Lindgren e os Kraines proporcionavam incluso de diferentes aspectos evolutivos: erros, m compreenso, mudana de resultados, dimenso territorial, migraes e adaptaes atitude do outro. Modelos mais realistas chegam agora a assumir que uma populao monomrfica de estratgias pode ser ligeiramente modificada por geraes que se diferenciam aos poucos de seus ancestrais. A habilidade de sobrevivncia e reproduo depende, ento, da capacidade de reconhecer essas pequenas variaes em seus parentes, reagindo com maior ou menor tolerncia, de acordo com a magnitude das tranformaes. Nos DPI evolutivos, as interaes podem ser, portanto, modeladas localmente, como nos autmatos celulares que atuam espacialmente com seus vizinhos laterais, ou globalmente, quando cada indivduo interage com todos ao longo do jogo. A dimenso espacial a principal diferena entre esses dois tipos de jogos. A ocupao territorial muda de forma evidente de um modelo para o outro. No modelo de autmatos celulares, os parasitas podem ser rechaados por avanos da onda espiral de alguma espcie, ou seja, regies de estratgias cooperadoras podem resistir explorao de trapaceiros, apresentando uma estabilidade no domnio territorial que no pode ser percebida no modelo todos contra todos179. A territorialidade afeta a evoluo da cooperao em vrios aspectos. Quando a mistura aleatria das estratgias ocupa o espao, a reciprocidade pode sustentar a cooperao com uma estrutura social mnima. A reciprocidade tambm permitiu que pequenos grupos de visitantes pudessem penetrar em uma populao mesquinha (meanies). Diversificao social surge com a identificao de membros em um grupo; assim, a reputao pode ser construda entre as partes. O domnio de uma estratgia hegemnica passa a depender da correspondncia da maioria das estratgias existentes, se for benfica para cada um e para o todo, em geral. Por fim, a interao entre vizinhos
179
. Veja LINDGREN, Kr. "Evolution of Behaviour in the Prisoner's Dilemma", p. 13.
89
promoveu o crescimento de estratgias que em outro cenrio no poderiam subsistir - tal como a inocente SEMPRE C, que pode estabelecer regies seguras mesmo em um cenrio onde SEMPRE D prolifera, desde que os cooperadores da fronteira em contato com os desertores sejam trocados pelos bens sucedidos cooperadores do ncleo do nas prximas geraes180. II parte Modelos de Jogos Captulo 4: DPI At aqui, procurou-se apresentar os conceitos principais e os princpios mobilizados na modelagem da interao entre agentes racionais seja por meio de matrizes, seja na forma estendida de rvores de Kuhn. No primeiro captulo, foram mostrados os antecedentes histricos da Teoria dos Jogos, levantando suas principais obras e autores. Logo em seguida, tratou-se de revelar como so construdas as tabelas da forma estratgica e da forma extensiva que permitem que sejam feitas abordagens diferentes na interpretao de um mesmo jogo que tem caractersticas prprias que so reveladas quando jogados simultaneamente - nesse caso as matrizes so a melhor forma de representao - ou quando h uma sucesso de movimentos alternados entre os jogadores - situao que se descreve adequadamente no esquema de uma rvore. Depois disso, passou-se definio dos conceitos de estratgia dominante, ponto de sela, equilbrio, estratgias mistas e soluo maximin. Foram exibidos exemplos e tcnicas simples ou intuitivas para deteco das estratgias que podem determinar o fim de um jogo, ou marcarem precisamente o seu desenvolvimento. O primeiro captulo encerrou-se com um ponto problemtico para essas teorias que se encontram na concepo de racionalidade. A imagem de jogadores que atuam como se fossem agentes racionais egostas trouxe alguns paradoxos para a busca dos resultados que maximizassem sua utilidade. Ao agirem assim, em situaes como a do Dilema dos Prisioneiros, tudo que os envolvidos conseguiriam seria um resultado abaixo do timo de Pareto para todas as partes. Questionamentos iniciais sobre a psicologia dos agentes naturais, levantados pelo economista francs Maurice Allais obrigaram a formulao de novos conceitos que compuseram a teoria das perspectivas (Prospect Theory), cuja explicao desses problemas subjetivos dos agentes racionais frente ao risco garantiu a distino do prmio Nobel de Economia para Daniel Kahneman, em 2002. No segundo captulo, fez-se a abordagem de um assunto especfico em que se trata do papel da comunicao na soluo de jogos. Nesse momento, quando ameaas, acordos obrigatrios, informao perfeita e os principais conceitos relativos aos temas comuns teoria dos jogos e da comunicao surgem para estabelecer uma aproximao entre essas duas teorias. Os principais conceitos comuns dos Jogos com Comunicao e da teoria filsofica da comunicao foram listados a fim de estabelecer as correlaes e divergncias entre essas duas interpretaes dos fenmenos comunicativos. A aplicao dos principais conceitos dos Jogos com Comunicao aos modelos tradicionais da teoria dos jogos e s situaes prprias de jogos falados levaram a uma nova compreenso dos eventos comunicativos. A racionalidade instrumental pode ser compreendida como sendo uma atividade mental bsica que pode ser complementada pela razo
180
.Ver AXELROD, R. The Evolution of Cooperation, cap. 8, pp.167/8 e LINDGREN, Kr. Op. cit., p. 25.
90
comunicativa. Os modelos de jogos com comunicao servem para revelar os limites da ao comunicativa e estabelecer o contato entre as duas formas de racionalidade. A seguir, foi introduzida a Teoria da Cooperao elaborada por Robert Axelrod que utiliza o modelo do Dilema dos Prisioneiros repetido vrias vezes, como um superjogo, para avaliar como a cooperao pode emergir entre agentes egostas. Superjogos tm como caracterstica a produo de uma infinidade de estratgias em equilbrio. A Teoria da Cooperao de Axelrod permitiu que se encontrasse um mtodo para seleo de um ponto de equilbrio entre tantos concorrentes. Nesse sentido, a interpretao da evoluo pelos modelos de jogos foi desenvolvida por meio de torneios de computadores. Os torneios de computadores elaborados por Robert Axelrod serviram para renovar a interpretao sobre a origem da cooperao entre seres racionais ou no considerados egostas. Atravs desses torneios vrias estratgias foram examinadas, a fim de encontrar aquelas que fossem mais propcias fomentao da cooperao. Apesar dos torneios de computadores elaborados por Robert Axelrod terem trazido novas luzes sobre a forma que a cooperao pode surgir entre seres egostas, o modelo padro do Dilema dos Prisioneiros Iterado recebeu vrias crticas. Muitos sugeriram alternncia nos movimentos, possibilidade de erro e lances feitos de acordo com uma taxa de variao. Mudanas significativas na montagem da simulao em computadores ajudaram a tornar mais realistas as estratgias vitoriosas em um Dilema dos Prisioneiros Iterado. Alternncia dos movimentos, possibilidade de erro e outras caractersticas desenharam programas mais sofisticados que funcionavam bem em um cenrio, mas no em outros. O Dilema dos Prisioneiros Iterado passou por uma histria de transformaes e adaptaes s caractersticas que procuravam refinar cada vez mais sua descrio das relaes entre agentes racionais. Rudo, troca de papis e evoluo foram ingredientes importantes nessa sofisticao do modelo de DPI que revelaram detalhes que antes no poderiam ter sido discutidos. Alm desse dilema, outros jogos foram modelados para avaliar com maior preciso os paradoxos encontrados. O jogo da Centopia um deles. A centopia permite examinar o papel do tempo e da induo reversa como fatores a influenciar o comportamento de agentes racionais, nem sempre aceitveis. 4.1 As Simulaes dos Principais Jogos e suas Consequncias Nesta segunda parte, segue-se uma abordagem mais detalhada dos mtodos utilizados para o emprego dos principais modelos de jogos que foram sumariamente descritos na primeira parte. A defesa da simulao, como uma nova forma de apoiar ou refutar as hipteses levantadas, exposta logo em seguida a essa recapitulao. As linguagens de computador mais adequadas para iniciantes e pesquisadores avanados so sugeridas. Depois, as estratgias derivadas da famosa OLHO POR OLHO so tambm discutidas como uma famlia de estratgias que tem seu uso otimizado em situaes especficas. Estratgias hbridas e da famlia pavloviana tambm so confrontadas. Ao final do quarto captulo, ento, desenvolve-se o debate em torno das principais condies que o DPI precisa satisfazer para que surja a cooperao entre indivduos racionais. Com o captulo cinco, os modelos do Jogo dos Bens Pblicos trabalhados por diversos autores so montados como ferramenta adequada para anlise e implicaes do comportamento de um agente que assuma o papel do carona. Tal como na definio de David Hume para a personalidade do patife esperto, a figura do carona tornou-se na
91
Teoria dos Jogos o representante desse tipo de conduta nociva cooperao que visa produzir um bem comum. Para resolver os problemas causados pela atuao desastrosa desse ator, ao contrrio do que talvez pensasse Hume, faz-se necessrio a punio e a presena de um terceiro elemento, ou uma instituio como o Estado para obrigar o cumprimento dos acordos. S assim a cooperao poder ser considerada vivel, em situaes como a formalizada pelo Bem Pblico. Em seguida, o Jogo do Ultimato, apresentado em seus diversos experimentos, coloca em maior relevo o papel da reputao que no poderia ser detectado claramente nos dois modelos anteriores. Sua formulao simultnea e sem comunicao prvia, antecipada por Thomas Schelling, tem na soluo justa de um ponto focal a possibilidade de compreenso de um sentimento inato de justia que pode ser a manifestao de algum carcter especfico em vez de ser apenas uma concluso aritmtica adequada. Com essa observao em mente a pesquisa que revelou a ausncia de um suposto "homem econmico" - imaginado pelos tericos dos jogos -, em meio sociedade pode tambm vir a reforar a hiptese do sentimento de justia inato, bem como o papel das prticas sociais atuando sobre as deliberaes dos indivduos. Destarte, ser oportuno aportar as condies que surgem no Ultimato para o aparecimento e atuao da equidade como soluo tima para jogos desse tipo. Por fim, a construo de jogos tal como sugerida pelos vrios tericos que se dedicam formalizao do processo de deciso entre agentes racionais tm sua utilizao indicada aos campos de investigao sobre o comportamento de seres vivos em geral e do ser humano em especial. Em muitos domnios fora da economia e administrao, os jogos vm servido como instrumento de avaliao das hipteses elaboradas para descrever esse desempenho. A biologia evolutiva foi uma das primeiras disciplinas a empreg-los para explicao de pontos problemticos da evoluo. A psicologia tambm chegou a merecer distino como a teoria sobre o comportamento do homem racional frente a situaes de risco. Agora, at mesmo a neurologia encontra-se entre as disciplinas que aplicam os testes dos jogos para deteco de reas do crebro responsveis pela deliberao e reaes emocionais ou racionais. A prpria filosofia foi uma das primeiras reas a reconhecer a importncia dos jogos atravs da obra de Richard B. Braithwaite, Theory of Games as a Tool for the Moral Philosopher, que props um princpio equitativo, segundo orientao fornecida por uma fronteira de eficincia. De l para c, John Rawls (1921-2002), em Uma Teoria da Justia (1970), tambm valeu-se de instrumentos matemticos para tratar do problema de distribuio, enquanto David Gauthier desenvolveu toda uma teoria contratualista da moral fundada na Teoria dos Jogos, em Morals by Agreement (Moral por Acordos, 1986). Esses autores, entre outros, que vm transformando a filosofia contempornea trabalham como o novo instrumental, a fim de enfrentar argumentos crticos de outras reas das cincias humanas que cobram maior preciso das proposies filosficas. Mas no s em preciso ganha a filosofia como o emprego dos jogos, principalmente na clareza pretendida desde o incio da modernidade. Uma concluso favorvel ao trato da Teoria dos Jogos por parte dos filsofos dever, portanto, fechar esta trajetria, destacando as vantagens de se aliar esse mtodo de investigao s restries crticas prprias da disciplina. 4.2 O Dilema dos Prisioneiros Iterado
92
Como se sabe, o Dilema dos Prisioneiros o exemplo pioneiro que se tornou o clssico dos experimentos montado por meio dos modelos de jogos, desde quando foi criado, em 1950. A simulao iterada (DPI) ficou popularizada, depois de Robert Axelrod ter lanado dois torneios de programas de computadores, nos quais diversos pesquisadores foram convidados a apresentar estratgias que pudessem vencer um campeonato onde todas tomassem parte. The Evolution of Cooperation trouxe os resultados desses torneios e lanou a base da chamada Teoria da Cooperao. O Dilema dos Prisioneiros foi assim batizado depois que Albert W. Tucker ter usado a histria de dois suspeitos presos pela polcia para explic-lo a uma audincia de psiclogos da Universidade de Stanford. Originalmente, no entanto, o experimento fora inventado nos laboratrios da corporao RAND, em janeiro de 1950, pelos matemticos Merrill Flood e Melvin Dresher como um contra-exemplo ao conceito de equilbrio de Nash. Embora essa experincia tenha sido iniciada em 1950 e citada por centenas de artigos entre os anos 60 e 70, s em 1980, Tucker iria publicar sua monografia sob o ttulo On Jargon: The prisoner's dilemma (Sobre o Jargo: O Dilema dos Prisioneiros). Como j foi dito antes, esse dilema a situao na qual se encontram dois criminosos capturados pela polcia, mantidos em celas separadas, e que so interrogados isoladamente a fim de que um possa acusar o outro. O inspetor encarregado das investigaes tem provas suficientes apenas para conden-los por um crime leve, mas sabe que ambos cometeram algo mais grave. No intuito de lev-los confisso, prope a cada um a liberdade, por auxiliar a justia, desde que entregue o outro comparsa, que arcaria, caso ficasse calado, com a pena mxima. Ao se denuciarem mutuamente, os dois presos pegariam uma sentena dura, mas atenuada pela confisso. Ao contrrio, no entanto, se permanecessem de boca fechada, os dois ficariam pouco tempo na cadeia. Jogado de uma s vez, o Dilema dos Prisioneiros apresenta apenas a desero geral como nico equilbrio de Nash dominante. No obstante, em 1984, Axelrod props dois torneios de computador nos quais era possvel jogar o Dilema dos Prisioneiros, vrias vezes, iterado. Para esses campeonatos, foi montada uma tabela de pontuao em que a tentao de denunciar era premiada com 5 pontos, a recompensa por ficar calado era de 3 pontos, a punio pela delao mtua pagava s 1 ponto, enquanto o pagamento simplrio (sucker) de 0 ponto caberia a quem ficasse em silncio sozinho. Os ganhos nesse jogo se reduzem a condenaes que so consideradas muito boas, justamente boas, justamente ms ou muito ms, traduzidas no sistema de pontuao da figura 4.1, onde R > (T+S)/2.
Figura 4.1 Pontuao das Estratgias Puras Cooperar (C) Jogador 1 Desertar (D) Jogador 2 Cooperar Desertar (C) (D) R, R T, S S, T P, P Modelo Padro do DPI Tentao (T) = 5 Recompensa (R) = 3 Punio (P) = 1 Simplrio (S) = 0
CONDIES:
1. T > R > P > S; 2. R > (T + S).
Em cada clula da matriz, por conveno, o primeiro resultado atribudo ao jogador 1, na linha, enquanto o segundo corresponde ao ganho do jogador 2, na coluna. O DPI jogado por um certo nmero de rodadas at o seu final (como se os prisioneiros fossem interrogados separadamente vrias vezes). O placar calculado a cada rodada. O objetivo otimizar a pontuao antes do final do jogo. No final do jogo, o placar
93
apresentado em porcentagem do melhor resultado possvel. Inicia-se o jogo decidindo cooperar ou desertar e ento faz a melhor escolha conforme o resultado obtido. As simulaes de DPI podem apresentar dois tipos de cenrios distintos: determinista ou indeterminista. Numa simulao determinista, as estratgias so jogadas puras, isto , a probabilidade de cooperar de 0 ou 100 por cento. Ao passo que, no cenrio indeterminista (com rudo), a cooperao pode variar de acordo com uma taxa aleatria ou mistura de estratgias timas. Existem to somente 16 tipos de estratgias deterministas - na figura 4.2, esto listadas todas as estratgias deterministas - as mais estudadas tm o nome assinalado - e a RANDOM (que varia sempre a uma taxa de 50%). As estratgias indeterministas, no entanto, so infinitas, sendo variaes das estratgias puras originais. Algumas estratgias puras podem ter verses gentis ou no, respectivamente, cooperando ou desertando na primeira rodada, como por exemplo OLHO POR OLHO, cuja verso pura no gentil SUSPEITOSO OLHO POR OLHO.
R E0 0 E1 0 E2 E3 E4 E5 E6 E7 E8 E9
10
S 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1
T 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1
Figura 4.2 - 16 Estratgias Deterministas e 1 Randmica
0 SEMPRE "D" 1 0 1 0 1 0 1 s coopera aps P s coopera aps T Coopera aps T ou P s coopera aps S ANTI-OLHO POR OLHO Coopera aps S ou T s deserta aps R
0 0 0 0 0 0 1 1 1
0 RETALIADOR PERMANENTE 1 PAVLOV 0 OLHO POR OLHO 1 FIRME, MAS JUSTO 0 1 0 Coopera aps R ou S s deserta aps T s deserta aps P
E11 1 E12 1 E13 1 E14 1 E15 1
1 SEMPRE "C"
E16 0,5 0,5 0,5 0,5 RANDOM
4.3
Os Torneios e a Estratgia TIT FOR TAT
O uso de computadores para realizao de testes de simulao no era uma novidade nos anos 1980. J na primeira edio de O Gene Egosta (1976), Richard Dawkins informava que programas estavam sendo empregados "em todos os campos onde a previso futura necessria"181. Assim, pesquisadores de reas como economia,
181
. DAWKINS, R. O Gene Egosta, cap. 4, p.84.
94
ecologia, sociologia, psicologia alm dos estrategistas militares, estavam aplicando modelos simplificados de aspectos do mundo trabalhados por suas respectivas teorias. As simulaes eletrnicas traziam a vantagem de reduzir o tempo necessrio para observao dos efeitos de um ao, caso esta viesse a ser desempenhada no contexto real. Apesar de serem apenas aproximaes virtuais da realidade, as simulaes funcionavam como substitutas eficientes prtica da tentativa e erro aleatria. Nesse sentido, a inovao que Robert Axelrod trouxe com seus campeonatos de computadores foi a de, ao permitir a participao de especialistas de outras disciplinas, buscar entre os vrios programas e estratgias submetidos aqueles que apresentassem as propriedades necessrias para uma linha de ao eficaz nos contextos virtuais e que possivelmente se aplicariam aos ambientes concretos da vida. Como toda simulao, os torneios de Axelrod procuraram delimitar o conjunto de elementos mais relevantes para elaborao, manipulao e previso dos resultados admissveis, diante das alternativas disponveis. Axelrod, que cientista poltico da Universidade de Michigan, evitou apontar, depois de terminados os certames, uma estratgia que fosse considerada a melhor em todas as circunstncias imaginadas, enfatizando que a escolha depende em parte do que se espera que o outro far em face da expectativa que este tem sobre o que o sujeito tambm far182. A situao tpica de uma racionalidade estratgica que obriga cada agente a considerar as intenes de todos envolvidos, reciprocamente. O Dilema do Prisioneiro Iterado (DPI) foi o modelo escolhido por apresentar a possibilidade de desenvolvimento de uma rica faixa de de estratgias que poderiam ser interpretadas como sendo correspondentes a vrios contextos do mundo da vida, montadas sobre o pano de fundo de jogos de soma variante, quando os interesses dos agentes envolvidos em parte coincidem, em parte entram em conflito. Alm de levar em conta as reaes esperadas dos outros, o sucesso de cada uma dependeria da capacidade de se ter em "mente" o histrico das relaes passadas e seu posterior desdobramento. (...) Em um torneio de computador, cada entrada descreve um programa que incorpora uma regra para selecionar a escolha cooperativa ou no cooperativa em cada movimento. O programa dispe para isto do histrico do jogo, e pode usar essa histria para deliberar.(...) (AXELROD, R. The Evolution of Cooperation, part. II, cap. 2, p. 30). O modelo padro do Dilema dos Prisioneiros segue a matriz da figura 4.3, na qual so distribudos os pontos para Tentao (T) de Desertar (D) sozinho, a Recompensa (R) pela Cooperao (C) mtua, a Punio (P) por ningum cooperar e a posio de Simplrio (S), que se deixa explorar pelo outro. Tais pagamentos devem ser obtidos sob duas condies. A primeira determina que a tentao seja superior recompensa, est punio e por ltimo o ganho do simplrio (T > R > P > S). Em segundo lugar, a recompensa deve ser maior ou igual mdia entre a tentao e simplrio (R > (T + S)/2). Sendo assim, a matriz que Axelrod props como base de pontuao oferece cinco pontos para o jogador que deserta, enquanto o outro cooperador no ganha nada. Trs pontos foram para cooperao mtua e um ponto para a desero mtua. Ao lado da estratgia RANDMICA - cooperar e desertar com probabilidade igual -, 14 outros programas foram inscritos no primeiro turno do campeonato por especialistas de cinco disciplinas: psicologia, economia, cincia poltica, matemtica e sociologia. Nessa primeira fase, o torneio foi disputado em 200 movimentos at o final.
182
. Veja AXELROD, R. The Evolution of Cooperation, part. II, cap. 2, p. 27.
95
De modo que, aqueles que sempre cooperassem entre si, ganhavam a soma de 600 pontos cada um de um placar mximo de 1000 pontos, o que ocorreria se algum conseguisse explorar um cooperador do incio ao fim da partida sem sofrer retaliao. Todas entradas interagiam entre si - duas a duas -, com os programas sendo escritos em formato e linguagem comuns a todos.
Coluna Figura 4.3 Estratgias Linha Cooperar Desertar Dilema dos Prisioneiros Cooperar 3, 3 l 5, 0 Desertar 0, 5 c l 1, 1 c
Nem a complexidade ou simplicidade, nem o peso ou largura dos programas foram caractersticas significativas para determinar a vitria no primeiro concurso. A estratgia vencedora TIT FOR TAT (OLHO POR OLHO, OPO), apresentada pelo psiclogo canadense Anatol Rapoport, mereceu esse resultado devido s propriedades destacadas por Axelrod na anlise feita de seu desempenho. Olho por Olho Para Axelrod, OPO teria vencido a primeira fase do torneio por ter sido uma estratgia considerada gentil (nice) e clemente (forgiving) frente s outras. OPO sempre comeava uma partida cooperando e, mesmo depois de retaliar uma desero, retornava cooperao esquecendo o desvio feito no passado pela outra parte - que recebera uma punio imediata. A estratgia OPO sempre coopera com o oponente at que este deixe de cooperar, imitando em seguida o comportamento deste. Com isso, essa estratgia evitaria o efeito de "eco", que pode ocorrer aps a punio de uma desero, caso ela gere uma longa cadeia de retaliao e contra-retaliao. Axelrod sugeriu que, apesar da vitria de OPO, "seria fcil encontrar muitas regras que poderiam ter desempenhado substancialmente melhor do que OLHO POR OLHO no ambiente do torneio"183. Ele mesmo sugeriu que trs estratgias poderiam ter vencido a primeira disputa se tivessem sido inscritas. TIT FOR TWO TATS (UM OLHO POR DOIS OLHOS, OP2O) poderia ter sido uma delas, pois uma variante mais clemente do que OPO, s pune se no tiver havido cooperao nos dois movimentos anteriores. O provvel sucesso de OP2O seria devido importncia do perdo, muitas vezes negligenciado pelos especialistas. LOOK AHEAD (OLHE ADIANTE) uma estratgia elaborada com base em recursos de inteligncia artificial, aplicada ao xadrez, que tambm poderia ter ganho o torneio se tivesse sido submetida. Por fim, uma verso otimista do programa apresentado pelo psiclogo estadunidense Leslie Downing seria aquela que obteria a maior mdia entre todas as quinze concorrentes. A DOWNING REVISADA deveria comear avaliando os outros jogadores como responsveis, ao invs de no cooperadores irresponsveis, como fazia a DOWNING original. No primeiro torneio, OPO conseguiu a mdia de 504 pontos. Ao passo que, essas trs ltimas estratgias, deixadas de fora inicialmente, quando foram testadas no contexto do primeiro campeonato, obtiveram 520 pontos, OLHE ADIANTE; 532, OP2O; e 542, DOWNING REVISADA. Isso serviu para reforar a idia da inutilidade
183
. AXELROD, R. Op. cit., idem, p. 38.
96
de encarar de modo estritamente competitivo o DPI e a vantagem de se mostrar clemente s deseres - alm da hiptese de que no h uma estratgia vitoriosa em absoluto no contexto do Dilema dos Prisioneiros Iterado. No intuito de pr prova mais uma vez as concluses extradas da primeira fase, um segundo turno de rodadas foi sugerido para um nmero maior de participantes, incluindo representantes de seis pases - Canad, Estados Unidos, Gr-Bretanha, Noruega, Nova Zelndia e Sua - e de outras disciplinas ou atividades, como bilogos evolutivos, professores de informtica e fs de jogos eletrnicos. Dessa vez, no entanto, os efeitos do "lance final" foram amenizados com a determinao de uma taxa de variao que indicava a chance de terminar o jogo no prximo movimento, em 0.00346 por cento. Tambm foram admitidos programas nas linguagens FORTRAN e BASIC. Das 63 propostas encaminhadas, novamente, OPO saiu-se vencedora, com 434.73 pontos na mdia, mesmo depois de um relatrio ter sido divulgado com a anlise da disputa anterior. Outras duas propriedades mostraram-se decisivas para explicar a robustez dessa estratgia: sua clareza e capacidade retaliadora. (...) Uma regra pode ser chamada retaliadora se deserta imediatamente aps uma desero "imotivada" do outro. Exatamente o que significa "imotivada" no determinado precisamente. O ponto, contudo, que ao menos uma estratgia incitada a uma resposta imediata por um desafio do outro jogador. (...) (AXELROD, R. Op. cit., idem, p. 44). A eficincia de uma estratgia gentil - que sempre comea cooperando - depende de seu poder de retaliao. A promissora OP2O, que venceria OPO no campeonato anterior, no obteve o sucesso esperado por ter se defrontado com estratgias como a TESTADORA, que eram capazes de explorar a sua demora em punir a outra estratgia que desertou ao menos uma vez nas duas rodadas prvias. O eminente bilogo evolutivo, o britnico Maynard Smith, candidatou OP2O, mas s conseguiu o 24 lugar. Por terem sido anunciadas as vantagens em ser gentil e clemente, como caractersticas decisivas do primeiro campeonato, a maioria dos novos concorrentes do segundo turno procurou atacar alguma vulnerabilidade presente nessas afirmaes, apresentando programas que visavam derrubar tais hipteses. OPO, entretanto, provou ser robusta a esses ataques e a sua imediata retaliao foi um ponto forte para sua manuteno na primeira posio. Sua robustez foi testada mais tarde at em variantes evolutivas do segundo campeonato, onde as estratgias bem sucedidas teriam maior nmero de descendentes nas geraes futuras. Comprovando os resultados obtidos em situaes tpicas estudadas antes por Dawkins, em O Gene Egosta, por Maynard Smith, em "The Evolution of Behavior" (1978), e por Robert L. Trivers, em "The Evolution of Reciprocal Altruism" (1971). A anlise ecolgica mostrou que ir bem com regras que no fazem boa pontuao com elas mesmas eventualmente um processo de autodestruio. No ser gentil pode parecer promissor no incio, mas ao longo do tempo, isto pode destruir muito o ambiente necessrio para seu sucesso (AXELROD, R. Idem, ibidem, p. 52). A vitria de OPO no cenrio evolutivo serviu para provar no que esta fosse a melhor estratgia para todas situaes, mas que sua persistncia indicava ser a mais adequada para uma ampla variedade de ambientes. Por ser fcil de encontrar, de ser reconhecida e difcil de explorar, OPO destacou-se tambm por sua clareza.
97
(...) O sucesso da robustez de OLHO POR OLHO uma combinao de ser gentil, retaliadora, clemente e clara. Sua gentileza previne de se meter em problemas desnecessrios. Sua retaliao desencoraja o outro lado de persistir, sobretudo quando a desero tentada. Sua clemncia ajuda a restaurar a cooperao mtua. E sua clareza a faz inteligvel ao outro jogador, pela qual se deduz uma cooperao longa (AXELROD, R. Ibidem, ibidem, p.54). A estratgia OPO encontra uma correspondncia no comportamento Rancoroso e Retaliador descritos por Dawkins, para o jogo Pombos e Falces, onde so colocados os exemplos tirados de uma simulao feita em computadores a partir das anlises de Maynard Smith sobre as estratgias evolucionrias estveis (EEE)184. De tudo isso, vem a concluso de que a reciprocidade a base dos comportamentos aptos a gerarem a cooperao entre os seres vivos. Reciprocidade que est estampada na chamada Regra de Ouro - faa aos outros o que gostarias que fizessem a ti -, talvez seja a regra fundamental da tica que, no inventrio registrado pelo filsofo australiano Peter Singer, est presente nas mais diversas culturas e nos momentos histricos mais distintos, desde o cdigo de Hamurabi at as tentativas atuais de elaborao de uma Declarao Universal de Uma tica Global. (...) A Regra de Ouro est presente, com distintas formulaes, numa ampla variedade de culturas e de ensinamentos religiosos, abrangendo, numa ordem mais ou menos cronolgica, os de Zoroastro, Confcio, Mahavita, do Buda, do pico hindu Mahabharata, do Levtico, de Hillel, de Jesus, de Maom, e de Kant, entre outros. Fez-se na ltima dcada a tentativa de elaborar a "Declarao de uma tica Global", uma declarao de princpios universalmente aceitos em todas as culturas. (...) Uma delas, esboada pelo telogo Hans Kng e aprovada no Segundo Parlamento Mundial de Religies, comea com a exigncia fundamental de que "todo ser humano tem de ser tratado humanamente". Ao tornar mais precisa a exigncia, essa verso se refere Regra de Ouro como a norma irrevogvel e incondicional para todas as reas da vida. (...) (SINGER, P. Um S Mundo, cap. 4, p. 183). A divulgao das idias contidas no livro de Axelrod aumentou o interesse pelo DPI. Por conta disso, muitas observaes foram feitas sobre o modo como os torneios foram preparados e a pretenso de validade das caractersticas as quais se atriburam o sucesso de OPO. Ao longo de duas dcadas, diversos artigos foram escritos sobre o assunto, abordando os fatores como alternncia dos movimentos, a oferta de garantias, a interao entre redes sociais, a troca de informao, em funo do reforo da reputao, a aprendizagem do comportamento, o papel da inveja, da confuso e a possibilidade de se abandonar o jogo. Em resposta a tantas observaes, vrios outros artigos foram lanados por Axelrod, s ou em parceria com outros autores, defendendo a possibilidade de se cubrir a maior parte das variaes do modelo de DPI, com a formulao de uma famlia de estratgias derivadas de OPO. Essa nova famlia de estratgias poderia ento atender os desafios de um repertrio mais abrangente de relaes. No obstante, a teoria da cooperao desenvolvida por Axelrod trouxe uma nova compreenso sobre o
184
. Veja DAWKINS, R. Op. cit., cap. 5, pp 99 e ss, e cap. 10, pp. 206-208.
98
comportamento recproco entre os seres vivos que precisava ser elaborada de uma forma mais plausvel, frente aos paradoxos de uma concepo egosta de indivduos preocupados com sua sobrevivncia e reproduo. Em 2004, foi realizada uma competio comemorativa do 20 aniversrio do primeiro torneio de 1984, com 223 entradas jogadas cada uma contra todos os outros jogadores. A estratgia vencedora foi um dos 60 programas inscritos pela equipe da Universidade de Southampton, da Inglaterra. A variao campe foi desenhada para executar uma srie de cinco de dez movimentos, atravs dos quais reconhecia cada uma de suas variantes. Quando dois jogadores SOUTHAMPTON se encontravam, assumiam imediatamente os papis de "senhor e escravo" - um poderia sacrificar-se para que o outro vencesse vrias vezes. Caso reconhecesse uma estratgia rival, SOUTHAMPTON desertava imediatamente. Destarte, o trabalho de equipe permitiu a essa estratgia tomar os trs primeiros lugares, enquanto alguns dos que se sacrificaram ocuparam as ltimas posies na tabela. O responsvel pela edio comemorativa do DPI, Graham Kendall, da Escola de Cincia da Computao e Informtica da Universidade de Nottingham, notou que uma estratgia com mltiplos jogadores, como SOUTHAMPTON, talvez tivesse dificuldades para vencer OPO isoladamente, no contexto do campeonato original, onde era impossvel prever o conluio entre as entradas. Em declarao ao noticirio da Wired News, na Internet, Kendall disse que a importncia dessa estratgia foi "testar algumas idias que tnhamos sobre equipes de trabalho em sistemas de agentes em geral, e sua percepo do trabalho conjunto em uma equipe, como problema fundamental. O que foi interessante ver foi quantos colaboradores voc precisa contar em uma populao. (...) Vencemos com cerca de 20"185. 4.4 Uma Famlia Campe O sucesso de OPO nos primeiros campeonatos virtuais de DPI chamou ateno para essa estratgia simples, mas que tinha consequncias surpreendentes aos que achavam difcil fazer emergir a cooperao a partir de seres egostas. O espanto inicial e as crticas em torno da forma como aqueles torneios tinham sido montados levaram preparao de novas simulaes, a fim de testar pontos especficos de uma interao ou que estivessem mais prximos de uma concepo realista dos contextos nos quais as escolhas dos indivduos ocorrem. Nesses vrios experimentos, outras estratgias sobrepuseram-se OPO original. Entretanto, os autores que defendiam a robustez deste algoritmo fizeram algumas modificaes no intuito de adapt-la s novas circunstncias. Por conta disso, surgiu uma srie de estratgias variantes da verso determinista de OPO que acabaram por formar uma grande famlia de estratgia. De acordo com a notao adotada nos novos torneios, as estratgias poderiam ser facilmente representadas em um conjunto que exprimisse a probabilidade de cooperar aps os respectivos resultados - (C, C); (C, D); (D, C) e (D, D) -, isto (R, S, T, P). Estratgias "puras", que variam suas chances de cooperar ou desertar, mas desertam ou cooperam com probabilidades fixas de 0 ou 1, so chamadas de deterministas porque no misturam suas opes e seguem rigidamente os comandos propostos pelo seu
185
. KENDALL, Gr. apud GROSSMAN, W.M. "New Tack Wins Prisoner's Dilemma", 13 outubro de 2004.
99
programa, sem qualquer margem de erro ou produo de acaso. A estratgia OPO pura, opera a regra (1, 0, 1, 0), iniciando sempre de forma gentil, isto , cooperando. Uma simples mudana na propriedade da gentileza (nice) de OPO, que a force comear o jogo desertando, permitiu a criao da regra conhecida como SUSPICIOUS TIT FOR TAT (SUSPEITOSO OLHO POR OLHO, SOPO). No contexto de uma pequena populao, composta por jogadores OPO gentil e suspeitoso, a estratgia OLHO POR DOIS OLHOS (OP2O) - que retalia aps duas deseres seguidas - pode invadi-la por ser uma boa cooperadora de OPO e SOPO, enquanto esta ltima entra em retaliao permanente contra a primeira. Tal resultado mostra que a robustez de OPO, que se mostrou vlida na verso ecolgica tratada por Axelrod, no se reproduz adequadamente em qualquer conjunto de estratgia, sujeitando-se, eventualmente, ao aparecimento de mutantes ou invasores. Nenhuma estratgia determinista seria, portanto, evolutivamente estvel186. Efetivamente, os ambientes naturais, nos quais haja a presena de rudo e alternncia das jogadas, para uma estratgia determinista como OPO sair-se bem, preciso que seja feita uma mistura de suas decises, gerando estratgias estocsticas cuja probabilidade de cooperar seja maior do que zero e menor do que um (0 < p < 1). As experincias feitas por Martin A. Nowak e Karl Sigmund, a partir de 1992, com estratgias estocsticas, em DPI infinito, permitiu que o lance inicial que determinava a gentileza da linha de ao fosse considerada irrelevante para o desenvolvimento do jogo, uma vez que a memria estava limitada rodada anterior e os efeitos da largada eram esquecidos e diludos ao longo da partida. Nessas circunstncias, a GENEROSA OLHO POR OLHO tornou-se vitoriosa e estvel - resistente invaso e mutaes. A verso estocstica de GOPO (1, 0, 1, 2/3) instrui aos jogadores cooperarem aps uma punio 2/3 das vezes. Sua tolerncia ou generosidade possibilitou a vitria em 39 das 40 simulaes em que foi testada, dominando aps 600 mil em 10 milhes de interaes187. A propriedade da clemncia ou do esquecimento era maior em GOPO do que em OPO e isso foi um fator decisivo no desenlace de seu bom desempenho em jogos evolutivos. A rigor, a clemncia mostrou ser mais necessria do que a gentileza. A atuao dessa estratgia alterou o comportamento de OPO em dois pontos chaves. Por um lado, permitiu a tolerncia a erros de execuo do comando ou de interpretao. Por outro lado, evitou o efeito de eco permanente pela defasagem da retaliao de enganos cometidos por estratgias semelhantes. A OPO determinista reage bem com estratgias diferentes da sua em contextos randmicos, mas cai em uma retaliao fratricida contra os erros de estratgias gmeas, enquanto a generosidade de GOPO recompe a cooperao em poucos movimentos aps um lance equivocado da outra parte. Esse resultado no passou despercebido de Axelrod que, junto ao cientista poltico chins Jianzhong Wu, destacou que a [g]enerosidade efetiva ao deter a repetio contnua de um simples erro, se o erro foi cometido pelo prprio agente ou por outro jogador. O nvel de generosidade determina quo rapidamente um erro pode ser corrigido e a cooperao restaurada. O problema que a generosidade
. Pelo menos essa foi a concluso das pesquisas realizadas por Robert Boyd e Jeffrey P. Lorberbaum e publicadas na revista Nature de 07 de maio de 1987 sob o ttulo "No Pure Strategy Is Evolutionarily Stable in the Repeated Prisoner's Dilemma Game". Veja BREMBS, B. Chaos, Cheating and Cooperation, pp. 15 e 16, bem como AXELROD, R. The Evolution of Cooperation, cap. 2, p. 51. 187 . Veja NOWAK, M. A. & SIGMUND, K. "The Alternating Prisoner's Dilemma", 4, p. 223.
186
100
requer um balano entre a rapidez na correo do erro e o risco de explorao (WU, J. & AXELROD, R. "How to Cope with Noise in the Iterad Prisoner's Dilemma", p. 6). Outra variante que permite cobrir os prprios erros do agente, chamada CONTRITE TIT FOR TAT (COPO), conseguiu obter bons resultados no cenrio ecolgico - sem o surgimento de mutaes ou invases - do segundo torneio de Axelrod, acrescentado de rudo. COPO evita retaliar a desero do outro se esta desero foi provocada pelo prprio jogador. COPO atua como um agente arrependido de ter ganho uma vantagem imerecida, mantendo a cooperao aps uma justa retaliao por parte do outro. Junto a GOPO, COPO forma uma famlia de estratgias robustas, em torno de OPO, na maioria dos ambientes ruidosos188. Generosidade e arrependimento so dois aspectos da condio de clemncia que se amplicam respectivamente relao externa com o outro e interna, consigo mesmo. A clemncia (forgiving), que a primeira vista foi um dos fatores relevantes do sucesso de OPO nos torneios puros, foi tambm sistematicamente desafiada pelos especialistas que prepararam suas estratgias, dentro do esprito competitivo, para derrubar essa estratgia no segundo turno. Axelrod considerou esse equvoco capital para as intenes das outras regras em atingir os melhores resultados possveis. Seus programadores esqueceram que ser razoavelmente tolerante ajuda a estabelecer a cooperao entre todos. Um incremento na tolerncia de OPO, realizado por GOPO e COPO seria a razo para estratgias dessa famlia conseguirem resistir e prosperar em contextos nebulosos e incertos como aqueles nos quais erros e confuses podem acontecer. GOPO por si s chegou a constituir uma gama de estratgia com base em uma verso pura - (1, 0, 1, 1) denominada FIRM BUT FAIR (FIRME MAS JUSTO, FMJ), tambm chamada famlia FAIR (JUSTO). Pagar na mesma moeda revelou ser uma linha de ao eficaz para enfrentar estratgias estranhas que no cooperem sistematicamente ou aquelas no gentis - que comeam desertando. Mas mostrou falhas em reconhecer e tolerar enganos de seus prprios semelhantes. Tais falhas poderiam ser corrigidas antecipadamente, caso as informaes sobre quais seriam os cooperadores entre os futuros jogadores que sero enfrentados estivessem disponveis a tempo. Saber se um agente um mesquinho desertor (SEMPRE D), antes da interao, ajudaria a reduzir os pagamentos feitos aos maus cooperadores, em geral. Uma variante intitulada OBSERVER TIT FOR TAT (OBSERVADOR OLHO POR OLHO, OOPO) agiria nos primeiros encontros com um parceiro gentil tal como OPO, porm, atacaria com uma ao no gentil - igual a SOPO -, desertando no primeiro lance, se o outro jogador fosse um desertor historicamente conhecido. Desse modo, OOPO seria eficaz para explicar a exigncia por controles sociais com severas ameaas aos exploradores, a fim de reduzir a presena de de desertores em curto prazo. A longo prazo, a sombra do futuro e as retaliaes decorrentes dos sucessivos encontros seriam bastantes para inibir a desero189. Outras Famlias Notveis Alm de OPO, outras famlias de estratgias puderam ser constitudas tendo como origem estratgias deterministas modificadas para o ambiente evolutivo com rudo.
188
. Veja AXELROD, R. "On Six Advances in Cooperation Theory", p. 27 e WU, J & AXELROD, R. "How to Cope with Noise in the Iterad Prisoner's Dilemma", p. 7. 189 . Veja BREMBS, Bj. "Chaos, Cheating and Cooperation", p. 17.
101
PAVLOV (1, 0, 0, 1) tornou-se a principal concorrente de OPO em jogos simultneos ruidosos. Sob o parmetro de Axelrod (R = 3; S = 0; T = 5; P = 1), a estratgia PAVLOV est sujeita invaso de agentes mesquinhos, que sempre desertam. Em poucas rodadas, seu frgil mtodo de retaliao permite sua explorao por SEMPRE D. Entretanto, no padro de Nowak e Sigmund (R = 3; S = 0; T = 4; P = 1), PAVLOV determinista consegue obter bons resultados por ter a capacidade de restabelecer a cooperao com rapidez190. A diferena principal entre PAVLOV e OPO foi apontada por Nowak e Sigmund, em 1994. Enquanto a ltima procura imitar o comportamento dos seus oponentes, PAVLOV orienta suas aes apenas pelos resultados recebidos. Agindo assim, os pavlovianos conseguem ir bem entre si ao recuperarem rapidamente a cooperao, depois de uma desero mtua equivocada. Os pavlovianos no precisam entender muito sobre como funciona a mente do outro ou afinal o que est em jogo no DPI, basta apenas mudar sua ao quando os ganhos no forem favorveis. Ao lado da PAVLOV determinista, Axelrod testou, em uma retomada randmica de seu segundo torneio, uma verso generosa dessa estratgia (GPAVLOV), que coopera um dcimo das vezes, depois da desero do outro jogador. No ambiente ruidoso, enfrentendo outras 63 estratgias, Axelrod percebeu que as duas verses de PAVLOV no ascendiam das ltimas posies. A PAVLOV original ficou em 55 lugar e GPAVLOV na 48 colocao. Na disputa ecolgica - evoluo sem mutao -, os pavlovianos foram levados beira da extino, sobrando apenas um milionsimo de seus praticantes, depois de cem geraes. Ademais, PAVLOV, que funciona bem em jogos simultneos com rudo, torna-se instvel em jogos alternados191. Apesar desses resultados decepcionantes, PAVLOV reage bem contra estratgias especficas. Exceto pela primeira rodada, em um jogo alternado, PAVLOV resiste s tentativas grosseiras de explorao de uma verso invertida de OPO (ANTI-TIT FOR TAT, AOPO) - tambm chamada de BULLY (FANFARRO), por David Kraines e Vivian Kraines (Figura 4.4).
Figura 4.4 - Jogos Alternados FANFARRO D C C C ... D C C C ... PAVLOV D D D D ... C D D D ...
FANFARRO, ou AOPO (0, 1, 0, 1), sabe explorar os cooperadores incondicionais (SEMPRE C), desertando contra a cooperao, mas se deixa explorar por SEMPRE D, pois, ao contrrio de OPO, coopera sempre com desertores. Diferente de OPO, ao invs de imitar o comportamento adversrio, AOPO procura fazer o oposto do que o outro faz. Melhores resultados so obtidos pelas variantes hbridas de PAVLOV que constituem uma combinao com OPO. Dessa forma, FIRME MAS JUSTO, patriarca da famla JUSTO, alia a robustez de OPO com a facilidade de adaptao de PAVLOV. Uma verso estocstica de FMJ, variante de GOPO - chamada de TOUGH LOVE (AMOR BRUTO, AB), por Kraines e Kraines -, foi a vencedora de um Dilema dos Prisioneiros Alternado com memria192. PAVLOV tambm ajuda a formar outra famlia quando se une ao RETALIADOR PERMANENTE (1, 0, 0, 0) - famlia GRIM - para estabelecer GRIM PAVLOV, um algoritmo que mantm a desero, mesmo depois de ter punido a sua desero acidental.
. Veja WU, J. & AXELROD, R. Op. cit., p. 6 e NOWAK, M. A. & SIGMUND, K. Op. cit., 3, p. 222. 191 . Veja WU, J. & AXELROD, R. Idem, p. 4. 192 . Veja KRAINES, D. & KRAINES, V. "Protocols for Cooperations", 8.3, p. 14.
190
102
Compe ainda a famlia GRIM a verso suave do RETALIADOR PERMANENTE denominada GRIM BUT RELENTING (RETALIADOR DELICADO). Ao invs de promover a desero perptua depois de ser simplrio, o RETALIADOR DELICADO refaz a cooperao depois de dois erros consecutivos. Dessa maneira, os retaliadores permanecem robustos invaso dos desertores incondicionais (SEMPRE D), ao mesmo tempo em que reduzem os vcios de naturais enganos193. A proliferao de tantas famlias de estratgias, a partir de pequenas unidades interativas, revela a gradativa emergncia da complexidade em relaes e nos comportamentos dos seres vivos, no lento processo de seleo natural. Regras simples como as propostas por tais algoritmos, construdos e apoiados nas reaes possveis ao Dilema dos Prisioneiros, pode estar na base da explicao das reaes qumicas das macromolculas de cido desoxirribonuclico (ADN), como sugeriram Nowak, Robert May e Sigmund194. As simulaes em computadores serviram para mostrar simplificadamente como um processo de cooperao como esse pode ter surgido e se sustentado por meio de organismos vivos. (...) Sofisticadas criaturas podem ser desenhadas para seguir estratgias que encorajam a cooperao por causa de repetidas interaes entre indivduos que podem reconhecer e relembrar uns aos outros. (...) No curso da evoluo, parece ter havido ampla oportunidade para cooperao ter assistido a todos desde os humanos s molculas. Nesse sentido, a cooperao poderia ser to velha como a prpria vida em si (NOWAK. M. A., MAY, R. M. & SIGMUND, K. "The Arithmethics of Mutual Help", p. 81.) As propriedades e condies que fazem a cooperao emergir entre os sistemas complexos sero discutidos, a seguir. 4.5 Condies para Cooperao Os diversos experimentos realizados em torno do Dilema dos Prisioneiros Iterado, todas simulaes e torneios de computador, bem como as estratgias construdas para enfrentar as peculiaridades de cada situao subsidiaram a discusso sobre as condies e os pressupostos que promovem o comportamento cooperativo entre os jogadores. Compreender quais so os fatores que contribuem para formao e manuteno da cooperao uma das metas principais da filosofia poltica, da tica, e da psicologia comportamental. Uma sociedade bem ordenada s pode se manter como tal se houver a cooperao entre seus membros. Cooperar com o outro um aspecto do altrusmo que pode ser explicado, mesmo entre agentes egostas, sem perda de consistncia, por conta dos efeitos da reciprocidade exigida pelas partes e que fundamenta princpios ticos fortes como a conhecida Regra de Ouro - faa ao outro aquilo que gostaria que fizesse a si mesmo. O livro The Evolution of Cooperation, de Robert Axelrod, o responsvel pelo lanamento dessa Teoria da Cooperao que procura responder simples questo de como agentes egostas podem seguir cooperando uns com os outros, sem a necessidade de nenhum instrumento externo - como o Estado, instituies jurdicas ou contratos que
193 194
. Veja KRAINES, D. & KRAINES, V. Op. cit, 15, pp. 25 e 26. . Veja NOWAK. M. A., MAY, R. M. & SIGMUND, K. "The Arithmethics of Mutual Help", p. 81.
103
obriguem a levar em considerao os interesses dos outros. De um ponto de vista radical, nem mesmo uma racionalidade forte seria requerida para que a cooperao emergisse e, por conseguinte, at mesmo organismos muito simples - bactrias, vrus etc. - poderiam ser considerados aptos a tomar parte da interao igualmente fcil de se perceber como o Dilema dos Prisioneiros. Por conta de sua montagem simplificada, bilogos, polticos, economistas e matemticos puderam propor uma ampla gama de cenrios onde os agentes poderiam atuar. A concepo de agente utilizada partilha da noo de agncia creditada do filsofo estadunidense Daniel Clement Dennett. Um agente dennettiano tem capacidade suficiente para praticar aes, ao invs de apenas sofr-las. Este agente atua em funo de razes ou conjunto de instrues sobre as quais no tem conscincia195. Fora da filosofia, um agente dennettiano corresponde a sistemas complexos dinmicos, s macromolculas orgnicas e aos autnomos celulares. Organismo que reagem entre si segundo regras, leis da fsica ou qumicas e programas instalados. Assim sendo, a reproduo do comportamento de unidades reativas to bsicas pde ser perpetrada convenientemente em torneios virtuais de computadores. As simulaes que se sucederam s primeiras competies promovidas por Axelrod trataram de explorar as consequncias e concluses anunciadas em 1984. Em seu livro, Axelrod apresentou as condies que considerava responsveis pela vitria da estratgia OLHO POR OLHO entre as cooperadoras. A ao de OPO era clara, gentil, retaliadora e clemente. Essas quatro primeiras condies eram tidas, ento, como sendo a chave explicativa para a robustez exibida nas disputas iniciais196. Com base nessas propriedades, alguns conselhos foram proferidos como sendo adequados para jogadores desenvolverem sua finalidade em uma longa interao do tipo do Dilema dos Prisioneiros: no ser o primeiro a desertar, no ser invejoso, nem ardiloso e responder com reciprocidade cooperao e a desero197. A ambio de um ganho maior sobre o outro jogador eventualmente conduz a uma tentativa de reparar o desequilbrio dos resultados. Isto leva, ento, a uma desero que visa retificar as perdas sofridas. Dessa forma, jogadores invejosos provocariam a runa mtua atravs de uma srie de punies repetidas. Por ser uma estratgia que nunca busca vantagem sobre os ganhos dos outros, OPO consegue no mximo igualar os ganhos aos do outro jogador ou um pouco abaixo do outro. Mesmo assim, no ambiente dos dois primeiros torneios, foi a estratgia que obteve a melhor pontuao mdia em comparao s demais. Os ganhos equilibrados de um jogador OPO, ocorreu por que este nunca o primeiro a desertar. A gentileza inicial evitava a deflagrao de conflitos desnecessrios. Estratgias gentis, no por acaso estiveram entre as melhores colocadas, no obstante o fato da desero ser uma estratgia dominante na verso bsica do Dilema dos Prisioneiros, em uma s rodada. A falta de gentileza pode trazer vantagens imediatas, mas a longo prazo degrada a convivncia necessria para sua proliferao ao futuro, como ocorreu a todas estratgias desse tipo na disputa ecolgica feita depois do segundo torneio198. Muita sofisticao e sutilezas dos programas no foram caractersticas prprias aos algoritmos que tiveram xito no DPI. Comportamentos ardilosos e muito complexos podem, dada a dificuldade de compreenso pela outra parte, ser considerados aleatrios,
195 196
. Veja DENNETT, D. Cl. Tipos de Mentes, cap. 2, p. 26. . Veja AXELROD, R. The Evolution of Cooperation, cap. 2, p. 54. 197 . Veja AXELROD, R. Op. cit., cap. 6, p. 110. 198 . Veja AXELROD, R. Idem, cap. 6, p. 117.
104
imponderveis, ou irresponsveis. Desta forma, estratgias difceis de entender so perigosas devido falta de clareza sobre suas aes o que gera desconfiana em quem deve participar da cooperao. A clareza de OPO foi uma das razes para seu desempenho vitorioso. Ao contrrio do jogo de soma zero, onde ocultar informaes sobre sua linha de ao dificulta as tomadas de decises do adversrio a ser derrotado, em jogos de soma varivel, como o DPI, em que se busca a cooperao do outro, importante parecer transparente, sinalizando e fornecendo garantias de que o objetivo de ambos maximizarem seus resultados passa pela cooperao mtua. Tal transparncia das aes reforada medida que a cooperao for sendo retribuda com cooperao e desero punida com desero. De todos os conselhos extrados dessa forma de interao, a prtica da reciprocidade o mais eficaz, de um modo geral. Objees e Respostas Como sempre ocorre em debates filosficos, esses conselhos e as propriedades relacionadas s estratgias vitoriosas nas simulaes e intuitivamente aceitveis foram criticados por outros pesquisadores que no estavam satisfeitos com as concluses tiradas. Kenneth Binmore atacou duramente as propriedades atribudas a OPO, advertindo que, em contextos especficos, estratgias que no fossem claras, gentis, retaliadoras e clementes poderiam tambm ser bem sucedidas199. Alm deste, vrios outros pesquisadores consideraram irrealista as primeiras simulaes e introduziram novos ingredientes, a fim de aproximar aquelas descries ao ambiente natural cotidiano. Alternncia de movimentos, possibilidade de erro ou m compreenso, memria de mais de uma rodada, ao lado de diversos outros aspectos ligados topologia do territrio foram criados para tornar ainda mais precisas as observaes feitas sobre a interao entre os organismos. De um modo geral, todas as dificuldades postas acabaram por confirmar os resultados iniciais que apontavam para a possibilidade da cooperao evoluir na maioria das circunstncias examinadas. Contudo, de acordo com a avaliao de Robert Hoffmann - feita duas dcadas depois de constantes debates aos torneios iniciais - outras estratgias, que no a OPO determinista, poderiam promover a cooperao sob certas condies. Toda uma famlia de estratgias variantes de OPO foi gerada. Outros algoritmos hbridos permitiram a ligao entre famlias concorrentes, diluindo as fronteiras entre estratgias cooperadoras. Os resultados dessa literatura, portanto, confirma um nmero de descobertas chaves dos trabalhos tericos. Primeiro, a cooperao possvel em equilbrio quando jogadores no levam em considerao o trmino do jogo. Segundo, na estrutura evolucionria, qualquer estratgia que propague rigidez pode ser em ltima instncia deslocada por formas alternativas de comportamento (HOFFMANN, R. "Twenty Years On", 4.2, p. 10). De todos os atributos estratgicos e condies necessrias para a cooperao, a reciprocidade surge como elemento principal. Contudo, outros fatores relevantes ajudam a entender porque a cooperao nem sempre ocorre entre espcies diferentes e como ela pode ser mantida em meio adversidade. Relacionamentos mais complexos em cenrios que envolvam eventos aleatrios, mudanas territoriais, erros, alternncia
199
. Um sumrio dessas crticas encontra-se em BINMORE, K. "Review: The Complexity of Cooperation", resenha de 1998.
105
etc. mostraram a necessidade de manuteno de um contrato estvel ou de uma larga "sombra do futuro", no intuito de permitir a previso comportamento do outro a partir de uma adaptao a longo prazo, com obteno de resultados favorveis o bastante para que a desero no viesse a ser compensada. [A] utilizao e extenso do paradigma original do Dilema dos Prisioneiros Iterado entre duas pessoas proviu de ricas possibilidades os efeitos de uma ampla faixa de fatores tais como o tempo dos movimentos tomada de garantias, redes sociais, adaptao, inveja, rudo e mobilidade. luz de extensa literatura existente, sobre os modelos relatados relacionam resultados dos modelos detalhadamente relatados sobre cada fator, bem como para a contnua adoo de novos temas (AXELROD, R. "On Six Advances in Cooperation Theory", pp. 31/32). A simplicidade dos modelos empregados nas simulaes realizadas delinearam como a cooperao entre organismos complexos pode emergir no ambiente biolgico natural, a partir do permanente incentivo a repetida interao entre indivduos. O reconhecimento e as lembranas das aes passadas de cada um estimulavam os seres inteligentes a manter a cooperao entre os cooperadores e a desero para os que tm m reputao de desertores. Nos casos de agentes mais simples, prximos aos autmatos celulares, a cooperao resiste em face da reao da vizinhana. Direta ou indiretamente, a reciprocidade , portanto, uma condio necessria para sustentao a cooperao. Mas essa no a nica maneira disso acontecer. Sem a memria ou qualquer recordao das aes passadas, a reciprocidade deixa de ser um fator efetivo. Nesses casos, apenas a similaridade, ou o recurso ao reconhecimento de uma marca ou etiqueta que identifique um parceiro semelhante ao seu algoritmo, seria capaz de fazer prevalecer a tolerncia ou a cooperao entre os agentes. No entanto, a proliferao das etiquetas ou mesmo a falsificao delas podem gerar equvocos custosos queles que s cooperam pela observao de sinais externos. Entretanto, essas caractersticas fisionmicas ou comportamentais poderiam explicar a aplicao de mecanismos etnocntricos, como forma de garantir a cooperao entre os membros de um grupo identificado pelos mesmos rtulos200. Na prtica, a similaridade pode explicar o flocescimento da cooperao entre espcies ou etnias. Porm, embora primeira vista possa parecer uma forma simples e econmica de encontrar parceiros bons cooperadores, as etiquetas implicam em um custo crescente no refinamento do aparato de identificao, a fim de evitar falsificaes e o oportunismo dos organismos que mimetizam as maneiras do outro se apresentar ou comportar. Recorrer a garantias, por vezes acaba em regresso ao infinito de um inferno burocrtico em torno do aval das garantias, fiadores, garantias dos fiadores etc. Se as sinalizaes por meio de etiquetas podem enfrentar problemas de identificao ao longo do tempo, a reciprocidade obriga que os jogadores estejam atentos para as aes executadas pelos outros. Mais do que as palavras, importa aos agentes recprocos os resultados obtidos da interao. Em todo caso, as recomendaes no so to simples quanto possam parecer as regras adotadas. Intuitivamente,
. Veja RIOLO, R. L., COHEN. M. D. & AXELROD, R. "Evolution of Cooperation without Reciprocity" e AXELROD, R. & HAMMOND, R. A. "The Evolution of Ethnocentric Behavior" para o assunto das etiquetas.
200
106
permanecem vlidos os conselhos de Marco Polo a Kublai Khan em Cidades Invisveis, de talo Calvino. O inferno dos vivos no algo que ser; se existe, aquele que j est aqui, o inferno ao qual vivemos todos os dias, que formamos estando juntos. Existem duas maneiras de no sofrer. A primeira fcil para a maioria das pessoas: aceitar o inferno e tornar-se parte deste at o ponto de deixar de perceb-lo. A segunda arriscada e exige ateno e aprendizagem contnuas: tentar saber reconhecer quem e o que, no meio do inferno, no inferno, e preserv-lo e abrir espao (CALVINO, I. As Cidades Invisveis, 9, p. 150). O DPI apresenta alguns aspectos bsicos relacionados com a emerso da cooperao entre agentes egostas em interao direta, uns com os outros. Evolutivamente, espcies de primatas, alm do Homo sapiens, comportam-se como altrustas recprocos que consolidaram estratgias em situaes semelhantes ao dilema dos prisioneiros. Sem embargo, convm notar que o DPI adequado para anlise do comportamento entre duas partes. Para mais de dois jogadores, outros modelos esclarecem pontos que no so precisamente detectados em simulaes baseadas em jogos bimatriciais (2 X 2). Os Bens Pblicos vm esclarecer outros aspectos da cooperao em dilemas sociais.
107
Captulo 5: Bens Pblicos
Alm do Dilema dos Prisioneiros e da Centopia, dois outros modelos de jogos tm sido objeto de vrios estudos: o jogo do Bem Pblico e o j mencionado jogo do Ultimato. Esses dois tipos de jogos servem para analisar respectivamente o papel de um mediador e da equidade nas escolhas das estratgias. Como corolrio, tambm so examinados seus efeitos com a consequente instituio de mecanismos de fiscalizao, de controle, reputao, da influncia cultural e da existncia de um suposto homo oeconomicus. Em microeconomia, um bem pblico definido como uma externalidade, cujos benefcios ou malefcios devem ser distribudos igualmente entre todas as partes envolvidas no consumo de seu produto ou servio. Por externalidades entenda-se a situao em que uma ao individual afeta diretamente os outros agentes, trazendo consequncias que lhes so boas ou ms em comparao com a condio anterior. Cada um pode atribuir um valor prprio a sua poro, mas esta fornecida e usufruda da mesma maneira por todos envolvidos. A poluio do meio ambiente, a urbanizao da cidade e a segurana so exemplos de bens pblicos. Diferente dos bens privados, a utilidade individual - a satisfao que cada um tem segundo uma lista de preferncias de consumo de bens - depende necessariamente da utilidade dos outros participantes. Isto , ningum decide sozinho a quantidade de bem que ser obtida. Todos devero consumir obrigatoriamente a mesma frao do bem pblico201. O uso coletivo de um bem pblico abre margem para o aparecimento de oportunistas que "pegam carona" no investimento que os outros fazem na aquisio de algo que pode ser consumido em comum. Uma verso do Dilema dos Prisioneiros serve para explicar o fenmeno do carona quando um casal decide comprar uma televiso nova para seu apartamento. Um aparelho que custa $500 pode valer a cada um $300. Se ambos decidem dividir meio a meio, a utilidade de cada um ser $50 ($300 - $500/2). Entretanto, se Coluna deixar que Linha arque sozinha com a compra da TV, seu benefcio sobe a $300, enquanto a compradora perde -$200. Vice-versa para o caso de Linha aproveitar-se da compra incondicional de Coluna. Mas se os dois desistirem da TV, nenhum bem ser repartido entre ambos, gerando por fim, a seguinte matriz.
Coluna Figura 5.1 Linha Estratgias Comprar No Comprar Bem Pblico Comprar 50, 50 l 300, -200 No Comprar -200, 300 c l 0, 0 c
A estratgia dominante na aquisio de uma TV por um casal "no comprar". Qualquer um que resolver comprar a TV unilateralmente ver como o outro ter todo interesse em pegar carona na despesa efetuada. Quando o nmero de participantes de um bem pblico cresce, tambm aumenta a tendncia de novos caronas surgirem. Testes com grupos de quatro jogadores distriburam as quantias de $20 para que cada um pudesse investir ou no em um fundo comum ao grupo a que fizesse parte.
201
. Veja VARIAN, H. R. Microeconomia, cap. 35, pp. 691-704.
108
Cada unidade investida recebia meio porcento de juros distribudo a todos igualmente. Desse modo, se todos investem de uma vez suas dotaes, receberiam cada um o dobro do montante inicial (0.5 x $80 = $40). Entretanto, devido baixa remunerao individual, cada investidor sentiria tentado a nada aplicar e receber o rendimento do investimento dos outros jogadores no fundo comum, uma vez que este dividido igualmente entre eles, tenham ou no feito a aplicao, considerando que basta apenas que um o faa. Todavia, se todos pensarem assim, nada seria investido no empreendimento mtuo e cada um permaneceria com os mesmos $20 iniciais, sem nada ganhar alm disso. Experimentos contemporneos realizados em laboratrios da Universidade de Zurique revelaram que em jogos de Bem Pblico repetidos por 10 rodadas sucessivas a maioria das pessoas aplica, nas primeiras rodadas, cerca da metade de seu capital, diminuindo a cada rodada at o final quando deixa de participar do fundo de investimento. Isso ocorre porque durante o jogo as pessoas aprendem que a estratgia egosta sua dominante. Contudo, quando uma multa instituda como punio cobrada aos caronas - aqueles que se aproveitam do rendimento da aplicao alheia - se reduz drasticamente a desero e a maioria passa a investir valores prximos a todo capital, fazendo com que a cooperao prevalea202. Outro exemplo da discusso sobre a repartio dos custos de um bem pblico ocorre nos acordos internacionais acerca da reduo da emisso de poluentes na atmosfera. O protocolo de Quioto, que em 2001 j contava com assinatura de 178 naes, comprometeu os principais pases industrializados a reduzirem suas emisses em pelo menos 5% em relao aos nveis de 1990 at 2012. Tal compromisso foi ratificado, em 2005, pelas partes responsveis por mais de 55% das emisses de dixido de carbono (CO2) - o principal gs relacionado ao efeito estufa -, entretanto os Estados Unidos, responsvel por cerca de 25% das emisses de CO2 em 2000, ainda no ratificaram esse compromisso, alegando que isto acarretaria um alto custo para sua indstria nacional que teria de se adaptar s novas exigncias ambientais. Ao deixarem de se comprometer com o tratado internacional, estes pases se aproveitam do benefcio comum que a reduo promover ao planeta, enquanto as demais partes arcam com os custos dessa mudana em seus parques industriais203. Os pases que "pegam carona" na questo ambiental impem s outras naes um custo maior do que estas teriam se todos colaborassem na diminuio da poluio. Isso agrava-se, sobretudo, quando os maiores poluidores do mundo decidem desertar (EUA e China), explorando os ambientalistas. Sem um governo global, ou um mecanismo eficaz para determinar o cumprimento do Protocolo e punir os desvios, a tendncia que haja um fracasso na melhoria da qualidade de vida frente s transformaes climticas pelas quais passa o planeta, a longo prazo. Pois, voluntariamente, pouca reduo da emisso de gases deve ser esperada, se cada nao decidir que o que j foi contribudo seja o suficiente para a produo de uma clima equilibrado. A questo relativa ao Protocolo de Quioto piora sensivelmente devido a falta de consenso sobre as causas de tal mudana climtica estar ocorrendo na Terra. Sem um compromisso e uma fiscalizao, as partes podem exigir maiores explicaes e
. Veja SIGMUND, K. "The Economics of Fairness", pp. 3 e 4. . Veja informaes sobre a emisso de CO2 nas pginas do Carbon Dioxide Information Analysis Center (CDIAC - Centro de Informao e Anlise do Dixiodo de Carbono) em http://cdiac.esd.ornl.gov/ e sobre o Protocolo de Quioto na pgina do Ministrio da Cincia e Tecnologia do Brasil em http://www.mct.gov.br/clima/quioto/protocol.htm
203 202
109
justificativas para implementar sua cooperaro adequadamente em um jogo do Bem Pblico. Nesse caso, a tentao de no cooperar e usufruir daquilo que os outros proveram maior do que simplesmente participar na sua realizao. muito difcil que indivduos consigam sozinhos gerar a quantidade de um bem pblico tima, sem um instrumento que imponha a todos uma participao equnime204. Ao lado do Dilema dos Prisioneiros, os Jogos do Bem Pblico e do Ultimato foram dois modelos que contriburam decisivamente para o entendimento mais preciso do comportamento humano. Cooperao, reciprocidade, justia, equidade e altrusmo ganharam contornos de conceitos cientficos passveis de ser detectados por experimentos em laboratrio e no campo. Um grau de preciso que a filosofia no tinha obtido em mais de dois mil anos de debates intrusos. 5.1 O Bem de Todos O Dilema dos Prisioneiros Iterado tem sido o modelo mais aplicado quando se trata de estudar a cooperao entre duas partes egostas, mas que dependem uma da outra para atingir um resultado timo. Entretanto, se o nmero de participantes sobe acima de dois jogadores, o trato fica difcil de ser modelado por meio de matrizes, ou rvores de Kuhn. Efetivamente, os torneios que confrontavam vrias estratgias funcionavam como campeonatos de partidas contra os programas rivais e no final o somatrio dos pontos definidos para cada partida, determinava a que obtivera maior nmero de pontos e, por fim, a estratgia vencedora. Os jogos chamados de Bens Pblicos so uma extenso do Dilema dos Prisioneiros para mais de dois jogadores. Em economia, um bem pblico entendido como algo que deve ser usufrudo em propores semelhantes por todas as partes envolvidas em sua produo e consumo. Em geral, os bens pblicos so oferecidos por instituies governamentais, mas nada impede que empresas privadas tambm os gerem. No podem ser servios ou efeitos colaterais da ao de um grupo ou indivduo que seja membro deste. A poluio um exemplo do impacto das aes de indivduos sobre a natureza que afetam todos em uma regio ou at mesmo em escala global. Nos pases desenvolvidos ou em desenvolvimento, os parques indstriais e a expanso de fronteiras agrcolas provocam a emisso de gases - fumaa decorrente da transformao dos materiais, queima de combustveis, ou queimada de florestas. Os resultados dessa devastao so sentidos por todos os habitantes do planeta Terra, quando o aquecimento da atmosfera, gerado por esses gases afetam o clima em escala mundial. Naes subdesenvolvidas, ou mesmo aquelas desenvolvidas que investem em meios de produo sustentveis ecologicamente, tm reivindicado o direito ao "ar puro" ou uso de tecnologias que no agridam tanto o meio ambiente. O suposto direito ao ar puro tambm passvel de troca por meio de tratados internacionais que exigem compensaes adequadas pela perda de um pouco desse bem comum. Nesse sentido, acordos como o Protocolo de Quioto prevem o comrcio de emisses entre os pases comprometidos em reduzir o lanamento de gases relacionados ao efeito estufa e aqueles que obtiveram certificados de reduo, a fim de que cumpram suas cotas relativas ao esforo mundial de minimizao da mudana climtica no planeta. As dificuldades inerentes a esse tipo de comrcio esto na atribuio de um valor ou quantidade que seja suficiente para compensar os custos da adaptao de todo
204
. Veja VARIAN, H. R. Op. cit., cap. 35, p. 713.
110
um parque industrial a essas restries ambientais ou a acomodao de toda uma populao sujeita s consequncias do aquecimento global: secas em algumas regies, inundao em outras, degelo nos plos etc. Para entender como agentes que relutam em cooperar com o grupo podem ser induzidos a participar desses acordos, o modelo de jogos de Bens Pblicos so mais apropriados. Jogos de Bens Pblicos so objetos de estudos econmicos, pelo menos desde 1980, mas intuitivamente j eram percebidos por filsofos modernos, como JeanJacques Rousseau. Rousseau descreveu em "Discurso sobre a Origem e os Fundamentos da Desigualdade entre os Homens" (1755), o problema enfrentado por homens primitivos que participavam de uma caada de veado, antes das primeiras sociedades terem se formado. Eis como puderam os homens insensivelmente adquirir certa idia grosseira dos compromissos mtuos e da vantagem de respeit-los, mas somente quanto poderia exigi-lo o interesse presente e evidente, posto que para eles no existiu a providncia e, longe de se preocuparem com seu futuro distante, no pensavam nem mesmo no dia de amanh. Se era caso de agarrar um veado, cada um sentia que para tanto devia ficar no seu lugar, mas se uma lebre passava ao alcance de um deles, no h dvida de que ele a perseguia sem escrpulos e, tendo alcanado a sua presa, pouco se lhe dava faltar a dos companheiros (ROUSSEAU, J-J. "Discurso sobre a Origem e os Fundamentos da Desigualdade entre os Homens", II part., p. 261) Para a caa de uma grande presa, ser bem sucedida, necessria a cooperao de todos caadores. Como j antecipava Rousseau, se cada um se preocupar apenas em conseguir apenas o suficiente para o almoo, capturando uma lebre, todo grupo se dispersa e nada sobrar para o jantar. Situaes como a caada de veado podem ser descritas como um modelo de Bem Pblico. Jogos desse tipo ocorrem com frequncia na natureza e entre seres humanos civilizados, sendo um exemplo bsico das interaes econmicas na espcie. Uma das formas caractersticas de modelar-se os jogos dos Bens Pblicos foi apresentada pelos matemticos Christoph Hauert, Silvia de Monte, Karl Sigmund e Josef Hofbauer, ento membros do Instituto para Matemtica da Universidade de Viena, em 2001. A um grupo de seis jogadores distribudo $10 para cada um. Esses jogadores devem, em seguida, decidir individualmente com quanto deveram investir - frao da dotao ou todo montante disponvel - em um fundo mtuo. Um stimo jogador recolhe os valores, multiplica-os por trs e divide o produto igualmente entre os seus participantes que recebem, portanto, 1/6 do saldo do rendimento de todo grupo. Se todos jogadores contriburem, respectivamente, com $10, cada um receber $30, ao final205. Contudo, a tentao de desertar e explorar o investimento alheio grande, tendo em vista o juro baixo de 0.5% para cada $1 aplicado [(1 x 3) : 6 = 0.5]. Porm, se todos pensarem assim, nada seria mobilizado e cada um ficaria apenas com seu $10 iniciais. Essa soluo paradoxal prevista pela teoria dos jogos como o equilbrio racional de agentes egostas, interessados em maximizar seus lucros e minimizar suas perdas. No investir uma soluo recomendada devido ao alto risco de ser explorado. Pois, se apenas um jogador se arriscar investir tudo, enquanto os outros nada contribuem, aquele
205
. Veja HAUERT, Chr. et al. "Oscillations in Optional Public Good Games", 1, p. 1.
111
receber a metade de sua aplicao, ficando s com $5 [(10 x 3) : 6 = 5], ao passo que os outros somariam $15 [5 + 10] 206. Sem embargo, apesar das restries previstas pelos economistas, experimentos reais mostram, que, em geral, as pessoas investem quase a metade do capital disponvel em um jogo de um s lance. Todavia, quando o jogo repetido por at 10 rodadas, inicialmente, as partes aplicam o mesmo montante do jogo de um s movimento e gradativamente a maioria percebe que melhor deixar que os outros faam os investimentos, enquanto puder receber os juros sem os riscos de perda. Aps uma srie de experincias decepcionantes, os jogadores aprendem que a estratgia egosta acaba tomando o lugar da cooperao inicial207. Em 2002, Karl Sigmund, Ernst Fehr e Martin Nowak relataram revista Scientific American que, quando se permite a um jogador, que participou da falncia de uma cooperao em um grupo que jogou o Bem Pblico, voltar a participar de um novo grupo de investidores, esse jogador, ao invs de reproduzir um rancoroso comportamento egosta - por causa de sua experincia passada -, recomea cooperando com parte de seu capital, como na primeira vez. Outros testes revelaram que, depois de instituir uma punio para os desertores, as deseres caram a uma taxa menor do que a observada antes. E, mesmo depois de algumas repeties, no h um declnio da cooperao, como ocorre nos jogos sem penalidades, mas um incremento maior no montante aplicado, por causa da segurana imposta pelas multas estipuladas. Importante notar que a cobrana de multas no era sem custo para os agentes. Aquele jogador que impusesse uma penalidade ao desertor, tambm deveria contribuir com uma taxa para aplicao da sano - uma frao da multa. Todos os valores arrecadados por meio desse mecanismo seriam ento recolhidos e retidos pela banca. A despeito desse pequeno revs, os jogadores mostram-se dispostos a fazerem valer esse recurso quando um dos participantes contribuiu menos do que ele. A ameaa da punio inibe as deseres e estimula um aumento nas contribuies208. Em jogos repetidos, jogadores podem ver a punio como uma manobra astuta, investimento egosta na educao dos outros jogadores: avarentos so ensinados a contribuir para o benefcio geral. Os custos decorrentes para punir aplicaes baixas podem produzir lucros a longo prazo (SIGMUND, K., FEHR, E. & NOWAK, M. "The Economics of Fair Play", p. 87). Variantes dos Bens Pblicos A forma geral dos jogos de Bens Pblicos composta por uma banca e um nmero natural de jogadores que devem investir, em um fundo comum, uma quantia do montante que lhe distribudo. O valor aplicado multiplicado por um fator remuneratrio que deve ser maior que 1 e menor que o nmero de jogadores (1 < r < N). Depois, o total apurado dividido entre os jogadores de modo igual. Cada um recebe ento uma frao do saldo do rendimento (r/N). Essa frao sempre menor do que o valor de cada unidade investida. Por causa disso, a estratgia egosta que sugere nenhum investimento a recomendada pela teoria econmica209.
206 207
. Veja HAUERT, Chr. et al. "Op. cit.", idem. . Veja SIGMUND, K., FEHR, E. & NOWAK, M. A. "The Economics of Fair Play", p. 86. 208 . Veja SIGMUND, K., FEHR, E. & NOWAK, M. A. "Op. cit.", idem. 209 .Ver SIGMUND, K., HAUERT, C. & NOWAK, M. "Reward and Punishment in Mini Games", 1, p.1.
112
A punio com a imposio de uma multa instrumento eficaz para incentivar a formao de uma empresa economicamente produtiva. Em geral, essa punio acarreta em um custo para todos os jogadores, uma vez que a multa e a taxa de cobrana, respectivamente imposta ao desertor e paga pelos outros jogadores revertida para a banca. Outra maneira de estimular a participao no investimento mtuo promover recompensas que restituam parte da aplicao ao investidor. O mecanismo da premiao funciona da seguinte maneira: os jogadores devem responder simultaneamente se desejam enviar um presente aos outros jogadores. Assim, quem manda um presente tem um custo (-c) e quem recebe, um ganho (g). O doador tem a opo de receber parte de seu investimento. Quando o custo da premiao igual ao bem produzido pela cooperao do outro jogador, ento interpretado como uma restituio. Nesse tipo de situao, podem acontecer duas coisas. Primeiro, os cooperadores podem passar a desertar se no recebem nenhuma recompensa. Ou, em segundo lugar, os desertores podem tornar-se cooperadores em funo da premiao. Em todo caso, tal como na punio, a estratgia egosta no presentear ningum, devido ao custo de faz-lo210. Para que um Bem Pblico seja adquirido, preciso que a soma das contribuies de cada jogador seja maior ou igual ao custo da sua produo. Cada um, entretanto, est disposto a pagar um valor que esteja abaixo ou igual ao seu preo de reserva para obteno do bem comum. O preo de reserva representa o mximo que um comprador est disposto a pagar ou o mnimo que um vendedor pretende receber. Quando a soma dos preos de reserva de cada investidor menor do que o custo da aquisio do produto ou servio, nenhum bem pblico gerado e as partes conservam suas quantias iniciais que podem ser gastas no consumo de bens privados. Um bem pblico s ser adquirido se a utilidade deste e os valores restantes forem maiores do que a manuteno dos valores originais sem nenhum bem pblico, para cada um dos investidores. Porm, se h o conhecimento de que o preo de reserva de um jogador maior que o custo do Bem Pblico, os outros jogadores devero deixar que este arque sozinho com a compra deste produto ou servio, sabendo que aquela parte, se possuir riqueza suficiente, adquirir o bem de qualquer modo. Nesses casos, a tendncia que os outros participantes "peguem carona" no esforo do outro em ter o bem, aproveitando-se das externalidades que eventualmente venham a ocorrer, j que os benefcios ou malefcios do consumo daquele bem pblico ser distribudo igualmente entre todos envolvidos211. Punir a desero ou premiar a cooperao so dois mecanismos alternativos, cujos resultados so estabilizados quando se constri uma reputao de duro retaliador ou generoso doador. No entanto, a formao da reputao algo que s melhor avaliado em jogos do Ultimato, um caso especial do modelo de Bens Pblicos, para duas partes em interao com movimentos alternados. No obstante, os experimentos de Sigmund, Hauert e Nowak mostraram que a premiao com reputao menos estvel do que a simples punio212. Os jogos dos Bens Pblicos apresentam os aspectos cruciais de cooperao em sociedade. Os resultados timos s so obtidos se todos cooperam. Entretanto, "pegar carona" uma tentao premiada, enquanto quem contribui ficar com o pagamento simplrio. Se ningum coopera, a punio no usufruir de nenhum bem comum. O
210 211
. Veja SIGMUND, K., HAUERT, Chr. & NOWAK, M. "Op. cit", 6, p. 8. . Veja VARIAN, H. R. Microeconomia, cap. 35, pp. 691-696. 212 . Veja SIGMUND, K., HAUERT, Chr. & NOWAK, M. Idem, 7, pp. 11-12.
113
meio ambiente, a segurana social, a defesa do territrio nacional so ameaados por esse dilema de toda uma sociedade. Uma comunidade onde prevaleam desertores, agentes solitrios preferem no participar do jogo e receber o pequeno pagamento de seu prprio esforo, independente de outros jogadores. Os solitrios conseguem obter melhores resultados do que um grupo de desertores, embora seus ganhos sejam menores do que os dos cooperadores. Agentes solitrios so, portanto, uma terceira alternativa estratgica intermediria, entre desertores e cooperadores. Os desertores so uma linha de ao que domina os cooperadores. Mas os solitrios dominam os desertores, pois, ainda que seus ganhos sejam pequenos, no sofrem os custos da participao de uma sociedade com os desertores. O ciclo fecha-se novamente quando cooperadores dominam o ambiente dos solitrios, devido a seus altos ganhos. Modelos dinmicos e evolucionrios dos Bens Pblicos sugerem que um mecanismo de troca entre essas trs estratgias - desero, independncia e cooperao -, que adapte o jogador para a situao vivida, permite sustentar o dilema social e tornar consistente o convvio entre esses tipos de agentes. Nesse sentido, a opo de participar da interao tornaria a cooperao possvel, ao invs de faz-la obrigatria213. A reciprocidade que no Dilema dos Prisioneiros chega a ser um conselho til, em um jogo com muitos agentes perde fora e deixa de ser uma soluo vivel, se no houver uma instncia que execute as punies no lugar dos cooperadores que desejam aplicar uma penalidade. Os Bens Pblicos colocam para um nmero grande de jogadores, em rpida interao, a necessidade da punio ou premiao. Mas essa soluo exige que os desertores sejam identificados. Se essa identificao no possvel, a opo de abandonar a interao com tais desertores passa a ser uma alternativa eficaz, pois evita a explorao e permite que a cooperao seja voluntariamente retomada, depois, sem uma instituio que exera a retaliao. 5.2 O Carona Free-rider O problema do carona (free-rider) foi objeto de discusso filosfica sob vrios ngulos. J na Repblica - livro II -, Plato esboou na fala de seu irmo Glucon a descrio do comportamento de pessoas justas ou injustas submetidas a uma conveno que forada a respeitar. Ficou famosa a histria fabulosa do anel de Giges, um pastor que achara um anel mgico capaz de tornar invisvel quem o usasse voltado para palma da mo, recuperando a visibilidade depois de ser girado novamente para o lado externo. Uma vez de posse do poder da invisibilidade, algum tomado pela ambio procuraria tirar vantagens cometendo toda espcie de injustia, apoderando-se dos bens alheios, sem se preocupar em ser apanhado. Tal ao pareceria a mais racional possvel para quem tivesse usando o anel, pois atenderia sem maiores objees aos anseios de suas paixes pelos bens materiais livre das restries legais e da chance de ser capturado214. As aes de um egosta consequente tratadas de modo pioneiro por Plato foram retomados pelo contratualismo moderno de Thomas Hobbes, em Leviat. Hobbes reapresentou e defendeu uma concepo de justia apoiada nas leis e convenes formadas por um contrato, que teria na fundao do Estado civil, a maneira mais adequada de se tornar vivel. O personagem Giges ressurge no captulo XV do Leviat
213 214
. Veja MICHOR, Fr. & NOWAK, M. A. "The Good, the Bad and the Lonely", p. 679. . Veja PLATO, A Repblica, liv. II, 359d - 360d.
114
como o tolo que pensa na justia como algo artificial e inexistente em seu ntimo. Negando a validade dos pactos, os tolos consideram defensvel, sempre que puderem no cumprir os acordos, toda vez que isso trouxer benefcios ao transgressor215. Tambm David Hume viu as consequncias de uma ausncia de resposta formal para quem no possua nenhum sentimento moral - vergonha ou orgulho, por exemplo capaz de motiv-los a agir em favor da virtude. Hume sugere haver uma espcie de auto-contradio daquele que chamava de patife esperto, mas no tem, seno apelado para uma fraqueza de vontade, como explicar e, por conseguinte, refutar atitudes egostas a no ser defendendo a nobreza e o prazer de agir conforme a reputao de um homem honesto. Tal pessoa tem, alm disso, a frequente satisfao de contemplar os patifes que apesar de toda sua astcia e habilidade, so trados por suas prprias mximas e que, ainda que em seu propsito seja roubar de uma forma secreta e controlada, se surgir uma oportunidade tentadora, a natureza fragil e caem na armadilha, de onde nunca conseguem sair sem a perda total de sua reputao e de toda futura confiana e f por parte da humanidade (HUME, D. Investigao sobre os Princpios da Moral, se. IX, part. II, pp. 156-157). Alm dos filsofos mais importantes, a tentao de desertar vem sendo alvo de pesquisas nas reas de conhecimento interessadas na investigao do comportamento humano. Aquilo que parecia atingir apenas conceituais de uma determinada corrente filosfica, a contratualista, revelou-se como um problema geral da conduta humana, ora descrito como a tragdia dos comuns, pelo bilogo Garrett Hardin, ou altrumo recproco, pelo evolucionista Robert Trivers, dilema social, pelo economista Howard Raiffa, entre vrios autores e cientistas contemporneos. Os jogos dos Bens Pblicos talvez estejam a revelar os elementos definitrios comuns a todas as sociedades, desde a pr-histria at a civilizao global216. Enquanto o dilema dos prisioneiros procurava explicar como a cooperao pode emergir entre agentes egostas que tm na desero sua estratgia dominante, os bens pblicos tentam mostrar como as sociedades podem se manter unidas, mesmo sabendose que os desertores, individualmente obtm os melhores resultados da cooperao dos outros. No dilema dos prisioneiros, a retaliao e o comportamento recproco funcionam graas proximidade e o contato direto entre os dois agentes. Para promover os Bens Pblicos, entretanto, essa soluo torna-se problemtica, pois o nmero maior de participantes dificulta a punio imediata. Todavia, esta punio s eficaz se alm de atingir com firmeza o desertor, seja tambm custosa aos cooperadores. Assim, para punir a desero com multa, toda a cooperao deve sentir seus efeitos de um modo geral, fazendo com que todos esperem que tais aes no ocorram novamente. A punio eficaz depende da identificao correta do jogador de quem se cobrar a multa. Um participante dos Bens Pblicos sempre pode considerar que o montante aplicado pelos outros suficiente para aquisio desse bem e se satisfazer com a parte que usufruir deste sem nada mais contribuir em troca. Nesse caso, ser o ltimo a jogar torna-se vantajoso para quem preferir no fazer contribuio alguma quando os outros j supriram com o necessrio e no podem mais voltar atrs em suas dotaes. Por outro
215 216
. Veja HOBBES, Th. Leviat, part. I, cap. XV, pp. 86 - 87. . Veja HAUERT, Chr. et al. "Volunteering as Red Queen Mechanism for Cooperation in Public Goods Games", p. 1.
115
lado, aqueles que foram capazes de antecipar tal movimento preferiro esperar que os outros contribuam em seu lugar, deixando para o ltimo jogador o encargo pelo financiamento do bem comum. Jogado sequencialmente, os bens pblicos transformamse em ultimato no qual o ltimo jogador pode decidir ou no se pega carona ou recusa o fornecimento de tal produto ou servio para todos. Em alguns experimentos feitos sob o modelo dos Bens Pblicos, constatou-se o efeito pedaggico da aplicao de multas a desertores que tenham um custo para os cooperadores, ainda que pequeno. Os mesquinhos foram ensinados a contribuir para o benefcio de todos. Agir contra os prprios interesses, passou ento a promover maiores ganhos a longo prazo. Porm, quando os grupos que aplicaram multas foram desfeitos e seus participantes transferidos para novos grupos formados por desconhecidos, onde tal regra ainda no havia sido instituda, os investimentos comearam altos e quando a multa se fez necessria, os "caronas" foram punidos rigorosamente. Isso implica que alm do aspecto educacional da primeira experincia, o empenho de punir os transgressores produziu uma satisfao adicional proporcionada pela vingana, um prazer primitivo frente aos traidores submetidos. A vingana surge ento como um sentimento moldado pela evoluo que permite aos vingativos no se deixar explorar por aproveitadores em momentos difceis como guerra, fome ou peste. A punio pe os infratores em uma disciplina rgida nessas ocasies, onde a sobrevivncia do grupo est ameaado e a possibilidade de interao no futuro so escassas. O prazer da vingana sentida pelos indivduos que no tm a conscincia da implementao desse mecanismo evolutivo e a forma com que a espcie foi estimulada a aplicar a punio contra seus prprios interesses imediatos217. Sentimentos morais, como generosidade, amizade, vergonha, culpa, podem ser explicados por meio de raciocnios semelhantes aos que levam vingana nos jogos de Bens Pblicos. Portanto, teriam sido adquiridos ao longo da seleo natural, por proporcionarem um desempenho melhor na intricada rede de relacionamento social. Na prtica, a existncia de caronas, em meio a cooperadores tambm pode ser explicada, paradoxalmente, pelo xito da cooperao. Poucos mutantes desertores teriam um melhor desempenho entre cooperadores do que entre semelhantes desertores, como mostra o exemplo dos jogos entre Pombos e Falces218.
. Veja SIGMUND, K., FEHR, E. & NOWAK, M. A. "The Economics of Fair Play", p. 87. . Na Teoria dos Jogos Evolucionrios, o conflito entre pombos e falces tornou-se um modelo pioneiro do processo pelo qual uma estratgia presente em determinado grupo populacional pode mudar. O jogo Pombo-Falco foi analisado por John Maynard Smith e George R. Price no artigo "The Logic of Animal Conflict" (A Lgica do Conflito Animal), publicado na revista Nature, em 1973. A matriz do jogo Pombo x Falco possui a seguinte forma:
218 217
Pombos Coluna x Falco Falces Estratgias Falco 1/2(V - C), 1/2(V - C) Linha Pombo 0, V
Pombo V, 0 V/2, V/2
Dois indivduos competem por um recurso que expresso pelo valor V, que assegura um incremento na habilidade em sobreviver e reproduzir seus genes prxima gerao. O custo do conflito por este recurso causa algum prejuzo ao indivduo representado pelo valor constante C. A estratgia do Falco fortemente agressiva, o jogador inicia atacando e no pra at ser atingido ou seu oponente recuar. A estratgia do Pombo, por sua vez, pacfica, recua imediatamente se o oponente comea agir agressivo. Quando dois falces se encontram, lutam at que um seja seriamente ferido. Ambos tm a mesma chance de vencer e serem prejudicados, mas os custos dos danos causados so superiores ao valor do recurso. Se um falco disputa contra um pombo, este foge imediatamente, deixando tudo para o
116
A Soluo Filosfica para o Carona Cada um dos trs filsofos citados antes apresentou uma soluo para o problema dos caronas. A resposta de Hume aproxima-se da concepo evolutiva na qual a cooperao prevalece na sociedade por meio de um crescimento lento consolidado pelo hbito da obedincia ou pela educao. Ademais, o sucesso momentneo do patife esperto no compensaria a perda completa de sua reputao com os prejuzos decorrentes da falta de confiana que o outro lhe tinha. Logo, ao final das contas, na viso de Hume, o comportamento do carona seria considerado auto-contraditrio e, portanto, irracional. Embora o prprio Hume considerasse insatisfatrio esse tipo de resposta ao agente egosta, o apelo racionalidade era sua ltima cartada contra quem no tivesse qualquer sentimento de culpa por seus atos imorais219. O largo argumento tecido por Plato, na Repblica, aponta para a necessidade de se encontrar uma concepo transcendente de justia apoiada pela fundao de uma sociedade em que cada um exerceria suas funes de acordo com suas aptides na espera de receber suas recompensas segundo seu desempenho justo. Sem ter como avaliar as chances de um argumento metafsico, como o platnico, funcionar em condies concretas, a proposta de Plato joga efetivamente a soluo de problema do carona para um outro patamar idealista impossvel de ser implementado na prtica220. Entrementes, certo que a soluo platnica no se alinha sinceramente verso contratualista esboada por seu irmo Glucon. O contratualismo moderno foi fundado por Hobbes que via na posio do carona a postura de um tolo que faz um falso raciocnio de suas aes nada razoveis contra o cumprimento do contrato. Hobbes considerava, com todas as letras, o comportamento do carona contrrio razo apoiado no seguinte argumento: (...) Em primeiro lugar, quando algum pratica uma ao que, na medida em que possvel prever e calcular, tendo para sua prpria destruio, mesmo que algum acidente inesperado venha a torn-la benfica para ele, tais acontecimentos no a transformam numa ao razovel ou judiciosa. Em segundo lugar, numa condio de guerra, em que cada homem inimigo de cada homem, por falta de um poder comum que os mantenha a todos em respeito, ningum pode esperar ser capaz de defender-se, da destruio s com sua prpria fora ou inteligncia, sem o auxlio de aliados, em alianas das quais cada um espera a mesma defesa. Portanto, quem declarar que considera razovel enganar aos que no pode razoavelmente esperar outros meios de salvao seno os que dependem de seu prprio poder. (...) Portanto, algum que seja deixado fora ou expulso de uma sociedade est condenado a perecer, e se viver nessa sociedade ser graas aos erros dos outros homens, os quais ele no podia prever e com os quais
primeiro. Porm, dois pombos preferem sortear o bem, de modo que ambos tenham chances iguais de ganhar, sem, no entanto, se machucarem. Uma outra verso desse jogo sob a mesma matriz conhecida como jogo do galinha, um ritual muito difundido entre a juventude estadunidense - sobretudo em filmes como Juventude Transviada (Rebel without Cause, 1955), de Nicholas Ray (1911-1979) - no qual dois jovens jogam seus carros um na direo do outro, sendo que o primeiro a desviar perde ("o galinha"). 219 . Veja HUME, D. Investigaes sobre os Princpios da Moral, se. IX, part. II, p 156. 220 . Veja PLATO, Op. cit., liv. II.
117
no podia contar, portanto contra a razo de sua preservao (HOBBES, Th. Leviat, part. I, cap. XV, pp. 87-88). O argumento de Hobbes claro em atacar a irracionalidade do tolo, ou carona, em no cumprir os pactos acertados. Hobbes pressupe, todavia, que os agentes sejam capazes de retaliar ou punir sua desero sistemtica, sem recorrer a sentimentos morais para isso. Mas o que os jogos de Bens Pblicos mostram que, na ausncia de tais mecanismos de controle, a escolha racional de maximizar sua utilidade recai sobre a desero. Esta a estratgia dominante no Dilema dos Prisioneiros e no Dilema Social, recomendada pelos tericos economistas, apesar de gerar um equilbrio sub-timo a todos envolvidos. No h, portanto, que refutar o comportamento do tolo como irracional, se no houver nenhum instrumento de punio aos desertores. Hobbes, como todos os filsofos da tradio moderna e anterior, no conhecia a teoria dos jogos, embora trabalhasse os problemas comuns de modo intuitivo. Na situao do estado de natureza, o comportamento egosta de quem puder explorar a cooperao do outro racional, quando o dilema dos prisioneiros jogado apenas uma vez e os reencontros futuros so raros. No obstante, a soluo hobbesiana imaginada para oferecer uma resposta aos desertores correta: retaliar e punir. O que no caso dos Bens Pblicos exige tambm a fundao de um Estado que identificasse os desertores e aplicasse as penalidades cabveis. Hobbes tem razo em considerar o estado de natureza - o mundo dos desertores - um ambiente onde a vida dos indivduos " solitria, pobre, srdida, embrutecida e curta"221. Tem razo tambm em recomendar a cooperao, desde que haja garantias institucionais. Mas peca em considerar irracionais as aes egostas, nas condies j postas. Filsofos contemporneos - entre eles, Simon Blackburn de Ruling Passions e Ernst Tugendhat de Lies sobre tica - criticam o contratualismo hobbesiano como base em uma viso prxima a Hume e Kant. Isso significa adotar uma postura a favor da formao de sentimentos morais e uma deliberao universal pela validade das aes morais. A falha dessa linha de raciocnio esta na ausncia de uma explicao do modo como tais sentimentos e mtodos de avaliao podem ser constitudos evolutivamente, sem o concurso de tcnicas de retaliao e tolerncia ao longo da evoluo. O prazer de sentimentos nobres s pode emergir depois que programas eficazes em identificar desertores e cooperadores foram incorporados por geraes daqueles que sobreviveram ao primeiro confronto com os trapaceiros e puderam se reproduzir em maior nmero. O consenso, considerado vlido por todos os agentes, s se sustenta, sem a necessidade de interveno estatal, na medida em que a considerao dos interesses dos envolvidos se revelou capaz de, atravs de sucessivas iteraes prvias que restringiram as deseres imotivadas, evitar as consequentes perdas de uma retaliao subsequente. Tais acordos universais sobre normas vlidas surgem, portanto, depois que um altrusmo recproco foi consolidado e no na forma de um incondicional compromisso pela cooperao, como exigia o imperativo categrico. A extenso do Dilema dos Prisoneiros ao Dilema Social, representado pelos modelos de jogos de Bens Pblicos, obrigam que haja uma reviso da carga da argumentao filosfica tradicional que ainda se reproduz entre os filsofos contemporneos. Anlises implementadas pelos tericos dos jogos sobre os diversos pontos que influenciam a tomada de deciso em interaes com um ou mais atores mostram que solues simples precisam ser complementadas com novas abordagens
221
. HOBBES, Th. Op. cit., part. i, cap. XIII, p. 76.
118
que incorporam gradualmente os elementos que determinam uma escolha adequada, segundo uma abordagem mais complexa e prxima s condies concretas do dia-a-dia. O caminho que conduz ao detalhamento crescente dos modelos de simulaes s pde ser trilhado depois que jogos mais simples foram estudados antes. Nesse sentido, a filosofia atual tem nos modelos oferecidos pela Teoria dos Jogos e da Cooperao as ferramentas mais precisas elaboradas at o momento para testar suas hipteses e resolver aporias que se perpetuam ao longo dos sculos. O problema do carona no encontra soluo definitiva em nenhuma corrente filosfica tradicional. Para tratar esse problema preciso levar em conta os aspectos conceituais e os princpios que sustentam. Os jogos dos Bens Pblicos e proporcionam o cenrio virtual adequado para que essas teorias sejam trabalhadas, a fim de que respostas plausveis sejam esboadas em funo de efetiva avaliao dos seus resultados em contextos, seno reais, ao menos verossmeis. 5.3 Punio e Estado
A vigilncia e a punio, funes que o contratualismo moderno atribuiu a instituies como Estado civil, so mecanismos que surgem no modelo de jogos de Bens Pblicos para restringir as deseres e manter estvel a cooperao entre os agentes economicamente racionais. No processo evolutivo da espcie homo sapiens sapiens, sentimentos de vingana podem ter surgidos como uma forma de consolidar estratgias retaliadoras no programa que rege seu comportamento em relaes que envolvam mais de duas partes interagindo entre si. Por outras razes que no foram a princpio fundadas em jogos sociais, os contratualistas defenderam a validade moral das sanes externas, a fim de fazer valer o cumprimento dos pactos. Entre filsofos contemporneos, h srias crticas contra solues calcadas apenas em sanes externas para o estabelecimento da cooperao ou da condio moral de acordos mantidos por estes meios. O filsofo analtico Ernst Tugendhat, em Lies sobre tica (1993), atacou esse estatuto da moralidade contratualista, considerado por ele, quela poca, no mximo, uma "quase-moral". Isso porque, na sua concepo, no seria possvel fundar uma conscincia moral simplesmente por meio de punies externas. O contratualismo, assim, no teria como reivindicar tal conscientizao, uma vez pressuposto a racionalidade instrumental de suas aes voltadas primeiro para a maximizao da satisfao dos interesses dos agentes. O contratualismo anuncia uma fundamentao compreensvel e correta, s que fundamentado no em uma moral, mas uma quasemoral. Naturalmente, tambm no pode ser uma moral o que fundamentado em caso particular - no podem existir no contratualismo, sendo ele consequente, juzos de valor com pretenso de fundamentao -, mas fundamentar-se (apenas) porque bom para o indivduo seguir tais regras. fundamentado um ser bom relativo para cada um (TUGENDHAT, E. Lies sobre tica, IV lio, p. 83). O passo que falta ao recurso da sano externa e da fundao de um Estado que vigie e imponha multas aos transgressores para que seja forte o suficiente a fim de fundar a moralidade entre os agentes egostas est no reconhecimento de tais medidas como sendo bom no apenas para o indivduo, que ter seu ganho incrementado pela participao forada do outro na cooperao, mas para todos envolvidos. Isso exige um grau de cognio e racionalidade que a prpria teoria dos jogos e da cooperao, a
119
princpio, tratou de deixar de fora, evitando qualquer petio de princpio, com o propsito de encontrar as causas mais elementares para a preservao da cooperao com muitos indivduos. Por ter sido a primeira teoria a tratar da punio e do Estado como elementos fundamentais para formao de sociedades pacficas, o contratualismo pode ser entendido agora com a corrente filosfica afim ao trato das consequncias advindas das anlises realizadas pelos modelos de jogos de Bens Pblicos. Aos Bens Pblicos, falta ainda esse aspecto contratual que permitiria s partes se reunir para formar um corpo jurdico que visasse a contemplar os interesses individuais e coletivos simultaneamente. De fato, o mecanismo da punio e das recompensas atuam de modo semelhante aos objetivos apontados de forma tortuosa por Michel Foucault (1926-1984), em Vigiar e Punir (1975). A funo a qual tais recursos esto voltados a normalizao de um comportamento que precisa ser controlado para que se atinja um empreendimento comum. (...) Que aquilo sobre o qual se aplicam esses dispositivos no so as transgresses em relao a uma lei "central", mas em torno do aparelho de produo - o "comrcio" e a "indstria" -, toda uma multiplicidade de ilegalidades, com sua diversidade de natureza e de origem, sem papel especfico no lucro, e o destino diferente que lhes dado pelos mecanismos punitivos. E que finalmente o que preside a todos esses mecanismos no o funcionamento unitrio de um aparelho ou de uma instituio, mas a necessidade de um combate e as regras de uma estratgia (FOUCAULT, M. Vigiar e Punir, IV part. cap. III, p. 269). O que est em jogo nos modelos interativos analisados pela teoria da cooperao essa batalha surda entre interesses na sobrevivncia e reproduo subjacente seleo natural. Cada indivduo emprega as estratgias que lhes so disponveis e as regras melhor sucedidas passaro as geraes seguintes, perpetuando sua existncia e normalizando suas atuaes em sociedades. O carter normativo da punio, denunciado por Foucault, reflete-se tambm nas estratgias adotadas pelos jogadores no contexto dos dilemas dos prisioneiros e social. Isso significa que, tal como Luce e Raiffa j admitiam, a teoria dos jogos pode ser um instrumento vlido para proposies de enunciados normativos, ainda que condicionados adequao de suas regras a um conflito de interesses real ou a pressupostos de racionalidade para agentes orientados pelos resultados de atitudes. No sentido exposto po John Harsanyi, em artigo de 1993, agentes orientados pelos resultados procuram seguir as regras que levam a um fim almejado e no atribuem um peso significativo, para suas decises, utilidade do processo em si, mas sim dos ganhos obtidos222. Antes S, do que Mal Acompanhado Todo mecanismo de punio adotado nos jogos de Bens Pblicos tem o propsito de resolver os conflitos e interesses existentes entre as partes conflitantes, da mesma forma como Foucault intuiu no seu famoso livro sobre a priso. Essa guerra no declarada que subjaz a toda interao social, detectada pela teoria dos jogos e da cooperao, est no pano de fundo da argumentao contratualista moderna. S que,
Veja HARSANYI, J. "Normative Validity and Meaning of Von Neumann-Morgenstern Utilities", p. 312.
222
120
enquanto Hobbes no via uma alternativa prtica fora do contrato e da possibilidade de se aplicar multas por meio de uma instituio, o Estado, tericos contemporneos, notadamente os matemticos austracos do grupo de Christoph Hauert, mostraram a possibilidade de transformar o dilema social em uma interao voluntria em que se permita a coexistncia de desertores e cooperadores. Com a participao de um terceiro tipo de agente "solitrio" - que tem uma possibilidade de obter seu sustento de forma independente - embora os cooperadores no dominam a maior parte da populao, pelo menos no seriam explorados223. O modelo de Bens Pblicos voluntrio traduz o seguinte padro cclico de estratgias sua maioria coopera, o melhor desertar; mas se os desertores dominam, o melhor cair fora do jogo e agir sozinho, por conta prpria. Porm, se os solitrios prevalecem, ento, grupos pequenos de cooperadores podem prosperar, pois seus ganhos so maiores do que a mdia de todos grupos de estratgias. Desse modo, o jogo segue a dinmica do famoso Pedra-Papel-Tesoura apresentado na figura 1.3, onde nenhuma estratgia pode dominar a outra e no h um ponto de equilbrio em estratgias puras. Essa dinmica permite que a cooperao possa persistir ciclicamente, ao invs de desaparecer por completo, como no jogo compulsrio, sem punio. Assim, os solitrios so um tipo de agente que protegem os cooperadores. No jogo dos bens pblicos, a opo de cair fora permite aos grupos formar-se sobre uma base voluntria, e assim reiniciar a cooperao novamente. Mas cada jogador adicional leva a um retorno da diminuio e uma ameaa de incremento da explorao. Como na terra da Rainha Negra [Red Queen] que obriga todos a correrem e se manterem no mesmo lugar. Indivduos mantm suas estratgias ajustadas, mas a longo prazo no fazem melhor do que se a opo dos bens pblicos nunca tivesse existido. Por outro lado, a participao voluntria evita o impasse da desero mtua que ameaa qualquer empresa pblica em grupos grandes (HAUERT, Chr. et al. "Volunteering as Red Queen Mechanism for Cooperation in Public Goods Games", p.3). Hobbes no tinha como prever que o mecanismo da Rainha Negra224 de Alice no Pas do Espelho (1872), escrito dois sculos depois de seu Leviat (1651), poderia resolver a guerra de todos contra todos, sem a necessidade de contratos ou da fundao de um Estado. Entretanto, mesmo que soubesse, talvez no ficasse satisfeito com a dinmica cclica em que estgios de conflito, disperso e reunio tivessem que se alternar infinitamente para alguma cooperao ter de prevalecer de tempos em tempos. Um absolutista que era, no aceitaria por certo tanto desgaste por nada. E embora tivesse de reconsiderar a possibilidade de uma vida solitria e autrquica no ser to bruta e mesquinha como a desero permanente, por certo, continuaria fiel necessidade de punio para que fosse mantido um horizonte de oportunidade estvel, sob o qual se poderia tecer e realizar planos de vida longos e no intermitentes.
. Veja HAUERT, Chr. et al. "Volunteering as Red Queen Mechanism for Cooperation in Public Goods Games", p. 3. 224 . Red Queen uma personagem de Alice no Pas do Espelho, de Lewis Carroll (Charles Lutwidge Dodgson, 1832-1898), que na adaptao brasileira de Jos Bento Monteiro Lobato (1882-1948) recebeu o nome de Rainha Negra. Traduo essa que foi respeitada aqui. Veja CARROLL, L. Alice no Pas do Espelho, cap. II.
223
121
Entrementes, caberia uma reviso descrio da situao original do estado de natureza, admitindo uma alternncia de estados em sistemas dinmicos, fora do equilbrio - como as observadas em sistemas complexos pela teoria do caos. Mas essa especulao a mais seria igualmente anacrnica. No entanto, no deixa de ser tentador notar as semelhanas nos grficos resultantes da triangulao cclica em populaes finitas de indivduos que alternam as trs estratgias - desero, solitria e cooperadora e o grfico do ciclo de Lotka-Volterra para predador e presa. O terceiro elemento, o solitrio, provocaria o ligeiro desequilbrio que faz da ciranda das aes um atrator cuja periodicidade pode ser detectada por uma seo de Poincar225.
Figura 5.2 Dinmica Replicadora dos Bens Pblicos Voluntrio226
Figura 5.3 - Ciclo de Predao Lotka-Volterra
Os dilemas dos prisioneiros e social permitem abrir a porta para investigaes de outros campos interdisciplinares atravs de suas simulaes e testes de campo, como se ver no ltimo captulo. Uma das razes para o estabelecimento dessas pontes est na utilizao da linguagem matemtica que permite o encontro de resultados equivalentes a vrios campos afins: inteligncia artificial, teoria do caos, biologia evolutiva, economia e tambm a tica. A soluo do agente solitrio vincula a dinmica do jogo ao desenvolvimento cclico de alguns eventos naturais j estudados pela fsica ou biologia, no controle das populaes227. O solitrio dos Bens Pblicos voluntrio corresponde sada no DPI. Isto , em um DPI, um agente coopera at que o outro jogador deserte e ento sai imediatamente. A sada impede que o jogador seja explorado e age contra os desertores, impedindo que estes prosperem. Com isso, a mobilidade das populaes pode agora ser relevante para o entendimento da sustentao e determinao da cooperao228.
. A seo de Poincar um segmento de reta que atravessa o crculo traado por um fluxo contnuo cclico para determinar o movimento peridico de um ponto. Essa idia foi aplicada pelo matemtico francs Jules-Henri Poincar (1857-1912) na tentativa de resolver o problema de um sistema envolvendo trs corpos. Em uma regio do espao, imagina-se um plano transversal por onde passariam os corpos em movimento. Haveria periodicidade toda vez que a curva traada pelo objeto retornasse ao mesmo ponto dessa seo. Aos interessados em Teoria do Caos, recomenda-se a leitura da divulgao de STEWART, I. Ser que Deus Joga Dados?. 226 . Grfico reproduzido de HAUERT, Chr. et al. Op. cit., p. 2. As taxas de rendimento maiores do que dois (r > 2), no jogo dos Bens Pblicos com opo de sada, tm ponto fixo Q cercado por rbitas fechadas que representam a oscilao entre cooperadores, desertores e solitrios de modo semelhante ao ciclo de Lotka-Volterra com apenas duas estratgias. 227 . Veja LEWIN, R. Complexidades, onde se passa em revista as principais correntes tericas dessa rea de investigao. 228 . Veja AXELROD, R. "On Six Advances in Cooperation Theory", pp. 29-31.
225
122
De acordo com o modo como so elaboradas as estratgias, a busca por pagamento mais alto pode gerar uma oscilao permanente da frequncia em que as trs estratgias - desero, solido e cooperao - so alternadas nos Bens Pblicos Voluntrio. Contudo, a mdia de pagamento envolvida nessa troca frentica menor do que o resultado timo da cooperao plena. A ao voluntria de sair nos Bens Pblicos no produz necessariamente uma fixao dos cooperadores, mas proporciona um limite desero, previnindo a permanncia de desertores no seio da populao. " preciso outros mecanismos, tal como a punio para adquirir um regime estvel de total cooperao" afirmam Franziska Michor e Martin Nowak229 A despeito das objees de Tugendhat ao contratualismo, os jogos dos Bens Pblicos tm revelado que Hobbes tinha razo. Sem o mecanismo de controle e punio implementado pelo Estado, esperar que a natureza incorpore ao padro gentico o sentimento de vergonha ou culpa que o comprometa com uma ao moralmente aceitvel de cumprir os acordos no resolve os problemas enfrentados pelos seres vivos em sua gerao. Seria o mesmo que pretender que o trabalho de Ssifo tivesse fim e o rei da mitolgica Corinto pudesse descansar de seu castigo eterno, enquanto os desertores procriam em meio cooperao, sem um perdo divino. O estado de natureza pode no ser exatamente o mesmo descrito por Hobbes. A situao simulada no jogo voluntrio permite a convivncia de um terceiro personagem entre desertores e cooperadores, o solitrio. Todavia, as circunstncias continuam no sendo a melhor para todos, apesar de mitigada frente s condies precrias de soma zero da guerra generalizada. Efetivamente, a cooperao pode, em um processo longo e muito lento, surgir entre os organismos vivos em sua constituio celular. Genes e clulas que colaboram uns com os outros na formao de tecidos, rgos que formam todo corpo de um ser vivo. Entretanto, esse mesmo organismo est sujeito a ataques de micrbios invasores ou mesmo mutaes e mal funcionamento interno, que pem a sade do vivente em perigo. Entre as espcies, a cooperao tambm floresceu a ponto de sociedades terem se formado como hoje. Nos animais capazes de formarem suas prprias leis de convivncia, intuitivamente, a instituio do governo e do Estado civil veio em socorro daqueles que pretendiam forar sua segurana, aumentar a expectativa de vida e poder realizar seus planos de vida com maiores chances de xito. O mecanismo de punio faz, ainda que artificialmente, que a cooperao se estabelea com maior eficincia. Nesse sentido, estimula que estratgias cooperadoras evoluam e se tornem estveis ao longo do tempo, antecipando os efeitos desejveis da evoluo de sentimentos morais espalhados na multido. Faz o Estado e a punio aquilo que Immanuel Kant previa que fosse sua funo: organizar a sociedade de demnios, a fim de garantir a paz interna e externa at que o ser humano venha a superar sua criminalidade e agir conforme a razo de maneira incondicionalmente boa. (...) O mecanismo da natureza atravs das inclinaes egostas, que se opem entre si de modo natural tambm externamente, pode ser utilizado pela razo como um meio de criar espao para o seu prprio fim, e regulao jurdica, e assim tambm, tanto quanto depende do prprio Estado, de fomentar e garantir a paz interna e externa (KANT, I. A Paz Perptua, B 62).
229
. MICHOR, Fr. & NOWAK, M. A. "The Good, the Bad and the Lonely", p. 679.
123
5.4
A Cooperao nos Bens Pblicos
A reao de quem participa de jogos como os dilemas dos prisioneiros e social, registrada pelo economista estadunidense Howard Raiffa, de estranheza frente situao em que se encontram. Por vezes, manifestam-se dizendo que deveria haver leis que impedissem tais circunstncias virem ocorrer. Em geral, imaginam que o erro est na estrutura do jogo e no em seus prprios comportamentos. Poucas pessoas conseguem perceber o que representa exatamente esses modelos de jogos e como se mantm a cooperao, em funo do maior benefcio geral, enquanto, a maior parte dos colaboradores age por confuso ou m interpretao das regras230. Esses modelos simplificados funcionam no sentido de isolar os componentes que influenciam o comportamento dos agentes em contextos reais. Os Bens Pblicos correspondem a problemas, em geral, associados com os efeitos da poluio, elaborao de oramento governamental, pagamento de impostos, entre diversas outras aes individuais que produzem resultados que afetam a todos participantes igualmente. A estranheza ocorre porque a simplicidade desses jogos, desprovidos de qualquer valor particular que as pessoas constroem para justificar seus atos, acaba revelando o comportamento que muitos preferiam manter escondidos sob a mscara de pessoas dignas e honestas. Os modelos de jogos desmontam as histrias que muitos levam anos construindo sobre si mesmo, fazendo florescer os seres inseguros e egostas preocupados em sobreviver e reproduzir. Os efeitos dramticos da ao humana sobre o meio ambiente, apoiado piedosamente por religies que simplesmente consideram a espcie homo s. sapiens privilegiada pela criao, so resultados nefastos do comportamento detectados por essas singelas simulaes. Todo problema levantado pelos Bens Pblicos est em encontrar um meio para evitar que os agentes voltados para os seus prprios interesses no se tornem caronas, mas continuem contribuindo com os valores necessrios para o provimento do bem comum. A teoria demonstra que voluntariamente isso no ocorre. No obstante, h uma averso bem difundida contra ser explorado e receber o pagamento simplrio. Por conseguinte, aqueles que naturalmente cooperam devem ter disposio para punir os caronas, se no quiserem ser explorados, a despeito dos eventuais custos da aplicao dessa punio. No dilema dos prisioneiros iterado, a punio decorre da estratgia dominante escolhida em conjunto e a reciprocidade exigida diretamente pelas duas partes envolvidas. Ampliando o nmero de participantes, a reciprocidade nos bens pblicos ocorre positivamente quando a contribuio dos outros estimula a colaborao de cada um. Porm, desde que os primeiros torneios ecolgicos de DPI, se sabe que a cooperao mtua pode ser explorada por uma minoria egosta que se aproveita da ao dos outros e nada retribui em troca, se no for retaliada. Sem poder retaliar diretamente ao carona, outros agentes tm como alternativa agir da mesma forma, negando sua participao na cooperao. Nesse caso, entretanto, as pessoas so induzidas a reproduzirem as escolhas egostas, diminuindo sua cooperao inicial. Uma punio direta poderia reverter essa tendncia desero, inibindo os caronas, a fim de que a cooperao no deteriorasse por completo. Os testes mostraram que mesmo uma minoria de cooperadores, se pudesse aplicar multas custosas
230
. Veja RAIFFA, H. El Arte y la Ciencia de la Negociacin, XXV, p. 337.
124
maioria de desertores, poderia fazer com que a cooperao prevalecesse, ainda que nenhum ganho imediato fosse obtido por aqueles que punem - j que o valor da multa revertido para a banca ou simplesmente desaparece do jogo231. Quanto mais pesada a multa, maior a disciplina observada entre os cooperadores. Assim, a punio funciona como um incentivo cooperao que encoraja a confiana naqueles que desejam cooperar de boa vontade. Contudo, h um limite para multas muito altas, uma vez que estas acabam reduzindo o estoque de valores disponveis para aplicao no fundo mtuo, pois retiram quantidades significativas dos caronas e parte dos bens dos cooperadores, que so obrigados a pagarem os custos da cobrana. No incio, portanto, as quedas no rendimento so sensveis, porm na medida em que os efeitos disciplinares e pedaggicos das penalidades forem sendo compreendidos, a tendncia haver um ganho nos pagamentos. "Para obter esses ganhos - advertem Fehr e Gchter - necessrio estabelecer a credibilidade plena da ameaa de punio com punio reais"232. Nesse sentido, os jogos de Bens Pblicos servem como aproximao para o trato de normas sociais a serem estabelecidas para manuteno da cooperao, alm daquelas outras abordagens mencionadas antes. Por normas sociais, entende-se o comportamento regular sobre algo que se acredita que deva ser feito, caso contrrio, uma sano social informal ser mobilizada. Assim, uma norma social pode ser pensada como um tipo de bem pblico comportamental em que cada um poderia fazer uma contribuio positiva - isto , cumprir a norma social - tambm onde indivduos precisam estar dispostos a vincular a norma social com sanes sociais informais, mesmo com algum custo imediato para si mesmo (FEHR, E. & GCHTER, S. "Fairness and Retaliation", p. 9). Tal como na intuio do contrato hobbesiano, norma social no se requer que seja explicitamente regulada. Basta que se adote um comportamento semelhante ao observado no relacionamento familiar, com a vizinhana ou mesmo em clubes e associaes informais. As normas sociais, dessa forma, podem reger o uso de recursos em um fundo mtuo, ou resolver o problema da invaso de terras e disputa entre latifundirios. Generalizadas na sociedade, as normas esto por trs da participao informal voluntria que est na base do convvio comunitrio. Contudo, por ser formal e se aplicar a qualquer tipo de agrupamento, nem sempre as normas sociais regulam aes desejadas pela sociedade em geral, sobretudo quando adotada por cartis, pelo crime organizado, por polticos e empresrios corruptos etc. Por serem informais, sua validade moral depende do contexto em que constituda, bem com da rea de sua atuao233. O que vale dizer que os jogos de Bens Pblicos no implicam necessariamente na fundao de um Estado civil, como a antiga pretenso de Hobbes. No obstante, exige que haja ao menos a formao de um grupo social que sirva de apoio s aes coordenadas de indivduos para elaborao de uma determinada atividade, cujo fim s pode ser atingido atravs da participao de mais de dois jogadores. As normas e seus mecanismos de punio dependem do grupo ao qual esto vinculados. A reciprocidade exigida decorre ento de uma propriedade emergente da associao de agentes egostas em torno de um fim a ser alcanado em conjunto.
231 232
. Veja FEHR, E. & GCHTER, S. "Fairness and Retaliation", pp. 6/7. . FEHR, E. & GCHTER, S. "Cooperation and Punishment in Public Goods Experiments", p. 991. 233 . Veja FEHR, E. & GCHTER, S. "Fairness and Retaliation", pp. 9 e 10.
125
Apenas quando a quantidade de agentes excede um patamar em que no possvel aos participantes aplicarem por si mesmos as devidas sanes aos desertores, por causa da dificuldade de identificao dos caronas, que se faz necessria a montagem de uma aparato externo ao grupo, com intuito de restringir as aes individuais e prever as aplicaes de multas aos que no podem ser atingidos diretamente pela retaliao do cooperador. Evolutivamente, a seleo dos arranjos culturais bem sucedidos - em geral, aqueles que mantm uma forte reciprocidade entre seus membros - pode ter gerado as condies para que uma instituio maior fosse aceita como rgo de controle das diversas associaes. Por conseguinte, a cooperao em sociedade foi favorecida sob esse aspecto234. Tambm contribuem para cooperao com muitos participantes, alm do medo da punio, a conscientizao, o hbito e fatores culturais da sociedade. Mas o fator evolutivo que torna a imposio de penalidades, com custo para os cooperadores, algo vivel de ser recomendado o prazer da vingana que surgiu na espcie Homo s. sapiens. Nos experimentos em que havia a mudana na formao do grupo, com os participantes sendo remanejados para novas associaes, os associados que haviam tido enfrentamento com caronas antes sentiram uma especial satisfao em punir os novos desertores, superando at mesmo o interesse pelo desempenho econmico geral do fundo comum235. Esse comportamento levou Karl Sigmund e colegas a suporem que "padres ticos e sistemas morais diferem de cultura para cultura, mas ns podemos presumir que eles so baseados em capacidades universais enraizadas biologicamente, do mesmo modo que centenas de diferentes linguagens so baseadas em um universal instinto da linguagem"236. Em ltima instncia, ainda que nenhum desses aspectos fosse suficiente por si mesmo, a cooperao poderia surgir periodicamente em situaes em que fosse possvel uma participao voluntria e no compulsria. Assim, depois da desero e da cooperao, essa terceira alternativa permitiria aos agentes cuidar deles mesmos, sem depender do outro, ou de uma associao com quem no coopera e tenta explorar os ganhos do fundo mtuo. Hora de Votar Outros modelos de jogos, que no a punio nos Bens Pblicos, so utilizados para analisar a maneira pela qual os recursos podem ser alocados, no intuito de viabilizar a realizao de um bem comum. O sistema de votao uma das alternativas mais empregadas nas sociedades democrticas. Trata-se de um mecanismo que s se aplica para jogos com mais de duas pessoas. E, quando a votao feita na ausncia de comunicao, assemelha-se a um dilema dos prisioneiros de mltiplas partes, ou o dilema social que foi discutido antes. Uma votao pode ser descrita como um jogo na forma normal, ou estratgica, onde uma lista de votao corresponde s linhas de ao que sero adotadas pelos eleitores. Estes tem conhecimento comum de todas opes e da maneira que a votao da maioria determinar os resultados finais. A maioria dos votos sobre uma estratgia indica a forma como o bem pblico ser ou no produzido. Se for possvel haver a comunicao prvia entre os eleitores, ento composies podem ser feitas em torno de
234 235
. Veja FEHR, E. & HENRICH, J. "Is Strong Reciprocity a Maladaptation?", p. 29. . Veja SIGMUND, K., FEHR, E. & NOWAK, M. A. "The Economics of Fair Play", p. 87. 236 . SIGMUND, K., FEHR, E. & NOWAK, M. A. Op. cit., idem.
126
um partido que defenda os interesses de seus membros. Cada jogador-eleitor procurar votar na estratgia que lhe for mais conveniente, maximizando sua utilidade237. Nessa descrio sumria, cujas variveis podem se ajustar a circunstncias especficas, quatro tipos de comportamento geral podem ser adotados. Primeiro, todos eleitores podem votar de acordo com uma nica estratgia. Segundo, a maioria de eleitores pode revolver agir conforme um outro princpio que no o da minoria. Em terceiro, cada um pode votar segundo seus princpios particulares. Por fim, a criao de blocos pode formar a maioria em torno das estratgias seguida por seus membros. O bloco, portanto, se apropria do bem comum em favor da sua associao. Na votao em bloco, os eleitores individualmente podem seguir seus prprios princpios, unindo-se na hora do escrutnio em bancadas que componham a maioria e favoream os interesses dos seus participantes. Assim, o bloco diferencia-se da maioria coesa que segue o mesmo princpio e no necessita de nenhuma negociao para ganhar a eleio. Na prtica, entretanto, a maioria pode se desfazer quando alguns de seus membros aproveitam para manobrar as votaes, a fim de atenderem apenas seus interesses particulares. Logo que essa estratgia percebida, o grupo majoritrio desaparece e cada um passa a votar segundo suas prprias preferncias, enquanto outros blocos passam a ser formados. E se no h comunicao prvia, uma votao passa a caracterizar um dilema social, ou dilema dos prisioneiros multipartidrio, onde a unanimidade o resultado cooperativo e o voto individualista a desero da maioria238. A manipulao dos resultados em uma votao pode ser feita sem que haja necessariamente uma fraude eleitoral. Basta apenas que o encarregado de estipular a ordem do que vai ser votado em dois turnos o faa do modo que lhe for mais conveniente. A manipulao da pauta de votao ser eficaz principalmente quando as preferncias dos diversos partidos forem intransitivas: A > B > C > A. Imagine, como sugere Hal Varian, que em um parlamento a ordem seja primeiro votar a proposta "A" e a alternativa "B". O resultado seria a vitria de "A". Depois, se fizesse escolher entre "A" e "C" - como a maioria prefere "C" a "A" (C > A) -, o resultado final desta sesso ser a vitria de "C"239. De outra maneira, caso se votasse em primeiro turno "C" contra "A" e, em seguida, a vitoriosa "C" contra "B", o resultado final seria o sufrgio de "B" (B > C). O nico modo da opo "A" vencer seria primeiro propor a votao entre "B" e "C" para depois colocar "A" na disputa com "B". O resultado final seria a esperada vitria de "A" (A > B). A manipulao do resultado por um agendador sagaz inevitvel quando as preferncias da maioria das pessoas no transitiva. A intransitividade das preferncias, que para muitos caracteriza uma irracionalidade ou pelo menos fraqueza de vontade no indivduo, foi detectada nos experimentos de Maurice Allais, nos quais as pessoas tinham de fazer suas escolhas em ambientes de incerteza240. Entretanto, no contexto social no possvel falar de irracionalidade da maioria, pois mesmo que cada indivduo mantivesse suas preferncias transitivas, ainda assim seria possvel ao grupo formar preferncias circulares. Por conta do "paradoxo dos eleitores", frequentemente, os resultados das eleies geram uma insatisfao e ineficincia na produo de um bem pblico, devido
237
. Veja DAVIS, M. D. Teoria dos Jogos, cap. 6, p. 193 e VARIAN, H. Microeconomia, cap. 35, 35.8, p. 705. 238 . Veja DAVIS, M. D. Op. cit., cap. 6, p. 194. 239 . Veja VARIAN, H. Op. cit, idem. 240 . Veja ALLAIS, M. F. Ch. "Le Comportement de l'Homme Rationnel Devant le Risque", p. 527.
127
inconsistncia de uma maioria dotada de preferncias manipulveis. A impossibilidade de solucionar esse problema de determinao das preferncias da maioria foi apresentado pela primeira vez com clareza por Edward John Nanson (1850-1936), no livro Transactions and Proceedings of the Royal Society of Victoria (Processos e Transaes da Sociedade Real de Vitria, 1882). O problema decorre do fato de um grupo preferir A a B; outro preferir B a C e um terceiro C a A. Individualmente, as preferncias de cada eleitor podem at ser coerentes e transitivas, mas as escolhas que fazem socialmente no so. Disto resulta que o conselho de orientar as pessoas a seguirem sua ordem de preferncia nem sempre determina a vontade de toda sociedade. Em consequncia disso, o economista Kenneth J. Arrow demonstrou seu famoso teorema de Bem-Estar Social como a inviavilidade de se descobrir uma relao de preferncias da sociedade que satisfizesse as seguintes condies: 1. A partir das preferncias individuais, para uma funo de bem-estar social garantir a preferncia A sobre B, ento esta funo deve sempre favorecer A, se uma nova relao de preferncias dos indivduos fizer de A mais preferida do que antes; 2. Quando A for parte do conjunto total de alternativas, se todos indivduos preferirem A a B, a sociedade preferir sempre A; 3. Existe sempre um padro de preferncia do indivduo que far a sociedade escolher uma alternativa existente entre seus membros; 4. Nenhum indivduo pode ditar as suas preferncias como sendo aquelas que a sociedade deve seguir. No h uma funo social que atenda essas quatro restries, pois se uma sociedade preferir A a B, a despeito das preferncias individuais, ento no haveria necessidade de se levar o grupo votao. Por outro lado, tal escolha tambm seria desnecessria se uma s pessoa fosse capaz de determinar o que a sociedade deve escolher, como no caso de uma ditadura. Portanto, nenhum indivduo poderia gerar as preferncias de uma sociedade, nem estas poderiam ser formadas pela vontade da maioria de votantes, da a impossibilidade do bem estar social se basear em preferncias individuais. O que faz da eleio um mecanismo pouco eficiente.
128
Captulo 6: Ultimato
No modelo dos Bens Pblicos, tem-se a extenso adequada do Dilema dos Prisioneiros para dilemas sociais, onde mais de duas partes devem decidir entre cooperar ou no em um empreendimento comum. Com muitos jogadores envolvidos, os Bens Pblicos mostram a necessidade de se ter um instrumento para impedir que desertores permaneam explorando a cooperao na ausncia de uma punio direta pela retaliao recproca entre as partes. Se, devido distncia entre os diversos agentes, a reciprocidade forte no pode ser efetuada, o que os Bens Pblicos ensinam que haja a instituio de um mecanismo que fiscalize e aplique as penalidades convenientes, a fim de inibir a desero e permitir que a cooperao seja estabilizada. Problemas sobre equidade so abordados pela Teoria dos Jogos preferencialmente no modelo de jogos do Ultimato. Esse tipo de jogo foi projetado pelo economista alemo Werner Gth, por volta de 1982. No Ultimato, dois jogadores tm a chance de dividirem entre si a quantia de $100, em notas. Mas para isso, preciso que o primeiro jogador, o lder, faa uma proposta ao segundo jogador de como repartir tal valor. Se este aceit-la, o jogo termina e os ganhos so distribudos. Porm, caso a oferta seja recusada, os $100 desaparecem e ambos ficam sem nada241. De acordo com a teoria, jogadores racionais egostas deveriam propor e aceitar uma diviso (99, 1), posto que o primeiro estar maximizando seus ganhos e o segundo receber um a mais do que zero. Todavia, essa previso contra-intuitiva falha outra vez em experimentos reais. Hal R. Varian registrou que testes feitos com universitrios estadunidenses apresentavam, em mdia, uma proporo de 55% para o lder e 45% para o outro, sendo essa proposta aceita "na maioria dos casos"242. Embora no seja uma diviso que possa ser considerada propriamente justa, como seria uma partio meio a meio, concordar com ela no deve ser considerado irracional, pois $45 esto prximos da maximizao dos ganhos esperados ($50). Fazer uma oferta favorvel a si mesmo um comportamento considerado racional para o lder. A rejeio daquelas que estivessem abaixo de 33% que seria interpretado como paradoxal da parte do segundo jogador, porque qualquer valor acima de zero seria melhor do que nada receber. Se as decises reais do recebedor divergem da previso terica, as explicaes adequadas para tal comportamento devem ser buscadas fora da racionalidade econmica, mas em fatores psicolgicos, culturais ou mesmo genticos. O modelo do jogo do Ultimato foi aplicado por pesquisadores da Universidade de Princeton que pretendiam estudar o envolvimento das emoes em decises relacionadas a ganhos de valores. Participaram dos testes 19 pessoas que foram submetidas ao exame por um aparelho de ressonncia magntica, a fim de se observar que reas do crebro eram ativadas, enquanto procuravam chegar a um acordo sobre a diviso. Os voluntrios foram informados que a diviso deveria ser feita com outras pessoas e com um computador, na mesma proporo. Metade das ofertas apuradas repartiam justamente em meio a meio, enquanto as demais tinham algum grau de desequilbrio. A ressonncia magntica revelou que trs regies do crebro estavam atuantes na avaliao desse tipo de oferta. Uma rea no centro do crebro, ativada frequentemente
. Veja GTH, W., SCHMITBERGER, R. & SCHWARZE, B. "An Experimental Analysis of Ultimatum Bargaining", in Journal of Economic Behavior and Organization, 3, 367-88, 1982. 242 . VARIAN, H. R. Idem, cap. 29, p. 575.
241
129
quando se percebe situaes de conflitos, chamada crtex cingulado anterior, foi acionada. Alm desta, a nsula anterior esteve presente sempre que se recebia uma oferta considerada injusta. As propostas recusadas provocavam a participao mais forte dessa regio, responsvel pela representao de estados mentais associados ira e decepo. Completando o quadro, o crtex pr-frontal dorso lateral foi a rea mais influente nas deliberaes sobre ofertas desequilibradas. Esse rgo trabalha sempre que haja tomadas de decises, fixando a meta a ser alcanada. Por conta disso, foi a regio mais intensamente ativa nas propostas aceitas243. A investigao antropolgica que procurou detectar a presena do Homo oeconomicus em diversas pequenas comunidades ao redor do mundo tambm teve como teste principal o Jogo do Ultimato. O Homo oeconomicus uma espcie fictcia inventada pelos economistas para encarnar a hiptese de que os indivduos agem apenas em funo de seus interesses pessoais e que para maximizar seus ganhos materiais, desconsideram a justia e a reciprocidade. Esse personagem irreal j vinha tendo sua existncia questionada por vrios experimentos em laboratrios que apontavam os desvios dos voluntrios desse comportamento padro. Para verificar se essas variaes apresentadas por estudantes universitrios das sociedades ocidentais repetia-se em ambientes culturais, ainda preservados dessa forte influncia comportamental, vrios pesquisadores dos Estados Unidos e da Europa distriburam formulrios a colegas em 12 pases espalhados em cinco continentes. Foram recrutados voluntrios em 15 pequenas sociedades que aparentavam comportamentos culturais e econmicos variadas sob condies diferentes umas das outras. Grupos de caadores e coletores; nmades, sedentrios e pequenos agricultores foram pesquisados. Tais comunidades jogaram o Ultimato, o Bem Pblico e tambm no terceiro jogo chamado Ditador244. Os resultados mostraram que o modelo cannico do Homo oeconomicus no resistia em nenhuma sociedade estudada. Esse padro no capaz de prever a ampla variedade de comportamento encontrada nas diversas sociedades. O grau de organizao econmica - a presena de prticas comerciais em interaes de mercado - interfere diretamente no nvel de cooperao observado. O nvel econmico do indivduo e variveis demogrficas no foram suficientes para explicar o comportamento de cada povo. E, por fim, o comportamento econmico da vida cotidiana transparecia nos resultados experimentados nessas sociedades245. O jogo do Ultimato jogado de uma s vez. Sob esse aspecto, o comportamento emprico dos seres humanos que conflitavam com a recomendao terica da repartio egosta parece ser contraditrio. Entretanto, se for jogado repetidas vezes o Ultimato permite que se perceba a evoluo da equidade, tal como o Dilema dos Prisioneiros Iterado promovia a emerso da cooperao. A possibilidade do lder obter alguma informao sobre as respostas anteriores feitas pelos recebedores mudaria radicalmente a configurao das ofertas propostas. Martin A. Nowak, Karen M. Page e Karl Sigmund realizaram pesquisas com uma variante do Jogo do Ultimato informado que teve como concluso a compreenso do papel chave da formao da reputao na escolha de solues "justas" para esse tipo de
243 . SANFEY, A.G. et al. "The Neural Basis of Economic Decision Making in the Ultimatum Game", in Science, 300, pp. 1755-1758, 2003. 244 . O jogo do Ditador uma variante radical do Ultimato que permite ao lder dividir a quantia segundo sua prpria vontade, destinando uma frao a um recebedor passivo que no pode rejeitar os valores propostos. 245 . Veja HENRICH, J. et al. "In Search of Homo Economicus", pp. 73-74.
130
situao. A consolidao de uma imagem de algum que rejeita ofertas baixas, ao invs de ser meramente considerada uma resposta emocional, pode ter sido privilegiada a longo prazo, por proporcionar ganhos prximos do timo de Pareto aos rebedores de tais propostas ao longo da evoluo. Isso explicaria a revolta que muitos sentem ao receber "esmolas" ou "migalhas" dos outros. Explicaria tambm o fato de muitos rejeitavam ofertas mesquinhas, mesmo sem nunca terem jogado esse jogo antes246. Geneticamente as pessoas invejosas moderadas teriam a seu favor uma reputao que obrigaria um comportamento real justo de quem se aproximasse para propor alguma interao que o envolve na soluo. A manifestao de tal gene ocorreria com clareza na forma simultnea do ultimato criada por Thomas Schelling, em The Strategy of Conflict , quando duas pessoas so obrigadas a dividir $100 entre si. Postos separados e sem nenhum contato que permita a comunicao prvia entre eles, deveriam decidir como partir o montante de modo que as propostas discordantes ocasionaria a perda do valor disponvel. O ponto focal neste caso recai na soluo justa meio a meio, no s por causa da mdia aritmtica bvia, mas porque a maioria se v como composta por seres semelhantes que no aceitariam nenhuma proposta que lhe fosse desfavorvel247. Pegar ou Largar Amide, os modelos de Bens Pblicos so implementados por meio de decises tomadas simultaneamente entre os agentes, podendo ser repetido por vrias rodadas. Uma outra maneira de aplicar esse modelo de jogo a uma dinmica de movimentos alternados com dois jogadores transform-lo em Ultimato. O jogo do Ultimato tem sua inveno relacionada com o aparecimento do artigo dos economistas alemes Werner Gth, Rolf Schmittberger e Bernd Schwarze, de 1982, intitulado "An Experimental Analysis of Ultimatum Bargaining" ("Uma Anlise Experimental da Negociao do Ultimato"). Trata-se, o Ultimato, de um Bens Pblicos simplificado, onde a banca oferece uma quantia fixa a dois jogadores que devem decidir como divid-la entre si. O primeiro jogador (o lder) deve ento fazer uma proposta de diviso ao segundo jogador (o receptor), que, por sua vez, deve responder se a aceita ou no. Caso aceite a oferta o dinheiro distribudo da maneira que foi sugerida pelo lder. De outro modo, a rejeio implica na devoluo de todo o montante banca que nada disponibiliza para ambos. No modelo do Ultimato, uma oferta alta da parte do lder significa um prmio de estmulo cooperao do outro. Em outras palavras, o benefcio que o receptor obtm igual ao custo da doao feita pelo lder. Por outro lado, ofertas irrisrias so passveis de punio pelo receptor. O custo da recusa, para este, equivale taxa paga banca, nos Bens Pblicos, para aplicar uma multa maior ao lder - to grande quanto o valor que este pretendia alcanar. Entre agentes egostas racionais, a teoria dos jogos prev que uma proposta de 99% para o primeiro jogador e 1% para o segundo deveria ser feita pelo lder e aceita pelo receptor. A razo dessa escolha ser considerada a mais racional est no fato do jogador A (o "lder") saber que a "folha" onde se encontra o resultado (99, 1) representa um equilbrio perfeito para essa pequena rvore, segundo a induo reversa (Figura 6.1). Na forma estratgica, ou normal (Figura 6.2), percebe-se tambm que a estratgia "b" domina fracamente a opo "a" do Receptor (jogador II), quando o Lder escolhe "B" e
. Veja NOWAK, M. A, PAGE, K.M & SIGMUND, K. "Fairness Versus Reason in the Ultimatum Game", p. 1774. 247 . Veja SCHELLING, Th. The Strategy of Conflict, cap. 3, p. 57.
246
131
fortemente, quando este joga "A". De qualquer modo, o Receptor o nico que possui uma estratgia dominante e o Lder pode explorar essa circunstncia se souber que o outro um agente racional. Se esse for o caso, o Lder no teria porque temer um desvio para "a", posto que dos dois equilbrios de Nash existentes nessa matriz, restaria apenas o equilbrio perfeito a ser escolhido depois da escolha de "A". Na forma normal ou extensiva, a recomendao para o primeiro jogador optar por "A".
Figura 6.2 Matriz do Ultimato Jogador II - Receptor
Figura 6.1
Estratgias Jogador I Lder A B
a (0, 0) l(50, 50)c
b l(99, 1)c (50, 50)c
Figura 6.1: Esquema de rvore
Contudo, no isso que ocorre na maioria dos testes realizados com pessoas em laboratrio e em campo. De acordo com Hal Varian, experincias feitas com estudantes estadunidenses apresentou ofertas para o receptor em torno dos 45% do total. Ofertas estas que eram, em geral, bem sucedidas248. O Ultimato jogado, geralmente, em uma s rodada com ofertas protegidas pelo anonimato. Porm, se permitido ao Lder saber que tipo de receptor enfrentar, alguns fatores importantes para compreenso dessas ofertas fora do padro terico podem ser detectados. Se o Receptor for algum incapaz de punir ou tenha a reputao de pessoa fria e racional, a tentao de desertar aumenta. Por outro lado, se o histrico do Receptor for de uma pessoa emotiva e pronta a manter sua fama de negociador "duro", o melhor talvez seja propor uma diviso mais equitativa prxima do equilbrio imperfeito, mas justo. Enquanto os lderes fizerem ofertas com o objetivo de maximizarem seu ganho, conforme a possibilidade de rejeio, as previses dos tericos estam salvas. O problema surge a partir do comportamento do receptor em no aceitar qualquer valor maior do que zero. A explicao que vem sendo fornecida por dezenas de trabalhos realizados em torno do Ultimato tem apelado para incluso de reaes psicolgicas, consolidadas durante o processo de evoluo da espcie Homo s. sapiens, no cerne de seus diagnsticos tericos. A aparente irracionalidade humana em oferecer e pretender uma diviso justa indica que algo mais est em jogo no Ultimato do que apenas maximizar a utilidade de interesses pessoais imediatos. O motivo mais provvel talvez seja o fato das pessoas entenderem o jogo como parte de uma interao que pode ser repetida outras vezes, mesmo quando se afirma expressamente que o jogo ser realizado em uma nica rodada. As pessoas sabem por experincia prpria que atitudes grosseiramente injustas so passveis de retaliao. Para evitar o risco de rejeio, procuram fazer propostas razoveis, do ponto de vista partilhado por sua comunidade. Dessa forma, tanto lderes, como receptores, conseguem manter sua reputao de bons negociadores, entre os seus. A recusa de propostas baixas tem um pequeno custo para o Receptor e um alto preo pago pelo Lder. Entretanto, a reputao construda de no oferecer nem aceitar "esmolas" favorece maiores ganhos no futuro, ao mesmo tempo que inibe tentativas de estabelecer uma distribuio desigual de recursos. A forma pura do Jogo do Ultimato simplifica muito a realidade cotidiana, ao evitar que haja uma contra-oferta, atravs da
248
. Veja VARIAN, H. Microeconomia, cap. 29, 29.7, p. 575.
132
qual as pessoas poderiam obter informaes umas das outras, desaparecendo e encerrando a negociao caso a diviso permanecesse desequilibrada, a ponto de no ser considerada vlida. No obstante, tais limitaes permitem que se avalie exatamente quais so os fatores que esto influenciando as deliberaes, mudando aqui ou ali as variveis que forem mais relevantes para anlise. Tais restries, ao invs de serem desvantajosas, deixam-nos estudar o comportamento humano em situaes bem definidas, descobrindo os princpios fundamentais que governam nosso mecanismo de tomada de deciso. O processo algo de semelhante s colises de partculas da fsica no vcuo, voltados para o estudo de suas propriedades (SIGMUND, K., FEHR, E., NOWAK, M. A. "The Economics of Fair Play", p. 84). O jogo do Ultimato vem sendo aplicado por neurocientistas atentos que buscam localizar na atividade cerebral as reas responsveis pelo processo de deciso observados por meio de tomgrafos computadorizados. Entre agentes humanos, o pleno conhecimento dos tipos que participam do Ultimato leva os jogadores a se comportarem de acordo com a norma social que manda cooperar e punir os desertores. Ao passo que, quando as ofertas so feitas por uma mquina, os receptores tendem a aceitar volumes mais baixos de dinheiro ao contrrio do que geralmente se observa entre dois humanos. Destarte, as propostas dirigidas a computadores so as mais desiguais possveis249. O sentimento de vingana que aflora no jogo dos Bens Pblicos aparece no Ultimato acompanhado pela indignao de ter sido alvo de um desertor. Nesses dois casos, a vingana definida por um custo ou risco que algum tem de correr para impor uma penalidade a quem obteve ou quer obter uma vantagem sobre a boa vontade do agente em cooperar. A vingana um sentimento moral internalizado que emerge naturalmente pelo desejo de impor um sofrimento a outra pessoa ou objeto que lhe tenha causado algum dano. Tal reao teria sido consolidada pela evoluo no repertrio de estratgias inatas a serem acionadas sempre que o sujeito se sentir prejudicado. Como afirma o socilogo noruegus Jon Elster, "esse tipo de comportamento universal"250. Uma norma social um outro mecanismo disposio das pessoas, a fim de poderem incorporar o sentimento de vingana ao de justia presente em muitas formas de organizao da sociedade, tais como a vendetta dos mafiosos. Assim, como nos Bens Pblicos e no Dilema dos Prisioneiros, a capacidade de retaliao permite que o medo de uma sano externa acabe por gerar maiores prejuzos no Ultimato. O medo da vingana suficiente para explicar porque as pessoas evitam uma diviso injusta, a despeito dos seus interesses pessoais. Isso refora o argumento de Hobbes e rebate as objees de Tugendhat, acerca do estatuto moral do contratualismo251. Implicaes do Ultimato Toda essa discusso sobre os sentimentos envolvidos na situao de ultimato provocam, ao menos, duas posies extremas e contrrias. Uma que considera necessrio, para consideraes ticas, que tais sentimentos estejam incorporados no indivduo, a fim de florescer uma conscientizao que reconhea as sanes externas como sendo algo com valor moral para expiao de suas culpa e vergonha, sentidos em
249 250
. Veja SIGMUND, K., FEHR, E., NOWAK, M. A. "The Economics of Fair Play", p. 84. . ELSTER, J. "Some Unresolved Problems in the Theory of Rational Behavior", p. 187. 251 .Ver HOBBES, T. Leviat, I part., cap. XV, p.94 e TUGENDHAT, E. Lies sobre tica, IV li., p.83.
133
foro ntimo. Outra posio argumenta que tais sentimentos pouca utilidade tm na satisfao de critrios de racionalidade, no momento em que se precisa tomar uma deciso sobre a conduta a ser adotada. De fato, reaes baseadas em regras preconcebidas e instaladas no agente sero de alcance reduzido se no permitirem que estas sejam capazes de se adaptarem s circunstncias novas que no estavam prevista pela programao prvia. Jogos como Ultimato, Bens Pblicos e Dilema dos Prisioneiros tm indicado que programas muito simples facilitam a vida do programador, mas dificultam a adaptao a ambientes mais complexos. As simplificaes so teis para ajudar a compreender quais so os ingredientes fundamentais das interaes, sem, no entanto, autorizar qualquer avano sobre o modo como as pessoas devero agir necessariamente dadas certas condies. O que no quer dizer que esses estudos sejam de todo vedados a proposies normativas acerca de linhas de ao recomendveis para determinadas circunstncias. Na Alemanha, dois pesquisadores do Instituto Max Planck para Pesquisa Psicolgica, Peter M. Todd e Bernhard Borges, analisaram o papel da racionalidade e o grau de complexidade suficiente para agentes que pudessem ser considerados socialmente inteligentes, a partir do jogo do Ultimato. Confrontaram propostas de alguns autores que defendiam a incluso de uma capacidade de aprendizagem por reforo e de outros que sustentavam ser o raciocnio dedutivo necessrio no s para compreenso dos problemas reais, mas tambm para imaginar os futuros obstculos. Discutiram, ainda, as hipteses contrrias utilidade de um lento processo que, ao invs de ajudar, dificultaria as tomadas de deciso. Posto que os resultados obtidos pelos agentes capazes de aprender com o reforo de experincias anteriores e prever novas aes seriam algo externo teoria dos jogos e que no faria parte de ser escopo de investigao252. Por sua vez, Todd e Borges no consideram essa objeo racionalidade definitiva. Para esses autores, o importante seria definir que tipo de raciocnio deveria ser acrescentado aos agentes sociais a fim de que estes pudessem resolver problemas como o do Ultimato. A maneira como seres humanos tm reagido s ofertas do ultimato esto prximas daquela adquirida por agentes dotados de uma regra de raciocnio behaviorista de aprendizagem por reforo. Ao lado da regra de reforo, acrescenta-se o raciocnio lgico que proporciona a cada um a capacidade de inferir as respostas do Receptor, a partir de informaes sobre sua aceitao das propostas anteriores. Assim, com base nesses dados, poder-se-ia antecipar suas reaes futuras em situaes semelhantes. Mantidas as mesmas condies, maiores seriam as chances de uma proposta igual ou maior historicamente aceita ser tambm exitosa. Essa mistura de raciocnio e aprendizagem, ao invs de sustentar o Ultimato na forma prevista pelos tericos dos jogos, com o tempo, encaminharia os resultados para o comportamento similar quele observado entre humanos que participam de experimentos com esse tipo de jogo - prximo da diviso equitativa meio a meio. Tal fuga da soluo perfeita (99, 1) dever-se-ia ao acrscimo do raciocnio que antecipa os resultados na forma da regra lgica que manda subir os valores ofertados, em vez de mant-los fixos, apoiados na suposio de que a aceitao de uma oferta baixa implica em uma regra do tipo "aceitar qualquer coisa". O fundamento dessa regra lgica est no fato de que se uma proposta foi aceita antes, uma oferta posterior um pouco maior dever necessariamente de ser aceita, se nenhum fato relevante tiver sido alterado.
252
.TODD, P.M. & BORGES, B. "Designing Socially Intelligent Agents for the Ultimatum Game", p. 135.
134
Contudo, interpretaes behavioristas pessimistas considerariam esse tipo de acrscimo de raciocno prejudicial aos resultados timos do lder, pois reduziria cada vez mais os seus ganhos a cada nova oferta. Sendo assim, a inferncia acrescentada ao ensino geraria resultados piores e distorceria o aprendizado. No obstante, a concluso pessimista dos behavioristas que considera irrelevante a incluso do raciocnio aprendizagem por reforo s se sustenta se o ambiente no qual Lder e Receptor tomam suas decises se mantiver sempre como est sem perturbaes. Entretanto, para cenrios dinmicos, o processo de adaptao aparece com maior complexidade e no se dever considerar apenas as propostas timas para o Lder, mas a probabilidade de recebimento de respostas negativas do Receptor como uma estratgia para elevar os ganhos futuros. Nesse cenrio estratgico, que considera as reaes do outro, agentes que atuassem apenas por reforo teriam os piores resultados se no levassem em conta a possibilidade de aumentar suas ofertas como um indivduo que raciocina e aprende. A incluso do raciocnio na aprendizagem torna mais flexvel e rpida a adaptao da oferta a novas situaes, previnindo respostas negativas, o que no seria possvel agindo apenas por estmulo e reforo. [E]m estudos complementares temos considerado os efeitos da coevoluo entre estratgias de ofertas e aceitao com nossa gama total de estratgias de raciocnio-mais-aprendizagem, e descobrimos mais uma vez que o complexo processo de coadaptao pode levar agentes ao comportamento do tipo humano em jogos do ultimato, mas muito mais rapidamente do que poderiam apenas aprendendo por reforo. Talvez seja o caso quando pretendemos modelar o nvel humano de inteligncia social em jogos simples, adicionando o tipo certo de raciocnio que podem gerar ganhos rpidos (TODD, P. M. & BORGES, B. "Designing Socially Intelligent Agents for the Ultimatum Game", p. 136). Uma variante radical do Ultimato permite avaliar at onde vai a generosidade do lder. O denominado jogo do Ditador d ao Lder a oportunidade de dividir os valores da maneira que achar melhor, enquanto o Receptor s pode aceit-la, sem jamais recusar. Nesse caso, no haveria ento que temer qualquer punio para ofertas egostas, uma vez que no cabe a rejeio por parte do outro. Mesmo assim, as partilhas ficam longe da previso terica e perto da diviso equitativa. No tanto como no Ultimato, mas razoveis, pelo que se poderia esperar. Novamente, a explicao para esse tipo de comportamento recai sobre a reputao que o lder tenta construir. Pois, a fama de "mesquinho" e mau cooperador poderia lhe prejudicar no futuro. Essa concluso reforada pelos resultados obtidos em uma verso ainda mais radical chamada de Ditador Duplo-Cego. Aqui as ofertas so feitas sem que o Receptor e experimentador saibam quem fez a proposta. S assim, protegido pelo duplo anonimato, o comportamento egosta finalmente aparece e o Lder, em geral, fica com tudo para si253. Tambm h uma outra verso do Ultimato hbrida ao Bens Pblicos que procura capturar a reciprocidade positiva atravs do Jogo da Confiana. Neste modelo, o Lder prope a sua diviso e a banca tripla o valor destinado ao Receptor que deve decidir se devolve parte ou tudo que recebeu ao Lder. Agora, o que acontece na maioria dos casos o envio do dinheiro por parte dos lderes e a devoluo de alguma quantia por parte
253
. Veja HENRICH, J. et al. "In Search of Homo Economicus", I, p. 75 e PINKER, St. Tabula Rasa, cap. 14, p. 351.
135
dos receptores, independente do montante envolvido. A reciprocidade entendida como resposta de um jogador a uma ao que foi feita pelo outro sem esperar nenhum ganho imediato, em favor da cooperao ou desero. No jogo do Ultimato, a punio da recusa corresponde reciprocidade negativa, observada em testes realizados por vrias culturas distintas. Enquanto, a reciprocidade positiva aparece estampada nas restituies dos valores feitos no jogo da Confiana254. 6.1 Um Teste de Thomas Schelling No comeo da moderna teoria dos jogos, foram lanados muitos livros que logo se tornaram clssicos contemporneos da matria. Ao lado do inaugural Theory of Games and Behavior Economics (1947), de Von Neumann e Morgenstern, podem ser listados Games and Decision (1957), de Luce e Raiffa, Theory of Games as a Tool for the Moral Philosopher (1955), de Richard Bevan Braithwaite e Lutas, Jogos e Debates, de Anatol Rapoport, entre outros. Muitos desses livros continham informaes especficas do contexto em que foram redigidos, no auge da Guerra Fria. Mesmo assim, as hipteses gerais que estavam subjacentes a eles permaneceram como uma contribuio perene e como fonte inspiradoras de teses que foram atualizadas depois. o caso de The Strategy of Conflict , de Thomas C. Schelling, com edies publicadas entre os anos 1959 e 1963. Esse livro trouxe uma ampla anlise sobre as tensas relaes internacionais de seu tempo, entretanto, forneceu tambm as bases do estudo de jogos de coordenao e do papel da comunicao, implcita ou explcita, na soluo de situaes em que as aes precisam chegar a um ponto focal que satisfaa os interesses de ambos encontrarem um lugar comum para poderem realizar seus ganhos, impossveis de serem alcanados por um agente solitrio. O conceito de ponto focal foi determinado a partir de uma srie de exemplos imaginados, onde indivduos com interesses divergentes precisavam escolher uma estratgia adequada para satisfaz-los, sendo obrigados a levarem em conta os interesses dos outros, a fim de serem bem sucedidos. Entre diversos experimentos apresentados no terceiro captulo de seu livro, Thomas Schelling imaginou um em que dois jogadores estavam na condio de terem de dividir uma quantia em dinheiro ($100) em duas partes, tal como no jogo do Ultimato. Contudo, diferente deste, os dois estavam isolados e tinham de fazer suas propostas simultaneamente, sem nenhuma forma de comunicao entre eles. Cada uma das partes se via ento envolvido em uma negociao tcita entre si, em que ambos tinham de coordenar suas aes com base em interesses, ao mesmo tempo, comuns e divergentes. Devido simetria existente, a diviso teria de ser igual, caso contrrio, ningum receberia nada255. Na ausncia de comunicao, jogadores so obrigados a observar o ponto de vista dos outros e a proporem uma soluo que considere os interesses dos envolvidos igualmente. O resultado meio a meio que, no jogo do ultimato original, surge apenas como uma hiptese que no est em equilbrio perfeito, no teste sugerido por Schelling, aparece como uma "dica" matemtica na qual os participantes reconhecem sua validade para aquela ocasio. Mas isso apenas um artifcio matemtico para jogadores que no podem se comunicar e saibam ao menos operar uma diviso corretamente. A igualdade
. Veja FEHR, E. & GCHTER, S. "Fairness and Retaliation", in Journal of Economic Perspective, n 14, pp. 159-181. 255 . Veja SCHELLING, Th. The Strategy of Conflict, cap. 3, p. 61.
254
136
da deciso resulta do conhecimento que as pessoas tm de que o outro, se for como o agente, querer maximizar os seus ganhos do mesmo modo. Por conta disso, no desejar obter ganhos menores do que a metade que estaria disponvel na distribuio de um bem entre indivduos com a mesma constituio. O ponto focal desse tipo de jogo recai sobre a repartio justa. E l que os rivais devem se encontrar caso queiram satisfazer seus interesses, em parte opostos, em parte convergentes. Devem, ento, coordenar suas aes para esse objetivo, embora os resultados lhes sejam sub-timos256. O ponto focal descoberto por Schelling em jogos de coordenao representa a soluo dos problemas apresentados nesses modelos de situaes. Trata-se de uma marca notria que reconhecida pelos participantes como sendo adequada para o encontro das aes de cada um. No caso da negociao explcita, como o Ultimato, essa representao acaba por influenciar a orientao da soluo que os jogadores devem adotar. E o acordo ltimo, no qual os participantes no podem mais recusar o acordo. A intuio do ponto focal acrescenta um detalhe a mais s outras explicaes oferecidas pelos pesquisadores sobre os resultados fora do equilbrio perfeito no jogo do Ultimato. (...) O resultado final precisa ser um ponto do qual ningum espere que o outro recuse, enquanto o principal ingrediente dessa expectativa que um pensa que o outro espera que o primeiro espera e assim por diante. De certo modo, fora desta situao fluida e indeterminada que aparentemente no prova nenhuma razo lgica para ningum esperar alguma expectativa que se espera ser esperada por esperar, uma deciso requerida. Essa expectativa infinitamente reflexiva precisa de alguma forma convergir para um ponto nico, ao qual cada um espera que o outro no espera ser recusado (SCHELLING, Th. C. The Strategy of Conflict , cap. 3, p. 70). A racionalidade do ponto focal est em busca de um lugar que satisfaa a incessante cadeia do pensamento recursivo entre pessoas que tenham conhecimento comum sobre os tipos que participam da interao. Esse argumento de racionalidade estratgica depende entretanto de uma suposio forte de que haja, entre aqueles que se vai encontrar, a possibilidade real do outro ser algum que procura maximizar seus ganhos como o prprio agente. Porm, se a informao partilhada for de que o outro possa ser considerado irracional e que no visa o melhor para si, a dificuldade imposta pela ausncia de comunicao ao ultimato esta em saber agora em que ponto de diviso entre os dois jogadores ser bem sucedida. Ainda que o agente quisesse tirar vantagem de sua informao sobre o tipo de irracionalidade do outro, no poderia fugir da orientao matemtica, devido impossibilidade de saber qual resultado seria mencionado. Independente da racionalidade atribuda aos agentes, a diviso simultnea e sem comunicao faz da soluo matemtica a nica resposta plausvel de ser aconselhada. A existncia de um ponto focal no jogo do Ultimato traz alguma complicao ao argumento que defende a retaliao e a vingana como aspectos cruciais para a tendncia de pessoas oferecerem e aceitarem propostas de diviso justa entre as partes. Do ponto de vista do experimento de Schelling, a escolha do ponto focal meio a meio resulta da procura de um marco que oriente as aes dos agentes em funo de um objetivo que os livre do pensamento recursivo. Mas agora, jogado sequencialmente, a teoria dos jogos sugere que as opes atendam ao ponto de equilbrio perfeito e no ao
256
. Veja SCHELLING, Th. Op. cit., cap. 3, p. 65.
137
foco racional. E, no entanto, seres humanos parecem dividir prximos soluo intuitiva de Schelling, ao contrrio do que previa as concluses tericas. Isso significa que, ao invs de estarem preocupados com a punio que o outro lhe faz para vingar uma proposta egosta, o jogador que prope uma repartio perto do ponto focal, pode estar tentando tirar vantagem da tolerncia do receptor ao desvio dos valores que talvez tivesse em mente se a oferta de diviso fosse feita simultaneamente. Assim sendo, no seria necessrio buscar uma explicao fora do mbito da matemtica ou da psicologia da racionalidade estratgica para entender tal atitude. Principalmente, quando tais negociaes so feitas em um primeiro contato entre os jogadores que no tm informao recproca um sobre o outro, alm do conhecimento comum de que ambos devero agir racionalmente. A diferena entre o jogo simultneo e sem comunicao, para o ultimato est apenas na alternncia de movimentos de oferta e contra-oferta. Realizado em dois lances, a negociao estimula propostas arriscadas que explorem a margem de erro em torno da soluo matemtica do ponto focal. Ao contrrio de se imaginar que o lder suspeite da irracionalidade do outro recusar sua sugesto, ao fazer uma proposta equitativa, de fato ele poder estar testando a sua racionalidade em preferir divises diferentes do meio a meio. Mas no to longe que possa ofender sua presumida inteligncia. A existncia de um ponto focal alterar ligeiramente o enfoque das pesquisas feitas sobre a conduta baseada no ultimato. (...) Algum h de ter razo por fincar fortemente sobre uma posio, e ao longo do contnuo de posies qualitativamente indiferenciveis, ningum encontra racionalidade. O racional pode no ser forte em um "ponto focal" arbitrrio, mas ao menos ele pode defender-se com o argumento "se no aqui, ento onde?"(SCHELLING, T.Op.cit., idem). O jogo do Ultimato, jogado simultaneamente, torna-se um jogo de coordenao das aes, por causa da ausncia de comunicao. Desta forma, pouco importa se os jogadores so rivais ou companheiros, pois o objetivo encontrar um lugar onde todos possam fazer a partilha do bem disponvel. Depois de descobrir essa posio, no h como os jogadores deixarem de ir para l, sem que isso incorra em prejuzo para as partes. No modo alternado, prprio do Ultimato, o ponto focal perde parte de seu poder de atrao, mas continua agindo como se fosse uma referncia, na falta de uma outra razo que oriente as aes dos envolvidos. Passa ento a coordenar as expectativas de cada um, no intuito de encontrar um resultado satisfatrio. A negociao tcita entre dois jogadores que se enfrentam no Ultimato tambm requer suposies, manobras e comunicao indireta do mesmo modo que em outros tipos de barganha. A diviso igual, ou em torno desta, sustenta-se sobre vrios argumentos plausveis em seu favor. A primeira vista, representa o conceito de justia partilhado por uma sociedade. Reflete ainda um equilbrio no poder de barganha de participantes de uma mesma categoria, isto simetria. Ou pelo menos mostra como cada um avalia a estimativa do outro. Em todo caso, a suposta justia dessas escolhas coordenadas seriam reforadas pela tentativa de evitar os efeitos contrrios a um acordo que a indeterminao ou insegurana poderiam provocar257. Dessa perspectiva, a tendncia para reparties "justas", no Ultimato, no seria fortemente afetada apenas por se tratar de um jogo, onde as propostas so feitas claramente e com alternncia. Em ltima instncia, no seria necessrio recorrer a hipteses distantes da maneira como a racionalidade opera nas circunstncias do jogo,
257
. Veja SCHELLING, Th. Idem, cap. 3, p. 72.
138
para explicar a necessidade de se chegar a um lugar perto das expectativas partilhadas por todos. A proposta "justa" funcionaria, portanto, como um sinal de referncia para um possvel encontro entre as partes. Com isso, no seria preciso descer abaixo do nvel cognitivo, pressupondo a atuao decisiva de sentimentos inatos ou de um comportamento consolidado pela evoluo. Afinal, para que tais sentimentos e comportamentos inatos surgissem, seria necessrio primeiro encontrar a soluo para depois pass-la s futuras geraes. Esta soluo aparece sempre que o jogo apresentado, bastando apenas um mnimo de racionalidade reflexiva que permita a localizao do ponto focal. (...) [O] ponto focal pode certamente ser diferente quando falar permitido (...) Mas este que pode ser o meio principal na negociao tcita, aparentemente pode ser ao menos um dos princpios importantes na anlise da negociao explcita. E, desde que as famosas barganhas "explcitas" incluam manobras, comunicao indireta, simulao de posio, ou avisos para serem ouvidos, ou seja confundida por uma multido de participantes e interesses divergentes, a necessidade de expectativas convergentes e o papel de sinais que tm a fora de coorden-las podem ser poderosos (SCHELLING, Th. C. Idem, cap. 3, pp. 73-74). O que os testes de Schelling e tantos outros mostraram foi que nem sempre possvel controlar todas as variantes do jogo, a fim de limitar a fronteira na qual o comportamento dos indivduos influenciado pela sua personalidade ou capacidade de reconhecer objetivos claros da interao. Seja no dilema dos prisioneiros ou nas suas diversas variantes, difcil saber at que ponto os jogadores esto interpretando o experimento como uma simples competio ou como uma interao cotidiana a que esto acostumados a participarem todos os dias. Os problemas examinados em The Strategy of Conflict chamam ateno dos participantes para necessidade de coordenarem suas aes caso queiram resolver a situao da melhor maneira possvel para todos. Por vezes, a ausncia de comunicao pode parecer um fator decisivo na modelagem dos jogos, quando de outra perspectiva apresentam apenas um efeito sutil e rarefeito. A comunicao ou a falta desta, talvez influa na busca de um lugar comum para resoluo dos conflitos, quando os interesses dos envolvidos so em parte convergentes, em parte divergentes. Quando no h comunicao, o ponto focal exerce sua atrao com fora total, logo que descoberto pelos jogadores. medida que a comunicao se torna explcita, o seu "campo magntico" se dilui, permitindo um espectro maior de opes para os envolvidos. Entretanto, sua presena ainda se faz notar como no caso do ultimato, onde as divises so feitas nas faixas entre 60 e 40 porcento e vice-versa. A existncia de um ponto focal uma explicao pertinente que se impe como opo s hipteses sobre sentimentos de vingana ou tentativas de se preservar a reputao. Uma experincia que acabou por reforar as concepes inatas psicologia humana, em detrimento de operaes racionais ou cognitivas sobre a busca de uma soluo no Ultimato, foi feita pela equipe de neurologistas chefiado por Alan G. Sanfey, que detectou a atuao de regies do crebro responsveis por reaes emocionais negativas - como raiva e decepo - no momento de avaliar uma oferta injusta. Sendo assim, a recusa no se daria por um desencontro das alternativas marcantes imaginadas (pontos focais), mas pelo entendimento da situao de conflito em que o agente se v inserido. Tal percepo, que ativada por outra rea do crebro voltada para os
139
momentos de perigo, conduz ento concluso provisria de que, de fato, sentimentos morais estejam atuando fortemente para que divises consideradas injustas sejam rejeitadas. E que tais desacordos no ocorreriam por um mal entendido sobre o lugar onde as propostas estavam sendo esperadas por agentes racionais preocupados em coordenar suas aes. Os testes dos neurocientistas estiveram focados nas respostas dos receptores. Resta saber que tipo de mecanismos cognitivos ou regies cerebrais so mobilizadas por quem faz as ofertas de repartio. Por hiptese, se a participao do crtex pr-frontal dorso lateral for mais decisiva, ento poder-se-ia especular se os pontos focais estariam a ser procurados por essa regio relacionada com tarefas cognitivas direcionadas para fixao de um objetivo e deliberaes a seu respeito. Mas essa uma conjectura a ser investigada em outro local e momento. 6.2 A Busca do Homem Econmico
Os experimentos de Thomas Schelling chamaram ateno para aspectos da racionalidade que confrontam com as previses da Teoria dos Jogos. O prprio autor de The Strategy of Conflict propunha modificaes na orientao dada pelos tericos quela poca. Sobretudo nas situaes em que houvesse mtua dependncia, como nas coordenaes que precisam de um ponto focal para sinalizar o local de encontro das alternativas dos jogadores. A prtica metodolgica s foi efetivamente modificada depois que jogos evolutivos foram tratados pela teoria da cooperao de Axelrod. S ento os diversos modelos de Dilemas - dos Prisioneiros, Sociais e Ultimato - passaram a enfrentar diretamente os problemas de adequao surgidos na primeira fase da teoria. Racionalidade, cooperao, reciprocidade, punio entre outros aspectos entraram em cena nas vrias pesquisas que foram realizadas a partir dos anos 1980. O egosmo que serviu de ponto de partida concepo original dos agentes racionais tinha por objetivo evitar qualquer juzo de valor que por ventura viesse a distorcer os resultados finais da descrio dos fatores econmicos principais que levam escolha de uma determinada linha de ao. Os problemas de adequao dessa perspectiva deflacionada do sujeito estavam relacionados com o comportamento cooperador nas ocasies em que a teoria previa o contrrio. Tais aporias seguiam no sentido inverso do enfrentado pela filosofia que partia dos sentimentos morais e tradicionalmente precisava explicar o comportamento egosta dos agentes, quando lhe fosse conveniente. Para a filosofia prtica, explicar o comportamento do carona ou de uma pessoa sem senso moral sempre foi uma dificuldade extrema aos contratualistas, cticos e utilitaristas. Na contramo desta tendncia, a teoria dos jogos se viu forada a interpretar, o comportamento aparentemente irracional das pessoas em testes laboratoriais e de campo que fugiam dos padres esperados pelos pesquisadores. Nas experincias realizadas, os seres humanos com frequncia agiam de modo no egosta, cooperando quando deveriam buscar maximizar seus prprios interesses, em primeiro lugar. Por isso, enquanto os filsofos se preocupavam com aqueles que sempre burlavam um acordo, procurando tirar vantagem toda vez que fosse possvel faz-lo em segredo, os tericos dos jogos e economistas, em geral, tinham de lidar com as aes "altrustas" que fugiam regra que deveria ser seguida pelo Homo oeconomicus. A figura imaginria desse personagem - uma assombrao para os filsofos -, descobriu-se depois, na realidade no existia em nenhuma sociedade, seja ela de grande ou pequeno porte, onde os modelos de jogos foram examinados. Em busca do Homo oeconomicus, partiram os pesquisadores a realizarem testes com o Ultimato, Bens
140
Pblicos e Jogo do Ditador, atravs de 12 pases e 15 pequenas sociedades - tribos, aldeias e pequenas cidades - espalhadas pelos cinco continentes. Essa investigao foi financiada pelo Grupo de Pesquisa sobre a Natureza e Origem de Normas e Preferncias da Fundao MacArthur, dirigido por Robert Boyd e Herbert Gintis, respectivamente das Universidades da Califrnia e de Massachusetts. Os cientistas tiveram a preocupao de escolher comunidades que tivessem sido menos afetadas pela influncia da cultura ocidental, a fim de saber at que ponto poderia ser considerado adequado atribuir uma racionalidade estratgica simples a essas pessoas258. Os primeiros experimentos com estudantes estadunidenses j haviam apontado para um desvio do modelo cannico de comportamento previsto pela teoria. Como vrios autores relataram, a maioria tendia a fazer uma diviso equitativa, no caso do Ultimato, e a iniciar cooperando nos Bens Pblicos, quando deveriam proceder de outro modo. Mas, agora, o que se pretendia saber se essa "falha" na racionalidade dos agentes supostamente egostas era exclusiva daqueles alunos pesquisados, ou da prpria sociedade estadunidense, e que portanto, o Homo oeconomicus deveria ser localizado nas sociedades mais prximas da condio de vida "natural", tpica da espcie humana no seu incio civilizatrio. Entre as culturas que foram avaliadas, estavam as que praticavam agricultura familiar, pastores nmades e pequenos agricultores. Os resultados obtidos fugiram de todas maneiras ao modelo padro de comportamento da teoria econmica. A variao encontrada foi, ento, relacionada com o grau de formao do mercado existente nas sociedades. Quanto maior fossem as prticas comerciais e o ganho resultante do empreendimento mtuo, maiores eram os nveis de cooperao detectados259. Isso a de encontro s recomendaes de qual seria a atitude racional recomendada para aqueles indivduos que procuram maximizar sua utilidade. Adam Smith sustentou pela primeira vez em sua Teoria dos Sentimentos Morais (1759) que uma mo invisvel conduziria as aes de seres naturalmente egostas de modo que a distribuio dos bens necessrios vida fosse to igualitria quanto seria "caso a terra fosse dividida em pores iguais entre todos os seus moradores"260. O mesmo argumento foi apresentado depois de uma forma mais clara, em A Riqueza das Naes, tal como segue-se: (...) Geralmente, na realidade, [cada indivduo] no tenciona promover o interesse pblico nem sabe at que ponto o est promovendo. (...) Alis, nem sempre pior para a sociedade que esse objetivo no faa parte da intenes do indivduo. Ao perseguir seus prprios interesses, o indivduo muitas vezes promove o interesse da sociedade muito mais eficazmente do que quando tenciona realmente promov-lo. Nunca ouvi dizer que tenham realizado grandes coisas para o pas aqueles que simulam exercer o comrcio visando o bem pblico (SMITH, A. A Riqueza das Naes, liv. IV, cap. II, pp. 379-380). Mo Invisvel do Leviat Muitos argumentos filosficos e econmicos foram mobilizados a favor e contra a postura clssica do liberalismo econmico. A concepo inicial da teoria dos jogos tambm seguiu esse modelo de agente racional, adotado pelos economistas. O ponto de
258 259
. Veja HENRICH, J. et al. "In Search of Homo Economicus", p. 73. . Veja HENRICH, J. et al. Op. cit., pp. 73-74. 260 . Veja SMITH, A. Teoria dos Sentimentos Morais, IV part., cap. I, p. 226.
141
equilbrio descoberto por Nash parecia indicar que a soluo matematicamente correta resumiria a forma pela qual os resultados deveriam ser alcanados pelos indivduos, que procuram atingir os melhores ganhos para si. Todavia, assim que o primeiro jogo experimental elaborado pelos matemticos Melvin Dresher e Merrill Flood - o Dilema dos Prisioneiros - procurou testar essas descobertas, percebeu-se que o comportamento das pessoas racionais desviavam consideravelmente da hiptese defendida pelos economistas da tradio liberal. O Dilema dos Prisioneiros Iterado foi o primeiro obstculo enfrentado pelos defensores da existncia do Homo oeconomicus. As propriedades da repetio daquele jogo emergiram para mostrar que seres humanos tendem a fugir do comportamento egosta quando percebem intuitivamente que sua estratgia dominante leva a um resultado subtimo. O melhor resultado conjunto s pode ser alcanado pelo empreendimento comum. Na situao do Dilema dos Prisioneiros, agir em funo apenas do seu interesse particular acaba conduzindo os indivduos para a desero mtua, ao passo que poderiam obter o melhor resultado se fugissem da dominante. Portanto, no Dilema dos Prisioneiros, a mo invisvel no levaria diviso igualitria pretendida por Smith, mas a um resultado aqum de suas necessidades vitais. Pelo contrrio, considerar apenas os interesses individuais, no permite mo invisvel atingir a distribuio igualitria. Para conseguir isso, este mecanismo deve seguir uma orientao obrigatria no sentido de considerar os interresses dos outros jogadores e assim escapar da punio. O jogo dos Bens Pblicos que estende o dilema dos prisioneiros a um contexto social, por seu turno, revela que a cooperao inicial s perdida com o aprendizado do comportamento egosta, aps a repetio de sucessivas rodadas. Ao voltarem-se apenas para a satisfao de seus interesses, os jogadores acabam por destrurem a oportunidade que tm para multiplicarem seus bens. Se nenhuma penalidade for instituda contra os desertores, a tendncia ser cada jogador seguir por si mesmo, esvaziando o empreendimento comum. A tragdia dos comuns, anunciada por Garrett Hardin, em 1968, outro argumento contra a validade da tese de que a maximizao de interesses individuais pode produzir resultados timos em contextos sociais, que envolvam os interesses de outros participantes. Da perspectiva de Hardin, no que diz respeito ao problema da superpopulao, a vontade de um indivduo ter mais filhos - procriar - no leva a um equilbrio que seja o melhor para cada um, mas simplesmente destruio dos recursos naturais e qualquer possibilidade de ser feliz neste mundo261. Com o jogo do Ultimato, ocorre ento a suspeita de que seres humanos inicialmente partem de um comportamento cooperativo racional apoiado na busca de um ponto de equilbrio que coordene suas aes ou fundado em estratgias equitativas que visam preservar a reputao dos agentes - seja isto algo que foi consolidado no genoma, seja por influncia cultural da comunidade a que se pertena. De acordo com os estudos realizados nas sociedades industriais, a diviso dos recursos ficam prximas de 44% que so oferecidos aos receptores, enquanto nos pequenos grupos culturais a frao proposta variava de 26 a 58 porcento. Tal variao permitiu agrupar os comportamentos culturais em dois padres ntidos. Primeiro, pela importncia observada em cada grupo aos valores relativos participao da cooperao. As sociedades com menor participao de indivduos na troca - fora do ambiente domiciliar - ficaram na posio mais baixa entre as propostas cooperadoras, ao contrrio daqueles
261
. Veja HARDIN, G. "The Tragedy of Commons", p. 1244.
142
que se envolviam em vrias atividades conjuntas, principalmente as vinculadas aos aspectos econmicos de suas culturas. Por conseguinte, em segundo lugar, aqueles grupos com maior integrao de mercado mostraram ter mais experincia em transaes comerciais e a abstrao necessria para partilhar os resultados de fcil aceitao por ambos concernidos262. Em geral, as pessoas que tomam parte desses experimentos, ao se defrontarem com o ineditismo do jogo, procuram atuar conforme o seu desempenho rotineiro em meio a seus semelhantes. Isso anulou os efeitos indesejveis da influncia da presena de um experimentador estranho ao grupo. Destarte, pde-se perceber que a teoria econmica precisava rever suas concepes sobre o modelo econmico de agentes egostas, interessados em primeiro lugar de satisfazer seus desejos materiais por maiores ganhos possveis. O comportamento social difere radicalmente do comportamento de um indivduo solitrio em uma ilha deserta - um problema de maximizao individual. A construo das preferncias e das escolhas econmicas no feita independente do resto da sociedade ou da vida cotidiana em grupo. Essa vinculao da economia diria com as escolhas das estratgias deve ser ento o ponto de partida da montagem de um novo modelo de agente racional realista em vez do antigo padro individualista263. As razes mobilizadas para explicar tal divergncia do comportamento humano em comparao ao do personagem fantasioso do Homo oeconomicus so vrias e vo desde o hbito de participar de diversas interaes repetidas; a antecipao por parte dos agentes das possveis vantagens que o outro est buscando obter produziria uma necessidade de imaginar uma oferta justa que eliminasse a inveja e o ressentimento; alm do fato j apontado por Maurice Allais, sobre as dificuldades dos indivduos de fazerem suas expectativas subjetivas se aproximarem das matematicamente objetivas. Tudo indica que a insistncia dos seres humanos em focarem suas deliberaes em torno de parties justas no depende to somente do ganho que cada um ir obter ou do medo da possibilidade da rejeio, mas de uma perspectiva de longo prazo, tanto em relao ao passado de quem faz a oferta, como ao futuro de quem as aceita. A explicao evolutiva para uma tendncia cooperadora j no mais se embaraa com a firme convico de que por detrs das aes dos indivduos esto genes egostas, lutando por maior procriao na prxima gerao. O altrusmo observado, em contraste com o egosmo pressuposto, no implica em contradio com a teoria evolutiva, desde que se entenda a forma recproca dessa cooperao e as vantagens que isso trouxe para o genoma de um ponto de vista mais amplo. Embora individualmente, cada gene seja programado para se auto-reproduzir, nada impede que, nos momentos que se mostrar oportuno, este venha a interagir e cooperar em funo dos interesses do grupo do qual faa parte, de modo que todo um organismo possa usufruir do bem estar dessa cooperao reciprocamente altrusta. Se tal comportamento resulta em ganhos bem sucedidos para todos os genes envolvidos, provavelmente, as chances de suas estratgias se repetirem na prxima gerao aumentaro. Tudo depende, claro, que a reciprocidade possa recompensar cada gene envolvido na manuteno do vivente. Diferente das escolhas e preferncias individuais que, para serem racionais dependem de respeito a caractersticas tais como a transitividade, as deliberaes coletivas podem, sem contradio, apresentar inconsistncias e uma deciso divergente daquelas que os indivduos tomariam em outra situao. Quanto impossibilidade das
262 263
. Veja HENRICH, J. et al. Op. cit, II, p. 76. . Veja HENRICH, J. et al. Idem, IV, p. 77.
143
aes coletivas refletirem as preferncias de cada um dos indivduos incondicionalmente, o exemplo da manipulao da agenda de votao e o teorema de Arrow apresentam uma explicao suficiente acerca dessas posies, em primeira vista, paradoxais, mas cujo n se desfaz se o comportamento de cada um for observado separadamente ou em grupo. O que para teoria econmica e evolutiva era um problema - o comportamento "altrusta" de agentes naturais - foi resolvido de um modo geral apelando para aes tomadas com base na reciprocidade. Do ponto de vista filosfico, no obstante, permanecia a necessidade de explicar ou encontrar um antdoto contra as atitudes prprias do carona ou daquelas que sofressem da ausncia de senso moral (lack of moral sense). Por mais que a pesquisa de campo antropolgica tivesse fracassado em detectar a figura tpica do Homo oeconomicus, a tentao de poder escapar punio, sempre que isso fosse possvel, continuava sendo uma escolha defensvel racionalmente da perspectiva instrumental. Para o filsofo, seria necessrio mostrar no s que o agente racional egosta, de fato, no existe, mas que sua viabilidade precisa ser amplamente contestada por argumentos prvios. O Homo oeconomicus rene as caractersticas do carona, que se aproveita do esforo dos outros sempre que no for rechaado, e daquele que no tem senso moral, isto no possui nenhum sentimento de culpa, vergonha ou remorso, por desertar quando houvesse oportunidade para tanto. Na tica, o problema no est na existncia ou no do Homo oeconomicus, mas na possibilidade de um ctico sustentar a racionalidade de suas aes, contraposta universalidade exigida pelo lei moral que obriga a considerao dos interesses dos outros. Em suma, as aes egostas puras no poderiam encontrar argumentos racionais defensveis, diante da suposio de que o agir moral tambm racional do ponto de vista de todos concernidos. Ao menos foi essa a linha de raciocnio adotada pela tradio filosfica - Plato, Hobbes, Hume, Kant - em relao ao problema do ctico moral. Se j no mais plausvel recorrer a fundamentos transcendentais para refutar as escolhas realizadas pelo Homo oeconomicus, as solues empricas precisam encontrar respostas alm da punio, da manuteno do Estado, ou do sentimento moral evolutivo. Para entender como a moral pode evoluir de decises egostas, preciso ampliar o conceito de racionalidade estratgica, alm do prprio indivduo, para que possa levar em conta os resultados disponveis dos outros em um contexto que envolva o desempenho de pelo menos dois agentes. No mbito da sociedade, os efeitos recursivos do raciocnio estratgico - em oposio ao paramtrico - exigem que os interesses dos outros devam ser considerados e assim, o clculo das deliberaes precisa avaliar tambm as possveis reaes imediatas e a longo prazo. Destarte, a soluo maximizadora decorre da necessariamente da sua extenso a todos envolvidos e no s centrada da figura do prprio agente. Ao proceder desta forma, as respostas estratgicas contemplariam no s os interesses dos outros e as externalidades decorrentes de suas aes. O que no significa que o sujeito tenha de abrir mo "altruisticamente" da satisfao de seus desejos e crenas em favor de toda sociedade, mas que a otimizao dos interesses da sociedade incluem a maximizao de seus prprios interesses. Contudo, o pensamento recursivo que considera a reflexo alheia tem especificaes que no so tratveis apenas do ponto de vista subjetivo e instrumental. Nesses casos, faz-se necessrio o refinamento da deliberao, a fim de se poder responder adequadamente os desafios impostos pelas demandas dos outros participantes. O que
144
vale dizer que a figura artificial do Homo oeconomicus tem de empregar recursos reflexivos, intersubjetivos, que o capacitem a resolver o dilema social. As respostas humanas aos testes de jogos realizados em campo e laboratrio, parecem indicar o reconhecimento, ainda que intuitivo, dessa necessidade de transformar a racionalidade estratgica subjetiva, em intersubjetiva - com a necessria observao das respostas dos outros sujeitos. Essas respostas so influenciadas por fatores culturais e genticos que so moldados em decorrncia da percepo do prolongamento das interaes no futuro e a consolidao de estratgias que no passado permitiram, at o presente, que os organismos sobrevivessem. Portanto, a moralidade pode surgir de seres egostas, do mesmo modo que com o carbono puderam se formar as molculas orgnicas, bem como as propriedades especficas do indivduo que s podem aparecer no seu contato com outro elemento reagente. 6.3 A Emerso da Equidade
A noo de equidade (fairness) fundamental para compreenso da tese central da Teoria da Justia de John Rawls. tambm um dos conceitos chaves do modelo de jogo do Ultimato. Ao longo de sua vida, Rawls trabalhou a idia de equidade como uma concepo de justia onde a sociedade foi interpretada como um sistema de cooperao social que deve passar de gerao em gerao. Trata-se de uma teoria que carrega de pressupostos uma interface de alto nvel que obriga a tecer a trama de uma intricada rede de argumentos para justificar aquilo que pode ser facilmente abordado da maneira deflacionada que os modelos de jogos analisam a possibilidade de cooperao264. Uma das gratas surpresas que os filsofos tm, ao examinar modelos de jogos como Ultimato, est na possibilidade de trabalhar conceitos to caros para as principais teorias filosficas sem se comprometer com todo um conjunto de enunciados que frequentemente produzem uma sucesso infinita de proposies que acabam por gerar inconsistncia na argumentao. A satisfao maior, sobretudo, quando se percebe que a intuio da equidade est presente em vrios tipos de agrupamentos polticos e no apenas entre os pases de regime democrtico. A despeito de ser uma tendncia gentica ou no, o fato da noo de equidade ser notada em sociedades alm das fronteiras ocidentais colabora no sentido de reforar a defesa da cooperao como um sistema adequado para o convvio humano. A teoria econmica tende a evitar que concepes morais distoram as concluses que so extradas de conceitos e princpios formalizados de maneira mais precisa possvel. J em Lutas, Jogos e Debates, Anatol Rapoport se viu contrangido ao tecer anlises sobre a racionalidade dos agentes no Dilema dos Prisioneiros valorizando a cooperao por levar ambos os jogadores a uma recompensa conjunta, ao invs de uma desero prejudicial a todos: "Quase que posso ouvir um coro de risadas. Deixei que a moralidade temperasse a razo (...)"265. At aquele estgio de desenvolvimento da teoria dos jogos - no incio dos anos 1960 - os pesquisadores no se preocupavam em alinhar suas descobertas formais com provas contrafactuais. Nenhum teste emprico era exigido tentativa de montar um conjunto slido de axiomas que orientassem a proposio de normas para escolhas
. Para um contato direto com o conceito filosfico e poltico de equidade, veja RAWLS, J. Justia como Equidade, 2, p. 7. 265 . RAPOPORT, A. Lutas, Jogos e Debates, part. II, cap. X, p. 137.
264
145
estratgicas apoiadas exclusivamente em uma lgica prpria. Contudo como o prprio Rapoport havia notado, o comportamento humano dificilmente se deixaria moldar pelas diretrizes sugeridas pelos tericos. Isso porque a maneira com pela qual procuravam agir ou tomar decises nem sempre eram lgicas ou ponderadas. (...) Tais normas no so lgicas, e sim arbitrrias, e podem ser extremamente variadas. Deste ponto em diante, portanto, no pode haver uma nica teoria dos jogos, mas sim uma grande variedade de tais teorias, cada qual baseada em normas diversas. Aqui, o cientista experimental deveria naturalmente entrar em cena para explorar as normas que atuam na realidade nos assuntos humanos (RAPOPORT, A. Lutas, Jogos e Debates, part. II, cap. XIII, p. 171). Na prtica, o que aconteceu com os jogos evolutivos e a teoria da cooperao subsequente foi a transformao da teoria dos jogos em poderosa ferramenta de anlise de situaes empricas, onde interesses em parte conflitantes, em parte convergentes entravam em interao. Desse modo, testes psicolgicos e antropolgicos puderam avaliar a extenso e presena dos conceitos morais nas relaes humanas. Foi quando a reciprocidade, a confiana e a equidade puderam ser delineadas e destacadas por meio das simulaes com modelos de jogos repetidos, comeando pelo DPI. A pesquisa em torno do conceito de equidade ganhou impulso depois que Werner Gth e seus colegas iniciaram as anlises experimentais do jogo do Ultimato, em 1982. Na ltima dcada do sculo XX, essa investigao abordou o assunto sob os vrios ngulos possveis. Das diversas pesquisas realizadas, extrau-se a compreenso de que uma mdia de 60 a 80 porcento das ofertas feitas estavam na faixa de 40 a 50 porcento do montante disponibilizado para o receptor e que algo entre trs a cinco porcento ficava abaixo de 20 porcento, geralmente recusados. De acordo com a teoria econmica, no haveria motivos para temer tal recusa, pois o centavo ganho seria melhor que nada. No obstante, onde quer que tenha sido jogado, o mesmo padro de comportamento fora observado. A explicao para isso foi que, nos encontros entre pessoas de uma mesma comunidade, os jogadores eram obrigados a levarem em considerao no apenas seus prprios interesses, mas o daquele que estava envolvido na diviso. Assim, as demandas do outro tambm teriam de ser consideradas igualmente. Karl Sigmund resume as explicaes dos tericos sobre esse comportamento desviante como uma dificuldade que as pessoas teriam para entender que o jogo ser disputado apenas em um lance para cada jogador e no como parte do processo de barganha semelhante aos vividos pela humanidade desde a pr-histria266. No passado distante, havia a dependncia dos caadores e coletores do apoio de vrios integrantes na busca por alimento. Por causa disso, a preocupao com o grupo teria sido consolidada entre os seres humanos, o que explicaria a persistncia de ofertas mais altas. Por outro lado, a recusa frequente de propostas de diviso baixas teria condicionado os lderes a fazerem ofertas maiores. Desse modo, a marcao da rejeio com respostas emocionais - indignao, vergonha, injria e vingana - ajudaria a formao de uma reputao em quem no aceitasse esmolas ou migalhas, beneficiandolhe em futuras negociaes. Tudo isso para reforar a idia de que sentimentos morais e concepes de justia e equidade esto entrelaados na soluo de problemas econmicos cotidianos.
266
. Veja SIGMUND, K. "The Economics of Fairness", p. 2.
146
Padres ticos e sistemas morais diferem entre culturas, mas podemos presumir que estes so baseados em capacidades universais biologicamente enraizados; do mesmo modo como centenas de linguagens diferentes so baseadas no mesmo instinto de linguagem universal. (...) [T]emos investigado um estgio onde podemos formalizar tais idias em modelos de jogos tericos e test-los empiricamente (SIGMUND,K."The Economics of Fairness", p.5). Independente de serem ambientais ou genticos, os valores morais dos indivduos precisam ser mobilizados, a fim de se atingir um resultado que satisfaa os interesses dos participantes da interao, cada um sendo obrigado a levar em conta a reao do outro. Ao ter de considerar igualmente os concernidos, os aspectos fundamentais da moral tambm devero ser observados por quem tem de tomar uma deciso eficaz. Caso contrrio, as chances de conseguir um melhor resultado no futuro so reduzidas habilidade de cada um obter por si mesmo aquilo que precisa, em um estado de natureza, exposto ao conflito permanente. Fatores como a preservao da reputao, no jodo do Ultimato, proporcionam a emerso da equidade como a probabilidade maior de recompensa, do que a tentativa meramente racional de atingir o equilbrio perfeito, mas injusto. Esse fato fica ainda mais evidente quando esto disponveis as informaes sobre o tipo do receptor. E mesmo que a estratgia equitativa no seja a recomendada pela racionalidade econmica, sua aplicao acaba por fomentar as trocas comerciais. Isso bem concorda com as descobertas sobre a emergncia da cooperao ou do comportamento negociador. Reputao baseada na comunicao e em compromisso desempenham papel essencial na histria natural da vida econmica (NOWAK, M., PAGE, K. & SIGMUND,K.Fairness versus Reason in the Ultimatum Game", p. 1774). Justia e Equidade Desde Uma Teoria da Justia (1971) at o final de sua vida John Rawls defendeu a noo de justia como equidade, tendo em mente a existncia, pelo menos em sociedades ocidentais, de "um sistema equitativo de cooperao social que se perpetua de uma gerao para a outra"267. Nesse sistema de cooperao, cidados cooperadores, livres e semelhantes agiriam sob o mecanismo de uma sociedade j aparelhada para regular a justia em seus domnios. A partir dessas intuies, caracterstica de regimes democrticos, Rawls organizou sua teoria apoiado em trs outras noes essenciais: existncia de regras pblicas aceitas pelos cooperadores; idia de reciprocidade e a busca por vantagens racionais268. Alm disso, Rawls passou a fazer a distino entre razoabilidade e racionalidade, como necessria para evitar o tradicional problema filosfico de considerar inconsistente ou, por vezes, contraditria a ao do egosta racional - efetivamente filsofos como Jrgen Habermas e Karl-Otto Apel tendem a considerar o carona, o lack of moral sense, um indivduo que cometeria contradies performticas ao agirem contra um acordo que antes houvesse considerado vlido. Rawls admite que, em geral, no irracional a violao de pactos, se for em benefcio prprio, toda vez que se
267 268
. RAWLS, J. Justia como Equidade, part. I, 2, p. 7. . Veja RAWLS, J. Op. cit., part. I, 2, pp. 8-9.
147
apresentasse oportunidade para tanto. Porm, a desero poderia ser considerada irrazovel posto que... (...) pessoas razoveis so aquelas dispostas a propor, ou a reconhecer quando os outros o propem, os princpios necessrios para especificar o que pode ser considerado por todos como termos equitativos de cooperao. Pessoas razoveis tambm entendem que devem honrar esses princpios mesmo custa de seus prprios interesses se as circunstncias o exigirem, desde que os outros tambm devam honr-los (...) (RAWLS, J. Justia como Equidade, part. I, 2, 2.2, p. 9). Depois que os princpios de justia so propostos e reconhecidos como vlidos pelos cooperadores, seria insensato no proceder de acordo com a estratgia cooperadora proposta, embora no fosse irracional viol-las para obter vantagens racionais. Posto neste termos, toda obra de Rawls um esforo de aliar o kantismo de seres razoveis, que aceitariam o imperativo categrico de seguir os princpios de justia, e o contratualismo que prev as aes racionais em funo de um imperativo hipottico, que usa as normas como meio para atingir um fim e no como um dever ou compromisso, cuja violao acarretaria culpa moral ou, ao menos, um erro cognitivo. Intuitivamente, John Rawls construiu sua teoria da justia apoiada no mesmo conceito de reciprocidade detectado pelo modelos dos jogos baseados no Dilema dos Prisioneiros Iterado, onde a retaliao vem em seguida desero praticada pelo outro. Entre os agentes que rejeitam pequenas quantias, h a percepo de que ofertas que poderiam ter sido feitas de forma mais equitativas devem ser recusadas com mais frequncia. Isso implicaria que as respostas dos receptores consideram no apenas as suas preferncias, mas tambm as intenes do outro em ser visto como justo269. Pos trs da reciprocidade, haveria, ento, um critrio pblico de como cada um deveria se beneficiar da cooperao. Regras essas que so aceitas pelos cooperadores. Agentes que sabem reconhecer as vantagens racionais que os participantes podem tirar da distribuio justa dos recursos obtidos pela interao na qual participam. Rawls admitiu a possibilidade de tal concepo ser suficiente para o desenvolvimento de uma teoria de justia adequada para as sociedades bem-ordenadas que imaginara. Sua hiptese ganhou plausibilidade com as descobertas recentes proporcionadas pelos testes de jogos como o Ultimato, realizado em vrios tipos de agrupamentos humanos espalhados por todo mundo. Evidente foi que, nas culturas pesquisadas, para se reproduzir um padro de equidade como fora observado, deveria tambm de haver aquilo que Rawls chamava de justia de fundo, ou seja, a estrutura bsica econmica, reconhecimento da propriedade e relacionamentos familiares270. Em suma, as condies de mercado ou interao comerciais cujo grau de avano era proporcional ao nmero de ofertas equitativas271. Se a defesa que Rawls faz da democracia liberal, sustentada nesses pressupostos, pode ser oportunamente questionada, no obstante, seu ponto de partida, primeira vista, parece est de acordo com as observaes feitas pelos tericos dos jogos atuais em testes de campo. A equidade emergiu nas interaes entre agentes econmicos como uma propriedade decisiva da distribuio justa de recursos e como ponto focal para
269 270
. Veja FALK, A., FEHR, E. & FISCHBACHER, U. "On the Nature of Fair Behavior", I, p. 3. . Veja RAWLS, J. Idem, part. I, 4, 4.1, pp. 13-14. 271 . Veja HENRICH, J. et al. "In Search of Homo Economicus", p. 74.
148
dirimir as disputas entre os participantes, embora esse no seja o nico fator envolvido. A eficcia das solues justas s se tornou possvel devido capacidade retaliadora dos agentes e a existncia desse sinal claro de que uma diviso prxima do meio a meio pode ser vislumbrada pelas duas partes - no caso de jogos bimatriciais (2 x 2). Reciprocidade tambm aparece como um conceito chave no s para que a cooperao se sustente, mas que esta seja justa. Uma vez mais o instrumento dos jogos permitem compreender como ocorre o estabelecimento das condies necessrias para o comportamento cooperador surgir nos seres humanos. Diferente das outras espcies, os seres humanos podem antecipar o futuro, observar o passado e alimentar sentimentos de vingana, vergonha, preservar sua reputao etc. Todas essas particularidades influenciam os resultados obtidos pelas pessoas em interao umas com as outras. De fato, seres humanos no agem apenas como agentes racionais egostas - previstos tanto pela teoria econmica, como pela biologia evolutiva. Ao longo de sua evoluo, a espcie Homo sapiens acumulou em seu cdigo gentico e nos registros histricos informaes sobre estratgias que foram bem sucedidas no passado e por isso ficaram guardadas na memria, como aquelas como maior ou menor chance de xito, dependendo das circuntncias. Com base nessa experincia, intuitivamente ou conscientemente, as pessoas reagem em funo das linhas de ao que se consolidaram como sendo as mais indicadas para maximizao, no s dos interesses pessoais, mas considerando os interesses de outros semelhantes. Durante um intenso debate filosfico a definio de justia variou sobre muitos aspectos. Porm, desde os primeiros registros legais que remontam ao Cdigo de Hamurabi , uma noo mnima de justia vem sendo reforada. A Regra de Ouro que expressa a noo de reciprocidade encontrada nas mais diversas civilizaes e povos vem se mantendo perene como principal conceito de justia a forar os humanos a inclurem a equidade nas suas formas de relacionamento.
149
Captulo 7: Novos Campos Interdisciplinares
Embora o uso de computadores no seja uma novidade para as cincias naturais desde a II Guerra Mundial vinham sendo utilizados como ferramentas de clculo ou como mecanismos de experimento virtual -, as simulaes so uma inovao para as cincias sociais, sobretudo, depois dos torneios de Robert Axelrod. Estas tm servido para o exame das consequncias das hipteses trabalhadas em cada rea de conhecimento. Nesse sentido, as simulaes surgiram como um terceiro mtodo de avaliao cientfica ao lado da induo emprica ou da deduo axiomtica. Em vrias disciplinas das cincias sociais, da antropologia, economia, biologia evolutiva, direito at a poltica, foram produzidos artigos sobre o mtodo da simulao publicados em mais de 50 jornais cientficos diferentes. Axelrod destaca, em artigo dedicado ao avano das tcnicas de simulao - pelo menos at 2003 -, dos sete propsitos atribudos a essa prtica, a previso, o fornecimento de provas e descoberta. As previses atravs das simulaes so realizadas por meio de dados que alimentam o sistema que os processa, gerando consequncias relacionadas com a hiptese de trabalho. Tais consequncias podem servir como provas quando os eventos observveis ao final aparecem como efeitos esperados das regras simples que representam os princpios testados. Alm de consolidarem os modelos de condutas pelos quais a simulao baseada, esta nova tcnica de averiguao de princpios cientficos pode ser til tambm para descobrir novas formas de relacionamento. A despeito das dificuldades de se moldar detalhadamente o movimento das pessoas em sociedade, as simulaes tm servido para o encontro de estratgias e normas comportamentais que partem de um conjunto de instrues limitado. Simulao vem se constituindo em uma terceira forma de fazer cincia. Como a deduo, parte de um conjunto de proposies explcitas. Mas diferencia-se desta por no provar teoremas. Ao invs disto, a simulao gera dados que podem ser analisados indutivamente. Diferente de uma induo tpica, por outro lado, a informao simulada trabalha a partir de um conjunto de regras rigorosamente especificado que no envolvem medies diretas do mundo real. Enquanto a induo pode ser usada para encontrar padres informativos, e a deduo pode ser usada para encontrar hipteses consequentes, a simulao, se bem modelada, pode ser usada como ajuda intuio (AXELROD, R. "Advancing the Art of Simulation in the Social Sciences", p. 5). Assim, a simulao vem em auxlio aos tradicionais experimentos mentais realizados por filsofos como Thomas Hobbes, David Hume e Jean-Jacques Rousseau. Propriedades emergentes dos sistemas dinmicos complexos surgem de umas poucas proposies simples. Atravs das simulaes, pode-se questionar a necessidade dedutiva de se manter o pressuposto da escolha racional como princpio bsico da teoria dos jogos, propondo em seu lugar a adaptao como processo principal nos estudos das populaes que no agem de modo racional pleno. O postulado da racionalidade no indispensvel na modelagem do comportamento de agentes nas condies tratadas por jogos repetitivos como no Dilema dos Prisioneiros. Metodologicamente, as simulaes so baseadas em agentes autnomos. Portanto, se inscrevem na categoria do individualismo metodolgico das cincias sociais que trabalha as instituies como mecanismos onde sujeitos so considerados "peas" e
150
"engrenagens" fundamentais que explicam a montagem, a existncia e o funcionamento de um sistema maior. Trata-se, ento, de uma tcnica ascendente de construo das propriedades caractersticas de um sistema a partir das interaes dos agentes. Os histricos dos resultados das simulaes podem ser descritos, por conseguinte, de trs maneiras diferentes. Pela ordem cronolgica, as aes podem ser descritas como desenrolar de fatos relacionados causalmente uns com os outros. Da perspectiva do agente, suas decises podem ser interpretadas como reveladoras dos efeitos do tempo sobre suas jogadas. Por fim, a viso geral de todo processo permite perceber os padres em larga escala do comportamento de todos participantes. Com isso, as variaes dos parmetros da modelagem da simulao podem revelar a influncia de cada fator no resultado geral do agente, do processo e de todos os participantes em conjunto. O que vale dizer que os resultados partilhados dependem de detalhes relativos maneira como a simulao foi preparada. Nesse sentido, pesquisadores de disciplinas distintas podem interferir na sua avaliao dos resultados das pesquisas de outros, perscrutando resultados sensveis a sua rea de atuao. Faz-se ento necessrio que o cdigo fonte do programa utilizado seja tambm informado. Na prtica, Axelrod recomenda a programao em Visual Basic para iniciantes em informtica e a linguagem Java para programadores avanados. Entre esses dois processos, JavaScript um recurso disponvel para pesquisadores de nvel intermedirio, capazes de modelar jogos como o Dilema dos Prisioneiros Iterado. Destarte, os testes podem ser repetidos em diversos lugares, onde hajam computadores dotados de recursos mnimos de "navegao" e de reproduo de mquinas virtuais. Crticas ao Modelo Apesar das simulaes terem uma vasta aplicao em diversas reas de pesquisa, seu uso em contextos pedaggicos est sujeito a crticas como as levantadas por Howard Gardner acerca da desinformao que jogos, como o famoso SIM CITY, podem transmitir s crianas. Um dos preconceitos praticados pelas primeiras verses desse simulador do governo de uma cidade revelado pela recorrente revolta da populao da cidade fictcia sempre que os impostos so aumentados pelo prefeito virtual272. Por outro lado, a interpretao biolgica da utilidade como a habilidade de uma estratgia reproduzir-se nas futuras geraes filosoficamente problemtica quando se analisa sob a tica da influncia cultural. Individualmente, a habilidade reflete na obteno de ganhos superiores aos de outros jogadores. A acumulao quantitativa de bens talvez seja uma concepo limitada para o conceito de aptido, nesses contextos. De fato, tais limitaes esto vinculadas ao comportamento racional dos agentes culturais, que variam de indivduo para indivduo. No mbito da comunidade, as habilidades, ou aptides, do agente devem ser interpretadas sempre como uma racionalidade restrita aos valores de cada sociedade. Ademais, a histria de uma cooperao ou constituio de um grupo social, quando modelada pelos jogos irrelevante caso se compreenda tal processo como decorrente de uma sequncia causal determinada pelas regras programadas. Para ser considerada vlida, a simulao de jogos evolutivos teria de ser contraposta a testes empricos que procurassem apontar ou no a alternativa virtual como mais uma entre as vrias histrias passveis de acontecer ou serem destacadas do pano de fundo cotidiano.
272
. GARDNER, H. O Verdadeiro, o Belo e o Bom, cap. 3, p. 48.
151
Assim sendo, as simulaes seriam irrelevantes, uma vez que teriam de passar sempre crivo da experincia histrica real, a fim de ter sua plausibilidade constatada273. No obstante essas objees, autores como Richard Dawkins tem feito uso da simulao da maneira prevista por Axelrod, para verificar a correo de suas intuies. As vantagens da simulao permanecem como a melhor forma da experimentar vrias suposies uma aps a outra, sem os custos de preparar muitos testes de campo. (...) H, evidentemente, bons e maus modelos do mundo, e mesmo os bons so apenas aproximaes. Nenhuma simulao pode prever exatamente o que acontecer na realidade, mas uma boa simulao muito prefervel tentativa e erro cega (...) (DAWKINS, R. O Gene Egosta, cap. 4, p. 82). Um computador pode rodar rapidamente vrias propostas que consumiriam uma grande quantidade de tempo se examinada por mtodos tradicionais. Tentativas empricas de testes de projetos custam muito tempo e energia. Se imaginar os efeitos devastadores dos testes nucleares, as vantagens da simulao desse tipo em computadores merecem o rtulo de ecologicamente corretas. 7.1 Computadores X Estudos Acadmicos
O desenvolvimento de computadores ou mquinas inteligentes algo que sempre esteve na agenda de filsofos visionrios, pelo menos desde quando Plato comeou a elaborar uma teoria do conhecimento em seu dilogo Teeteto. As teorias da mente estavam por detrs desse tipo de investigao sobre o entendimento humano tornaram mais ntida a vinculao de mecanismos inteligentes ao comportamento dos seres vivos, a despeito do que pensava o mecanicista Ren Descartes (1596-1650)274. Mas a inveno de autmatos reais ou virtuais no era exatamente uma inovao moderna. Mecanismos sofisticados j haviam sido usados por gregos do sculo I a.C. para calcular a trajetria dos astros visveis - como a calculadora mecnica descoberta em restos de naufrgio prximo ilha Antiquitera, no mar Egeu. O materialista Thomas Hobbes no tinha dvidas que que seu Leviat descrevia a constituio de um "homem artificial" que reproduzia o comportamento de todo um corpo social formado pelo somatrio das aes de cada cidado275. Para tanto, bastava uma leitura atenta do ser humano. A observao detalhada de si mesmo deveria permitir que fosse exposta claramente de maneira ordenada, o conhecimento do gnero humano. A partir desse exame emprico da matria, poder-se-ia concluir, entre outras coisas, que o entendimento no passa de uma imaginao decorrente do uso das palavras, que comum tanto aos homens quanto aos animais, e por extenso as mquinas tambm. Desde o incio do sculo XVII, graas ao avano da arte da relojoaria, tentativas de construir esses mecanismos tiveram grande divulgao. Na Frana, Jacques de Vaucanson (1709-1782) construiu vrios tocadores de flauta transversa, pfaros, tambor, bem como seu famoso "pato" que batia asas, nadava, comia gros e depois os expelia. Seu conterrneo, Julien Offroy de la Mettrie (1709-1751), chegou a ser banido, por
. ALEXANDER, J. McK. "Evolutionary Game Theory" 4, pp. 9-11. . Apesar de ser um dos pioneiros do mecanicismo, Descartes considerava praticamente impossvel a construo de autnomos que pudessem agir pelo conhecimento, devido ao fato de no possuirem rgos suficientes para atuarem da mesma maneira que os humanos (veja DESCARTES, R. Discurso do Mtodo, part. 5, p. 57). 275 . HOBBES, Th. Leviat, introduo, p. 5.
274 273
152
sustentar, no livro L'Homme Machine (O Homem Mquina, 1747), que "a alma apenas um termo vo sem qualquer significado. Concluamos ento audaciosamente que o homem uma mquina"276. Por volta de 1833, o matemtico ingls Charles Babbage (1792-1871) trabalhou no projeto de uma mquina de calcular, cujas caractersticas principais antecipavam o arranjo dos primeiros computadores eletrnicos. Ela era composta por uma porta de entrada de dados; uma memria de armazenamento de informao; uma unidade matemtica, para operar os clculos; uma unidade de controle, que indicava quando e como usar a informao, e um dispositivo de sada de dados, que fornecia as respostas impressas. O processo de computao utilizaria cartes perfurados com informao codificada, tal como os teares mecnicos inventados pelo francs Joseph-Marie Jacquard (1752-1834), em 1801. Embora a Inglaterra vitoriana no tivesse condies industriais para produzir as peas sofisticadas necessrias construo da "mquina diferencial" de Babbage, como ela ficou conhecida, o estatstico estadunidense, Herman Hollerith (1860-1929), pde fabricar mquinas de somar que foram utilizadas para separar, contar e catalogar os resultados do censo de 1890 trs vezes mais rpido que as mquinas convencionais de ento. Mais tarde, mecanismos semelhantes ao de Hollerith passaram a ser empregados em contabilidade e negcios, em geral, utilizando os cartes perfurados que s foram superados 90 anos depois pelas fitas magnticas. Nesse nterim, ele fundou a Computing Tabulating Recording Company (CRT) que se fundiu a outras empresas para formar a International Business Machine Corporation (IBM). Simultneo aos avanos desses equipamentos, George Boole (1815-1864), matemtico ingls, procurava associar as leis bsicas do pensamento aos princpios da lgica com o intuito de eliminar as ambigidades da linguagem natural. Em 1847, Boole apresentou, no opsculo The Mathematical Analysis of Logic (A Anlise Matemtica da Lgica), um sistema que consiste num conjunto de smbolos, cujos operadores disjuntivo, conjuntivo e negao correspondiam, respectivamente, aos sinais "+", "." e "" que formavam expresses de valores verdadeiro ("1") ou falso ("0") com variveis "a", "b", "c" etc, representando proposies de um conjunto de sentena "S". A lgebra booleana permitia que o raciocnio fosse processado sem qualquer relao a contedos particulares e especficos, ao mesmo tempo que garantia a postulao de axiomas para identidade, associatividade, comutatividade, distributividade, complementao e todas operaes bsicas do pensamento. A teoria de Boole prosseguiu de forma mais sistemtica na obra A Investigation of the Laws of Thought (Uma Investigao das Leis do Pensamento, 1854), a qual Bertrand Arthur William Russell (1872-1970) atribuiu a descoberta da matemtica pura277. A aplicao da lgebra booleana aos circuitos eletrnicos s foi possvel depois de Claude Elwood Shannon concluir, em 1938, sua dissertao de mestrado, intitulada "A Symbolic Analysis of Relay and Switching Circuits" (Uma Anlise Simblica dos Circuitos de Interruptores e Rels). Shannon adaptou as idias de Boole ao chaveamento de circuitos telefnicos, associando os estados aberto e fechado dos interruptores, respectivamente, aos valores falso e verdadeiro das equaes lgicas. Esse esforo de traduo de uma linguagem formal para um aparato fsico, facilitou a formulao de projetos e a construo de maquinrio eletrnico a um custo menor. Desde ento, a fabricao de circuitos eletrnicos, bem como posteriormente, os
276 277
.DE LA METRIE, J.O. L'Homme Machine, apud CHANGEUX, J-P. O Homem Neuronal, cap. 2, p. 47. . Veja GARDNER, H. A Nova Cincia da Mente, pp. 157-158.
153
programas deveriam levar em conta instrues em linguagem de mquina sob o ponto de vista formal da lgica e no pelo acmulo de operaes e nmeros da aritmtica. Jogo da Imitao Toda essa discusso em torno da capacidade de mquinas reproduzirem a cognio humana, no sculo XX, tinha como eixo o argumento de Alan Turing (19121954) apoiado no seu famoso Jogo da Imitao. Seu objetivo era tentar mostrar como mquinas inteligentes poderiam reproduzir com perfeio o comportamento humano a ponto de se tornarem indiscernveis um do outro. Isto , percepo de um observador humano, no seria possvel dizer qual ao teria sido determinada por um algoritmo ou se fora fruto do livre arbtrio de uma mente humana278. Na filosofia, computadores surgiram como um tema central da Inteligncia Artificial e da Teoria da Mente. Fora desse mbito restrito, tm sido usado to somente como mquinas datilogrficas de luxo por aqueles que no sentem horror ao desenvolvimento da tecnologia. Entretanto, cada vez mais as cincias que estudam o comportamento humano tm utilizado essas mquinas como instrumentos teis para simulao de determinadas prticas que, ao lado dos testes laboratoriais feitos com voluntrios humanos, ajudam a compreender melhor a emergncia de atitudes cooperativas, senso de justia, indignao ou instituies como Estado ou a polcia. Apesar das crticas emocionais, nem sempre razoveis, que surgem contra esse tipo de abordagem, os computadores esto se fixando como mecanismos valiosos para refutao de hipteses filosficas que de outro modo permaneceriam eternamente em meio especulao sobre sua viabilidade prtica. Computadores, desde o incio, serviram como modelo para compreenso de particularidades das faculdades cognitivas. No Jogo da Imitao de Turing, uma mquina e uma pessoa ocupariam o lugar de um homem ou uma mulher, enquanto um interrogador, localizado em uma outra sala deveria advinhar o sexo de quem respondia suas perguntas. A melhor estratgia para uma mquina seria tentar oferecer de forma "natural" as respostas como se fosse um ser humano. Turing acreditava que um computador com capacidade de memria conveniente - em torno de 1 gigabite - poderia imitar o comportamento humano nesses exames to bem que uma pessoa comum no seria capaz de fazer uma identificao correta com 70% de probabilidade, em menos de cinco minutos de teste279. O teste de Turing visava encontrar um mtodo para determinar se mquinas poderiam pensar, mas dependia de uma percepo de terceira pessoa sobre o desempenho teatral. Esse aspecto intersubjetivo do jogo de imitao foi criticado pelo filsofo da linguagem John Searle, como insuficiente para definir se o programa embutido na mquina compreende ou no aquilo que responde ao interrogador. Em 1980, Searle escreveu o artigo "Minds, Brains and Programs" (Mente, Crebro e Programas), no qual lanou a distino das pesquisas que visavam esclarecer os processos mentais, como causas do comportamento das partes do crebro - ou IA fraca , daquelas que consideravam o crebro como um computador e a mente o seu programa - a IA forte. Para Searle, a IA fraca permite a harmonia entre as abordagens biolgicas e o que se sabe sobre o mundo, enquanto a IA forte, ao tentar criar mentes artificiais
278 279
. Veja TURING, A. "Computao e Inteligncia", pp. 21-23. . Veja TURING, A. "Computao e Inteligncia", 6, p. 34.
154
estaria condenada ao fracasso, pois nenhum programa de computador seria suficiente para fornecer um sistema inteligvel280. Nesse artigo, Searle apresentou o experimento mental batizado de "quarto chins", como um contra-exemplo s pretenses dos partidrios da IA forte. Um falante de uma lngua ocidental - o portugus, no nosso caso - isolado numa sala que contm vrios smbolos em mandarim - lngua oficial da China -, cujo significado ele desconhece. Sobre uma mesa, h um manual em portugus com regras de como o "lusfono" deve entregar os smbolos corretos, toda vez que determinados cartes, em mandarim, lhe forem mostrados. Desse modo, observando no manual a correlao especfica entre os sinais recebidos e os enviados, a pessoa dentro da sala, induz o destinatrio de seus cartes, do lado de fora, falante do mandarim, a acreditar que ele compreende sua lngua. No entanto, o falante do portugus trancado na sala, na verdade, no entende uma palavra em mandarim. Tudo que ele faz seguir as instrues contidas no manual. Moral da histria: se o manual, semelhante ao programa de um computador, no ensina palavra alguma em outra lngua ao leitor, ento nenhum computador, ao executar um programa, compreende o contedo daquilo que est sendo processado. Tal como o personagem na sala, o computador apenas segue as instrues formais para manipular smbolos em uma sintaxe correta, sem compreender seu significado semntico281. Com isso, Searle atacava a pretenso de que o teste de Turing fosse suficiente para atribuir corretamente uma mente a mquinas, pois seu desempenho poderia ser uma mera imitao formal, sem entendimento do contedo da ao. Por apresentar apenas um comportamento sinttico formalmente correto, o computador no conhece a semntica, o contexto real de sua atuao, ou a inteno de seus estmulos ou respostas282. A inspirao do "quarto chins" uma adaptao de experimento semelhante imaginado por Ned Block no artigo "Troubles With Functionalism" (Problemas com o Funcionalismo, 1978). O chamado "ginsio chins" reunia, num estdio maior que o Maracan, milhes de pessoas para que elas transmitissem sinais umas s outras, por meio de rdios de fala-escuta - numa analogia ao funcionamento dos neurnios. Assim, seguindo uma srie de regras, a multido conseguiria responder a perguntas sobre histrias em mandarim, embora o ginsio no entendesse uma palavra dessa lngua. curioso notar que a inteno de Block era defender a teoria computacional do crebro, o oposto do que Searle props. Contra o conexionismo, Searle diz que as conexes correspondentes s sinapses neurais no simulam as propriedades causais que provocam a sua compreenso, por mais perfeita que seja a emulao do funcionamento do crebro. Falta-lhes habilidade para produzir estados intencionais. Para Searle, "o que quer que seja a intencionalidade, um fenmeno biolgico o qual deve ser to causalmente dependente da bioqumica especfica de suas origens como o a lactao, a fotossntese ou quaisquer outros fenmenos biolgicos"283. Um dos paradigmas da Inteligncia Artificial forte atacada por Searle eram os programas de xadrez, que na poca de Turing ainda eram muito precrios. Anos depois, filsofos como Hubert L. Dreyfus, precipitavam-se em dizer que esse tipo de programa jamais chegaria a vencer a habilidade humana para jogar xadrez. O tempo passa e, em
280 281
. Veja SEARLE, J. R. Mente, Crebro e Programas pp. 65-68. . Veja SEARLE, J. R. Op. Cit pp. 68-71. 282 . Veja GARDNER, H. Ibidem, pp. 187-188. 283 . SEARLE, J. R. Idem, p. 92.
155
1997, com a vitria do computador Deep Blue sobre o enxadrista russo Garry Kasparov, mais esse mito filosfico cai por terra. Imitao da Vida Pouco a pouco, a evoluo dos programas foi superando os obstculos cognitivos a ponto de computadores terem se tornado modelo de racionalidade para tal como nos primeiros conceitos de razo na modernidade adotados por lgicos e filsofos da teoria do conhecimento. Os computadores serviram tambm para elaborao de programas que buscavam simular no s um tipo de inteligncia, mas a prpria reproduo da vida no planeta. A teoria matemtica dos sistemas dinmicos, na fsica, procurou explorar as analogias dos ciclos de ascenso e queda de organismos vivos e sociedades em modelos de jogos que representariam o processo de desenvolvimento da vida real. O jogo da Vida, de John Conway, trabalhava a idia de uma mquina de Turing que visaria passar no teste de simulao do aparecimento, sobrevivncia e morte de sistemas complexos, como a vida, a partir de um conjunto de regras simples. A imitao da vida, tal como da inteligncia trouxe a possibilidade de se usar os computadores como instrumentos adequados para o exame de hipteses acerca dos algoritmos que poderiam estar por detrs do desenrolar dos principais fenmenos biolgicos evolutivos. No modelo de Conway, leis genticas de nascimento, reproduo e morte descreveriam a forma com que organismos ocupariam um territrio, tal como autmatos celulares em um tabuleiro infinito (de Go ou de Xadrez, com as casas de uma mesma cor). Cada clula ocupada desta tabela representaria um organismo que interage com as oito casas que a cercam. Passam gerao seguinte - prximo movimento do jogo - os pontos adjacentes a duas ou trs casas ocupadas. Com quatro ou mais vizinhas, a superpopulao extingue o respectivo ponto. Enquanto o ponto solitrio ou com apenas um vizinho desaparece pelo isolamento. Novos organismos surgem sempre ao lado de trs vizinhos exatos. Com base nessas regras, trs cenrios poderiam surgir: nenhum padro conseguiria avanar indefinidamente; aparentemente os padres formados cresceriam sem limite; ou se dispersariam at desaparecerem completamente ou congelariam ou cairiam em um ciclo eternamente oscilante. De todos cenrios possveis, Conway concluiu que nenhuma configurao inicial com um nmero finito de organismos conseguiria progredir indefinidamente sem chegar a um limite284. A vida no computador, tendo por modelo autmatos celulares, com regras simples de gerao e extino, reproduziu o conhecido padro cclico das populaes descoberto pelos matemticos Lotka e Volterra285. (...) O ciclo, que o padro mais conhecido na biologia das populaes, descreve a interao entre populaes de uma espcie predadora e sua presa. Com essa populao estabelecida de presas, a populao de predadores aumentar. Finalmente, os predadores comeam a exercer um srio impacto na populao de presas, que comea a diminuir. Com menos presas para comer, os predadores comeam a sofrer e sua populao diminui. Liberta da presso dos predadores, a
. Veja GARDNER, M. Mathematical Games, pp. 120-123. . O estadunidense, nascido na ustria, Alfred James Lotka (1880-1949) era qumico, matemtico, demgrafo e fsico e o italiano Vito Volterra (1860-1940) era matemtico e durante a I Grande Guerra trabalhou para a Fora Area da Itlia, ambos construram um modelo matemtico utilizado pelos tericos do caos e da biologia.
285 284
156
populao de presas agora tem um impulso, seguida pela populao de predadores. O ciclo de ascenso e queda das populaes continua indefinidamente (...) (LEWIN, R. Complexidade, cap. 5, p. 119). O movimento cclico que aparece nitidamente no jogo da vida emerge tambm no jogo dos Pombos e Falces repetidos por Richard Dawkins, Maynard-Smith e Robert Trivers. Nos computadores, trs teorias cruciais desenvolvidas no sculo XX tm o ambiente propcio para os seus encontros e desdobramentos. Inteligncia Artificial, Teoria do Caos e dos Jogos abordam de modo complementar os aspectos particulares de uma teoria geral sobre o surgimento, sobrevivncia e destruio dos organismos vivos. Por meio de computadores, de hipteses simples, podem ser extradas consequncias complexas em geral. Tal instrumento, mostrou como caractersticas locais, em larga escala, poderiam fazer surgir "propriedades emergentes" das interaes entre indivduos em um sistema global286. O uso de computadores na avaliao de hipteses facilita a observao de discrepncias de concluses consideradas razoveis de estudos meramente acadmicos e dedutivos. Axelrod chamou ateno para os equvocos de dedues tiradas das anlises acadmicas feitas sobre a estratgia RETALIADOR PERMANENTE. Alguns ensaios consideraram que RP possuiria as condies mnimas para sustentao da cooperao e da confiana. Contudo, os torneios de computadores de Axelrod, onde RP participou, revelaram que se trata de uma estratgia perigosa, uma vez que teria ficado nas piores colocaes entre as estratgias gentis - aquelas que comeam cooperando287. Essa discusso ilustra dois princpios. Primeiro, que fazer bons conselhos depende no apenas das propriedades dedutveis da estratgia em questo, mas tambm das condies exatas sob as quais a estratgia ser usada. Em um mundo de agentes adaptativos, mesmo um jogador plenamente racional precisa levar em considerao o que o outro jogador est provavelmente experimentando ao invs de otimizando. Segundo simulaes oferecem uma rica possibilidade para checar a eficcia das idias estratgicas em ambientes que so altamente diversos (AXELROD, R. "On Six Advances in Cooperation Theory", p. 15). Todo trabalho sobre o comportamento feito em laboratrios de informtica tem servido para testar hipteses que filsofos mais atentos, como Daniel Dennett, tm considerado vlidas e estimulantes, at mesmo para questes ticas. Fatores como o reconhecimento mtuo, comunicao e reciprocidade tm se mostrado como condies necessrias para o processo de evoluo da moral288. Embora o mecanismo dos jogos no seja adequado para formulao de leis cientficas deterministas, este pode ser utilizado corretamente na preparao de explicaes probabilsticas de procedimentos difceis de ser definidos intuitivamente pela mera observao dos fenmenos sociais. Com a teoria dos jogos, possvel compreender quais so os principais componentes a serem considerados em uma relao entre dois ou mais agentes racionais e as possveis consequncias de seus atos. No sentido definido por Luce e Raiffa, a teoria dos jogos e seus modelos computacionais no devem ser entendidos como propositores de normas absolutas da maneira pela qual as pessoas se comportam ou deveriam agir. Porm, sua
286 287
. Veja AXELROD, R. "On Six Advances in Cooperation Theory". Analyse & Kritik , p. 10. . Veja AXELROD, R. Op. cit., pp. 11-12. RP ficou em stimo lugar no primeiro torneio e em 52 no segundo. 288 . DENNETH, D. Cl. A Perigosa Idia de Darwin, cap. 16, 3, p. 505.
157
funo tem sido at agora prescrever as linhas de ao viveis, caso as partes desejem atingir os fins especficos. (...) Ela prescreve para dadas hipteses cursos de ao para atender os resultados que tenham certas propriedades formais "timas". Tais propriedades podem ou no ser consideradas pertinentes em algum dado conflito de interesses no mundo real. Se eles forem, a teoria prescreve as escolhas que precisam ser feitas para alcanar o timo (LUCE, R.D. & RAIFFA, H. Games and Decisions, cap.4, 4.3, p.63). 7.2 A Construo de Jogos e sua Utilizao Prtica Em 1950, John Nash havia demonstrado a existncia de, ao menos, um ponto de equilbrio em qualquer jogo no-cooperativo finito com mais de um jogador e soma diferente de zero. Essa teoria foi apresentada em sua premiada tese "Non-Cooperative Games", que propunha uma soluo mais abrangente do que os resultados do teorema minimax de Von Neumann que se restringia a jogos cooperativos e de soma zero. De fato, Nash logrou demonstrar a existncia de ponto de equilbrio para qualquer tipo de situao finita: cooperativa ou no cooperativa; soma zero ou variante; dois ou mais agentes. Todo seu esforo estava voltado para tornar mais teis e prticas as idias lanadas em Theory of Games and Economic Behavior, por Von Neumann e Morgenstern. Ainda que as estratgias puras no mostrassem um ponto de equilbrio, sempre se poderia encontr-lo por meio de mistura das linhas de ao289. Apesar da justeza de sua descoberta, no dilema dos prisioneiros, em geral, os participantes percebem que deveriam cooperar, caso quisessem maximizar seus ganhos, usando a dominante somente quando o outro no tivesse cooperado, como punio instantnea, e retomando a cooperao na rodada posterior - segundo a estratgia OLHO POR OLHO. Desse modo, conseguiriam fugir do fatdico ponto de equilbrio, atingindo um resultado timo para todos, ao longo de sucessivas rodadas. Modelos de jogos como esse, historicamente, surgiram como uma maneira de testar as hipteses propostas para solucionar o conflito parcial de interesses entre agentes racionais egostas. Mais tarde o campo de aplicao de suas simulaes se estendeu a todo tipo de agente - racional ou no - que tivesse de tomar uma deciso sobre que fazer diante de um ser semelhante que disputa os bens disponveis, mas que depende do outro para alcan-lo. Dessa forma, a construo de jogos como mtodo de pesquisa permite por em prtica os tradicionais experimentos mentais que sempre foram produto da especulao filosfica mais apurada. S que, alm disso, os jogos possibilitavam encontrar uma resposta sobre os efeitos da proposta examinada. No caso do Dilema dos Prisioneiros, sua matriz jogada em uma s rodada punha em cheque o influente mecanismo da mo invisvel, anunciado por Adam Smith, em Teoria dos Sentimentos Morais e depois reapresentado em A Riqueza das Naes. medida que, sendo repetido vrias vezes, o jogo permitia cooperao ser implementada, contra a orientao racional que era recomendada pelo equilbrio de Nash, no que diz respeito mo invisvel, a noo apresentada por Smith no seria capaz de fornecer a distribuio justa que se pensava poder realizar afinal. Ao promover suas aes no sentido de obter "o mximo valor possvel", cada indivduo no conseguiria elevar ao mximo a renda da sociedade de modo que a distribuio desses
289
. Veja NASH, J. "Non-Cooperative Games", pp. 85 e ss.
158
bens, conduzida pela mo invisvel, fosse a mais igualitria e eficiente do que se fosse planejada. Os agentes racionais, na situao do dilema, se seguirem as estratgias que maximizam seus ganhos individuais, acabam por gerarem o pior resultado conjunto: a puniao mtua290. Uma distribuio justa s surge quando, aos jogadores, dada a oportunidade de retaliar e tolerar os erros cometidos pelos outros. O comportamento recproco torna-se vivel com a repetio frequente das rodadas. No obstante o fato da fuga da estratgia dominante, no Dilema dos Prisioneiros Iterado, contradizer a previso de que seres racionais a seguem e se encontram em um ponto de equilbrio de Nash. O uso de experimentos por modelos de jogos para formalizar as situaes de conflito visa detectar os aspectos mais importantes de cada circunstncia e que influenciam as deliberaes, bem como o comportamento dos agentes. Desde o Dilema dos Prisioneiros, sua aplicao vem sendo cada vez mais incrementada. Por conta disso, os elementos que permitem prever as aes dos indivduos, ou ao menos interpretar suas decises, podem ser descritos de forma mais precisa. Antes dos torneios de Axelrod, diversos testes realizados em torno do Dilema dos Prisioneiros revelaram uma atitude competitiva dos participantes, tal como aquelas adotadas pelos programadores que tentaram bater a estratgia OPO, vitoriosa desde o incio. Contudo, alm da capacidade de retaliar, Axelrod havia chamado ateno para a condio de clemncia (forgiving), que fazia OPO recuperar a cooperao, como caracterstica decisiva de seu xito nos dois torneios que ele promoveu291. A complexa ao dos elementos observados nos experimentos transformou a meta inicial de se construir uma teoria que buscasse em primeiro lugar a predio de resultados. Agora, ao invs de apontar solues para todos os jogos, a investigao procura avaliar o grau de participao de cada fator deliberativo e dos princpios do comportamento estratgico. O conhecimento emprico adquirido pela prtica dos jogos permitiu avanar respostas para as questes problemticas do comportamento estratgico, que as suposies tericas, por si s, no conseguiam solucionar. (...) As previses da teoria dos jogos, particularmente a teoria dos jogos no cooperativos, que suportam muitas aplicaes, so notavelmente sensveis aos detalhes da estrutura do jogo, e muito de sua sensibilidade refletida no comportamento observado. Tais detalhes raramente podem ser precisamente observados ou adequadamente controlados no campo. O laboratrio partilha alguns desses problemas, mas o controle e observao que tcnicas experimentais modernas permitem amide fornecer aos experimentos uma decisiva vantagem na identificao da relao entre o ambiente e o comportamento estratgico (...) (CRAWFORD, V. P. "Introduction to Experimental Game Theory", I, p. 2). Se antes a personalidade do jogador era uma varivel importante que estava longe do alcance do experimentador, hoje, modelos como o Ultimato e o DPI procuram enfocar os diversos aspectos da cognio humana - crenas, desejos e sentimentos - que interferem nas escolhas de cada um. Nesse sentido, as simplificaes praticadas pelas simulaes funcionam de modo similar aos experimentos avanados da fsica, que
290
. A descrio da "mo invisvel" est em SMITH, A. Teoria dos Sentimentos Morais, IV part., cap. 1, p. 226 e SMITH, A. A Riqueza das Naes, liv. VI, cap. II, pp. 379-380. 291 . Veja AXELROD, R. The Evolution of Cooperation, II, cap. 2, p. 40.
159
isolam as partculas em ambiente artificial, a fim de estudar o comportamento entre elas e as foras que atuam em situaes especficas. Cada modelo de jogo proporciona a observao mais detalhada das caractersticas do comportamento que influenciam as tomadas de deciso. O DPI aponta o papel fundamental da reciprocidade para o estabelecimento da cooperao de um modo geral. Os Bens Pblicos mostram o papel de mecanismos como a punio na manuteno de um emprendimento comum. Enquanto o Ultimato revela que as emoes e o ambiente cultural tambm exercem presso considervel na emerso de resultados equitativos. Sentimentos morais, como indignao, vergonha e vingana, foram incorporados ao repertrio comportamental da espcie humana medida que suas manifestaes provocavam restries s escolhas estratgicas que a longo prazo traziam resultados prejudiciais sobrevivncia e reproduo dos indivduos. Esses sentimentos proporcionariam as respostas adaptativas a diversas situaes sociais e ambientais que envolvessem outros sujeitos e ameaassem o bem estar do agente racional. Corresponderiam quilo que Antnio Damsio chamou de marcadores-somticos292. A base neural para o sistema interno de preferncias consiste, sobretudo, em disposies reguladoras inatas com o fim de garantir a sobrevivncia do organismo. Conseguir sobreviver coincide com conseguir reduzir os estados desagradveis do corpo e atingir estados homeostticos, isto , estados biolgicos funcionalmente equilibrados. O sistema interno de preferncias encontra-se inerentemente predisposto a evitar a dor e procurar o prazer e provvel que esteja pr-sintonizado para alcanar esses objetivos em situaes sociais (DAMSIO, A. R. O Erro de Descartes, part. 2, cap. 8, p. 211). A utilizao de jogos como o Ultimato permite avaliar at onde os sentimentos morais, adquiridos durante a evoluo, se manifestam de acordo com uma lista de preferncias internas e a compreenso dos contextos externos nos quais o agente deve decidir a maneira de se comportar conforme normas sociais e ticas. Martin Nowak e Karl Sigmund pressumem que essas respostas emocionais foram montadas graas convivncia humana praticada por milhes de anos em pequenos grupos, nos quais cada um de seus membros so conhecidos dos outros. Ao passo que, a superpopulao e o crescimento desordenado das grandes cidades colocarariam o problema do anonimato como fator perturbador das interaes continuadas. O conhecimento do tipo de agente com o qual se interage favorece a manifestao das emoes, enquanto a recusa sistemtica de ofertas baixas restringem sua repetio no futuro, obrigando o outro a aumentar os ganhos propostos e maximizar a utilidade de todos participantes293. Todavia, quando a impossibilidade de novos encontros entre agentes se torna constante, o anonimato acaba por perturbar a cooperao e proporcionar o florescimento de desertores e a insegurana das propostas e respostas. A reputao s eficaz se novos encontros puderem ocorrer no futuro. Coisa que se torna difcil entre estranhos de uma megalpole. Pode-se saber com alguma preciso como se comportam parentes, vizinhos, amigos e colegas. Mas o controle fica difcil quanto maior for o nmero de conhecidos com os quais se interage. O efeito do anonimato mais uma consequncia perturbadora das grandes cidades e da superpopulao sobre o comportamento dos seus habitantes, diminuindo a confiana entre eles. Por conta dessa desconfiana, a exigncia
292 293
. Veja DAMSIO, A.R. O Erro de Descartes, part. 2, cap. 8, pp. 209 e ss. . Veja SIGMUND, K., FEHR, E. & NOWAK, M. "The Economics of Fair Play", p. 85.
160
de garantias, mecanismos de identificao - cadastro de bons e maus pagadores - e aparelhos de represso tornam-se cada vez mais necessrios. A construo do modelo adequado de jogo permite, ento, avaliar com maior preciso os componentes relevantes de interao. A partir disso, as decises a serem adotadas no intuito de fomentar ou restringir a cooperao podem ser sugeridas com maior probabilidade de correo. Desse modo, o emprego de simulaes e jogos entre agentes humanos ajuda a compreender melhor os aspectos sutis que subjazem interao. Com isso, as hipteses tecidas por tericos que estudam o comportamento humano podem ser testadas no sentido de fazer valer ou derrubar as concluses tiradas sobre a cooperao que acontece no mundo concreto. A pesquisa realizada por esse mtodo deve atender alguns requisitos bsicos acerca da maneira como a experincia ser modelada, da anlise dos resultados e sua divulgao. Os modelos de jogos funcionam como os experimentos mentais, bastante difundidos em textos filosficos, mas que podem ser reproduzido por meio eletrnico ou questionrios tradicionais, em papel. De um modo geral, parte-se de hipteses simples que uma vez implementadas geram consequncias complexas ou paradoxais. Os efeitos decorrentes da complexidade de interao entre agentes simples fazem emergir propriedades que no eram observadas antes no comportamento individual. Tais propriedades emergentes so temas comuns s pesquisas feitas na fsica contempornea sobre os sistemas complexos abordados sob a perspectiva da Teoria do Caos. Nesse sentido, hipteses fortes sobre a racionalidade das escolhas podem ser enfraquecidas, no intuito de abranger toda forma de atuao de indivduos cujo processo de deliberao leva a inferncia de algum princpio dedutivo. Seres muito simples poderiam ser includos nessa pesquisa, concebendo suas escolhas como geradas por meio de um processamento de informaes obtidas no meio ambiente que provocam uma resposta do agente. Essas respostas dar-se-iam atravs de um conjunto de regras incorporadas que criariam um modo de gerar aes conforme a entrada de informaes. Quanto mais simples forem os testes baseados no modelo de agente, maiores so as possibilidades de se perceber o processo fundamental ascendente que se inicia com os elementos bsicos da interao e se eleva s concluses gerais sobre o comportamento social. A validade interna do procedimento que conduz esse tipo de pesquisa a resultados consistentes depende do grau de preciso entre elementos que compem o experimento e a situao real analisada. Resultados contra-intuitivos causam forte discusso sobre a possibilidade de algum erro ter sido cometido na formulao ou execuo dos modelos propostos. Nesses casos, deve-se proceder ao reexame de todo mtodo empregado, utilizando propostas alternativas, variantes e contra-exemplos, a fim de se detectar possveis falhas na aplicao dos testes que devem tambm ser flexveis o suficiente para permitir novas verses aprimoradas e extenses a diversas circunstncias294. Os modelos mais avanados de estudo do comportamento de agentes incluem abordagens de redes neurais, algoritmos que podem evoluir e tcnicas de aprendizagem que se aplicam maneira como os indivduos se adaptam nas interaes cotidianas. O sistema de agentes modelado com base em informaes sobre como os agentes tomam suas decises de modo autnomo. Assim, procura-se saber como so organizados os mercados, o fluxo da populao e a difuso das estratgias simuladas de um ponto de
. Pormenores dessa metodologia podem ser buscados em AXELROD, R."Advancing the Art of Simulation in the Social Sciences", 3.1, p. 7.
294
161
vista "atmico" (partculas mnimas e indivisveis) da sociedade como alternativa viso "macroscpica", que descendente. A rigor, a simplicidade dos modelos no deve diminuir a importncia e a profundidade dos conceitos trabalhados. Nas cincias sociais, as simulaes dos contextos da sociedade tm estimulado a mudana de metas tradicionais que antes buscavam uma ferramenta que produzisse resultados previsveis, mas que agora se restringem aos limites da tarefa de compreenso do modo como os agentes atuam. Nas palavras de Eric Bonabeau - ento, pesquisador da Icosystem Corporation -, "prever o sucesso pode ser simples, mas coisa difcil de faz-lo; entender como o sucesso acontece um uso melhor do modelo"295. Tais modelos so teis para mostrar o modo complexo de como o agente aprende e se adapta a uma situao. Alm disso, podem ser aplicados para avaliar a mobilidade territorial e a resistncia a invases, sobretudo, quando o comportamento dos indivduos de uma populao heterogneo e varia de regio para regio - nas relaes de convvio familiar, vizinhana, instituies pblicas, trabalho etc. Em geral, os temas de maior interesse para essa rea do conhecimento so as questes sociais, polticas e econmicas, que devem aplicar modelos especficos para cada proposta de investigao e no forar o uso de um modelo de soluo universal para todos os problemas da humanidade. Como j se tentou destacar os DPI, os Bens Pblicos e o Ultimato, por exemplo, servem para tratar questes de reciprocidade direta, indireta e de equidade, respectivamente, com maior preciso. Isso no implica em solues ad hoc, pois a formalizao empregada segue os mesmos procedimentos gerais da teoria dos jogos, variando apenas os elementos que tm de ser mudados para tornar o modelo mais realista. Para as cincias sociais, o modelo de jogos talvez seja a nica maneira vivel, salvo melhor juzo, de abordar a inconsistncia do comportamento humano e seu complexo processo cognitivo de escolha. Os jogos experimentados vm expandindo-se alm dos domnios econmicos e se tornando um ambiente prprio para troca de informaes interdisciplinares. Mesmo quando so tratados por economistas, suas concluses dizem respeito a outras matrias pertinentes, como no caso da avaliao da equidade nos modelos de jogos que interessam desde reas administrativas at as recentes descobertas das neurocincias. 7.3 As Diversas Disciplinas que Empregam os Modelos de Jogos Logo no primeiro captulo de Theory of Games and Economics Behavior, John Von Neumann e Oskar Morgenstern colocaram como nica possibilidade de soluo para os problemas de diversas situaes tpicas da economia - troca de bens, monoplio, oligoplio e livre competio - a abordagem destes atravs dos mtodos matemticos contemporneos. A teoria dos jogos moderna j surgia como a responsabilidade de aplicar as tcnicas de uma disciplina (a matemtica) sobre outra (a economia). As anlises dos jogos estratgicos vinham desenvolvendo-se, desde 1928, com a pesquisa de matemticos acerca da melhor maneira de vencer em jogos de xadrez, pquer e outros divertimentos de salo. A idia era de que o comportamento econmico poderia ser descrito ou interpretado do mesmo modo que esses jogos estratgicos296.
BONABEAU, E. "Agent-Based Modelling", p. 7286. . Veja VON NEUMANN, J. & MORGENSTERN, O. Theory of Games and Economics Behavior, cap. 1, 1.1, pp. 1 e 2.
296
295
162
O que aqueles dois autores imaginavam era que a matemtica poderia ser til economia, da mesma forma como fora para as diversas teorias da fsicas - calor, nuclear, quantas etc. Apesar do ceticismo das cincias sociais, que consideravam a psicologia e o comportamento humano fenmenos de difcil trato formal, acreditava-se que uma formulao clara desses problemas seria o primeiro passo para o emprego da matemtica, tambm em economia. Por outro lado, o uso do instrumental matemtico adequado economia evitaria o desconforto de iniciativas anteriores nesta direo em relao a uma fsica social - como fora proposta pelos positivistas, marxistas e malthusianos -, procurando assim orientar-se pela aplicao de novas tcnicas relevantes tal como fora importante o clculo diferencial para o estudo de trajetria de objetos no passado. O ceticismo inicial no permitiu que os economistas se entusiasmassem pela teoria dos jogos. Em Uma Mente Brilhante, Silvia Nasar lembra que as contribuies da obra de Von Neumann e Morgenstern estavam limitadas a uma reapresentao mais extensa do teorema minimax e uma nova roupagem de problemas econmicos tradicionais. Isso explica, porque durante muito tempo a teoria dos jogos continuou sendo um tema mais difundido entre matemticos do que entre economistas. Por tratar prioritariamente de jogos de soma zero, o alcance da teoria ficou reduzido aos interesses de militares que interpretavam a guerra como um jogo que para um vencer, outro tem necessariamente que perder297. A partir da descoberta do ponto de equilbrio, por John Nash, para jogos nocooperativos com mltiplos jogadores, o interesse de cientistas sociais pde ser despertado. Fora da matemtica e da economia, ou administrao, os primeiros textos publicados sobre o tema foram Theory of Games as a Tool for the Moral Philosopher, de Richard B. Braithwaite, lanado em 1955. Cinco anos depois, o psiclogo Anatol Rapoport apresentou Lutas, Jogos e Debates. Enquanto Richard Lewontin foi o primeiro bilogo a escrever a respeito em "Evolution and Theory of Games" (1961). Nessa fase de aproximao, as principais objees levantadas partiram do economistas francs Maurice Allais. Suas crticas estavam voltadas para as dificuldades de seres humanos se comportarem racionalmente em condies de risco ou incerteza conforme os resultados previsto pela teoria. A suposta irracionalidade dos humanos observados diante do risco afrontava diretamente os axiomas assumidos pela teoria econmica estadunidense da metade do sculo XX. Uma resposta satisfatria a essas questes s foi bem sucedida, depois dos psiclogos israelenses Daniel Kahnemann e Amos Tversky lanarem a Teoria das Perspectivas, em 1979. O sucesso dessa teoria em suas implicaes econmicas valeram o Nobel de economia de 2002 Kahnemann e certamente seria estendido a Tversky, caso este estivesse vivo poca - Tversky falecera em 1996, vtima de cncer. Jogos Dinmicos At que a Teoria das Perspectivas viesse elucidar o comportamento de inconsistncia aparente dos agentes humanos, em escolhas envolvendo risco e incerteza, a teoria dos jogos sofreu vrias crticas de economistas acerca da concepo forte de racionalidade dos jogadores que no correspondiam ao real desempenho dos agentes racionais. Alm disso, muitos conceitos chaves, como ponto de equilbrio, axiomas da transitividade das preferncias, foram atacados atravs de experimentos simples, como o
297
. Veja NASAR, S. Uma Mente Brilhante, part. I, cap. 7, p. 106.
163
Dilema dos Prisioneiros, que obrigavam uma reinterpretao das deliberaes que fugiam do padro terico previsto. Enquanto a intransitividade das preferncias iria esbarrar no problema insolvel do teorema de Arrow, para o bem-estar social, o dilema dos prisioneiros acabou por transformar a teoria dos jogos estticos imaginada por Von Neumann e Morgenstern em uma teoria de jogos dinmicos que rapidamente foi desenvolvida e incorporada aos mtodos de pesquisa da biologia evolutiva contempornea. Em Theory of Games and Economic Behavior, seus autores foram enfticos em procurar delimitar sua formulao busca de compreenso das evidncias de como as pessoas se comportam em uma dada situao. Primeiro era preciso entender como as decises so tomadas em um instante determinado para depois investigar as repeties sucessivas das mesmas circunstncias iniciais. Sob o argumento de que, uma vez encontrado o equilbrio, no haveria razes para mudanas, eles rejeitavam a necessidade de se desenvolver uma abordagem dos jogos dinmicos, naquele estgio terico preliminar298. Entretanto, depois que, sobretudo, Axelrod colocou o Dilema dos Prisioneiros Iterado no centro de sua Teoria da Cooperao, o estudo dos jogos dinmicos acabou por preencher a lacuna deixada pela teoria original e apresentou um amplo espectro de possibilidades para sustentao do equilbrio em situaes mais favorveis do que a do jogo base, de um s lance. Assim, resultados na fronteira do timo de Pareto poderiam ser alcanados permitindo aos jogadores observarem as reaes do outro a suas decises e, nesse, sentido reorientar duas estratgias. Na biologia evolutiva, foram os jogos dinmicos uma ferramenta empregada na explicao de diversos comportamentos paradoxais, observados no s em humanos, mas em todo tipo de ser vivo. Surgiu, ento, uma nova classe de jogos evolutivos que transformou por completo a interpretao da teoria dos jogos tradicional, no se detendo mais em agentes racionais, mas abordando a conduta de qualquer tipo de indivduo que fosse capaz de atuar conforme as condies do meio e a presena de uma outra parte reagente. Por conta dessa nova abordagem, a teoria dos jogos e sua modelagem formal da interaes atraiu a ateno de pesquisadores de muitas outras disciplinas afins, interessadas no estudo do comportamento de sistemas dinmicos. Para a Teoria do Caos e para a Inteligncia Artificial, a teoria dos jogos apresentou a possibilidade de se programar autnomos celulares que simulassem a cognio e o movimento oscilatrio pertinente a condies de vida no limite entre o caos e a ordem. Desse modo, a teoria dos jogos conquistou a fsica contempornea e a cincia cognitiva mais avanada. Se na teoria econmica a teoria dos jogos ficou restrita microeconomia, nas outras reas do conhecimento veio galgando espaos cada vez mais amplos. Na biologia, est no centro dos experimentos a respeito da evoluo do comportamento e consolidao das emoes na psicologia humana. De fato, os jogos evolutivos vm ganhando cada vez mais ateno de pesquisadores fora da biologia. O afastamento inicial dos economistas no impediu que experimentos com modelos dinmicos fossem usados para atacar os pressupostos tericos do liberalismo econmico que no se sustentam na prtica. Nessa linha de investigao, testes que avaliam a capacidade de cooperao dos jogadores esto sendo empregados como mtodos que ajudam a revelar mecanismos que esto por detrs da complexa atividade humana.
298
. Veja VON NEUMANN, J. & MORGENSTERN, O. Op. cit., cap. 4, 4.8.2, pp. 44-45.
164
Na economia, os jogos experimentais esto em expanso graas gama de possibilidades de aplicao, j demonstrada pelos evolucionistas. Karl Sigmund, economista austraco, recomenda sua utilizao no estudo das interaes cotidianas de comrcio entre pessoas de diversos pases por meios eletrnicos, atravs da rede mundial de computadores. Essas e outras relaes interpessoais funcionariam a despeito da ausncia de contratos explcitos e instituies que deveriam regular essas trocas em escala global299. Neuroeconomia Por causa do sucesso do individualismo metodolgico na biologia e cincias sociais, os jogos dinmicos abrangem atualmente reas que antes a no eram atradas. A neuroeconomia um novo campo interdisciplinar que cresce com a reunio dos modelos de jogos investigao neurolgica, por meio de tomografia computadorizada, despertando o interesse de economistas e neurocientistas que querem descobrir as causas fisiolgicas do comportamento dos agentes. Antes, a ttica de evitar abordagens que levassem em conta juzos de valor era defendida por economistas que procuravam colocar suas teorias mais prximas dos mtodos cientficos. Assim, desde o sculo XIX, os economistas tratavam de desenvolver tcnicas de formalizao matemtica que no fizessem meno a sentimentos e estados mentais dos indivduos. No obstante, se no passado no era possvel trabalhar de modo experimental a cognio humana - a maneira pela qual as reaes nervosas ocorriam no crebro e provocavam por conseguinte um comportamento respectivo -, com o avano da tecnologia no invasiva de observao das atividades cerebrais relacionadas a um estmulo qualquer permitiu identificar as reas responsveis pelo comportamento econmico, j no final do sculo XX. A conduta humana surge da atividade conjunta do sistema de reaes automticas e controladas, dependendo da interpretao da ocasio em que se provoca uma atitude. A neuroeconomia informa os pesquisadores de ambas modalidades neurocincias e economia - sobre o papel do sistema nervoso no processo de deciso em negociaes rotineiras. Por conta disso, alm das variveis tradicionais a serem observadas preciso saber o estado mental do agente em relao ao tipo de ao que ir adotar. Em geral, os economistas imaginam que as escolhas dos agentes so resultados finais de um processo de tomada de deciso que, quando chegam a um equilbrio no podem mais ser mudados. Entretanto, os recentes estudos neurolgicos tm mostrado uma interferncia do sistema autnomo de respostas que no necessariamente percebida conscientemente e, por tanto, no depende do controle efetivo do sujeito. Por outro lado, h circunstncias em que as emoes exercem tambm um papel decisivo, de acordo com o calor do momento. Os mtodos das neurocincias procuram mapear as reas do crebro que trabalham no processamento das escolhas econmicas, identificando, por vezes, os neurnios atuantes, seja por meio de estmulos eltricos ou qumicos. Saber como o crebro funciona nessas ocasies ajuda a compreender melhor que hipteses tericas so sustentadas pelas evidncias empricas. Alguns dos conceitos criados pelos economistas, na prtica, no acontecem nos testes realizados, tais como avaliao do risco, o desconto paramtrico do futuro e consideraes altrustas, sobretudo quando as decises so derivadas de um processo automtico de seleo. Isto , no haveria nenhum mdulo isolado no crebro que fosse especializado nesse tipo de avaliao. O
299
. Veja SIGMUND, K. "The Economics of Fairness", p. 1.
165
que vale dizer que para o risco ser corretamente percebido, precisa estar envolvido em um contexto de incerteza ou insegurana para ser adequadamente estruturado300. Uma vez contextualizado o problema, o processo afetivo pode ento motivar o agente a seguir ou no uma tendncia delimitada pelas opes disponveis. Da perspectiva neurolgica, as preferncias, os interesses, as crenas e os desejos do agente s existem em funo da sua sobrevivncia e reproduo. Estes fatores so fins ou meios que so marcados como relevantes em razo da manuteno de um equilbrio homeosttico dos organismos que assegure sua existncia e perpetuao, nas condies impostas pelos meio ambiente. A homeostase , portanto, o princpio que conduz todo processo deliberativo exercido pelo sistema nervoso. Em outras palavras, tudo decidido no sentido de procurar preservar a integridade fsica do organismo301. Pesquisas recentes do economista Ernst Fehr, Michael Kosfeld e seus colegas da Universidade de Zrich tm ajudado a revelar que a confiana nas relaes sociais podem ser incrementadas, quando inalado pelos agentes um tipo de neutransmissor conhecido como oxitocina. Esse hormnio produzido naturalmente pelo hipotlamo, regio do crebro que controla a regulao biolgica e tambm as emoes. Trata-se de uma substncia qumica chamada peptido formada por nove aminocidos. utilizada por via intravenosa para induo do parto e de modo intranasal para estimular a lactao. Tambm ajuda a reduzir e controlar a hemorragia ps-parto, sendo contraindicada para pessoas hipertensas ou quando h complicaes na gestao. No deve ser administrada de forma oral por ser facilmente metabolizada pelo aparelho digestivo. Atua no sistema nervoso em regies associadas com o comportamento emocional e social (como a amgdala). Nos mamferos, a oxitocina diminui a resistncia natural dos animais aproximao de extranhos302. A equipe do Instituto para Pesquisa Emprica em Economia de Zrich borifou um lquido contendo a oxitocina e outro com placebo, respectivamente, em dois grupos distintos de jogadores que participaram anonimamente de uma variante do Ultimato conhecida como Jogo da Confiana. Neste tipo de jogo, duas pessoas atuam sem saber quem o investidor ou o depositrio. O investidor dever escolher uma parte ou o total de uma quantia disponvel para ser enviada a um depositrio. Ao fazer isso, o valor que for investido ser multiplicado pela banca (o experimentador) e imediatamente remetido ao depositrio, que de posse dessa transferncia deve ento decidir se devolve alguma parte, todo o dinheiro ou nada. O Jogo da Confiana testa a confiabilidade do investidor no retorno de seu capital por parte do depositrio. Entretanto, o investidor enfrenta o dilema de fazer um alto investimento e arriscar a ter sua confiana explorada pelo depositrio ou investir pouco e passar a ser alvo da indignao do segundo jogador, que pode considerar injusta a frao que recebe, em relao ao que o primeiro guardou para si. Nos experimentos realizados por Kosfeld, os investidores recebiam $12 e tinham as opes de aplicar nada, $4, $8 ou tudo. Os valores eram depois triplicados e enviados ao depositrio. Este somava as transferncias com os $12 que tambm recebera do experimentador e decidia quanto deveria devolver ao investidor, a saber: zero, $12, $24, $36 ou $48 303.
300 301
. Veja CAMERER, C., LOEWENSTEIN, G. & PRELEC, Dr. "Neuroeconomics", pp 17-18. . Veja CAMERER, C., LOEWENSTEIN, G. & PRELEC, Dr. Op. cit., pp 19 e 20 e DAMSIO, A. R. O Mistrio da Conscincia, part. 4, cap. 10, pp. 382-383. 302 . Veja DAMSIO, A. R. "Brain Trust", in Nature, p. 571. 303 . Veja KOSFELD, M et al. "Oxytocin Increases Trust in Humans", in Nature, p. 673.
166
Os participantes da experincia foram divididos em dois grupos. Os investidores que inalaram a oxitocina aumentaram suas transferncias em mdia 17 porcento, em comparao ao grupo de controle que inalou placebo. Esse comportamento indicou que a oxitocina interfere nas interaes sociais, estimulando a confiana no outro, mesmo que desconhecido. Razes para esta concluso foram reforadas, pois quando o investimento sofria a incerteza do risco - com uma taxa de probabilidade de no ser devolvido - ou quando era informado que o depositrio era uma mquina, a oxitocina no produzia nenhum efeito perceptvel304. Alm do mais, a oxitocina s agia sobre as decises do investidor e no do depositrio. Isto porque, os primeiros exercem papis psicolgicos diferentes dos segundo. Cabe ao investidor ter a iniciativa de abordar o depositrio, enquanto este tem apenas de avaliar se responde a ele reciprocamente ou no. O que significa que a oxitocina no atua sobre a reciprocidade, mas afeta o contato interpessoal, estimulando a interao social, que os bilogos chamam de "comportamento de abordagem"305. Os experimentos com jogos em que participam pesquisadores de vrios campos de investigao esto apenas comeando. Os resultados obtidos at agora, sobretudo na nova neuroeconomia, apontam para uma promissora rea de atuao para jovens pesquisadores interessados em abrir a "caixa-preta" que processa as deliberaes econmicas e sociais. O mistrio da conscincia e do comportamento humano nunca esteve to perto de ser elucidado. 7.4 Uma Nova Viso da tica Da filosofia, pode-se dizer que foi a origem de todas as cincias. No incio, passado o espanto original da percepo da regularidade dos fenmenos, os primeiros filsofos grosseiramente tentaram estabelecer princpios que pudessem explicar a origem de todas as coisas. Pouco a pouco, um maior refinamento do debate filosfico exigiu a formulao de argumentos e conceitos que explicassem as dificuldades que vinham sendo apresentadas. Da simples observao dos fenmenos e deduo de sua ocorrncia, volta-se para formulao de hipteses que depois deveriam ou no ser confirmadas pela experincia. Por vezes, a lgica perfeita do conjunto de proposies era um substituto conveniente para qualquer prova material. Assim, surgiu o pensamento metafsico e a prpria tica que no se detinham pela ausncia de qualquer contraexemplo que justificasse suas pretenses. A observao inicial cedeu espao a uma especulao dedutiva por meio da qual se pensava possvel interpretar o mundo e o lugar do ser humano neste. Regras de inferncia, solidamente construdas, garantiam a verdade das proposies. No obstante, medida que novos fenmenos iam sendo detectados, as propostas anteriores eram assaltadas por diversas indagaes que, caso no fossem respondidas de modo satisfatrio, minavam as bases antes tidas como inabalveis. A metafsica e a metatica que se mantiveram apegadas a teologias perduraram dogmaticamente por longos sculos. Mas a crescente demanda por novas explicaes gerou a especializao de vrios ramos tericos que fragmentavam o conhecimento em diversas disciplinas distintas e, por vezes, divergentes.
. Veja FEHR, E., FISCHBACHER, U. & KOSFELD, M. "Neuroeconomis Foundations of Trust and Social Preferences", II e III, pp. 7 a 9. 305 . Veja KOSFELD, M et al. Op. cit., p. 675 e DAMSIO, A. R. Op. cit., idem.
304
167
O desdobramento do Iluminismo levou formao de muitas novas maneiras de investigar a natureza, o que acabou por criar, no sculo XIX, as principais cincias conhecidas hoje. Nesse perodo, a tica, ou filosofia prtica, passou por vrias tendncias que oscilavam entre o materialismo e o idealismo. Do rigorismo kantiano por fazer valer suas normas, qualquer que fosse o contexto, at o utilitarismo de ato, voltado para as consequncias das aes morais, a tica tambm apresentou fortes discusses em torno do modo de sustentar os argumentos em favor de determinados princpios, bem como a aplicao dos seus preceitos ao cotidiano. Desde Scrates (470-399 a.C.), os principais pesquisadores dessa rea vm julgando a necessidade e convenincia de se pr em prtica as leis morais propostas por suas teorias. A moral teve sua origem histrico-filosfica nas questes levantadas por Scrates, na Grcia do sculo V a. C., e que foram exaustivamente desenvolvidas nos dilogos platnicos e nos Ditos e Feitos Memorveis de Scrates, de Xenofonte (c. 428-354 a.C.). Na obra de Plato, Scrates considerava que as demandas ticas s poderiam ser plenamente resolvidas com o conhecimento de si mesmo por parte dos indivduos. Uma vez alcanado tal conhecimento, a percepo das virtudes permitiria uma atuao poltica correta, segundo os ideais perptuos de um mundo ulterior306. No obstante, um Scrates muito mais preocupado com a utilidade das decises e do conhecimento filosfico aparece em diversas passagens dos Memorveis307. No entanto, o filsofo alemo do sculo XX, Martin Heidegger (1889-1976)308, via no fragmento 119 ethos anthropo daimon309, atribudo a Herclito de feso (c. 540-480 a.C.), o sentido originrio da tica, como lugar onde o homem habita, sua morada, diferente da concepo de um bem (agathon) socrtico e platnico a ser buscado num mundo ideal. Heidegger amparava-se, para tanto, na passagem Das Partes dos Animais A, 5, 645 a, 17, de Aristteles (384-322 a.C.), em que se conta uma anedota na qual Herclito teria dito a estrangeiros que temiam se aproximar de sua pobre moradia : einai gar kai entautha teous (pois aqui tambm moram os deuses)310. Se, portanto, de acordo com a significao fundamental da palavra ethos, o nome tica diz que medita a habitao do homem, ento aquele pensar que pensa a verdade do ser como o elemento primordial do homem enquanto algum que ec-siste [sic] j em si a tica originria. Mas este pensar no apenas ento tica, porque Ontologia. Pois a Ontologia pensa sempre apenas o ente (on) em seu ser (...) (HEIDEGGER, M. Sobre o Humanismo, p. 171). Heidegger percebia nessa busca tica por um conhecimento prprio como uma investigao ontolgica pela essncia do ser. Com isso, um sentido originrio da tica a reduziria a um domnio da metafsica em que se teria de comprometer com verdades absolutas to difceis de sustentar, quanto as pretenses de uma tica tradicional apoiada numa revelao divina. Contudo, se ao sujeito falvel da era contempornea est vedado o acesso ao verdadeiro conhecimento das essncias e a crena em Deus no passa de uma crena entre outras a ser privilegiada, ento uma tica centrada no sujeito precisa
. Entre os principais dilogos sobre a moral socrtica-platnica, destacam-se: Apologia de Scrates, Fdon, Fedro, Protgoras, Repblica, Crton; todos de autoria de Plato. Veja PLATO. Dilogos, vols. I, III, IV, V e VI-VII. 307 .XENOFONTE. Ditos e Feitos Memorveis de Scrates, liv.IV, cap.I, II e V, pp.133/140 e 149/150. 308 . Veja HEIDEGGER, M. Sobre o Humanismo, p. 170. 309 . Veja KIRK, G.S., RAVEN, J.E. & SCHOFIELD, M. Os Filsofos Pr-Socrticos, cap.VI, pp.218/9. 310 . Veja HEIDEGGER, M. Op. Cit., idem.
306
168
abrir mo de pretenses to elevadas e tentar explicar como, do ponto de vista subjetivo, possvel sustentar concepes ticas, vlidas objetivamente, sem passar por um consenso intersubjetivo. Aristteles argumentou por uma interpretao de ethos, no como morada, mas como um hbito ou prtica que o sujeito deveria optar a fim de realizar os atos nobres, uma vez que o conhecimento da virtude no seria suficiente para que o homem comum exercesse a funo de um ser racional, nobre e virtuoso311. Entretanto, Aristteles esbarrou no mesmo problema que Kant iria enfrentar dois mil anos depois, de como fazer com que seres racionais e sensveis fossem capazes de ou contemplar a verdade, eudaimonia, ou de agir segundo o dever racional. Ambos pensavam que as inclinaes sensveis limitavam a motivao racional pela tica e quanto a isso no tinham soluo que resolvesse, no mbito da subjetividade312. Para que um ser, ao mesmo tempo racional e afetado pelos sentidos, queira aquilo que s a razo lhe prescreve como dever, preciso sem dvida uma faculdade da razo que inspire um sentimento de prazer ou de satisfao no cumprimento do dever, e, por conseguinte, que haja uma causalidade da razo que determine a sensibilidade conforme aos seus princpios. Mas totalmente impossvel compreender, isto , tornar concebvel a priori , como que um simples pensamento, que no contm em si nada de sensvel, pode produzir uma sensao de prazer ou de dor; pois isto uma espcie particular de causalidade, da qual, como de toda causalidade, absolutamente nada podemos determinar a priori , mas a respeito da qual temos de consultar a experincia. (...) (KANT, I. Fundamentao da Metafsica dos Costumes, B 122-123). Por dois lados, a moral centrada no sujeito encontra problemas que at o presente no foram resolvidos. Primeiro, as limitaes naturais evidentes que impedem os indivduos de determinar por si s a sua prpria funo ou bem e alcan-lo. Em segundo lugar, ainda que pudesse descobrir qual fosse tal bem, enfrentaria tambm os obstculos que surgem durante sua busca e motivao, frente disputa com seres semelhantes, pelos recursos escassos. Alm disso, uma postura particularista da tica pe em choque os diversos fins subjetivos conflitantes, possveis de serem eleitos pelos agentes, e que s uma perspectiva mais ampla e abrangente teria condies de solucionar. A insuficincia dos seres vivos, a falibilidade da razo e o conflito de opinies impedem que uma tica subjetivista logre qualquer xito prtico. Desta se exige que indique qual a essncia do ser humano, como ele a determina ou determinado, se pode a conceber ou no, e ainda como pode por em prtica uma ao consequente, efetivamente moral, sem ter de levar em conta concepes contrrias de seres semelhantes. Dada a dificuldade da moral centrada no agente responder essas demandas, resta reconhecer as limitaes da razo, da sensibilidade e da capacidade fsica do sujeito para sustentar exclusivamente qualquer moral. As solues para os problemas de uma moral particular se resolvem em grande parte quando so considerados tambm os interesses de outros agentes, num cenrio de escassez de recursos, onde cumpre a moral
311 312
. Veja ARISTTELES. tica a Nicmaco, liv. X, cap. 9, 1179b-1180a. . Veja ARISTTELES. Op. Cit., liv. X, cap. 7, 1177b, 25-30 e KANT, I. Fundamentao da Metafsica dos Costumes, III se., B 122-123.
169
orientar as aes humanas consideradas vlidas por todos envolvidos. O isolamento dos indivduos logo vislumbra a impossibilidade de algum realizar sozinho seus fins. No momento em que se reconhece isso, cada um deve procurar adequar suas linhas de ao s circunstncias, nem sempre favorveis, que tem de enfrentar, caso queira satisfazer ao mximo seus interesses, quaisquer que sejam. Em meio a um cenrio passvel de concorrncia por outros atores semelhantes, o agente pode adotar uma perspectiva na qual se coloque como a nica fonte de aes, capaz de reagir ativamente s presses ambientais, adotando o ponto de vista de parmetro exclusivo de atuao. Nesse caso, a viso paramtrica gerar distores toda vez que agentes semelhantes tenham de competir pelos recursos escassos, necessrios para realizao de seus objetivos. Os piores resultados so esperados quando todos envolvidos seguem uma postura paramtrica. Os exemplos eloquentes do Dilema dos Prisioneiros e outros modelos de interao extrados da Teoria dos Jogos ajudam a compreender melhor a inviabilidade desse tipo de subjetividade. Para evitar os embaraos de uma postura paramtrica, convm adotar, ento, uma percepo estratgica, onde os agentes reconhecem, recursivamente, em seus semelhantes as capacidades relevantes que permitem com que eles reajam de maneira tal e qual os prprios agentes tambm reagiriam, diante da ao do outro. Assim, o reconhecimento da necessidade de considerar os interesses dos outros obriga descentralizao da moral, que passa a ser regida ento por padres intersubjetivos pelo encontro de estratgias conjuntas que satisfaam os interesses de todos envolvidos, caso se queira resolver os conflitos que os seres vivos enfrentam na busca de sua autorealizao. As condies naturais que os agentes vivem explicam a necessidade de se observar o processo pelo qual tais seres passaram at poderem produzir uma coordenao das prprias aes, tendo por consequncia uma melhor distribuio dos meios indispensveis para que cada um atinja suas metas de modo mais fcil e rpido. Todo teor da moral reside na preocupao com o outro e mesmo os pontos de vistas essencialistas ou perfeccionista de uma tica das virtudes ou ideal de bem defendem, tradicionalmente, a realizao humana em sua participao da sociedade. A vida poltica de um agente moral constri-se com sabedoria prtica e atos que condizem com a condio humana. Entretanto, o risco de tomar-se uma posio arbitrria e voluntarista de quem assume tal postura desencadeou alguns acontecimentos histricos temerrios e desastrados. Plato pagou com a perda da prpria liberdade a tentativa de adestrar o tirano de Siracusa, Dionsio, enquanto Karl Marx (1818-1883) inspirou os comunistas a implantarem pela fora uma utopia que arrastou milhes de vidas no sculo XX313. Esses episdios puseram em xeque as teorias ticas sobre o bem agir e distribuio igualitria de recursos. Tanto a moral subjetiva, quanto a universalista, caram em descrdito por serem irrealistas. Faltou aos tradicionais tericos da tica um dispositivo que pudesse aferir suas mximas e apontar as possveis falhas. Se tal dispositivo existisse antes, suas idias poderiam ser revisadas, salvando muitas vidas e o tempo perdido em experincias equivocadas. Richard Braithwaite chamou ateno para a teoria dos jogos como uma ferramenta disposio do filsofo contemporneo da moral que no havia sido descoberto at ento. Isso aconteceu pouco depois do lanamento de Theory of Games and Economic
. A aventura poltica de Plato est registrada na Carta VII, enquanto a convocao de Marx foi feita por meio do Manifesto Comunista.
313
170
Behavior, de Von Neumann e Morgenstern. Naquele tempo, a teoria ainda no havia avanado tanto como veio a progredir depois, sobretudo no que diz respeito arte da simulao. Efetivamente, muito caminho ainda resta a ser percorrido. Entretanto, o sucessivo reconhecimento da comunidade cientfica internacional tem dado destaque teoria na sua capacidade de avaliao de hipteses. O ano de 2005, pela terceira vez, viu o prmio Nobel de economia ser concedido a dois importantes pesquisadores dessa rea, Robert Aumann, matemtico israelense, e Thomas Schelling, economista estadunidense. O novo campo interdisciplinar aberto pela teoria dos jogos permitiu a economistas, matemticos, psiclogos, neurologistas e bilogos tratarem do comportamento tico em suas pesquisas, quando aplicavam os experimentos que provocavam a cooperao ou desero dos agentes de acordo com as condies do jogo. Contudo, embora a teoria dos jogos tenha despertado o interesse de diversas matrias para a influncia de valores ticos na tomada de deciso, no foi capaz ainda de atrair filsofos acadmicos para sua linha de pesquisa. Os exemplos de Braithwaite, Harsanyi, Rawls, Martin Hollis so to raros que suas contribuies podem ser listadas em um simples pargrafo. notria a dificuldade de autores de cincias sociais em trabalhar conceitos formais da matemtica. As confuses de Rawls em relao ao conceito minimax foram alvo do ataque certeiro de Harsanyi, um filsofo hngaro com formao de matemtico, imigrante tal com Von Neumann314. Uma Nova tica Os problemas que surgiram com a globalizao da economia provocaram a Declarao do Milnio da Assemblia Geral da Organizao das Naes Unidas (ONU), em setembro de 2000. Para minimizar os efeitos perversos da produo industrial em escala mundial - poluio, devastao e misria -, pases que compem a Assemblia Geral resolveram adotar uma nova tica de conservao e proteo do meio ambiente. O objetivo seria reduzir os danos provocados pela atividade humana e o comprometimento de recursos naturais no renovveis necessrios para satisfazer as demandas da espcie. O primeiro passo em direo a essa nova tica seria atender, entre outros pontos, a reduo da emisso de gases relacionados com o efeito estufa - gs carbnico (CO2), xido nitroso (N2O), metano (CH4) e oznio (O3) -; o manejo de matrias-primas conforme o conceito de desenvolvimento sustentvel - nada seria transformado alm do limite de sua reposio natural, isto , sem comprometer a capacidade das prximas geraes atenderem suas necessidades315 -; promover o acesso equitativo e adequado do abastecimento de gua potvel; estimular a cooperao com objetivo de minimizar os efeitos de desastres naturais e provocados por humanos316. A cada dia que passa est se tornando mais claro os efeitos nefastos de concepo distorcida adotada pela tradio de que os recursos naturais seriam inesgotveis e estavam disposio da espcie humana, por um suposto direito divino. A mudana climtica causada pela elevao da temperatura do planeta tem provocado fenmenos atmosfricos at ento inditos nos registros histricos. O aumento previsto para cerca de 2C, at o fim do sculo XXI, est diretamente relacionado com a produo
314 . Um exemplo da crtica de Harsanyi aos principios de Rawls e a defesa do utilitarismo de regra pode ser apreciado em HARSANYI, J. C. "Game and Decision Theoric Models in Ethics", in AUMANN, R. & HART, S. Handbook of Game Theory with Economic Application, vol 1, cap. 19, pp. 669-707. 315 . Conceito definido no Relatrio da Comisso Brundtland (1987), veja DASGUPTA, P. "Uma Abordagem Dosada", in Scientific American Brasil, ano 4, n41, p. 98. 316 . Veja ASSEMBLIA GERAL DA ONU. Declaracin del Milenio, IV, 23, pp. 6 e 7.
171
industrial dos pases desenvolvidos e os em desenvolvimento. O impacto dessa transformao atinge mais duramente os miserveis da Terra. O diagnstico desse problema e anlise das possveis solues s podem ser bem esclarecidos com uma nova concepo de tica que utilize o instrumental da teoria dos jogos. Para tanto, faz-se necessrio uma observao atenta do modo pelo qual as aes individuais em interao e em larga escala terminam por resultarem efeitos contrrios aos planejados. A metatica, que no se envolve com questes prticas e procura apenas investigar conceitos e sua metodologia, no traz qualquer contribuio soluo desses problemas. As tomadas de deciso dizem respeito a uma tica prtica que avalia no apenas as estratgias escolhidas, mas as suas consequncias. Por conseguinte, o modelo de jogos facilita a tarefa de avaliao das melhores escolhas. Uma nova tica, como a pretendida pelas Naes Unidas, tem na teoria dos jogos um instrumento indispensvel de compreenso do processo deliberativo e posterior comportamento humano. Os conceitos fundamentais para o tipo de discusso proposta j so debatidos por esses tericos h pelo menos meio sculo. Pouco a pouco, filsofos contemporneos, como Peter Singer, de Um S Mundo (2002), percebem o alcance desse novo mtodo para uma interpretao mais precisa e realista da situao planetria atual. Racionalidade estratgica, agentes egostas, cooperao, coordenao de esforos, equidade, confiana, entre muitos outros temas podem ser adequadamente estudados por meio de jogos317. A civilizao global traz ao primeiro plano problemas que a viso estreita do nacionalismo e do liberalismo econmico se recusam aceitar. As aes egostas de tais agentes, econmicos e polticos, levaram o mundo encruzilhada em que se encontra. Continuar agindo da forma insustentvel e irresponsvel que historicamente os seres humanos vm se comportando ter por resultado um grau crescente de sofrimento e morte para maior parte dos seres vivos. Uma nova tica baseada nos jogos capaz de prevenir os erros de tais opes e sugerir maneiras de ameniz-los. Motivao e aplicao de normas vlidas so abordadas e justificadas do mesmo modo como o encontro de proposies adequadamente formuladas. A estratgia que servir para produo do melhor resultado conjunto, no sentido do timo de Pareto, tem sua implementao corretamente recomendada para todos envolvidos. Uma vez descoberto esse ponto timo os mecanismos necessrios de penalidades devem ser acionados toda vez que haja um desvio, para que a cooperao seja mantida e se evite a situao dos jogos de soma zero, onde um s conseguir obter mais se reduzir os ganhos da outra parte, na fronteira de eficincia. A identificao e punio dos exploradores da cooperao um recurso chave para que a reciprocidade produza os efeitos desejados do empreendimento comum. S assim, o dilema social resolve-se satisfatoriamente, sem cair em um ciclo de cooperao-explorao-solido-cooperao. Essa transformao da tica est apta a recomendar as necessrias mudanas na estrutura da ONU, para que esta venha a cumprir seu papel efetivo de guardi da paz, prosperidade e justia no mundo. Com a vantagem de fornecer propostas realistas e amparadas no exame atento do momento. O aspecto realista - no confundir com o realismo platnico - da teoria dos jogos, ao invs de ser um empecilho como poderia argumentar cticos e relativistas, tem a vantagem de considerar a viabilidade de linhas de ao consideradas vlidas para um
317
. Em Um S Mundo, Peter Singer discute os principais problemas do mundo globalizada apontando solues a luz da teoria dos jogos, em favor de uma nova tica.
172
determinado modelo de situao. Levar em conta problemas concretos de retaliao, erros de avaliao e informao corrompida, por exemplo, ajuda a refinar as escolhas a ponto delas superarem as provas de um contexto real de vida. Portanto, em vez de problemas, a perspectiva realista ajuda a encontrar solues possveis para adaptao s mudanas climticas, a eliminao da misria e o desenvolvimento de uma perda gradual da soberania nacional, enquanto uma formao mais ntida de um governo mundial dever chamar para si a responsabilidade de garantir a segurana dos indivduos em qualquer parte do globo, em um futuro prximo. Esse um projeto de longo prazo que ser acelerado devido a imposies da globalizao e seus efeitos sobre o meio ambiente. As naes e os indivduos isoladamente no tm mais o poder de resolverem os problemas atuais que suas posturas egostas racionais detonaram. A misria acompanha os seres humanos desde a mitolgica "perda do paraso". A poluio agravou-se a partir da Revoluo Industrial (c. 1750). Juntos, esses fenmenos ameaam, agora, a sobrevivncia da espcie no planeta, a despeito de todas outras ameaas vivas terem sido controladas - com exceo dos vrus e bactrias. Somente uma tica mundial pode concentrar esforos na direo de solues prticas em escala global. As ticas universalistas modernas - kantianas ou utilitaristas, por exemplo - apresentam, por um lado, critrios que no podem ser aplicados, devido vacuidade de suas formulaes ou exigncia de forte racionalidade, ou normas prticas que carecem de uma justificao que s pode ser apoiada em pressupostos de outra teoria. O contratualismo permanece como uma concepo terica da validao de normas que resiste a vrias provas impostas pela nova tica modelada pelos jogos. Ao menos para a soluo de Dilemas Sociais, a necessidade de uma instituio que fiscalize e obrigue o cumprimento da cooperao, seja por um contrato tcito ou explcito, compatvel com a interpretao prpria da intuio hobbesiana. Seja no condomnio urbano, seja nas compras atravs da rede mundial de computadores, ou na Assemblia Geral, a figura do Leviat deve ser encarnada por quem ocupar o cargo de sndico ou secretrio geral. Nesse sentido, o contratualismo apoiado nos jogos pode vir a ser a base de uma nova tica factvel para os tempos atuais. 7.5 Concluso
O mais difcil em uma caminhada o primeiro passo. Uma longa caminhada no termina enquanto uma srie de passos no ligar o primeiro ao ltimo. Concepes imediatistas, em poltica, so adotadas por naes e seus respectivos governos que se arriscam a estabelecer projetos de larga escala, sem levar em conta os detalhes e aspectos elementares que compem o todo. Essa viso macroeconmica amide gera desperdcios que sobrecarregam os povos de impostos e custos desnecessrios. Em geral, sabem como comear, mas no como parar. A soluo dos problemas vividos por toda uma gerao neste comeo de milnio depende de uma correta compreenso de como a ao de cada ser humano no passado contribuiu para o estado de coisas alarmantes dos tempos atuais. A devastao do meio ambiente, superpopulao, m distribuio de recursos e misria so consequncias da cegueira de teorias para a ao individual e o impacto do somatrio dos seus ganhos no resultado final da interao humana. Como parte da microeconomia, a Teoria dos Jogos chama ateno dos efeitos das escolhas de cada um sobre a condio dos envolvidos.
173
O planejamento prvio e uma poltica imposta de cima para baixo no so capazes de resolver as dificuldades acumuladas por uma cadeia de erros sucessivos cometidos no passado. A mudana desse quadro ameaador s ocorrer quando se considerar seriamente os interesses individuais de cada envolvido e a satisfao de seus desejos no fim do jogo. De outro modo, polticas pblicas macroeconmicas no podem aspirar eficincia. Caso contrrio, os bons indicadores iniciais, que facilmente aparecem, no conseguem se manter a longo prazo. As teorias dos jogos e da cooperao tm a seu favor a capacidade de esclarecer os conceitos e princpios elementares que sustentam a possibilidade de xito de interpretaes sobre o comportamento dos seres vivos. O individualismo metodolgico, que caracteriza esse ponto de vista, tornou-se uma concepo bem sucedida, em face do fracasso evidente do positivismo nas cincias sociais. No existe fato social ou instituio que se sustente sem levar em considerao os interesses dos indivduos que os geraram. As escolhas que os agentes fazem esto limitadas por sua condio fsica herdada e pela situao em que se encontram. O somatrio dessas decises produz a sociedade humana com os vcios e virtudes que possuam seus integrantes. O objetivo deste livro pr em relevo essa concluso inevitvel. Muitos outros aspectos importantes da teoria no puderam ser sequer abordados, para no perturbar a linha introdutria que foi traada. Procurou-se, nessa primeira abordagem ao tema, evitar o desenvolvimento de frmulas que caracterizam a pesquisa mais avanada em seu domnio. Na primeira parte, foram apresentados um breve relato histrico e os principais conceitos e preceitos dos jogos. Em seguida, um tema especfico relacionado aos jogos com comunicao foi colocado como um exemplo da maneira que a teoria dos jogos trata um problema afim a diversas correntes filosficas da linguagem e comunicao. Depois, a teoria da cooperao foi introduzida e os pontos relacionados evoluo mostraram a mudana motivada pelos torneios de computadores. Na segunda parte, o Dilema dos Prisioneiros Iterado indicou as propriedades das diversas estratgias que contribuem para manuteno da cooperao em contextos diferentes. O Dilema Social, ou Jogo dos Bens Pblicos, uma extenso daquele dilema para mais de dois jogadores, onde a necessidade de punio e de uma instituio que implemente as penalidades se faz notar. As dificuldades tericas em relao concepo de um agente egosta e racional ficam evidentes em modelos de jogos como o Ultimato. Aqui, a equidade parece ser mais resistente do que a tentao de desertar, sobretudo, porque a possibilidade de retaliao imediata a propostas injustas, na maioria das sociedades. Consideraes sobre a reputao, passada e futura, bem como sentimentos morais - vergonha e indignao - so mobilizados para explicar o fenmeno e a ausncia de um comportamento que deveria ser, ao menos, prximo ao do "homo oeconomicus", personagem cuja conduta seria a recomendada pela teoria econmica. Esses poucos pontos apresentados foram suficientes para elencar uma srie de disciplinas ou campos de investigaes separados que podem estabelecer relaes atravs do uso de mtodos tpicos da teoria, por meio de simulaes e modelos de jogos, que tratam do comportamento humano e do processo de deliberao. A teoria dos jogos e os modelos de agentes fazem a ponte entre disciplinas como a economia e as neurocincias, promovendo a formao da neuroeconomia. A partir desta nova disciplina, foram feitas pesquisas sobre como o sistema nervoso reage a situaes econmicas, nas quais os participantes devem decidir de acordo com a reao esperada de outros agentes supostamente egostas.
174
As ambies iniciais de uma teoria que visava prever a melhor estratgia de atuao em qualquer contexto, na prtica, cederam lugar a uma concepo mais promissora de um instrumento de anlise til a muitas reas de investigao. Com isso, a teoria dos jogos ampliou seu espao de atuao enquanto fomentava novos setores, como a biologia matemtica, a economia experimental e essa neuroeconomia. Para a filosofia, a percepo de Braithwaite ainda aguarda a participao de mais autores interessados. Contudo, a tica um campo que tem muito a evoluir com a implementao de suas tcnicas e formalizao da intuio de muitos filsofos modernos: Hobbes, Rousseau, Hume, Bentham, entre outros. Foroso dizer que muitos outros pontos relevantes para filosofia foram deixados de fora. Jogos que exigem habilidade e no so exclusivamente estratgicos no foram mencionados. Tambm os leiles e o interessante Jogo do Leilo do Dlar, de Martin Shubik, - chamado de Escalada, por Howard Raiffa - no tiveram mais do que uma meno em nota no segundo captulo. O estudo de coalizes e pagamentos laterais, tipos de jogos cooperativos foram outra omisso notvel, devido ao enfoque nos jogos nocooperativos ter predominado. Nenhuma palavra foi escrita sobre o valor de Shapley, importante conceito da primeira fase da teoria e muitos outros temas que o leitor mais informado poder estranhar a ausncia. Tudo isso graas s limitaes naturais que uma apresentao introdutria tem de enfrentar. A meta principal do plano de estudo da Teoria dos Jogos e da Cooperao para Filsofos foi colocar em uma linguagem acessvel maioria dos leitores interessados os aspectos centrais da teoria como vem sendo desenvolvida atualmente. Como primeiro contato, atacou-se de imediato os conceitos comuns filosofia e aos jogos, a fim de estabelecer uma aproximao natural de quem possui pouca ou nenhuma informao sobre o assunto. Se os textos elaborados foram bem sucedidos devero despertar no leitor o desejo de buscar mais informao em pesquisas mais avanadas. A rigor praticamente impossvel mostrar de uma vez todo campo de investigao trabalhado por um setor em franca expanso. De um modo geral, procurouse apontar a tendncia predominante e que vem sendo reconhecida pelas sucessivas premiaes recebidas por tericos dos jogos, desde o Nobel de economia de 1994. So poucos os ttulos sobre teoria dos jogos que se mantm em catlogo, disponveis em portugus, alguns introdutrios outros voltados a especialistas. Dentre os que esto disposio do pblico, a maior parte se dirige a economistas e administradores. Raros so aqueles que se dedicam ao pblico geral amide, tradues de obras estrangeiras. Teoria dos Jogos e da Cooperao procurou atender uma faixa de leitores lusfonos de outras disciplinas, mas que tambm possam estar interessados em discusses filosficas a respeito do processo de escolha, tomadas de deciso e o consequente comportamento de agentes humanos ou no. Nesse sentido, as frmulas matemticas foram reduzidas ao mnimo necessrio para no prejudicar a explicao. Na maior parte das vezes, foram postas por extenso, verbalmente, na linguagem natural. Entende-se que todas as formulaes simblicas podem ser traduzidas no vernculo corrente, embora isso resulte em uma perda de preciso e em um nmero maior de caracteres. Assim, frequentemente, preferiu-se uma expresso da forma "a probabilidade que este resultado possa acontecer tem a chance menor do que cinco porcento" ao invs da simples inequao "p < 0.5" 318.
. Esse um exemplo apresentado por AXELROD, R. "Advancing the Art of Simulation in the Social Sciences", 3.3, p. 9.
318
175
Com razo o leitor mais exigente pode objetar que tal verbalizao contraria o "esprito" cientfico e a pretendida preciso buscada pela teoria. No obstante, o esforo da divulgao, por vezes, obriga o sacrifcio do rigor acadmico em funo de uma causa nobre de atrair os iniciantes para um tema que estes podero mais tarde desenvolver com maior objetividade. A meta da Teoria dos Jogos e da Cooperao para Filsofos , portanto, servir como uma pequena escada que depois deve ser descartada por quem tiver alcanado um patamar mais elevado. Deve ser interpretado como um incentivo, ou primeiro passo, para quem queira iniciar sua pesquisa nessa rea, mas no sabe ainda por onde comear. A teoria dos jogos j avanou para nveis dos quais no mais possvel retroceder. O neodarwinismo da biologia evolutiva contempornea, a cincia cognitiva da inteligncia artificial, a teoria dos sistemas complexos dinmicos e a neurocincia do estudo da mente desenvolvem pesquisas que no foram previstas no estgio inicial da teoria dos jogos. Filsofos contratualistas e utilitaristas contemporneos j usam-na como base de sua argumentao e princpios gerais. Para entender o debate atual preciso conhecer os pressupostos originais e ter uma viso abrangente do seu desdobramento conceitual. A partir da, o interesse de cada um dever direcion-lo ao acompanhamento dos assuntos que lhe forem mais prximos. E depois, possivelmente, produzir novas pesquisas em textos crticos sobre os problemas encontrados. Da maneira que evoluiu, a prpria teoria dos jogos um exemplo de campo interdisciplinar aberto a todos os pesquisadores, nas reas mais diferentes. Nesse sentido, construiu a percepo de ser um mtodo de anlise eficiente e verstil das situaes de interao entre agentes egostas. O que refora a tendncia em consider-la um meio adequado para soluo dos problemas atuais vividos pela humanidade em uma escala global. O acmulo de erros e confuses metodolgicos de uma tradio acadmica impediu o desenlace de novas perspectivas para o trato da crise provocada pela globalizao. Sem fazer tbula rasa de toda essa cultura filosfica, a teoria dos jogos abre horizontes onde podem ser trabalhados sem preconceitos os problemas mais prximos aos indivduos que sobrevivem em um mundo poludo, com escassez de recursos, superpopuloso e em meio a uma desigualdade que lana pelo menos um bilho de humanos em uma condio de vida miservel. A soluo desses problemas passa por uma minimizao da corrupo, da superao da tragdia dos comuns e da necessidade do estabelecimento de um organismo mundial com poderes de interveno legitimado pelo consenso dos representantes de toda populao do planeta. Todos esses aspectos e muitos outros so abordados nos modelos de jogos. Tal tcnica de sistematizao ajuda a encontrar respostas para as questes gerais e especficas que lhe so formuladas. Portanto, a teoria dos jogos se apresenta como a disciplina mais promissora para abordagem desses temas. As prximas geraes tm, ento, uma maneira de examinar os problemas que cedo ou tarde tero de enfrentar pela sua prpria sobrevivncia, livres dos vcios e preconceitos da academia. Nesse sentido, do mesmo modo sugerido por Harsanyi, assim como no se deixa de ensinar aritmtica s crianas, tambm no se deveria furtar de lhe ensinar a teoria dos jogos, por mais difcil e contra-intuitiva que possa parecer, primeira vista319.
Veja HARSANYI, J. C. "Normative Vality and Meaning of Von Neumann-Morgenstern Utilities", in BINMORE, K., KIRMAN, A. & TANI, P. Frontier of Game Theory, cap. 15, 1, p. 307.
319
176
Os jogos tm a vantagem de simplificar, ao mesmo tempo em que tornam mais precisos, o estudo da interao e comportamento humanos. Serviu para apresentar com nitidez o que h de elementar em muitas formas de convvio social, cuja valorao difcil de hierarquizar no mbito da teoria poltica. Em um jogo, os jogadores procuram realizar da melhor maneira os objetivos que lhe so propostos, seguindo as estratgias disponveis, segundo uma interpretao correta das regras. Do mesmo modo, em sociedade, os cidados visam atingir um plano de acordo com os princpios particulares e as normas gerais aceitas pela comunidade. O resultado conjunto das escolhas feitas pelos indivduos reflete-se em uma constituio mais ou menos justa, conforme a capacidade de cada um em perceber a cooperao como a melhor soluo para todos. Para estudar o mundo social, necessitamos de conceitos rigorosos. Impe-se que emprestemos preciso a termos tais como utilidade, informao, comportamento timo, estratgia, equilbrio, ajuste e muitos outros. A Teoria dos Jogos de estratgia desenvolve noes rigorosas para todos esses vocbulos e, assim, nos capacita a examinar a perturbadora complexidade social sob nova luz. Sem esses conceitos precisos, jamais poderamos esperar que a discusso sasse de um estgio puramente verbal e nos veramos para sempre cingidos a uma compreenso muito restrita, se que conseguiramos alcan-la (MORGENSTERN, O."Prefcio" in DAVIS, M.Teoria dos Jogos, p.12). Oskar Morgenstern considerava importante a formalizao matemtica da teoria e que toda tentativa de divulg-la para o grande pblico fosse feita por quem tivesse o conhecimento profundo de todas complexidades tericas, bem como participado de sua elaborao. Duas caractersticas das quais carece o autor de Teoria dos Jogos e da Cooperao para Filsofo. No entanto, este ousou implementar essa tarefa na ausncia de algum mais habilitado que se dispusesse a faz-lo e com a conscincia dos riscos de ter cometido possveis equvocos. Mas, a importncia de se recuperar o tempo perdido pela falta de textos acessveis, obrigou deciso pela tomada do difcil primeiro passo. Que essa iniciativa temerria estimule autores credenciados a cumprirem sua misso de divulgador, responsabilidade social de todo cientista e acadmico. - Senhoras e Senhores, faam seu jogo! Bibliografia ALLAIS, M. F. Ch. "Le Comportement de L'Homme Rationnel Devant le Risque". Econometrica, vol. 21, n 4, pp. 503-546, outubro. 1953. APEL, K-O. "O Desafio da Crtica Total da Razo e o Programa de uma Teoria Filosfica dos Tipos de Racionalidade", in Novos Estudos, n23, maro de 1989; trad. de Mrcio Suzuki. ASHBY, W. R. Uma Introduo Ciberntica; trad. Geraldo G. de Souza. So Paulo: Perspectiva, 1970. AUMANN, R.J. Correlated Equilibrium as an Expression of Bayesian Rationality, Econometrica, vol. 55, n 1, jan 1987, pp. 1-18. AUMANN, R & HART, S. Handbook of Game Theory with Economic Application, vol. 1. Amsterdam: Elsevier Science, 1992.
177
______, ____. "Long Cheap Talk", in Econometrica, 2003, vol. 71, n 6, 1619-1660. Disponvel na Internet via http://www.ma.huji.ac.il/~hart/abs/long.html?. Arquivo consultado em 2005. AUSTIN, J. L. Quando Dizer Fazer; trad. Danilo M. de Souza F. Porto Alegre: Artes Mdicas, 1990. AXELROD, R. The Evolution of Cooperation. - Nova York: Basic Books, 1984. _______. "On Six Advances in Cooperation Theory". Analyse & Kritik, pp. 1-39, janeiro de 2000. Disponvel na Internet via http://wwwpersonal.umich.edu/~axe/research/SixAdvances.pdf _______. Advancing the Art of Simulation in the Social Sciences. Disponvel na Internet via http://www-personal.umich.edu/~axe/. Arquivo consultado em 2005. AXELROD, R. & HAMMOND, R. A. "The Evolution of Ethnocentric Behavior". Midwest Political Science Convention. - Chicago, abril de 2003. Disponvel na Internet via http://www.personal.umich.edu/~axe/research/Ax.Hamm.Ethno.pdf BANCHEREAU, J. O Longo Brao do Sistema Imunolgico, in Scientific American Brasil, ano 1, n 7, pp. 66-73, dezembro de 2002. BINMORE, K. "Review: The complexity of cooperation", in Journal of Artificial Societies and Social Simulation. Disponvel na Internet via http://jasss.soc.surrey.ac.uk/1/1/review1.html. Arquivo consultado em 2003. BINMORE, K., OSBORNE, M. J. & RUBINSTEIN, A. "Noncooperative Models of Bargaining", in AUMANN, R. J. & HART, S. Handbook of Game Theory, vol 1, cap. 7, pp. 179-225. - Amsterdam: Elsevier, 1992. Disponvel na Internet via http://arielrubinstein.tau.ac.il/papers/40.pdf. Arquivo consultado em 2005. BLACKBURN, S. Ruling Passions. Oxford: Claredon Press, 1998. BOUZON, E.O Cdigo de Hammurabi . - Petrpolis: Vozes, 1992. BREMBS, B. Chaos, Cheating and Cooperation, in Oikos, 76, pp. 14-24. Copenhagen, 1996. Disponvel na Internet via http://www.brembs.net/ipd/ipd.html. CALVINO, I. As Cidades Invisveis; trad. Diogo Mainardi. - So Paulo: Companhia das Letras, 1998. CAMERER, C., LOEWENSTEIN, G. & PRELEC, Dr. "Neuroeconomics", in Journal of Economic Literature, 2005. CARROLL, L. Alice no Pas do Espelho; trad. Monteiro Lobato. - So Paulo: Brasiliense, 1960. CHANGEUX, J-P. O Homem Neuronal; trad. Artur J. P. Monteiro. - Lisboa: Dom Quixote, 1991. CRAWFORD, V. P. & SOBEL, J. "Strategic Information Transmission", in Econometrica, vol. 50, n 6. Novembro de 1982. DAMSIO, A. O Erro de Descartes; trad. Dora Vicente e Georgina Segurado. So Paulo: Companhia das Letras, 1996. _______. O Mistrio da Conscincia, trad. Laura T. Motta. - So Paulo: Companhia das Letras, 2000. _______. "Brain Trust", in Nature, vol. 435, jun 2005, pp. 571-572. DASGUPTA, P. "Uma Abordagem Dosada", in Scientific American Brasil, ano 4, n41, p 98, outubro de 2005. DAVIS, M. D. Teoria dos Jogos; trad. Leonidas Hegenberg e Octanny S. da Mota. So Paulo: Cultrix, 1973.
178
DAWKINS, R. O Gene Egosta;trad. Geraldo Florsheim. Belo Horizonte: Itatiaia, 1979. DENNETT, D. C. A Perigosa Idia de Darwin; trad. Talita M. Rodrigues. - Rio de Janeiro: Rocco, 1998. _______. Tipos de Mentes; trad. Alexandre Tort. - So Paulo: Rocco, 1997. DESCARTES, R. Discurso do Mtodo; trad. J. Guinsburg e Bento Prado Jr. - So Paulo: Abril Cultural, 1983. (Os Pensadores) ELSTER, J. Ulysses and the Sirens. - Cambridge: CUP, 1984. Ed. mexicana Ulises y las Sirenas; trad. Juan J. Utrilla. - Mxico, D.F.: Fondo de Cultura Econmica, 1989. ______. "Some Unresolved Problems in the Theory of Rational Behavior", in Acta Sociologica, 36, pp. 179-190, 1993. FALK, A., FEHR, E. & FISCHBACHER, U. "On the Nature of Fair Behavior". Disponvel na Internet via http://www.iew.unizh.ch/grp/fehr. Arquivo consultado em 2002. FARRELL, J. "Meaning and Credibility in Cheap-Talk Games", in Games and Economic Behavior, 1993, 5, pp. 514-531. FARRELL, J. & RABIN, M. "Cheap Talk", in Journal of Economic Perspectives, vol. 10, n 3, pp. 103-118. Vero de 1996. FEHR, E., FISCHBACHER, U. & KOSFELD, M. "Neuroeconomis Foundations of Trust and Social Preferences", in American Economic Review, no prelo. FEHR, E. & GCHTER, S. "Fairness and Retaliation", in Journal of Economics Perspectives, 14, pp. 159-181, 2000. Disponvel na Internet via http://www.unizh.ch/iew/wp/. Arquivo consultado em 2002. _____, _____. "Cooperation and Punishment in Publics Good Experiments", in The American Economic Review, vol. 90, n 4, set. 2000. Disponvel na Internet via http://www.unizh.ch/iew/grp/fehr/index.html. Arquivo consultado em 2002. FEHR, E. & HENRICH, J. "Is Strong Reciprocity a Maladaptation?", in HAMMERSTEIN, P. The Generic and Cultural Evolution. - Cambridge (Mass.): MIT, 2003. FIANI, R. Teoria dos Jogos. - Rio de Janeiro: Elsevier, 2004. FOUCAULT, M. Vigiar e Punir; trad. Lgia M. P. Vassalo. - Petrpolis: Vozes, 1987. GARDNER, H. A Nova Cincia da Mente; trad. Cludia Caon. - So Paulo: Edusp, 1995. GARDNER, M. "Mathematical Games", in Scientific American, 223, pp 120-123, outubro de 1970. GAUTHIER, D. Morals by Agreement. Oxford: Clarendon, 1986. GROSSMAN, W. M. "New Tack Wins Prisoner's Dilemma", 13 outubro de 2004. Disponvel na Internet via http://www.wired.com/news/culture/0,1284,65317,00.html. GTH, W., SCHMITBERGER, R. & SCHWARZE, B. "An Experimental Analysis of Ultimatum Bargaining", in Journal of Economic Behavior and Organization, 3, 367-88, 1982. HABERMAS, J. Tcnica e Cincia como Ideologia; trad. Arthur Moro. - Lisboa: Edies 70, 1987. ________. Conscincia Moral e Agir Comunicativo; trad. Guido A. de Almeida. Rio de Janeiro: Tempo Brasileiro, 1989. ________. Erluteerungen zur Diskursethik. - Frankfurt: Suhrkamp, 1991. Edio francesa De l'thique de la Discussion; trad. Mark Hunyadi. - Paris: CERF, 1992.
179
________. A Constelao Ps-Nacional; trad. Mrcio Seligmann-Silva. - So Paulo: Littera Mundi, 2001. ________. Verdade e Justificao; trad. Milton C. Mota. - So Paulo: Loyola, 2004. HAMMERSTEIN, P. & SELTEN, R. "Game Theory and Evolutionary Biology", in AUMANN, R. & HART. S. Handbook of Game Theory with Economic Application, vol. 2, cap. 28, pp. 929-993. Amsterdam: Elsevier Science, 1992. HARDIN, G. "The Tragedy of the Commons", in Science, vol 162. 13 de dezembro de 1968, pp. 1243-1248. Disponvel na Internet via http://www.garretthardinsociety.org/articles_pdf/tragedy_of_the_commons.pdf. Arquivo consultado em 2005. HARSANYI, J. C. "Game and Decision Theoric Models in Ethics", in AUMANN, R & HART, S. Handbook of Game Theory with Economic Application, vol. 1, cap. 19. Amsterdam: Elsevier Science, 1992. pp 669-707. ________. "Normative Validity and Meaning of von Neumann-Morgenstern Utilities", in BINMORE, K., KIRMAN, A. & TANI, P. Frontiers of Games Theory, cap. 15. Cambridge (Ma): MIT, 1993. pp. 307-320. HAUERT, Chr. et al. "Oscillations in Optional Public Good Games". Disponvel na Internet via http://www.iiasa.ac.at. Arquivo consultado em 2003. ______, _____. "Volunteering as Red Queen Mechanism for Cooperation in Public Goods Games". Disponvel na Internet via http://www.iiasa.ac.at. Arquivo consultado em 2003. HEIDEGGER, M. Sobre o Humanismo, in Os Pensadores; trad. Ernildo Stein. So Paulo: Abril Cultural, 1984. HENRICH, J. et al. "In Search of Homo Economicus", in Economics and Social Behavior, vol. 91, n2, pp. 73-78, mai 2001. HOBBES, Th. Leviat; trad. Joo P. Monteiro e M B. M. da Silva. So Paulo: Abril Cultural, 1983. HOFFMANN, R. "Twenty Years on: The evolution of cooperation revisited", in Journal of Artificial Societies and Social Simulation, vol. 3, n 2. Disponvel na Internet via http://www.soc.surrey.ac.uk/JASSS/3/2/forum/1.html. Arquivo consultado em 2000. HOLLIS, M. Trust Within Reason. Cambridge: CUP, 1998. HUME, D. A Treatise of Human Nature. Verso eletrnica disponvel na INTERNET via http://gutenberg.net. Arquivo consultado em 2005. JAKOBSON, R. "Fonema e Fonologia", in Os Pensadores; trad. J. Mattoso Cmara. So Paulo: Abril Cultural, 1978. JOHNSON, J. "Is Talk Really Cheap?". American Political Science Review, vol. 87, n 1, pp. 74-86. 1993. KAHNEMAN, D. "Experienced Utility and Objetive Happiness", in KAHNEMAN, D & TVERSKY, A. Choice, Values and Frames, cap. 37, pp. 673-692. Nova York: CUP, 2000. KAHNEMAN, D. & TVERSKY, A. "Prospect Theory". Econometrica, vol. 47, n 2, pp 263-291, maro. 1979. KANT, I. A Paz Perptua; trad. Artur Moro. - Lisboa: Edies 70, 19. KIRK, G. S., RAVEN, J. E. & SCHOFIELD, M. Os Filsofos Pr-socrticos; trad. Carlos A. L. Fonseca. - Lisboa: Fundao Calouste Gulbenkian, 1994. KOSFELD, M. et al. "Oxytocin Increases Trust in Humans", in Nature, vol. 435, jun 2005, pp. 673-676.
180
KRAINES, D.P. & KRAINES, V. Y. "Protocols for Cooperation". mar 2001. Disponvel na Internet via http://www.math.duke.edu/~dkrain/ProtCoop.pdf KREPS, D. M. Game Theory and Economic Modelling. Oxford: OUP, 1996. KREPS, D. M. & SOBEL, J. "Signalling", in AUMANN, R. & HART, S. Handbook of Game Theory with Economic Application, vol. 2, cap. 25, pp. 849-867. Amsterdam: Elsevier Science, 1992-1994. KUHN, St. T. "Prisoner's Dilemma". Disponvel na Internet via http://plato.stanford.edu/entries/prisoner-dilemma/. Arquivo consultado em 2002. LEWIN, R. Complexidade; trad. Marta R. Schmidt. - Rio de Janeiro: Rocco, 1994. LINDGREN, Kr. "Evolutionary Phenomena in Single Dynamics", in LANGTON, Ch. G et al. Artificial Life II , pp. 295-311. - Redwood: Addison-Wesley, 1992. ________. "Evolution of Behaviour in the Prisoner's Dilemma". Disponvel na Internet via www.business.auc.dk/evolution/evolecon/evolgames/Lindgren.pdf. Arquivo consultado em 2005. LUCE, R.D. & RAIFFA, H. Games and Decisions. - Nova York: Dover, 1989. MACINTYRE, A. Dependent Rational Animals. Chicago: Open Court, 1999. MICHOR, Fr. & NOWAK, M. A. "The Good, the Bad and the Lonely", in Nature, vol. 419, pp. 677-679, outubro de 2002. MILINSKI, M. "Tit for Tat in Sticklebacks and the Evolution of Cooperation", in Nature. 246:15-18, 1987. ________. "Cooperation Wins and Stays", in Nature, 364. 12-13, 1993. MYERSON, R. B. "Multistage Games with Communication", in Econometrica, vol. 54, n 2, 2, pp. 323-358. Maro de 1986. _______. "Communication, Correlated Equilibria and Incentive Compatibility", in AUMANN, R. & HART. S. Handbook of Game Theory with Economic Application, vol. 2, cap. 24, pp. 827-847. Amsterdam: Elsevier Science, 1994. NASAR, S. Uma Mente Brilhante; trad. Srgio Rego. Rio de Janeiro: Record, 2002. NASH, J. "The Bargaining Problem", in KUHN, H. & NASAR, S. The Essential John Nash. - Princeton: PUP, 2002. ______. "Equilibrium Points in n-Person Games", in KUHN, H. & NASAR, S. The Essential John Nash. - Princeton: PUP, 2002. ______. "Non-Cooperative Games", in KUHN, H. & NASAR, S. The Essential John Nash. - Princeton: PUP, 2002. ______. "Two-Person Cooperative Games", in KUHN, H. & NASAR, S. The Essential John Nash. - Princeton: PUP, 2002. Von NEUMANN, J. & MORGENSTERN, O. Theory of Games and Economic Behavior. Princeton: PUP, 1953. NOVARESE, M. & RIZZELLO, S. "Origin and Recent Developments of Experimental Economics". Disponvel na INTERNET via http://www.cce.unifi.it/dse/spe/indici/numero37/nova.htm. Arquivo consultado em 2001. NOWAK, M.A., FEHR, E., SIGMUND, K. "The Economics of Fair Play", in Scientific American, jan. 2002. NOWAK, M.A., MAY, R. & SIGMUND, K. "The Arithmetics of Mutual Help". Scientific American, pp. 76-81, junho de 1995. NOWAK, M.A., PAGE, K.M & SIGMUND, K. "Fairness Versus Reason in the Ultimatum Game", in Science, pp. 1773-5, setembro 2000.
181
NOWAK, M.A. & SIGMUND, K. "The Alternating Prisoner's Dilemma". Journal Theoretical Biology, n 168, pp. 219-226, 1994. OTERO, L. S. Borboletas. - Rio de Janeiro: FAE, 1986. PARETO, V. Manual de Economia Poltica; trad. Joo G. Vargas Nto. So Paulo: Nova Cultural, 1987. PINDYCK, R. S & RUBINFELD, D. L. Microeconomia. So Paulo: Makron, 1994. PINKER, St. Como a Mente Funciona; trad. Laura T. Motta. - So Paulo: Companhia da Letras, 1998. PLATO. Dilogos, vols. I-IX; trad. Carlos A. Nunes. - Belm: Universidade Federal do Par, 1975. RAIFFA, H. The Art and Science of Negotiation. - Cambridge (Ma): Harvard U. P. 1982. Ed. mexicana El Arte y la Ciencia de la Negociacin; trad. Guillermo Cardenas. Mxico, D.F.: Fondo de Cultura Econmica, 1996. RAPOPORT, A. Lutas, Jogos e Debates; trad. Srgio Duarte. Braslia: UnB, 1980. RAWLS, J. Uma Teoria da Justia; trad. Carlos P. Correia. Lisboa: Presena, 1993. _____. Justia como Equidade; trad. Cludia Berliner. So Paulo: Martins Fontes, 2003. RIOLO, R. L., COHEN. M. D. & AXELROD, R. "Evolution of Cooperation without Reciprocity", in Nature, vol. 414, novembro 2001. ROSS, D. "Game Theory", in Stanford Encyclopedia of Philosophy. Disponvel na INTERNET via http://plato.stanford.edu/entries/game-theory/. Arquivo consultado em 2001. ROUSSEAU, J.-J. "Discurso sobre a Origem e os Fundamentos da Desigualdade entre os Homens"; trad. Lourdes S. Machado. - So Paulo: Abril Cultural, 1983. SAMUELSON, P.A. Fundamentos da Anlise Econmica; trad. Paulo de Almeida. So Paulo: Abril Cultural, 1983. SANFEY, A.G. et al. "The Neural Basis of Economic Decision Making in the Ultimatum Game", in Science, 300, pp. 1755-1758, 2003. SAUSSURE, F. Curso de Lingustica Geral; trad. Antnio Chelini et al. So Paulo: Cultrix, 1989. SCHELLING, Th. C. The Strategy of Conflict . Nova York: OUP, 1963. SEARLE, J. R. Os Actos de Fala; trad. Carlos Vogt. Coimbra: Almedina, 1984. ______. "Mentes, Crebros e Programas", in TEIXEIRA, J.F. Crebros, Mquinas e Conscincia; trad. Cla R. de O. Ribeiro. So Carlos: UFSCAR, 1996. SHUBIK, M. Game Theory in the Social Sciences. Cambridge (Ma.): MIT, 1982. Ed. mexicana Teora de Juegos en las Ciencias Sociales; trad. Catalina D. Reyes. Mxico, D.F.: Fondo de Cultura Econmica, 1992. SIEBRASSE, N. "Generalized Win-Stay, Lose-Shift is Robust in the Repeated Prisoner's Dilemma with Noise Played by Multistate Automata". - New Brunswick, jun 2000. (Texto de trabalho) Disponvel na Internet via http://law.unb.ca/Siebrasse/Download/SiebrasseRPD.pdf. SIGMUND, K. "William D. Hamilton's Work in Evolutionary Game Theory". Disponvel na Internet via http://www.iiasa.ac.at. Arquivo consultado em 2003. _________. "The Economics of Fairness". Disponvel na Internet via http://www.iiasa.ac.at. Arquivo consultado em 2003. SIGMUND, K., HAUERT, Chr. & NOWAK, M. "Reward and Punishment in Mini Games". Disponvel na Internet via http://www.iiasa.ac.at. Arquivo consultado em 2003.
182
Da SILVA, A. R. A Voz do Outro. Rio de Janeiro: UFRJ/IFCS, 2003. Tese (Doutorado em Filosofia). SIMON, H. Comportamento Administrativo; trad. Aluzio L. Pinto. - Rio de Janeiro: FGV, 1965. SIMONSEN, M. H. "Teoria dos Jogos". Ensaios Econmicos, n 159, pp. 1-74. - Rio de Janeiro: FGV, 1990. SINGER, P. Um S Mundo; trad. Adail U. Sobral. - So Paulo: Martins Fontes, 2004. SMITH, A. Teoria dos Sentimentos Morais; trad. Lya Luft. - So Paulo: Martins Fontes, 1999. _____. A Riqueza das Naes; trad. Luiz J. Barana. - So Paulo: Nova Cultural, 1985. STEWART, I. Ser que Deus Joga Dados?; trad. M Luza X. de Borges. - Rio de Janeiro: Zahar, 1991. SUETNIO TRANQUILO, C. A Vida dos Doze Csares; trad. Sady-Garibaldi. - Rio de Janeiro: Ediouro, s/d. SUN TZU. A Arte da Guerra; trad. Caio F. Abreu e Mirian P. Costa. So Paulo: Cultura, 1994. TUGENDHAT, E. Lies sobre tica; trad. Rbson R. dos Reis et al. Petrpolis: Vozes, 1996. TUROCY, Th. L. & Von STENGEL, B. Game Theory. Disponvel na Internet via http://www.cdam.lse.ac.uk/Reports/Files/cdam-2001-09.pdf. Arquivo consultado em 2004. TURING, A. "Computao e Inteligncia", in TEIXEIRA, J.F. Crebros, Mquinas e Conscincia; trad. Fbio de C. Hansem. So Carlos: UFSCAR, 1996. VARIAN, H. Microeconomia; trad. M Jos C. Monteiro. Rio de Janeiro: Campus, 2003. WERLANG, S. R. da C. "Jogos de Informao Incompleta". Ensaios Econmicos, n 50. Rio de Janeiro: FGV, 1984. WIENER, N. Ciberntica e Sociedade; trad. Jos P. Paes. So Paulo: Cultrix, 1978. WITTGENSTEIN, L. Investigaes Filosficas; trad. Jos C. Bruni. So Paulo: Nova Cultural, 1989. WU, J. & AXELROD, R. "How to Cope with Noise in the Iterated Prisoner's Dilemma". Journal of Conflict Resolution, n 39, pp. 183-189, maro de 1995. XENOFONTE. Ditos e Feitos Memorveis de Scrates, in Os Pensadores; trad. Libero R. de Andrade. - So Paulo: Nova Cultural, 1991.

Teoria Dos Jogos e Da Cooperacao para Filosofos

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Teoria Dos Jogos e Da Cooperacao para Filosofos

Enviado por

Direitos autorais:

Formatos disponíveis

TEORIA DOS JOGOS E DA COOPERAO PARA FILSOFOS Por Antnio Rogrio da Silva ndice

Teoria dos Jogos e da Cooperao

I parte Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

. SIMON, H. A. Comportamento Administrativo, pp. XXVIII-XXIX.

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

. Veja HOLLIS, M. Trust within Reason, cap.8, p. 162.

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

A Estrutura do Jogo: Conceitos e princpios

Teoria dos Jogos e da Cooperao

f(1, 2) .... f(1, y2) .... f(1, yn)

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

. SIMONSEN, M.H. Op.cit., p. 25.

Teoria dos Jogos e da Cooperao

A Irracionalidade do Agente Racional

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

. Veja KAHNEMAN, D. & TVERSKY. A. Ibidem, pp. 274 e 281.

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Captulo 2: O Papel da Comunicao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

e o prprio ofertante ficasse com

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao

. SCHELLING, Th. The Strategy of Conflict, apndice C, pp. 302-303.

Teoria dos Jogos e da Cooperao

Teoria dos Jogos e da Cooperao