Você está na página 1de 7

A ARITMTICA DA AJUDA MTUA

Martin A Nowak; Robert M. May e Karl Sigmund


Trad. e adapt.: Dwain P. Santee, do ttulo original The Arithmetics os Mutual Help
(Scientific American, junho de 1995)

O princpio de dar e receber predomina na nossa sociedade. mais velho do que o


comrcio e as trocas. Os membros de um domiclio, por exemplo, esto envolvidos numa
troca contnua de servios e bens, na maior parte do tempo inconsciente. Os economistas
tem cada vez mais de fascinado por essas trocas; assim como os bilogos, que tem
documentado muitos exemplos comparveis entre os chimpanzs e outros primatas. O
prprio Charles Darwin tinha pleno conhecimento do papel da cooperao na evoluo
humana. Na Descendncia do homem ele escreveu que a pouca fora e velocidade do
homem, sua falta de armas naturais etc., so bem contrabalanadas por...suas qualidades
sociais, que levam a dar e receber ajuda de outros humanos.
Isso obviamente muito diferente da existncia humana selvagem descrita pelo
filsofo Thomas Hobbes, que descreveu o homem como solitrio, pobre, amargo, bruto e
pouco tolerante. Mesmo assim, vrios dos primeiros seguidores de Darwin enfatizavam os
aspectos ferozes da luta pela sobrevivncia, de tal maneira que o prncipe russo
Kropotkin se sentiu compelido a escrever um livro para rechaa-la. No livro Ajuda Mtua
(Mutual Aid) considerado pelo Times de Londres como possivelmente o livro mais
importante do ano (1902), ele descreveu muitos exemplos de cooperao entre pastores
siberianos, polinsios e cls medievais. Kropotkin era um famoso defensor do anarquismo,
mas seu gosto por histria natural no era apenas passatempo: Para algum preocupada
com acabar com o estado era essencial mostrar que a cooperao humana no era uma coisa
imposta por uma autoridade com mo de ferro, mas que tem origens nas condies
naturais.
De certa forma os argumentos de Kropotkin tiveram sucesso alem do que ele
mesmo esperava. Uma gama de estudos antropolgicos e na primatologia indicam o papel
predominante da ajuda mtua nas primeiras sociedades homindeas. Livros texto sbre
comportamento animal esto cheios de exemplos de ajuda mtua: catao, alimentao,
ensino, alerta, ajuda em lutas e caa conjunta. Na ecologia as associaes simbiticas tem
cada vez mais sido consideradas fundamentais. Os bilogos encontram exemplos de
cooperao entre clulas, organelas e molculas prbiticas. Mas, ao mesmo tempo, a
ubiquidade da cooperao parece ter se tornado ainda mais paradoxal. O anarquista russo
falhou ao no reconhecer o quanto a cooperao est ameaada pela explorao que impede
os mutualistas de se tornarem parasitas? Porque algum deveria compartilhar um esforo
comum ao invs de se enganar os outros? A seleo natural valoriza o sucesso reprodutivo
individual. Como esse mecanismo pode modelar um comportamento altrusta, no sentido de
que ele beneficie outros s custas da progenia de seu executor?
Existem duas abordagens para essa questo que se encaixam nos ttulos. Seleo de
Parentesco e Ajuda Recproca. Esses dois conceitos no so mutualmente exclusivos mas
podem ser distinguidos. A seleo de parentesco tem suas razes na gentica (ver
Reconhecimento de Parentesco por David W. Pfenning e Paul W. Sherman). Se um gene
auxiliar na promoo do sucesso reprodutivo de parentes prximos do seu portador, ele
tambm ajuda na promoo de cpias de si mesmo. Dentro de uma famlia um bom
comportamento sua prpria recompensa. Mas, um comportamento que beneficie um
estranho tem que ser reciprocado para que valha a pena. A ajuda recproca a troca de um
ato altrusta onde os benefcios superam os custos essencialmente uma troca econmica.
Ela funciona de forma menos direta do que a seleo de parentesco e portanto mais
susceptvel a abusos.
Duas partes podem arranjar um negcio mutualmente lucrativo, mas cada uma delas
poderia ganhar ainda pela reteno de sua contribuio. Na sociedade moderna um enorme
aparato legal faz a tentao de ser desonesto ser resistida. Mas como pode o altrusmo
recproco funcionar na falta dessas instituies autoritrias, to desprezadas pelos
anarquistas de Kropotkin? Essa difcil questo respondida melhor quando primeiro
consideramos os sistemas e mais idealizados.

O Dilema do Prisioneiro

Para demonstrar esse problema difcil, Robert L. Trivers, um socilogo (e ex-


advogado) da Universidade da Califrnia em Santa Cruz, emprestou uma metfora da teoria
dos jogos conhecida como Dilema do Prisioneiro. Como foi originalmente concebido no
incio da dcada de 50, se pergunta a cada um de dois prisioneiros se o outro cometeu o
crime. Seu nvel de punio depende de um deles, ambos ou nenhum dos dois acusar o
outro. Essa situao pode ser vista como um simples jogo. Os dois jogadores tem apenas
que decidir se desejam cooperar um com o outro, ou no. Numa ilustrao do Dilema do
Prisioneiro, se os dois cooperarem, cada um ganha trs pontos. Se ambos se recusarem a
cooperar ganham apenas um ponto cada. Mas, se um jogador cooperar e o outro no, o que
no cooperou recebe cinco pontos enquanto o que coopera no recebe nada.
Haver cooperao? Se o primeiro jogador se recusar, o outro ao cooperar no
receber nada. Claramente, o segundo jogador tambm deveria se recusar. De fato, mesmo
que o primeiro coopere o segundo deveria se recusar, porque essa combinao resulta em
cinco pontos ao invs de trs. No importa o que o primeiro fizer, a melhor opo para o
segundo se recusar. O primeiro jogador est exatamente na mesma posio. Assim ambos
jogadores escolhero a recusa, recebendo um ponto cada. Porque no cooperam?
As decises dos prisioneiros acentuam as diferenas entre o que melhor do ponto
de vista do indivduo e do ponto de vista coletivo. Esse conflito coloca em risco quase
melhor forma de cooperao, incluindo a troca de ajuda mtua. A recompensa pela
cooperao mtua maior do que a punio pela recusa mtua, mas a recusa unilateral
uma tentao pela sua maior recompensa, deixando o cooperador explorado com a
recompensa de perdedor, um resultado pior do que se tivesse se recusado. Essa
hierarquizao da tentao pela recompensa e punio at o prmio de perdedor implica
que a melhor jogada de desero, independentemente da jogada do outro. A lgica leva
inevitavelmente descrio mtua.
A maioria das pessoas se sente incomodada com essa concluso. De fato, elas
ocasionalmente cooperam, motivadas pela solidariedade. Em negociaes comerciais a
desero tambm rara, talvez pela presses da sociedade. Mesmo assim, tais
preocupaes no deveriam afetar o jogo que reveste a vida no sentido rigorosamente
Darwiniano, onde todas as formas de ganho (sejam essas calorias, parceiros sexuais ou
segurana contra predadores) so convertidas numa nica moeda: filhos.
Torneios virtuais

Pode-se pensar num experimento onde uma populao inteira formada de


jogadores programados. Cada um desses autmatos est firmemente ligada a uma estratgia
fixa e cooperar sempre ou sempre se recusar a faz-lo. Eles se engajam num torneio
rotativo do dilema do prisioneiro. Para cada participante o ganho depender dos outros
jogadores que encontrar e, portanto, da compensao da populao. Um desertor, no
entanto, sempre obter mais do que um cooperador. No final do torneio imaginrio os
jogadores se reproduzem, criando uma prole como si (cooperadores e desertores). A
gerao seguinte novamente se engajar na competio e ser paga em prole e assim
sucessivamente. Nessa caricatura biolgica, onde o ganho o nmero de prole e as
estratgias so herdadas, o resultado bvio. Os desertores cresceram em nmero a cada
gerao e eventualmente dominaro a populao.
Existem vrias maneiras de evitar que isso acontea. Em muitas sociedades os
mesmos dois indivduos no interagem apenas uma vez, mas freqentemente. Cada
participante pensar duas vezes antes de se recusar a cooperar se sua jogada fizer o outro se
recusar a cooperar da prxima vez. Assim a estratgia do jogo repetitivo pode mudar o
resultado que ocorreu da ltima vez.
Em contraste com as jogadas nicas do Dilema do Prisioneiro, onde sempre era
melhor no cooperar, existem incontveis estratgias na verso das interaes repetitivas,
mas nenhuma serve para todos os oponentes. Se outro jogador, por exemplo, decidir sempre
cooperar, ser melhor sempre se recusar. Mas, se o seu adversrio decidir cooperar at que
voc se recuse e depois disso nunca mais cooperar, voc ter mais cuidado para no
estragar a parceria: a tentao de trair numa rodada, obtendo os cinco pontos ao invs dos
trs, ser em muito compensada pela subsequente perda nas demais vezes, onde no se
poder ganhar mais do que um ponto.
A falta de uma melhor escolha um ponto crucial. No existe uma receita simples e
direta para o jogo do Dilema do Prisioneiro repetitivo. O sucesso depender da estratgia
do outro jogador, que ningum conhecer de antemo. Uma estratgia que vai bem em
determinados ambientes poder falhar miseravelmente em outros.
No final dos anos 70 o cientista poltico Robert Axelrod, da Universidade de
Michigan, realizou torneios do Dilema do Prisioneiro repetitivo no seu computador. Os
jogadores programas submetidos por seus colegas eram bastante complicados, m as
aconteceu que a estratgia mais simples foi a vencedora. Essa estratgia adequadamente
chamada olho-por-olho (tit-for-tat). Ela comea com uma resposta cooperativa e sempre
repete a jogada anterior do oponente.
Marcadamente, um jogador que utilizar essa estratgia do olho-por-olho nunca
estar na frente no jogo e sempre o ltimo a se recusar a cooperar. O jogador olho-por-
olho pode no entanto vencer todo o torneio porque no torneio do Dilema do Prisioneiro
possvel fazer pontos sem tir-los dos outros. Pela sua transparncia o olho-por-olho
sempre persuade os oponentes a cooperarem. No torneio de Axelrod a estratgia olho-por-
olho (inscrita pelo terico de jogos Anatol Rapoport) eliciou muitas rodadas
recompensadoras de cooperao, enquanto outros jogadores, se destruiriam entre si em
longas jogadas de desero.
Ganhando o torneio, a estratgia olho-por-olho ganhou mais representantes na
gerao seguinte do que as outras estratgias. Em geral, os jogadores que cooperavam
tambm tendiam a ter mais prole do que os que no o faziam. A cada gerao o olho-por-
olho modelou o ambiente. As estratgias que implacavelmente exploravam os cooperadores
se acabavam com seus prprios recursos.

Adversrios imprevisveis

Recentemente ns realizamos simulaes de computador com uma quantidade de


estratgias que baseavam suas decises da rodada anterior e no apenas na jogada
subsequente do adversrio (como no caso do olho-por-olho). Uma estratgia baseada no
resultado anterior deve determinar a resposta para cada uma de quatro eventualidades:
tentao, recompensa, punio e perda. Duas respostas possveis para cada uma de quatro
resultados produz 16 tipos possveis de jogadores.
Permitimos ainda estratgias estocsticas, que respondem aos quatro resultados
possveis pela mudana das probabilidades estatsticas de cooperao. Tais estratgias no
respondem necessariamente da mesma maneira a um determinado resultado. Um tipo nde
jogador estocstico pode, por exemplo, cooperar 90 porcento do tempo depois de
experimentar uma recompensa. Tal incerteza estimula os erros inevitveis que ocorrem
durante as interaes reais.
O acrscimo das respostas estocsticas resultou numa grande variedade de
possibilidades. Nosso computador buscou os jogadores mais bem sucedidos pela simulao
das foras de seleo natural, adicionando a cada centsima gerao uma pequena
quantidade de uma estratgia estocstica selecionada randomicamente. Ns acompanhamos
muitas rodadas com essas mutaes e selees durante milhes de geraes. No porque o
surgimento da cooperao necessitasse de tantas repeties, mas porque essa quantidade
nos permitiu testar uma grande quantidade de possveis estratgias.
Apesar da rica diversidade exibida nessas interaes, elas invariavelmente nos
levavam a resultados simples e claros. O primeiro que o ganho mdio da populao pode
mudar bruscamente. De fato, o comportamento que encontramos um exemplo do
equilbrio pontuado na evoluo biolgica. Na maior parte do tempo a maioria dos
membros de uma populao cooperam ou quase todos se recusam a faz-lo .As transies
entre esses dois regimes eram geralmente raras e abruptas , levando apenas algumas
geraes. Descobrimos que mais tarde no jogo os perodos de equilbrio tendiam a
aumentar, com uma tendncia clara para a cooperao. Quanto mais tempo se permitia que
o sistema evolusse maior a probabilidade do surgimento de um sistema cooperativo. No
entanto, a ameaa de um colapso sbito permanecia.

Populaes cooperativas so s vezes dominadas por uma estratgia olho-por-olho


generoso, uma variao em que, em algumas ocasies, a cooperao resposta falta dela.
Mas, muito mais freqentemente, reinou absoluta uma estratgia muito diferente, chamada
de Pavlov pelo matemtico David P. Kraines, da Universidade de Duke e por Vivian
Kraines, da Meredith College. Depois de experimentar uma recompensa por cooperao
mtua um jogador do tipo Pavlov repete o movimento cooperativo anterior. Depois de se
safar por ser um desertor unilateral, de forma semelhante ele repete sua ltima jogada. Mas,
depois de ser punido por desero mtua. Pavlov se torna cooperativo. Depois de receber o
pagamento de perdedor por unilateralmente se recusar a cooperar, ele reage com desero.
Em suma, a regra de Pavlov dita que ele deve continuar o movimento anterior se tiver um
bom ganho (recompensa ou tentao), mas que mude se a jogada anterior tiver trazido um
baixo retorno (punio ou ganho para o perdedor).
Esse princpio de ganhar-manter, perder-mudar parece funcionar bem em muitas
outras situaes. Na psicologia animal isso visto como fundamental: o rato est pronto
para repetir a ao que lhe trouxer uma recompensa e a deixar de executar comportamentos
com conseqncias dolorosas.
Dentro do jogo Dilema do Prisioneiro repetitivo a retaliao, depois de Ter sido
explorada normalmente, vista como evidncia de comportamentos semelhantes ao olho-
por-olho, mas tambm serve para o jogador tipo Pavlov. Uma sociedade de estrategistas
tipo Pavlov muito contra erros. Uma desistncia errnea entre dois de seus membros leva
a uma rodada de desero mtua e depois volta cooperao. Mas, frente a um oponente
dque no retalia, um jogador tipo Pavlov continua desertando. Esse comportamento torna
difcil para os jogadores que sempre cooperam obterem um lugar na comunidade. Em
contraste, uma sociedade de jogadores olho-por-olho generosos no discriminam os
cooperadores incondicionais. A longo prazo essa benevolncia cara porque os jogadores
que no retaliam podem adentrar na populao e prejudicar a cooperao, permitindo assim
que os exploradores se propaguem.
Embora Pavlov seja uma boa estratgia para evitar dque os exploradores invadam
uma sociedade cooperativa, ele se d mal entre os no cooperadores. Contra os desertores
persistentes, por exemplo, essa estratgia tenta estabelecer a cooperao a cada duas
rodadas. Nos torneios de Axelrod, Pavlov estaria perto do final. As vantagens de Pavlov s
surgem depois que estratgias mais rgidas como olho-por-olho prepararam o caminho
guiando a evoluo para longe da recusa.

Cooperao inata.

Pode-se concluir com segurana que o surgimento e a persistncia do


comportamento cooperativo no so improvveis quando consideramos que os
participantes se encontram repetidamente, se reconhecem e se lembram dos resultados dos
encontros passados. Essas circunstncias podem ser familiares na vida cotidiana de alguns
lares ou escritrios, mas no mundo maior das coisas vivas, tais exigncias requerem uma
alto grau de sofisticao. Mesmo assim observamos a cooperao at mesmo entre
organismos simples, que no possuem tais habilidades. Mas ainda, as estratgias discutidas
s funcionaro se os benefcios dos confrontos futuros no forem significativamente
descontados dos ganhos presentes. Novamente, essa expectativa pode ser razovel para
muitas atividades humanas. Mas para os organismos mais simples, ganhos posponados na
forma de sucesso reprodutivo futuro podem valer pouco: Se a vida for curta e imprevisvel
existe presso evolutiva escassa para se realizar um investimento a longo prazo.
Mas, o que acontece com as criaturas, como muitos invertebrados, que parecem
exibir formas de cooperao recproca, mesmo que freqentemente no possam reconhecer
jogadores individuais ou se lembrar de suas aes? Ou, se os ganhos futuros forem
rigorosamente descontados? Como podem os arranjos altrustico ser mantidos nessas
circunstncias? Uma possvel soluo que esses jogadores encontram um grupo fixo de
oponentes e que o jogo na maior parte feito com eles. Em geral essa seletividade
dificilmente ser obtida, mas existe uma circunstncia em que isso no s fcil como
tambm automtico. Se os jogadores ocupam locais fixos e interagem apenas com vizinhos,
no haver necessidade de reconhecer e lembrar porque os outros jogadores so fixos pela
geometria. Enquanto que em muitas das nossas simulaes os jogadores sempre encontram
uma amostra representativa da populao, tambm temos especificamente olhado para as
situaes em que cada jogador interage apenas com vizinhos, numa grade bidimensional.
Esses jogos espaciais so muito recentes e acrescentam algo ao Dilema do Prisioneiro.

Preso num plano

No deve ser nenhuma surpresa que a cooperao mais facilmente mantida numa
populao estvel: os desertores podem se dar bem em cima de uma multido annima,
mas a ajuda mtua geralmente ocorre entre vizinhos. Esse conceito muito claro. Mas, em
muitos casos, as interaes numa estrutura territorial promovem cooperao, mesmo sem
que se espere um encontro sucessivo. Esse resultado favorece a cooperao at no Dilema
de Prisioneiro de rodada nica.
Consideramos um torneio do Dilema do Prisioneiro com restries espaciais, onde
cada membro da populao se coloca num quadrado de um tabuleiro do tipo xadrez. Cada
jogador um cooperador puro ou um desertor puro e interage apenas com seus oito
vizinhos imediatos, jogando uma rodada do Dilema do Prisioneiro com cada um. Na
gerao seguinte o quadrado herdado por aquele que totalizar um maior nmero de
pontos.
Um cooperador solitrio ser explorado pelos desertores que o rodeiam e acabar
sucumbindo, mas quatro cooperadores num bloco podem se manter porque cada um deles
interage com trs cooperadores; um desertor, sendo um estranho, poder interagir e
explorar apenas dois. Se o ganho por ser desertor no for muito grande surgiro
agrupamentos de cooperadores. Ao contrrio, desertores solitrios sempre estaro bem
porque estaro arrodeados de cooperadores explorveis. Mas, ao se multiplicarem os
desertores cercam a si mesmos, diminuindo portanto seus ganhos.
A verdadeira evoluo desse sistema espacial depende dos valores a serem ganhos.
Certamente possvel que os cooperadores sejam eliminados do tabuleiro, mas
freqentemente encontramos mosaicos que se modificam e mantm ambas estratgias.
Misturas de cooperadores e desertores puros podem coexistir indefinidamente em
propores variadas, mas a composio mdia da populao previsvel. Essa concluso
robusta. Essencialmente, ela tambm verdadeira para outros padres de distribuio no
tabuleiro e at para padres randmicos. O requisito importante que cada jogador no
interaja com muitos vizinhos.
As regras simples desses jogos espaciais definem uma dinmica bastante complexa,
permitindo que padres se movam pelo tabuleiro e assumam sua forma inicial. Elas
tambm podem resultar em motivos que crescem sem limites. Algumas dessas
caractersticas se parecem com o jogo Life (Vida) de John Horton Conway (ver
Mathematical Games por Martin Gardner, Scientific American, Outubro de 1970, que so
um esquema para a construo de padres espaciais que evoluem pelo uso de regras
simples, imitando organismos regenerantes. Pode perfeitamente ocorrer que os resultados
gerados por qualquer uma das nossas verses espaciais do Dilema do Prisioneiro sejam
padres irregulares ou tapetes persas simtricos sejam intrinsecamente imprevisveis e
caticas no sentido de que nenhum organismo pode prever o que ocorrer. Talvez
matemticos mais espertos pudessem inventar uma maneira de determinar os padres
futuros, mas estamos satisfeitos em assistir os surgimentos dos arabescos.
A vida assim mesmo.

Ao longo da histria da vida a cooperao entre unidades menores levou ao


surgimento de estruturas mais complexas como, por exemplo, das criaturas multicelulares a
partir de organismos unicelulares. Nesse sentido a cooperao se torna to essencial para a
evoluo quanto a competio.
Estruturas espaciais em particular agem para proteger a diversidade. Elas permitem
que os cooperadores e os desertores coexistam lado a lado. Num contexto diferente mas
semelhante, padres espaciais permitem que populaes de hospedeiros e parasitas, ou de
presas e predadores, coexistam a despeito da inerente instabilidade de suas interaes.
Tais estratgias cooperativas podem ter sido cruciais na evoluo pr-bitica, que
muitos pesquisadores acreditam pode ter ocorrido nas superfcies ao invs de nas solues
bem misturadas. A catalisao da replicao de uma molcula constitui uma forma de ajuda
mtua; ento, uma cadeia de catalisadores, cada um com uma ligao que retorna para si,
seria a ocorrncia mais antiga da ajuda mtua (veja The Origin of Genetic Information
por Manfred Eigen, William Gardiner, Peter Schuster e Ruthild Winkler-Oswatitsch;
Scientific American, abril de 1981).
Reaes qumicas cooperativas estariam vulnerveis a mutantes moleculares
fraudulentos que levassem mais cido catalisador do que dessem. Pensava-se que tais
dificuldades desacreditariam muitas idias sobre a evoluo pr-bitica baseadas em
cadeias cooperativas, mas Maarten C. Boerjist e Pauline Hogeweg da Utrecht University
recentemente demonstraram com simulaes de computador que estruturas espaciais auto-
geradas, anlogas as que inventamos, podem evitar a disseminao de molculas parasticas
destrutivas.
Nossos modelos, crus como so, ilustram como a cooperao pode surgir e ser
mantida em sistemas biolgicos reais. Criaturas sofisticadas podem ser levadas a seguir
estratgias que encorajem a cooperao pelas repetidas interaes entre indivduos que
podem reconhecer e se lembrar uns dos outros. Mas, em organismos mais simples a
cooperao ainda persiste, talvez por causa das estruturas espaciais auto-organizadas,
geradas por interaes com vizinhos imediatos em algum espao fixo. No curso da
evoluo parece ter ocorrido amplas oportunidades de cooperao tanto entre humanos
quanto molculas. Em essncia, a cooperao pode ser mais antiga que a prpria vida.
Leituras adicionais:

The Evolution of Cooperation. Robert Axelrod. Basic Books.1985


Tit-for-tat In Heterogeneous Populations. Martin A Nowak e Karl Sigmund. Nature. V.355.
n.6357.pginas 250-253.janeiro 16,1992.
Evolutionary Games and Spacial Chaos. Martin A Nowak and Robert M.May. Nature.

V.359.n.6398.pginas 826-829.outubro 20,1992.


A Strategy of Win-stay, Lose-shift That Outperforms Tit-for-tat in the Prisioners Dilemma

Game. Martin A Nowak e Karl Sigmund. Nature. V.364. n. 6432. Pginas 56-58;
julho 1,1993.
Games of Life: Explorations in Ecology, Evolution and Behavior. Karl Sigmund.
Penguin.19995