Você está na página 1de 22

A EVOLUO DARWINIANA LUZ DA GENMICA

RESUMO
A genmica comparativa e a biologia de sistemas oferecem oportunidades sem
precedentes para testar os princpios fundamentais da biologia evolutiva formulada por Darwin
em A Origem das Espcies, em 1859 e expandida na Sntese Moderna 100 anos mais
tarde. Os estudos da Genmicas-evolutiva mostram que a seleo natural apenas uma das
foras que moldam a evoluo do genoma e no quantitativamente dominante considerando
que os processos no-adaptativos so muito mais proeminente do que se suspeitava
anteriormente. As principais contribuies de transferncia de genes horizontal e diversos
elementos genticos egostas para a evoluo do genoma minam o conceito da rvore da
Vida. Uma adequada discrio da evoluo requer um conceito mais complexo de uma rede ou
"floresta" de vida. No h nenhuma tendncia consistente da evoluo para o aumento da
complexidade genmica, e quando a complexidade aumenta, esta parece ser uma
consequncia no adaptativa da evoluo sob seleo purificadora fraca, em vez de uma
adaptao. Vrios fundamentos universais da evoluo do genoma foram descobertos,
incluindo as distribuies invariantes das taxas evolutivas entre genes ortlogos de diversos
genomas e do tamanho da famlia de genes parlogos, e a correlao negativa entre o nvel de
expresso gnica e taxa de sequncia da evoluo. Simples modelos de evoluo noadaptativo explicam alguns destes fundamentos universais sugerindo que uma nova sntese da
biologia evolutiva pode se tornar vivel em um futuro no to distante.

INTRODUO
O livro A Origem das Espcies de Charles Darwin que apareceu em Londres em 1859
(1) foi o primeiro relato plausvel detalhado da evoluo biolgica j publicada, juntamente com
os contornos breves simultneos e independentes de Darwin e Alfred Russell Wallace
publicado no ano anterior (2-3). claro que Darwin no descobriu a evoluo e nem sequer
ofereceu a primeira descrio coerente da evoluo - sem dvida, essa honra pertence a JeanBaptiste Lamarck, cujo magnum opus Philosophie Zoologique (4) foi, estranhamente,
publicado no ano do nascimento de Darwin. No entanto, a imagem da evoluo de Lamarck
baseou-se em um impulso inato de organismos evoluindo rumo perfeio, uma ideia que no
pode ser aceitvel para uma mente racionalista. Alm disso, Lamarck no proclamar o carter
universal da evoluo: ele postulou mltiplos atos de criao, aparentemente, um para cada
espcie. Darwin foi o primeiro a apresentar um retrato racional, mecanicista, e sem dvida,
magnfico da origem de toda a diversidade de formas de vida 'de um comeo to simples',
provavelmente, a partir de um nico ancestral comum (1). A viso de Darwin da evoluo da
vida era suficientemente completa e poderosa para conquistar, ou, pelo menos, afetar
profundamente as mentes dos maiores biologistas (e cientistas em geral, e o pblico culto em
geral), de modo que todas as pesquisas em biologia durante os ltimos 150 anos se
desenvolveu dentro da estrutura estabelecida pela Origem (mesmo quando em oposio s
ideias de Darwin).
A viso de Darwin no tinha a base essencial em gentica porque os mecanismos da
hereditariedade eram desconhecidos em seus dias (o trabalho de Mendel passou
despercebido, ao passo que as prprias ideias de Darwin nesta rea foram menos produtivas).
A base gentica da evoluo foi estabelecida aps a redescoberta das leis de Mendel, com o
desenvolvimento da gentica populacional no primeiro tero do sculo 20, principalmente,
atravs do trabalho pioneiro de Fisher, Wright e Haldane (5-7). O novo entendimento avanado
da evoluo, informado pelo trabalho terico e experimental em gentica, foi consolidado na
Sntese Moderna da biologia evolutiva, geralmente, associado com os nomes de Dobzhansky,
Julius Huxley, Mayr e Simpson (8-11). Aparentemente, a Sntese Moderna (neo- Darwinismo)
aprovou a sua forma madura durante a celebrao do centenrio da origem em Chicago em
1959 (12-14).
Agora, 50 anos aps a consolidao da Sntese Moderna, a biologia evolutiva, sem
dvida, enfrenta um novo desafio importante e, ao mesmo tempo, a perspectiva de um novo
avano conceitual (15). Se a Sntese Moderna pode ser sucintamente descrita como
darwinismo Luz de Gentica (muitas vezes referida como neo-darwinismo), ento, a nova
fase Biologia Evolutiva luz da Genmica. Neste artigo, vou tentar descrever as alteraes

ocorridas nos princpios bsicos da biologia evolutiva trazidas pela genmica comparativa e
funcional e argumentar que, em muitos aspectos, a fase genmica poderia ser uma sada mais
radical do neo-darwinismo que o ltimo foi do darwinismo clssico. Claro que, para isso,
necessrio primeiro recapitular os principais conceitos da evoluo proposta por Darwin e
alterados pelos arquitetos da Sntese Moderna. No resto do artigo, eu voltarei para cada um
destes pontos.
(i)
Sem direo, a variao aleatria o principal processo que fornece o
material para a evoluo. Darwin foi o primeiro a propor o acaso como fator
importante na histria de vida, e sem dvida, essa foi uma das suas maiores
ideias.
(ii) A evoluo prossegue por fixao das raras variaes benficas e
eliminao das variaes deletrias: este o processo de seleo natural que,
juntamente com a variao ao acaso, a principal fora motriz da evoluo
segundo Darwin e a Sntese Moderna. A seleo natural, que , obviamente,
semelhante ao e inspirado pela "mo invisvel" (do mercado), que governou a
economia de acordo com Adam Smith, foi o primeiro mecanismo de evoluo j
proposto que era simples, plausvel, e no requeria nenhuma misteriosa tendncia
inata. Como tal, esta foi a segunda viso fundamental de Darwin. Os fundadores
da gentica de populaes, em particular, Sewall Wright, enfatizou que o acaso
poderia desempenhar um papel importante na fixao de mudanas durante a
evoluo, no s em seu surgimento, via o fenmeno da deriva gentica, que
implica a fixao aleatria de mudanas neutras ou at mesmo prejudicial. A teoria
de populao gentica indica que o desvio particularmente importante em
pequenas populaes que passam por pontos de estrangulamento (6,16). No
entanto, a sntese moderna, na sua forma "endurecida" (13), de forma eficaz,
rejeitada a deriva como uma fora evolutiva importante, e aderente a um modelo
puramente adaptacionista da evoluo (17). Este modelo leva inevitavelmente ao
conceito de "progresso", a melhoria gradual de "rgos" durante a evoluo, uma
ideia que Darwin aprovou como uma tendncia geral, apesar de seu claro
entendimento de que os organismos so menos do que perfeitamente adaptado,
como notavelmente exemplificado por rgos rudimentares, e, apesar de sua
averso a qualquer aparncia de uma inata procura pela perfeio da turma
lamarckiana.
(iii) As mudanas benficas que so corrigidas pela seleo natural so
"infinitamente" pequenas, de modo que a evoluo prossegue, atravs do acmulo
gradual desses pequenas modificaes. Darwin insistiu em rigoroso gradualismo
como numa referncia essencial da sua teoria: "A seleo natural s pode agir pela
preservao e acumulao de infinitamente pequenas modificaes hereditrias,
cada uma rentvel ao ser preservada. . . Se pudesse ser demonstrado que existiu
algum rgo complexo que no poderia ter sido formado por numerosas,
sucessivas e ligeiras modificaes, minha teoria seria absolutamente quebrar. '[(1),
captulo 6]. Mesmo alguns contemporneos de Darwin acreditava que era uma
estenose desnecessrio na teoria. Em particular, as objees iniciais de Thomas
Huxley so bem conhecidos: mesmo antes da publicao da Origem Huxley
escreveu a Darwin'' Voc tem carregado a si mesmo com uma dificuldade
desnecessria na adoo da Natureza no faz salto to incondicionalmente
(18).
(iv) Um aspecto da biologia evolutiva clssica que est relacionada, mas
no idntica aos princpios do gradualismo a uniformitarianismo (absorvido por
Darwin a partir da Geologia de Lyell), isto , a crena de que os processos
evolutivos permaneceram, essencialmente, os mesmos ao longo da histria de
vida.
(v) A evoluo da vida pode ser apresentada como uma "grande rvore",
como simbolizada pela simples, famosa ilustrao da Origem [(1), captulo 4].
(vi) Um conceito corolrio da nica rvore da vida (TOL) que, no entanto,
merece o status de um princpio separado: toda a diversidade existente de formas

de vida evoluram a partir de um nico ancestral comum [ou muito poucas formas
ancestrais, sob a frmula cautelosa de Darwin (1) , captulo 14], que mais tarde foi
apelidado de ltima Universal comum (Cellular) Ancestral (LUCA) (19).

ENTRE A SNTESE MODERNA E A GENMICA EVOLUTIVA


Obviamente, os bilogos evolucionistas no ficaram ociosos durante o espao de 40
anos que separou a consolidao da Sntese Moderna e a chegada da idade da genmica
evolutiva; abaixo resumirei o que parecem ser os principais avanos (sem dvida, este breve
relato incompleto e pode ser considerado um pouco subjetivo).
A evoluo e a filogenia molecular
A filogenia tradicional que concretizou o conceito da TOL de Darwin baseou-se em
comparaes de caractersticas diagnsticas da morfologia de organismos, tais como, por
exemplo, a estrutura do esqueleto de animais e plantas na arquitetura da flor(20). A ideia de
que o substrato molecular real da evoluo que sofre as mudanas postas em prtica por meio
da seleo natural (os genes, simplesmente) poderia ser comparado com a finalidade de
reconstrues filogenia no entrar nas mentes dos bilogos evolucionistas pela razo bvia de
que (por pouco) nada foi conhecido sobre a natureza qumica do referido substrato e a maneira
como ele codificou o fentipo de um organismo. Alm disso, o paradigma adaptacionista da
biologia evolutiva parecia implicar que os genes, seja qual for a sua natureza molecular, no
seriam bem conservadas entre organismos distantes, dadas as grandes diferenas fenotpicas
entre eles, como enfatizou em particular Mayr, um dos principais arquitetos da Sntese
Moderna (21).
A ideia de que a sequncia de bases de DNA poderia ser empregada para a
reconstruo da evoluo parece ter sido expressa pela primeira vez em papel por Crick,
apropriadamente, no mesmo artigo seminal em que ele formulou a hiptese de adaptador (22).
Os princpios reais e a primeira implementao de anlise evolutiva molecular foram dados
poucos anos mais tarde por Zuckerkandl e Pauling que diretamente falsificou a conjectura de
Mayr por mostrar que as sequncias de aminocidos de vrias protenas disponveis no
momento, tais como citocromo c e globinas, eram altamente conservada mesmo entre os
animais distantemente relacionados (23,24). Zuckerkandl e Pauling tambm propuseram o
conceito de relgio molecular, uma taxa relativamente constante da sequncia da evoluo que
eles previram serem caractersticas de cada protena na ausncia de alterao funcional. Nos
poucos anos depois, principalmente, atravs dos esforos de Dayhoff e colaboradores, foi
demonstrado que a conservao da sequncia de protena se estendeu para as mais diversas
formas de vida, a partir de bactrias de mamferos (25-27).
A fase inicial de pesquisa da evoluo molecular culminou na obra de Woese e
colaboradores onde revelaram a conservao das sequncias de certas molculas, acima de
tudo, o RNA ribossomal em todas as formas de vida celulares, e a sua adequao para a
anlise filogentica (28). O coroamento desta linha de pesquisa foi descoberta totalmente
inesperada do terceiro domnio da vida, arquebactrias, que inclui organismos anteriormente
agrupados com bactrias, mas mostrou-se altamente distinta pela anlise filogentica de rRNA
(29,30). Como resultado destes estudos, uma tendncia crescente se desenvolveu para igualar
a rvore filogentica de rRNA, com a sua estrutura de trs domnios (31), com o 'TOL prevista
por Darwin e explicada primeiro por Haeckel (28,32,33). No entanto, mesmo na era prgenmica, tornou-se claro que nem todas as rvores de genes codificadores de protenas tm
a mesma topologia como a rvore de rRNA, as causas das discrepncias permaneceram
obscuras, mas no pensou-se em envolver a transferncia horizontal de genes (HGT) (34).
A teoria neutra e seleo purificadora
Provavelmente, o maior avano conceitual importante na biologia evolutiva aps a
sntese moderna foi a teoria neutra da evoluo molecular que geralmente associada com o
nome de Kimura (35,36), embora uma teoria similar foi desenvolvida simultaneamente e de
forma independente por Jukes e King (37 ). Originalmente, a teoria neutra foi obtida como um
desenvolvimento das ideias de populaes genticas de Wright sobre a importncia da deriva
gentica na evoluo. De acordo com a teoria neutra, a grande maioria das mutaes que

foram corrigidas no curso da evoluo so seletivamente neutras de modo que a fixao ocorre
atravs de deriva aleatria. Um corolrio dessa teoria que as sequncias de genes evoluem
de aproximadamente relgio de maneira semelhante (em apoio hiptese de relgio molecular
original do Zuckerkandl e Pauling), enquanto que mutaes benficas episdicas sujeitas
seleo natural so suficientemente raras para ser desconsideradas com segurana por uma
descrio quantitativa do processo evolutivo. Naturalmente, a teoria neutra no deve ser
tomada para significar que a seleo no importante para a evoluo. O que mantm
efetivamente a teoria que o modo dominante de seleo no a seleo positiva Darwiniana
de mutaes adaptativas, mas a estabilizao ou seleo purificadora que elimina as mutaes
deletrias, enquanto que permite a fixao de mutaes neutras por deriva (17).
Estudos subsequentes refinou a teoria e fez-se mais realista, que, para ser fixada, uma
mutao no precisa ser literalmente neutra, mas apenas precisa exercer um efeito deletrio
que seja suficientemente pequeno para escapar da eliminao eficiente atravs da seleo
purificadora da moderna teoria 'quase neutras' (38). Quais mutaes so "vistas" pela seleo
purificadora como deletria depende criticamente do tamanho das populaes eficazes: em
pequenas populaes, a trao pode corrigir mutaes mesmo com um efeito deletrio
significativo (16). O principal teste emprico da teoria (quase) neutra vem de medies da
constncia das taxas evolutivas em famlias de genes. Embora tenha sido observado
repetidamente que o relgio molecular significativamente sobre-dispersa (39,40), esses
testes sugerem fortemente que a frao de mutaes neutras entre as amostras fixadas , de
fato, substancial (36). A teoria (quase) neutra um importante ponto de partida a partir do
paradigma selecionista da Sntese Moderna, uma vez que postula explicitamente que a maioria
das mutaes fixadas durante a evoluo no so afetados por seleo (positivo) darwiniana
(Darwin parece ter pressagiava o paradigma neutralista observando que seletivamente
caracteres neutros serviria melhor para fins de classificao (1), no entanto, ele no entrou em
detalhes sobre essa idia, e ele no se tornou parte da Sntese Moderna).
Importante, nas elaboraes posteriores da teoria neutra, Kimura e outros perceberam
que as mutaes que foram (quase) neutras, no momento da fixao no foram indiferentes
evoluo. Pelo contrrio, essas mutaes consistiram-se no conjunto de variao que poderia
ser explorado pela seleo natural em condies mudadas, um fenmeno que poderia ser
potencialmente importante para a macroevoluo (17,41).

Em biologia evolutiva e biologia


molecular, Junk DNA um rtulo
provisrio para as pores da
seqncia do DNA de
um cromossomo ou genoma uma fun
o para a qual no foi identificado.

O termo transposon ou elemento gentico


mvel refere-se a um conjunto de
segmentos lineares de DNA, que so
capazes de mudar de posio dentro do
genoma, independentemente de homologia
entre a regio genmica onde encontram-se
inseridos e o local ao qual se destinam.

Genes egostas, junk DNA e elementos mveis


Embora isso fosse raramente declarado explicitamente, a gentica clssica certamente
implica que (quase) todas as partes do genoma (todos os nucleotdeos, em termos moleculares
mais modernos) tem uma funo especfica. No entanto, este entendimento implcito entrou em
dvida nas dcadas de 1960-70, devido acumulao de dados sobre a falta de uma
correspondncia direta entre e complexidade genmica e fenotpica dos organismos. Foi
mostrado que os organismos com aproximadamente o mesmo grau de complexidade fenotpica
frequentemente tinham genomas que diferiam em tamanho e complexidade por ordens de
magnitude (o assim chamado paradoxo do valor C) (42,43). Este paradoxo foi conceitualmente
resolvido por duas ideias fundamentais, relacionadas, os de genes egostas e junk DNA. O
conceito de gene egosta foi desenvolvido por Dawkins em seu livro clssico homnimo (44).
Dawkins percebeu, em um ponto de partida impressionante do paradigma organismo-central da
Sntese Moderna, que a seleo natural pode atuar no apenas no nvel do organismo como
um todo, mas tambm ao nvel de um gene individual. De acordo com uma formulao um
pouco provocativa deste ponto de vista, o genoma e o organismo so, simplesmente, os
veculos para a propagao de genes. Este conceito foi mais avanado por Doolittle e
Sapienza (45) e por Orgel e Crick (46) que propuseram que muito, se no a maior parte, do
ADN genmico (pelo menos, em organismos complexos) consistiu-se de vrias classes de
repeties que se originam a partir da replicao de elementos egostas (parasitas finais, de
acordo com Orgel e Crick). Em outras palavras, do ponto de vista do organismo, muito do seu

ADN genmico deve ser considerado refugo (lixo). Este ponto de vista do genoma difere
radicalmente da imagem implicada pelo paradigma selecionista sob o qual a maioria, se no
todos os nucleotdeos no genoma seriam afetados pela (ou um purificador de positivo) seleo,
atuando ao nvel do organismo.
Um desenvolvimento importante conceitualmente foi a descoberta, em primeiro lugar em
plantas por McClintock, na dcada de 1940 (47), e, subsequentemente, em animais (48), de
"genes saltadores ', mais tarde conhecida como elementos mveis, isto , os elementos
genticos que eram propensos frequentemente a alterar a sua posio no genoma. A
demonstrao da ubiquidade dos elementos mveis sugeriu a imagem de genomas altamente
dinmicos, em constante mutao do genoma mesmo antes do advento da genmica
modernos (49,50).
Evoluo por duplicao de genes e do genoma
O princpio central de Darwin, a insistncia gradual de mudanas infinitesimais como o
nico material da evoluo, foi contestada pelo conceito de evoluo por duplicao de genes,
que foi desenvolvida por Ohno em seu clssico livro de 1970 (51). A ideia de que a duplicao
de partes de cromossomos pode contribuir para a evoluo remonta a alguns dos fundadores
da gentica moderna, em particular Fisher (52), mas Ohno foi o primeiro a propor que a
duplicao de genes foi fundamental para a evoluo dos genomas e dos organismos e apoiou
esta proposio por uma teoria qualitativa. A partir da evidncia da duplicao precoce de um
genoma inteiro na evoluo dos cordados , Ohno sups que a duplicao do gene pode ser
importante, se no o principal, o caminho para o desenvolvimento de novas funes biolgicas,
porque aps um duplicao umas cpias de genes estariam livres das restries impostas pela
seleo purificadora, e teriam o potencial de desenvolver uma nova funo (um fenmeno mais
tarde nomeado neofuncionalizao). Claramente, o surgimento de um novo gene como
resultado de uma duplicao, e quanto mais a duplicao de uma regio genmica, incluindo
mltiplos genes ou a duplicao do genoma inteiro, esto longe de serem as mudanas
"infinitesimais", e se tais eventos maiores so realmente importantes para a evoluo, o
paradigma gradualista entra em perigo.
Tmpanos, exaptao*, ajustes e a deficincia do paradigma panglossiano da evoluo
Uma espirituosa, crtica radical do programa adaptacionista da biologia evolutiva foi
montado por Gould e Lewontin nos famosos papeis de "Tmpanos das San Marco (53). Gould
e Lewontin sarcasticamente descreveram a viso de mundo adaptacionista como o paradigma
panglossiano, depois que o personagem notrio em Cndido de Voltaire, que insistiu em que
"tudo era o melhor neste melhor de todos os mundos" (mesmo as grandes catstrofes). Gould
e Lewontin enfatizaram que, ao invs de inventar s pressas "apenas assim histrias' de
adaptaes plausveis, bilogos evolucionistas deveriam buscar explicaes sobre as
caractersticas observadas de organizao biolgica sob uma abordagem pluralista que leva
em conta no s a seleo, mas tambm limitaes intrnsecas, deriva aleatria e outros
fatores. A metfora do tmpano sustenta que muitos elementos funcionalmente importantes de
organizao biolgica no evoluram como dispositivos especficos para desempenhar suas
funes atuais mas antes so produtos de restries arquitetnicas no-adaptativos - muito
como tmpanos que inevitavelmente aparecem em arcos de catedrais e outros edifcios, e pode
ser utilizado para vrias funes, como elementos-chave de habitao do adorno imaginrio da
catedral. Ao processo de utilizao de tmpanos para as funes biolgicas foi dado o nome
especial de exaptao proposto por Gould como uma importante via de evoluo (54).
Em uma ainda mais cedo, o desenvolvimento conceitual relacionado, Jacob promoveu a
metfora da evoluo como ajustes (55). O argumento de Jacob, com base, principalmente,
dos resultados da anlise comparativa dos mecanismos de desenvolvimento, que a evoluo
no atua como um engenheiro ou designer, mas sim como um funileiro que fortemente
dependente de imprevistos anteriores para resolver os problemas pendentes e cujas aes
so, portanto, imprevisvel e inexplicvel sem o conhecimento detalhado da evoluo anterior.
A evoluo no mundo dos micro-organismos e vrus
Talvez, o desenvolvimento em biologia que teve o mais profundo efeito sobre as
mudanas em nossa compreenso da evoluo foi extenso da investigao evolutiva no

uma adaptao

biolgica que
no evoluiu dirigida
principalmente
por presses
seletivas relacionada
sua funo atual.
Em vez disso evoluiu
por
presses
seletivas diferentes
relacionadas a uma
adaptao
para
outras funes, at
que eventualmente
chegou a um estado
ou construo em
que veio a ser
utilizada para uma
nova funo.

reino das bactrias (e archaea) e vrus. A considerao da evoluo de Darwin e todos os


desenvolvimentos em biologia evolutiva nas seguintes dcadas trataram exclusivamente com
animais e plantas, com eucariotas unicelulares (Protista) e bactrias (Monera) nominalmente
colocadas perto da raiz do TOL por Haeckel e seus sucessores (56). Embora em 1950, a
anlise gentica de bacterifagos e bactrias era bem avanada, tornando-se bvio que estas
formas de vida tinham genomas evoludos (57), a sntese moderna no fez nenhuma
notificao destes desenvolvimentos. Que as bactrias (e muito menos vrus) evoluiriam sob os
mesmos princpios e com os mesmos mecanismos como animais e plantas, no dada de
forma bvia todas as suas diferenas biolgicas marcantes a partir de organismos
multicelulares e, especificamente, porque lhes faltam reproduo sexual regular e isolamento
reprodutivo que crucial para a especiao em animais e plantas.
Efetivamente, os procariontes se tornaram "visveis" para os bilogos evolucionistas, em
1977, com o trabalho pioneiro de Woese e colegas sobre a filogenia de rRNA que levou
identificao de archaea e os principais grupos de bactrias (28,29,58). Pouco depois, o campo
da genmica comparativa e evolutiva nasceu enquanto vrias sequncias completas do
genoma de diversas pequenos vrus se tornaram disponveis. Apesar da sequncia rpida da
evoluo que caracterstica dos vrus, esta pesquisa comparativa-genmica precoce foi bem
sucedida na delineao de conjuntos de genes que so conservadas em grandes grupos de
vrus (59-62). Alm disso, um princpio geral tornou-se evidente: enquanto alguns genes foram
conservados atravs de uma variedade impressionante de vrus, arquiteturas genmicas,
estruturas virion, e as caractersticas biolgicas de vrus mostraram muito mais plasticidade, de
modo que a troca de gene, mesmo entre os vrus altamente desiguais, surgiu como um fator
importante da evoluo (62).
Endossimbiose
A hiptese de que certas organelas das clulas eucariticas, em particular, os
cloroplastos de plantas, evoluram a partir de bactrias que no muito mais jovem que a
Origem: ela foi proposta por diversos investigadores no final do sculo 19, sobre a base do
estudo microscpico das clulas de plantas que revelaram similaridade estrutural evidente
entre cloroplastos e cianobactrias (ento conhecida como alga azul-verde) e foi apresentado
de forma coerente por Mereschkowsky no incio do sculo 20 (63). Durante os primeiros dois
teros do sculo 20, esta hiptese de endosimbiose permaneceu uma especulao de
margem. No entanto, essa percepo mudou logo aps o aparecimento da publicao seminal
de Sagan (Margulis) em 1967, que resumiu os dados ento disponveis sobre a semelhana
entre certas organelas e bactrias, em particular, a descoberta surpreendente de genomas
organelares, e chegou concluso de que no s os cloroplastos, mas tambm as
mitocndrias evoluram a partir de bactrias endossimbiticas (64). Os trabalhos posteriores,
em particular, a anlise filogentica de ambos os genes contidos no genoma mitocondrial, e os
genes que codificam protenas dessa funo na mitocndria e, aparentemente, foram
transferidos na forma mitocondrial para o genoma nuclear transformou a hiptese
endosimbiose em um fato bem estabelecido (65). Alm disso, estes estudos filogenticos
demostraram de forma convincente a origem de mitocndrias a partir de um determinado grupo
de bactrias, a proteobacteria (66,67). O principal papel evolutivo efetivamente atribudo a
eventos nicos como endosimbiose , naturalmente, compatvel com ambos gradualismo e
uniformitarianismo.

BIOLOGIA EVOLUTIVA NA ERA DA GENMICA


O tesouro de genmica, metagenmica e dados ps-genmicas
Os princpios fundamentais da evoluo molecular foram estabelecidos, e muitas
observaes especficas de grande importncia e impacto sobre os fundamentos do neodarwinismo foram feitas na era pr-genmica, a filogenia baseada em rRNA foi o primeiro caso
no ponto. No entanto, o advento do sequenciamento completo do genoma desenvolvido
qualitativamente mudou toda a empresa da biologia evolutiva. A importncia de uma
quantidade enorme de sequncias para comparao bvia porque este material permite que
os pesquisadores investiguem os mecanismos e eventos especficos da evoluo com o rigor
estatstico necessrio e revela tendncias evolutivas ainda sutis. Alm disso, vale ressaltar que

as colees de diversos genomas completos so de enorme utilidade alm da enorme


quantidade de dados em sequncia. De facto, apenas por meio da comparao de genomas
completos, possvel claramente distinguir a relao entre os genes ortlogos (descendncia
comum a partir de um nico gene ancestral) e parlogos (duplicao de genes); para
demonstrar de modo convincente a ausncia de um determinado gene num genoma e para
identificar eventos de perda de genes; para realizar uma comparao completa das
organizaes do genoma e reconstruir eventos de rearranjo do genoma (68-71). Alm disso,
para um benefcio mximo da biologia evolutiva, crucial experimentar ambos os espaos do
genoma profundidade (ou seja, obter sequncias do genoma de vrios representantes,
estreitamente relacionadas com o mesmo taxon) e amplamente (obter sequncias
representativas para o maior nmero de taxa diversos quanto possvel). Os genomas
separados por diferentes distncias evolutivas so mais adequados para tarefas diferentes, por
exemplo, para revelar a faixa de conservao de um gene particular, ou a tentativa de
reconstruo de importantes eventos evolutivos genomas distantemente relacionados tm de
ser comparados entre si, enquanto que para a caracterizao quantitativa do processo de
seleo afetando genomas, conjuntos de genomas estreitamente relacionados so
indispensveis (72-75). A coleo de genomas completamente sequenciados que esto
disponveis no 200 aniversrio de Darwin consiste em milhares de genomas virais,
aproximadamente 1.000 genomas de bactrias e archaea, e cerca de 100 genomas
eucariticos (76,77). Embora, certamente, nem todos os principais txons so representados
adequadamente, esta coleo crescente satisfaz cada vez mais as demandas de pesquisa,
tanto microevolutivo e macroevolutivo.
O complemento para os avanos da genmica tradicional o mais recente acmulo de
grande quantidade de dados metagenmicos. Embora metagenmicos tipicamente no
produzam genomas completos, eles fornecem informaes valiosas sobre a diversidade da
vida em vrios ambientes (78,79).
Para alm da genmica e metagenmica, uma das marcas da primeira dcada do novo
milnio o avano das pesquisas em genmica funcional e biologia de sistemas. Estes
campos agora produzem alta qualidade, os dados genmicos sobre a expresso gnica,
interaes genticas e protena-protena, localizao de protenas dentro das clulas, e muito
mais, abrindo novas dimenses de anlise evolutiva, o que s vezes chamado de Biologia de
Sistemas Evolutiva (80-82). Este novo campo de pesquisa tem o potencial para produzir ideias
sobre as conexes de grandes genomas entre a evoluo de sequncia e de outras variveis,
como a taxa de expresso, e iluminar os componentes seletivos e neutros da evoluo desses
aspectos do funcionamento do genoma.
Abaixo vou tentar sintetizar brevemente as principais ideias da genmica evolutiva, com
nfase nas formas em que essas novas descobertas afetam os princpios centrais da biologia
evolutiva, em particular, no que diz respeito s contribuies relativas de processos aleatrios,
seletivos e neutros.
A conservao evolutiva de sequncias e estruturas de genes versus a fluidez da
composio gentica e arquitetura do genoma
A observao fundamental suportada por todo o corpo de evidncia acumulada pela
genmica evolutiva que as sequncias e as estruturas de genes que codificam protenas e
RNAs estruturais so, geralmente, altamente conservadas atravs de grandes vos evolutivas.
Com a atual coleo de genomas sequenciados, genes ortlogos em taxa distantes so
encontrados pela grande maioria das protenas codificadas no genoma de cada um (83). Por
exemplo, o recente sequenciamento do genoma de animais primitivos, anmona do mar e
Trichoplax, revelou extensa conservao do repertrio de genes em comparao com
mamferos ou aves, com a implicao de que a vida til caracterstica de um gene animal inclui
(pelo menos) centenas de milhes de anos (84-86). Os resultados de extensa anlise
comparativa dos genomas das plantas, fungos e procariotos so totalmente compatveis com
esta concluso (87,83). Alm disso, reconstrues evolutivas profundas sugerem que os
ancestrais de centenas de genes existentes j estavam presentes em LUCA (88-92).
Reconstrues conservadoras do conjunto de gene dos ancestrais comuns dos dois domnios
de procariontes, as bactrias e archaea, parecem indicar que essas formas ancestrais que,
provavelmente, existiram a mais de 3 bilhes de anos atrs, foram comparveis em

complexidade gentica, pelo menos, ao mais simples dos procariontes modernos de vida livre
(88,93). Do ponto de vista da biologia evolutiva, parece que as sequncias de muitos genes
que codificam as funes celulares essenciais, especialmente, traduo, transcrio,
replicao e vias metablicas centrais, esto sujeitos a forte seleo purificadora que
permaneceu no local por intervalos de tempo prolongado, em muitas ocasies, durante todos
os 3,5 bilhes de ano da histria da vida celular.
Surpreendentemente, no apenas a sequncia e a estrutura das protenas codificadas,
mas tambm as caractersticas da arquitetura dos genes que no so, necessariamente,
diretamente relevantes para a funo do gene que so altamente conservadas atravs de
longos perodos de histria de vida. Em particular, as posies de uma grande frao de
ntrons esto conservadas mesmo entre os mais distantes genomas de eucariotas ricos em
ntron (conservao de 25-30% em ortlogos de plantas e cordados) (94-96), e a grande
maioria das posies dos ntrons so compartilhadas por mamferos e animais basais, como
Trichoplax e a anmona do mar (84,86).
A conservao impressionante de sequncias e estruturas de genes contrape a fluidez
da composio gentica de genomas de todas as formas de vida que revelada pela
genmica comparativa e a reconstruo evolutiva. Os (quase) genes universais compem uma
minscula frao do universo inteiro de gene: no total, este ncleo central da vida celular
composto por, no mximo, 70 genes, isto , no mais de 10% dos genes mesmo no menor dos
genomas das formas de vida celulares, mas normalmente, mais prximos de 1% dos genes ou
menos (90,97,98). Embora em cada genoma individual, a maioria dos genes pertence a uma
conservada gentica moderadamente "concha", que partilhada com organismos
distantemente relacionados, dentro de todo o universo de genes, os genes do ncleo e concha
(ou, mais precisamente, conjuntos de genes ortlogos) so uma pequena minoria (83). Dada
esta estrutura distinta do universo do gene, reconstrues evolutivas inevitavelmente produzem
uma imagem dinmica da evoluo do genoma, com numerosos genes perdidos e muitos
outros obtidos atravs de HGT (na maior parte, em procariotas) e duplicao de genes (ver
abaixo).
Mesmo em maior medida do que a composio gentica dos genomas, a arquitetura do
genoma, que o arranjo dos genes de um genoma, mostra instabilidade evolutiva em
comparao com sequncias de genes (99). Com a exceo da organizao de pequenos
grupos de genes funcionalmente relacionados em operons que so, em alguns casos,
partilhadas por bactrias e archaea distantemente relacionadas, em parte, provavelmente,
devido a uma extensa HGT (ver a seguir), no , geralmente, relativamente pouco conservao
da ordem dos genes mesmo entre organismos estreitamente relacionados (100.101). Em
particular, em procariotas, a conservao de longo alcance da ordem do gene desaparece
completamente, mesmo em alguns grupos de genomas muito afins que retm quase uma-auma correspondncia de genes ortlogos e mais de 99% de identidade significativa de
sequncia entre protenas ortlogas (75). Assim, em procariontes, a organizao dos genes
para alm do nvel de operons , principalmente, determinada pelo grande embaralhamento
aleatrio, em particular, atravs de inverses centradas na origem da replicao (75102103).
Eucariontes mostram uma conservao um pouco maior de longo alcance a sintenia genmica
mas, mesmo nesse caso, h poucos elementos comuns da arquitetura do genoma entre, por
exemplo, diferentes filos animais, e nenhuma entre todos os diferentes reinos (99).
A variabilidade das arquiteturas genmicas apresenta um dilema interessante para os
bilogos evolucionistas: os organismos possuem arquiteturas genmicas exclusivos que so
especificamente adaptados para satisfazer as demandas funcionais originais dos respectivos
organismos, ou a evoluo da arquitetura do genoma um processo principalmente neutro?
Embora o agrupamento local dos genes funcionalmente relacionados e outros padres
sugestivos de co-expresso gentica funcionalmente relevantes foram observados
repetidamente, essas tendncias so relativamente fracas e de nenhuma maneira ubqua
(104.105). Assim, o fator dominante na evoluo da arquitetura do genoma parece ser o
rearranjo aleatrio, no adaptativa, em vez de uma seleo purificador ou positiva.

Transferncia horizontal de genes, a rede da evoluo e a substituio da TOL para


Floresta
Mesmo muito antes da era genmica, os microbiologistas perceberam que as bactrias
tinham a capacidade de troca informao gentica atravs de HGT, em alguns casos,
produzindo resultados de grande importncia, tais como a resistncia aos antibiticos (106).
Vrios mecanismos moleculares de HGT foram elucidados, incluindo troca de plasmdeo,
transduo (HGT mediada por bacterifagos) e de transformao (107). Estas descobertas de
HGT, no obstante, foram geralmente vistas como um fenmeno secundrio que importante
apenas em circunstncias especiais e, em todo o caso, no foi considerada para prejudicar o
conceito do TOL que pode ser reconstituda por meio de anlise filogentica de rRNA e de
outros genes conservados. Esta crena fundamental foi contestada pelos primeiros resultados
da comparao do genoma de bactrias e archaea que indicavam que, pelo menos, em alguns
genomas de procariotas, uma grande frao de genes foram adquiridos via HGT demonstrvel.
As ilhas de patogenicidade e ilhas simbiose (Unidades distintas de alguns GENOMAS que
conferem virulncia e simbiose) semelhantes que compem mais de 30% do genoma em
muitas bactrias patognicas e simbiticas so o caso privilegiada no ponto (108-110). Alm
disso, a anlise comparativa dos genomas de bactrias e archaea hipertermoflicas sugeriu que
mesmo HGT interdomnio pode ser dada por extensos habitats partilhados (111.112).
Pode ser difcil demonstrar inequivocamente a HGT, e, em particular, diferenciar da
grande perda do gene, de modo que a extenso da mobilidade gentica horizontal entre
procariotas ainda discutida (113-115). No entanto, como o banco de dados genmica cresce,
extensas anlises genmicas comparativas e filogenticas levam cada vez mais concluso
de que HGT praticamente onipresente no mundo procaritico no sentido de que existe muito
pouco ou nenhum conjunto de genes ortlogos cuja histria livre de HGT (116.117). A taxa
de HGT difere substancialmente de genes diferentes, dependendo das funes gnicas, em
parte, de acordo com a chamada hiptese de complexidade que postula que possam existir
barreiras para HGT em genes que codificam subunidades de complexos proteicos, porque o
desequilbrio de dosagem e de mistura de subunidades heterlogas resultante de tais eventos
pode ser deletrio (118,119). No entanto, a anlise filogentica indica que mesmo tais genes,
por exemplo aqueles para as protenas ribossomais e subunidades de RNA polimerase, no
so imunes HGT (120-122).
A alta prevalncia de HGT em procariontes pode, em parte, explicar a persistncia da
organizao de diversos operons atravs de grandes intervalos de organismos, sob a hiptese
de operon egosta (123,124). Embora os operons possam ser inicialmente selecionados para
benefcio da co-expresso e co-regulao de genes funcionalmente relacionados, provvel
que sejam mantidos e difundidos no mundo procaritico devido ao aumento da probabilidade
de fixao de um operon seguindo de HGT, em comparao, por exemplo, a um par de genes
no operonicos. Este cenrio apresenta um caso notvel de uma combinao de foras
seletivas (co-regulao) e neutras (HGT) contribuindo para a evoluo de um dos principais
aspectos da organizao do genoma (76.104).
Eucariotos so diferentes dos procariotos com relao ao papel desempenhado pela
HGT na evoluo do genoma. Nos eucariotos multicelulares, em que as clulas da linha
germinativa so distintas da soma, HGT parece ser rara (125), embora no impossvel (126).
Sob certas circunstncias especiais, tais como a persistncia de bactrias endossimbiticas em
animais, a transferncia de grandes segmentos de genomas bacterianos para o genoma do
hospedeiro so um fato comum (127,128). Os eucariotos unicelulares parecem adquirir genes
de bactrias e trocar genes entre si em ocasies relativamente frequentes (129-131). Muito
mais importante, contudo, a principal contribuio dos genomas de endosimbiontes para
complementos de gene de todos os eucariontes. A descoberta de organelas como mitocndrias
e genes de aparente origem mitocondrial em todos os eucariotas unicelulares completamente
caracterizados, essencialmente, verificou-se que o ltimo ancestral comum dos eucariontes
existentes j possua o endosimbionte mitocondrial (132.133). Em termos das suas afinidades
filogenticas aparentes, genes eucariotas que possuam genes ortlogos procariticos
prontamente identificveis so acentuadamente divididos em genes de provvel origem arquea
(principalmente, mas no exclusivamente, os componentes dos sistemas de processamento de
informao) e as de provvel origem bacteriana (principalmente, enzima e componentes
metablicos de vrias estruturas celulares) (134,135). frequentemente assumido, em termos

gerais, que a maioria dos genes bacterianos ancestrais em eucariotas so de origem


mitocondrial, mas isso difcil de ser demonstrado diretamente porque na anlise filogentica
estes genes se agrupam com diversos grupos de bactrias (134). Estes resultados so de
difcil interpretao porque a composio do gene da endosimbionte e seu hospedeiro no so
conhecidos, e possivelmente, uma ou ambas podem j ter acumulado numerosos genes de
diversas fontes (136). Um ponto ainda maior de incerteza o cenrio atual da origem dos
eucariotos [uma discusso detalhada sobre este importante assunto est fora do escopo deste
artigo, ver comentrios recentes e discusses (133,137-140)]. Em suma, as hipteses
concorrentes e muito debatidas so os seguintes:
(I) O cenrio simbiogentico segundo o qual um antepassado alfa-proteobacterial de
mitocndrias invadiu um hospedeiro Archaea, e este evento desencadeou a eucariognese
incluindo a formao das caractersticas estruturais da assinatura da clula eucaritica, tais
como o sistema endomembranar, o citoesqueleto e o ncleo (138.141).
(II) O cenrio archezoan em que o hospedeiro da endosimbionte mitocondrial foi um
eucarioto primitivo que j possua todas as principais caractersticas da clula eucaritica, que
evoluiu sem qualquer relao com a endossimbiose, mas que facilitou a ltima atravs da
capacidade fagocitria do protoeukaryote (137.142).
Independentemente do papel exato desempenhado pela endossimbiose na
eucariognese, no h nenhuma dvida razovel de que o complemento do gene de
eucariotos uma quimera composta de genes funcionalmente distintos dos descendentes de
arqueia e bactria (134.143). Alm disso, a endossimbiose aparentemente fez contribuies
substanciais para o complemento de gene de alguns dos principais grupos individuais de
eucariotos. Assim, uma forte evidncia foi apresentada a macia HGT de milhares de genes a
partir de uma endosimbionte cianobactria (o cloroplasto) para o genoma do hospedeiro
(planta) (144). Da mesma forma, os genes de aparente origem algal foram detectados em
chromalveolates que engoliram uma alga vermelha em um ato de endossimbiose secundria
(145).
As observaes de extensa, onipresente e que ocorre atravs de mltiplas rotas HGT
descritas acima levam a uma generalizao fundamental: os genomas de todas as formas de
vida so colees de genes com diversas histrias evolutivas. A consequncia desta
generalizao que o conceito da TOL deve ser substancialmente revisto ou abandonado
porque uma topologia de uma nica rvore ou mesmo uma topologia congruente de rvores
para vrios genes altamente conservados no pode representar a histria de todos ou mesmo
a maioria dos genes (146-149). Assim, uma representao adequada da histria da vida uma
rede de trocas genticas, em vez de uma nica rvore, e, consequentemente, a "forte" hiptese
da TOL, ou seja, a existncia de uma rvore das espcies para toda a histria da vida celular
falsificada pelos resultados da genmica comparativa.
Certamente, esta concluso no para ser tomada como uma indicao de que o
conceito de rvore evolutiva introduzida por Darwin (1) deve ser completamente abandonado.
Em primeiro lugar, as rvores tm o potencial para representar com preciso a evoluo das
famlias de genes individuais. Em segundo lugar, existem, sem dvida, partes expansivas da
histria da vida que as rvores congruentes podem ser obtidas de grandes conjuntos de genes
ortlogos e, consequentemente, a topologia de consenso destas rvores qualifica como uma
espcie de rvore. A evoluo dos principais grupos de eucariontes, como animais ou plantas,
o caso mais evidente no momento, mas a evoluo em rvore parece aplicar-se tambm a
muitos grupos dos procariontes em profundidades filogenticas relativamente rasas. A questo
permanece em aberto se a evoluo da vida na sua totalidade mais bem descrita como:
- uma rvore de consenso dos genes altamente conservados que representam uma
"tendncia central" na evoluo, com eventos de HGT, incluindo aqueles associados com
grandes endossimbiose, compreendendo as conexes horizontais entre os galhos das rvores
[Figura 1A, (150)], ou
- uma rede complexa, onde as fases da evoluo em rvore (com conexes horizontais)
so intercaladas com as fases "Big Bang" das troca horizontal desenfreada de informaes
genticas que no podem ser representados como rvores em princpio [Figura 1B; (151)].

Figura 1. Duas vises da histria de vida para substituir a rvore da vida. (A) O "TOL
como uma tendncia central" do modelo. A histria de vida representado como uma rvore,
com linhas de conexo entre os ramos que retratam trapzios HGT e sombreada
representando as fases de comprimido cladognese (276). A origem dos eucariotos
representado de acordo com a hiptese archezoan em que o hospedeiro do endosimbiontes
mitocondrial era um proto-eucariotas (archezoan). Um ltimo ancestral celular comum universal
(LUCA) est previsto. (B) O modelo de 'Big Bang'. A histria de vida representada como uma
sucesso de fases de rvores como acompanhado por HGT e no como rvore, Big Bang
fases. Linhas de conexo entre os galhos de rvores retratam HGT e trapzios coloridas
retratam estrondo fases grandes (151). A origem dos eucariotos representada de acordo com
o modelo simbiognese em que o hospedeiro da endosymbiontica mitocondrial foi um
archaeon. A Estado pr-celular ltimo Ancestral Universal Comum (LUCAS) est previsto. Ar,
archaeon (hospedeiro da mitocndria na alnea b), AZ, archezoan (hospedeiro da mitocndria
em a), BB, Big Bang, C, cloroplasto, CC, comprimido cladognese, M, mitocndria.
Metagenmica, o mundo em expanso de replicons egostas e fuso de replicon
A metagenmica uma nova direo da pesquisa genmica que defende (em geral,
parcial, nesta fase) o sequenciamento dos genomas de todas as formas de vida que se
desenvolvem em um determinado habitat. Embora seja um campo novo, a metagenmica pode
j reivindicar grandes avanos na caracterizao da diversidade bacteriana de uma variedade
de ambientes, em particular, aqueles nos oceanos (152-154). A direo que eu gostaria de
enfatizar como sendo de particular importncia conceitual para a biologia evolutiva
metagenmica de vrus (155). A concluso surpreendente de vrios estudos metagenmicos
virais que, pelo menos, em alguns, especialmente, de habitats marinhos, os vrus
(bacterifagos) so entidades biolgicas mais abundantes, com o nmero de partculas virais
excedendo por ordem de magnitude o nmero de clulas (156,157). Embora genomas virais
sejam pequenos em comparao com os genomas das formas de vida celulares, estes
resultados indicam que a metagenmica de genomas virais incluem uma grande parte do
universo gentico que , pelo menos, comparvel em tamanho com a parte tomada por
genomas dos organismos celulares. Alm disso, dado que, nos vrus com grandes genomas,
uma frao substancial de genes no possuem homlogos detectveis em bancos de dados de
sequncias atuais (158-160), parece mais provvel que os vrus abranjam a maior parte da
diversidade gentica do planeta. Estes resultados repercutem com a alta prevalncia de vrias
classes de elementos mveis dentro dos genomas de muitos organismos celulares. De facto,
em genomas de mamferos, sequncias derivadas a partir de elementos celulares,
principalmente, retrotransposes (SINEs e LINEs) parecem constituir, pelo menos, 40% do
ADN genmico (161).
Vrus e outros replicons egostas (definidos como elementos genticos que no
codificam um sistema completo de traduo), tais como diversos plasmdeos e transposons,
compreendem um conjunto gentico interligado que tambm conhecido como o mobilome, o
virosphere ou o mundo dos vrus (76.162 - 164). A identidade do mundo dos vrus manifesta-se
na existncia de um conjunto de genes marcantes" que codificam protenas com funeschave na reproduo de elementos egostas (incluindo as protenas do capsdeo viral) e esto
presentes em elementos extremamente diversificados que se propagam em uma ampla
variedade de hospedeiros, mas no nas formas de vida celular. A existncia de um conjunto
distinto de genes marcantes, que inclui, entre outros, o RNA dependente de RNA e DNA
polimerase, enzimas de replicao que, provavelmente, antecedem os grandes genomas de
ADN, sugere fortemente que o mundo dos vrus coexiste com formas de vidas celulares ao
longo da sua histria, e possivelmente, mesmo se origina de um primordial conjunto de
elementos genticos pr-celulares (164).
Embora distintos, o mundo do vrus constantemente interage com o conjuto genmico
de formas de vida celulares, como ilustrado pelo movimento constante de genes entre
bacterifagos transdutores, plasmdeos e cromossomos bacterianos (83), ou pelo mtodo de
captura de genes celulares (proto-oncogenes) por retrovrus animais (165). As observaes
recentes da transferncia de genes mediada por bacterifago entre bactrias distantemente
relacionadas, mesmo sem propagao do fago no organismo receptor, sugerem que o fluxo de
genes mediado por replicons egostas poderia ser mais extensa do que at agora se suspeite
(166). importante ressaltar que partes dos elementos mveis so frequentemente recrutados

(exaptado) por genes hospedeiros como elementos reguladores (167,168) e, em alguns casos,
as partes de sequncias codificadoras de protenas (169). Casos individuais de exaptao de
genes completos de elementos mveis so tambm conhecidos como notavelmente
exemplificado pela evoluo do gene do ourio, um regulador chave do desenvolvimento
animal, a partir de um intein (170.171).
Todos os genomas de procariotas, sem exceo, contm traos de integrao de
mltiplos plasmdeos e fagos. Ainda mais revelador, que os genomas de arqueia
normalmente carregam vrias verses de um operon que codifica os principais componentes
da mquina de particionamento plasmdeo, e muitas vezes possuem mais de uma origem de
replicao (172). Assim, a fuso de distintos replicons parece ocorrer rotineiramente em
procariontes, e ao longo da evoluo, tal fuso pode ter sido um fator importante em definir a
observada arquitetura de cromossomos procariotas (83.173).
Em resumo, a genmica comparativa e a metagenmica revelam uma grande dinmica
mundial de replicons egostas interconectados que interage com os genomas de formas de
vida celulares e, ao longo de grandes extenses da evoluo, faz grandes contribuies para a
composio dos cromossomos. Em procariontes, a interao entre os cromossomos das
bactrias e Archaea e replicons egostas to intensa, e a distino entre cromossomos e
megaplasmdios turva, de tal forma que os cromossomos so, provavelmente, melhor vistos
como "ilhas" de relativa estabilidade no mar turbulento de elementos mveis (83). Em
eucariotos, principalmente, em formas multicelulares que evoluram a separao entre o
germinativa e a soma, a distino entre cromossomos e replicons egostas mais ntida. No
entanto, a mobilidade intragenmica de elementos transponveis egostas extensa e a
mobilidade intergenmica, pelo menos, dentro de uma espcie, realmente facilitada pelo
sexo, com rajadas de propagao dos elemento transponveis provavelmente marcando as
transies evolutivas (16). O papel central dos elementos mveis no genoma enfraquece ainda
mais a evoluo do conceito TOL, embora rvores filogenticas de genes marcantes
individuais possam ser altamente informativas para a reconstruo da evoluo dos prprios
elementos egostas (174,175).
A natureza e o incio das transies evolutivas do ltimo ancestral comum universal
A genmica comparativa justifica a conjectura de Darwin sobre a origem de todas as
formas de vida existentes a partir de um nico ancestral comum. Na verdade, as reconstrues
evolucionistas sugerem que centenas de genes conservados, muito provavelmente, remontam
a LUCA (88,89-91). Mais especificamente, estas reconstrues indicam que LUCA j possua
um completo sistema de traduo que no era drasticamente diferente das (pelo menos)
verses mais simples das mquinas modernas de traduo (isto , constituda por,
aproximadamente, 100 molculas de RNA e de protenas), assim como o sistema de
transcrio do ncleo e de vrias vias metablicas centrais, tais como a biossntese de
nucleotdeos de purina e pirimidina (90). No entanto, os conjuntos de genes atribudos a Luca
nestas reconstrues faltam certos componentes essenciais da maquinaria celular moderna.
Em particular, os componentes do ncleo da maquinaria de replicao de DNA no so
homloga (ou, pelo menos, no ortlogos) em bactrias, por um lado, e arqueobactrias e
eucariontes, por outro lado (176). Numa outra diviso ntida, os lpidos da membrana tm
estruturas distintas, e as enzimas da biognese de membrana so consequentemente no
homloga (no ortlogos) (177).
Estas grandes lacunas na reconstruo do conjunto de gene de LUCA apoia a ideia de
que diferentes sistemas celulares 'cristalizou' de forma assncrona e sugere "transies de
fase" nas primeiras fases de evoluo celular (151.178). Uma categoria de hipteses sustenta
que LUCA foi radicalmente diferente das clulas modernas, possivelmente, nem uma clula
absolutamente, mas sim um conjunto de elementos genticos que estratgias independente e
diversificada de replicao e expresso e pode ter povoado compartimentos inorgnicos como
os observados em fontes hidrotermais (179,180). Nestas situaes, os sistemas e membranas
dos tipos modernos de replicaes de DNA evoluram pelo menos duas vezes de forma
independente em dois domnios da vida (supondo uma origem symbiogentica para os
eucariontes). Neste caso, o prprio conceito de um LUCA distinto torna-se ambgua, e que
poderia ser mais apropriado falar de LUCAS, o ltimo Estado do Ancestral Universal Comum
(181). A classe alternativa de cenrios postula que LUCA era um tipo de clula-moderna tanto

com o arquia ou as variedades de bactrias dos sistemas e membranas de replicao de


DNA, ou at mesmo sistemas mistos (177.182). Esta classe de cenrios implica que havia
comutadores de um tipo para outro, na evoluo de cada um desses sistemas celulares chave
ou diferenciada perda dos genes respectivos.
Independentemente de qual o cenrio o preferido, a falta de conservao de sistemas
celulares centrais entre os domnios da vida indica que as primeiras fases de evoluo celular
envolveram mudanas radicais que so dificilmente compatveis com o uniformitarianismo.
Quantificao de seleo de grandes Genomas e junk DNA: regimes evolutivos distintos
para os diferentes genomas.
H grandes diferenas nos esquemas do genoma entre as diferentes linhas de evoluo
da vida. Os procariontes e, principalmente, os vrus tm genomas de "parede a parede" que
consistem, principalmente, de genes que codificam protenas e RNAs estruturais, com regies
no codificantes que compem, com poucas excees, no mais do que 10-15% do ADN
genmico. Os genomas dos eucariotas unicelulares tm baixa densidade de genes
caractersticos, mas, em geral, no se afastam muito longe dos princpios procariotas, com a
maior parte do ADN dedicado a codificao de protenas, apesar da arquitetura distinta do
gene xon-intron. Os genomas de eucariontes multicelulares so radicalmente diferentes em
que apenas uma minoria (uma pequena minoria em vertebrados) do DNA genmico
composto de sequncias que codificam protenas ou RNAs estruturais. Geralmente, ao longo
de toda a gama de formas de vida, h uma dependncia exponencial negativa notvel entre a
densidade de genes codificadores de protenas e o tamanho do genoma, embora os desvios
significativos a partir desta dependncia geral so vistos como bem, particularmente, em
procariotas (Figura 2).
Esta diferena dramtica na organizao do genoma entre os genomas de (mais)
organismos unicelulares e multicelulares exige uma explicao, e a mais simples e plausvel
explicao dada pela teoria gentica de populao segundo a qual a intensidade da seleo
purificadora afetando uma populao proporcional ao efetivo tamanho da populao. A
fixao de sequncias no-codificantes, como ntrons ou elementos mveis , na melhor das
hipteses, neutras, mas, mais provavelmente, pelo menos, um pouco prejudicial, mesmo que
apenas por causa do peso extra na maquinaria de replicao. Portanto, a grande acumulao
de tais sequncias possvel apenas em populaes relativamente pequenas em que a
intensidade da seleo purificadora desce abaixo do "limiar da complexificao '. Mais
especificamente, a teoria prev que todas as mutaes com o coeficiente de seleo (s) inferior
-6
a 10 seria acumulada como neutro em genomas de eucariotas multicelulares e, em muitos
casos de insero de sequncias no codificantes na verdade esto associados com tais
valores s baixos (16183184).
Considerando o estudo da evoluo da escala genmica, a prxima srie de questes
importantes tem a ver com a distribuio dos coeficientes de seleo entre genomas: quanto
do DNA no codificante realmente lixo, qual a presso da seleo purificadora em genes
diferentes, e como a seleo comum positivo (darwiniana) realmente ? Embora a medio da
seleo para genes individuais, sem falar nos stios individuais, especialmente, em regies
no codificantes seja tecnicamente desafiador (185.186), vrias anlises do genoma tm sido
relatadas. Uma anlise abrangente do conjunto de protenas humanas que combinou os dados
sobre mutaes patognicas, SNPs no-sinnimos, e divergncia nos ortlogos de homemchimpanz levou estimativa de que apenas, aproximadamente 12% dos resduos de
-5
aminocidos esto associados com s <10 , ao passo que cerca da metade dos stios tm
-4
-2
valores s entre 10 e 10 (187). Assim, a maioria das sequncias de protenas parecem estar
sujeitas a seleo purificadora substancial. Um estudo complementar sobre os regimes de
evoluo dos vrios grupos de bactrias e archaea estreitamente relacionados tambm revelou
tipicamente forte seleo purificadora, com os grandes genoma atravs da razo de dN / dS (a
razo entre taxas de substituio de nucleotdeos no-sinnimo para sinnimo que a medida
tradicional da seleo em sequncias codificadoras de protenas) entre 0,02 e 0,2 (dN / dS <<
1 a assinatura da seleo purificadora) (75).
Uma pesquisa dos grandes genomas por seleo positiva (medida como a razo de dN /
dS especfico gene) em genes que codificam protenas, de seis espcies de mamferos revelou

~400 genes (~2,5%) que parecem ter experimentado seleo positivo em pelo menos um ramo
da rvore filogentica das espcies analisadas, sendo os valores para a maioria dos ramos
individuais serem muito pequenos (188). Estas estimativas, mas conservadoras mostram que,
pelo menos, em mamferos, a seleo positiva afetando toda a sequncia de gene bastante
rara, embora muitos genes que so, em geral, sujeitos a seleo purificadora so susceptveis
a incluir stios selecionados positivamente. A anlise detalhada de locais de codificao de
aminocidos em 12 genomas de Drosophila produziu resultados muito diferentes, o que sugere
que uma frao substancial e, talvez, a maioria das substituies de aminocidos so
acionados por seleo positiva, apesar dos efeitos benficos da maioria destas substituies
parecerem muito pequenas (189.190). Notavelmente, a distribuio dos stios selecionados
positivamente fortemente no aleatria entre as categorias funcionais de genes, com os
genes envolvidos na imunidade e outras funes de defesa, reproduo, e percepo sensorial
sendo particularmente sensvel a seleo positiva; esta distribuio parece ser estvel entre
animais amplamente diferentes, incluindo mamferos, moscas e nematoides (188189191).
Uma pergunta urgente em estudos evolutivos de todo o genoma, especialmente, para os
mamferos com seus enormes genomas, que frao do DNA no-codificante 'realmente'
lixo, e quanto est sujeita a limitaes funcionais ainda desconhecidas. A possibilidade de que,
apesar da falta de conservao evolutiva detectvel, uma fraco grande se no a maior parte
do DNA humano , na verdade, importante funcionalmente e mantido consequentemente por
seleo est frequentemente sendo discutido, especialmente, luz das demonstraes que
uma frao muito grande do genoma transcrita (192-194). Alm disso, uma fraco
considervel do DNA "lixo" pode estar envolvido em papis funcionais que implicam apenas na
conservao da sequncia limitada, mas, no entanto, so importantes, em particular, para as
manutenes e remodelaes da estrutura de cromatina tais como as regies de ligao ao
esqueleto / matriz (RAE / MARS) (197.198). No entanto, uma anlise recente da distribuio da
insero e deleo de grandes genoma (em comparaes de genomas de humano, rato e co)
sugere que apenas ~3% do DNA humano eucromatina sob constrangimentos seletivos (199).
Dado que as sequncias codificantes de protena compreendem apenas ~1,2% da
eucromatina, estes resultados indicam que a maioria das sequncias de ADN funcionalmente
importantes em mamferos no codificam protenas, mas tambm reivindica as primeiras
conjecturas de que a maior parte do genoma humano no funcional que , afinal, lixo (45,46).
Claro, deve-se ter em mente que qualquer definio de lixo condicional na qual o lixo de
ontem amanh pode ser recrutado para um papel funcional. Em contraste, as comparaes de
inter-espcies da regies genmicas no-codificantes em Drosophila indicam que a maioria
(70% ou mais dos nucletidos) dessas sequncias evoluram sob constrangimentos seletivos, e
uma frao significativa (superior a 20%) parece ser afetada pela seleo positiva (200-202).
Certamente, esses estudos so baseados em diferentes hipteses simplificadoras (que no
pode ser discutida em detalhe), ento a concluso sobre as principais diferenas em regimes
seletivos entre as diferentes linhagens devem ser avaliadas com cautela e est sujeita a uma
validao adicional. No entanto, o simples facto de que os organismos com tamanhos
comparveis dos conjuntos de genes e nveis de complexidade organizacional, tais como
insetos, por um lado, e mamferos, por outro lado, que diferem to dramaticamente em termos
de densidade e quantidade de genes do evidente "lixo" genmico (Figura 2), sugerem que os
seus genomas evoluram sob diferentes presses seletivas.
O estudo da interao entre os processos neutros, seleo de purificao e seleo
positiva ainda est em seus estgios iniciais. A coleo de conjuntos de genomas
estreitamente relacionados de taxa diversos que essencial para esta anlise pequena
atualmente, embora esteja rapidamente crescendo, e os mtodos para discriminar os
diferentes modos de evoluo ainda esto em desenvolvimento ativo. No entanto, mesmo os
resultados j disponveis tornam claro que a contribuio de cada um destes fatores
altamente varivel entre os organismos, dependendo do tamanho efetivo da populao, das
caractersticas taxas de mutao e recombinao e, provavelmente, de outros fatores que
ainda no foram elucidados.
Duplicao de gene e genoma: a principal via de inovao genmica
A anlise dos inmeros genomas sequenciados deu razo viso da duplicao de
genes de Ohno como um mecanismo evolutivo importante (51), talvez, at mesmo em maior
medida do que o autor do conceito poderia antecipar. A maioria dos genes, na maioria dos

genomas de formas de vida celulares (exceto para os menores genomas de parasitas


obrigatrios) possuem parlogos indicativos da duplicao, em algum momento durante a
evoluo (16,69), e muitos genes pertencem a uma grande famlia de parlogos que formam
uma distribuio de lei de potncia caracterstica do nmero de membros [(203.204); ver
discusso abaixo]. Quanto contribuio da duplicao na origem de novos genes,
importante notar que h pouca evidncia convincente do surgimento de novos genes a partir de
sequncias no-codificantes, embora os genes possam expandir-se pelo recrutamento de
pequenos segmentos adjacentes de sequncia no codificante [por exemplo, a partir de um
ntron (205), nascimento de um novo gene completo por esta via parece ser um acontecimento
excepcional (206)]. Por isso, tentador generalizar que a duplicao de genes no apenas
importante, mas na verdade a rota dominante que leva origem de novos genes, com a adio
importante que a duplicao geralmente seguida por evoluo de sequncia acelerada, bem
como rearranjo de um gene, uma modo evolutivo que extingue conexes detectveis fonte
original.
A idia de Ohno na eliminao ou relaxamento da seleo depois de uma duplicao de
genes, permitindo a evoluo acelerada que tem o potencial para produzir novidade funcional,
tambm foi apoiado por dados comparativos-genmico, embora com um toque
significativo. Isto foi argumentado teoricamente e, em seguida, demonstrado por medida
emprica da presso de seleo sobre as sequncias de genes duplicados recentemente que o
relaxamento da seleo purificadora mais provvel que seja simtrica, para afetar ambas as
duplicaes mais ou menos igual (207.208). Assim, a via mais comum de evoluo de genes
duplicados no pode ser por neofunctionalizao postulada por Ohno mas subfuncionalizao
atravs do qual novos parlogos retm subconjuntos distintos das suas funes originais do
gene ancestral enquanto o resto das funes diferencialmente deterioram (209,210). Anlises
mais sofisticados parecem sugerir que os dois regimes de evoluo poderia ser realizados em
diferentes fases da histria de genes parlogos, com rpida subfuncionalizao imediatamente
aps a duplicao sucedida por subsequente neofunctionalizao mais lenta (211-213).
As duplicaes de genes ocorrem ao longo da evoluo de qualquer linhagem, mas a
taxa de duplicao no uniforme em grandes escalas evolutivas, de modo que as transies
organizacionais em evoluo parecem ser acompanhadas por exploses de duplicao de
genes, possivelmente, concebvel pela fraca seleo purificadora durante gargalos
populacionais (ver abaixo). Talvez o caso mais ilustrativo em questo o surgimento de
eucariontes, que foi acompanhada por uma onda de duplicao em massa, produzindo o
caracterstico manyto-um co-ortlogo relao entre genes eucariticos e seus ancestrais
procariontes (214). Da mesma forma, o diferencial de duplicao de grupos de genes Hox e
outros reguladores de desenvolvimento pensado para ter desempenhado um papel
fundamental na diferenciao dos filos animais (215.216 Indiscutivelmente, os casos mais
dramticos de duplicao de genes saltatrio" envolve eventos de duplicao do grande
genoma (WGD)217). Aps a hiptese original de Ohno, a anlise do genoma revelou vestgios
de eventos independentes WGD retidos na distribuio de tamanho de famlias de genes
parlogos e/ou nas posies das regies genmicas de parlogos, apesar da extensa perda de
genes aps WGD, em leveduras (218,219), cordados (220-223) e as plantas (224.225).
Mecanicamente, a alta prevalncia de WGD em eucariotos pode no ser particularmente
surpreendente porque resulta de um bem conhecido e difundido fenmeno gentico, a
poliploidizao. No entanto, as consequncias evolutivas de WGD parece ser importante j que
estes eventos criam a possibilidade de rpidas sub/neofunctionalizao simultaneamente em
todo o complemento de genes de um organismo (226). Em particular, WGD pensado para ter
desempenhado um papel central na radiao primria de cordados (220). difcil descartar a
possibilidade de que os eventos WGD mais antigos no so mais facilmente detectvel devido
a inmeras perdas de genes que obscurecem o sinal WGD; em particular, a exploso de
duplicaes que se seguiu a eucariognese, mas antecedeu o ltimo ancestral comum dos
eucariotos existentes pode ter sido provocada pela primeira WGD na evoluo eucaritica
(214).
Considerando a grande ocorrncia de WGD em mltiplas linhagens eucariticas,
notvel que at agora nenhum desses eventos foram detectados pela anlise dos inmeros
genomas de procariotas disponveis, embora a poliploidia transitria foi observada
repetidamente (227.228). Concebivelmente, a ausncia de WGD detectvel em procariotas
devido seleo purificadora eficiente, que atua em grandes populaes procariticas (ver
abaixo) e conduz a uma rpida eliminao de genes duplicados que obliteram vestgios de
WGD caso ocorra tal evento.

Ao nvel dos conceitos gerais da biologia evolutiva com a qual eu estou aqui
principalmente em questo, os estudos genmicos sobre a duplicao dos genes levam a, pelo
menos, duas generalizaes substanciais. Em primeiro lugar, a demonstrao do significado
evolutivo primrio de duplicaes, incluindo duplicaes de regies do genoma de grande porte
e de genomas inteiros, uma sentena de morte virtual para o gradualismo darwiniano: mesmo
uma nica duplicao de genes dificilmente se qualifica como uma infinitamente pequena
variao enquanto WGD qualifica-se como um evento saltatrio fidedigno. Em segundo lugar, a
supremacia da duplicao de genes com a posterior diversificao (por vezes, rpida) dos
parlogos, como a rota de origem de genes novos refora a metfora da evoluo como um
funileiro: a evoluo tende claramente para gerar novos dispositivos funcionais por mexer com
os antigos depois fazendo uma cpia de segurana em vez de criar novidade a partir do zero.
Surgimento e evoluo da complexidade genmica: o paradigma no-seletivo e a falcia
do progresso evolutivo
Sem dvida, eucariontes multicelulares, como animais e plantas, so caracterizados por
uma bem maior complexidade organizacional do que formas de vida unicelulares, e no esprito
da sntese moderna, essa complexidade geralmente vista como um resultado de inmeras
mudanas adaptativas impulsionadas pela seleo natural, e, sendo assim considerado, pode
ser visto como uma manifestao de "progresso" na evoluo. A correspondncia entre a
complexidade organizacional e a complexidade genmica uma questo em aberto, em parte,
porque a complexidade genmica no fcil de definir. Uma definio simples e plausvel pode
ser o nmero de nucleotdeos que carregam a informao funcionalmente relevante, isto , so
afetados pela seleo (229.230). Sob esta definio, os genomas de eucariotas multicelulares,
claro, so muito mais complexos do que os genomas de formas unicelulares, e este nmero
mais elevado de complexidade genmica se traduz em complexidade funcional tambm.
Um exemplo notvel no ponto de splicing alternativo, que um dispositivo funcional
fundamental em organismos complexos, como mamferos, onde ele cria vrias vezes mais
protenas do que os genes existentes para a codificao de protenas (231-233) (assim, o facto
de que os seres humanos possuem ~20.000 genes em relao aos ~10.000 genes na bactria
Myxococcus xanthus no deve ser traduzido para a afirmao de que "a proteoma humano
duas vezes mais complexo que o de uma bactria: a diferena real maior devido ao splicing
alternativo). O splicing alternativo possvel atravs de sinais de emenda fracos que so
processados ou ignorados pelo spliceossomo com frequncias semelhantes (234). Num certo
sentido, o funcionamento importante dos eventos de splicing alternativo so codificados nestas
momentos de unio e, em certa medida, tambm em sequncias intrnicas adicionais. No
entanto, teria splicing alternativo evoludo como uma adaptao funcional? Em toda a
probabilidade, no. Com efeito, demonstrou-se que os genomas ricos em intron possuem
tipicamente sinais de splice fracos enquanto que os genomas pobres em intron (principalmente,
aqueles de eucariotas unicelulares) tm junes de processamento apertados,
presumivelmente, assegurando uma elevada fidelidade de splicing (235). Estudos detalhados
recentes demonstraram baixa fidelidade de splicing em organismos ricos em intron, a fim de
que numerosas variantes misspliced sejam produzidos e sejam, na maior parte, destrudas pelo
sistema de decaimento disparate mediada (NMD) (236). As reconstrues evolucionistas
sugerem fortemente que os eucariotos antigos, incluindo o ltimo ancestral comum de formas
existentes possuam altas densidades de intron comparveis aos mais modernos genomas
ricos em intron, tais como vertebrados (237-239) e, por deduo, tinha sinais de emenda fracos
produzindo numerosas transcries alternativas (235). A conservao das mquinas NMD em
todos os eucariontes (240) completamente compatvel com esta hiptese. Assim, parece que
o splicing alternativo emergiu como um "defeito genmico do qual osa respectivos organismos
no podia se livrar, presumivelmente, devido fraca seleo purificadora, e desenvolveram um
mecanismo especial para lidar com ele, nomeadamente, o NMD. Aos poucos, eles tambm
desenvolveram maneiras de utilizar este tmpano para mltiplas funes.
O relato acima da origem do splicing alternativo poderia resumir a teoria da gentica de
populao no adaptacionista da evoluo da complexidade genmica, que foi recentemente
exposta por Lynch (16183184). Como j foi mencionado na seo anterior, o princpio central
da teoria que as alteraes genticas que levam a um aumento da complexidade, como a
duplicao de genes ou inseres de ntron so ligeiramente deletrio e, portanto, pode ser
fixado a um ritmo considervel somente quando a seleo purificadora em uma populao
fraca. Por conseguinte, dado que a fora da seleo purificadora proporcional ao tamanho

efetivo da populao, o aumento substancial na complexidade genmica possvel apenas


durante pontos de estrangulamento da populao. Sob este conceito, a complexidade
genmica no , originalmente, adaptativa, mas provocada por processos evolutivos neutros
quando a seleo purificadora ineficaz. Em outras palavras, a complexificao comea como
uma "sndrome genmica" embora as caractersticas complexas (tmpanos), posteriormente,
sejam co-optadas por vrias funes e tornam-se sujeitas a seleo. Em contraste, em grandes
populaes altamente bem sucedidas, tal como muitos procariotas a seleo purificadora to
intensa que nenhum aumento na complexidade genmica vivel e, de fato, a contrao do
genoma mais provvel.
Claro, h excees a esses princpios, como genomas bacterianos com mais de 12 000
genes (241), genomas virais com vasta proliferao de genes duplicados (158), e de genomas
de eucariontes unicelulares [por exemplo, Chlamydomonas (242) ou Trichomonas (243)] que,
pela maioria dos critrios, so to complexos quanto os genomas de animais multicelulares ou
plantas. Alm disso, alguns genomas procariticos [por exemplo a crenarchaeon Sulfolobus
solfataricus (244)] e genomas de eucariotos unicelulares [por exemplo, Trichomonas vaginalis
(243)] esto entre aqueles com o maior teor de elementos transponveis. Aparentemente, o
resultado da evoluo do genoma depende do equilbrio entre a presso da seleo
purificadora, ela prpria dependente do tamanho da populao e da taxa de mutao, a
intensidade de processos de recombinao, a atividade de elementos egostas e adaptao
aos habitats especficos (99). Uma hiptese atraente que, pelo menos, nos procariotas, o
limite superior para o nmero de genes no genoma, um bom indicador para a complexidade
genmica, determinada pela 'sobrecarga reguladora (burocrtica)' (83245246). A existncia
de tal sobrecarga implicada pela observao notvel que diferentes classes funcionais de
diferente dimenses de genes em relao ao nmero total de genes de um genoma, e em
particular, os genes reguladores (tais como repressores e activadores de transcrio) mostram
uma (quase ) escala quadrtica (83245247248). concebvel que, em alguma razo entre o
nmero de reguladores e o nmero de genes regulados, talvez, perto de 1:1, a carga de
reguladores torna-se insustentvel. Assim, a evoluo da complexidade do genoma, sem
dvida, depende de uma combinao complexa da estocstica (neutro) e processos
adaptativos. Parece, no entanto, que, neste momento, a simples hiptese de nulidade mais
consistente da evoluo genmica que a expanso do genoma, um pr-requisito para a
complexificao, no um resultado da adaptao, mas sim uma consequncia da fraca
seleo purificadora.
A prxima grande questo que implora para ser feita no que diz respeito complexidade
organizacional e genmica, : houve uma tendncia consistente para o aumento da
complexidade durante os ~3,5 bilhes de anos de evoluo da vida na Terra? A resposta mais
provvel no. Mesmo reconstrues muito conservadoras de genomas ancestrais de
arqueobactrias e bactrias indicam que estes genomas foram comparveis em tamanho e
complexidade para aqueles de formas modernas relativamente simples (88,89,91,93). Alm
disso, as reconstrues de alguns grupos individuais, e no s parasitas, apontam para perda
de genes e encolhimento do genoma como o modo predominante de evoluo (249).
Considerando que numerosos grupos procariontes, sem dvida, foram extintas no decorrer da
histria de vida, no h qualquer razo para acreditar que, mesmo antes da radiao de todas
as grandes linhagens conhecidas atualmente, a distribuio de tamanhos do genoma e a
complexidade mdia em procariontes era (quase) o mesmo que agora. Naturalmente,
concebvel que as formas mais complexas conhecidas evoluram relativamente tarde na
evoluo, mas, se for o caso, pode ser representado pelos processos puramente estocsticos,
dado que a vida, nas fases de pr-Lucas da sua evoluo, deve ter comeado 'de um comeo
to simples "(1250).
Na mesma linha, a descoberta de grandes e complexos genomas em animais estaminais
(isto , os animais com simetria radial, tal como Cnidaria, que ramificado do tronco de evoluo
metazorio anterior origem dos Bilateria) (84-86) sugere que houve pouco ou nenhum
aumento na complexidade genmica, durante a evoluo dos metazorios (embora
complexidade organizacional tenha aumentado), em vez disso, a perda de repetio de genes
em diferentes linhagens foi o processo evolutivo mais prevalente.
Certamente, os episdios de importante aumento da complexidade so conhecidos, tais
como a origem de eucariotas, bem como a origem de formas multicelulares, para mencionar
exemplos bvios. No entanto, estes no parecem ser partes de uma consistente tendncia
gradualista, mas sim eventos singulares mais ou menos catastrficos desencadeados por raros

acontecimentos ao acaso, tais como a domesticao do endosimbionte no caso da origem de


eucariotas.
No geral, os estudos tericos e empricos sobre a evoluo da complexidade genmica
sugerem que no existe uma tendncia para a complexificao na histria de vida, e que,
quando se aumenta substancialmente a complexidade, esta no ocorre como uma adaptao,
mas como uma consequncia da fraca seleo purificadora em si, por mais paradoxal que isso
possa parecer, um sinal revelador de falha evolutiva. Parece que estes resultados so
suficientes para acabar com o conceito de "progresso" evolutivo, uma sugesto que foi feita
anteriormente por razes mais gerais.
Genmica funcional, biologia de sistemas e os determinantes da taxa de evoluo de
genes
Assim como a ltima dcada do sculo 20 foi a era da genmica, quando a quantidade
de sequncias do genoma foi transformada em uma nova qualidade, permitindo uma nova
generalizao, como o "desenraizamento" da TOL, a primeira dcada do novo sculo, tornouse a idade da genmica funcional e da biologia de sistemas. Estas disciplinas revelaram dados
cada vez mais confiveis de uma nova forma que comea a preencher a lacuna anteriormente
gritante entre o genoma e o fentipo de um organismo (variveis Phenomic adiante indicados).
As variveis Phenomic dos grandes genomas incluem perfis dos nveis de expresso de
genes, mapas detalhados das interaes protena-protena e genticas, informaes sobre os
efeitos do gene knockout (dispensabilidade gene, geralmente, definido como essencialidade de
um gene de crescimento sobre rich media), e mais (81,82). As primeiras anlises comparativas
que se tornaram possvel quando a informao suficiente sobre a expresso do gene se tornou
disponvel para vrios organismos revelou uma interao entre processos neutros e seletivos.
Embora os nveis de expresso entre os genes ortlogos de humano e do rato mostrem
conservao significativa (em comparao com pares de genes ao acaso), a divergncia na
expresso mais pronunciada do que aquela entre as sequncias de protena dos ortlogos
(251,252). Assim, apesar de, em termos gerais, a evoluo da expresso do gene
semelhante sequncia da evoluo em que a seleo purificadora a fora restritiva principal
(253), o, componente irrestrito verdadeiramente neutro provvel que mais contribua para a
evoluo da expresso.
A anlise conjunta das classes novas de variveis Phenomic caracterizadas pela biologia
de sistemas e as medidas de evoluo de gene, tais como a taxa de evoluo de sequncia e
a propenso para a perda de gene revelou uma estrutura de correlaes bastante inesperada
[(81254255); Figura 3A]. Apesar da ligao intuitiva entre a taxa de evoluo e a
dispensabilidade de gene [genes "importantes" teria esperado para evoluir mais devagar do
que os menos importantes (256)], apenas uma ligao fraca (na melhor das hipteses) entre
estas caractersticas foi detectada (257-259). A ligao entre a taxa de evoluo e a
importncia funcional de um gene merece uma investigao mais aprofundada, pois uma
anlise abrangente revela um efeito fenotpico mensurvel de gene eliminatria (knockout) de
praticamente cada gene de levedura sob algumas condies (260). No entanto,
independentemente do resultado de tais estudos, claramente, esta ligao sutil, mesmo que
isso passe a ser resistente. Em contraste, a correlao mais forte em todas as comparaes
entre as variveis evolutivas e phenomic foi observada entre o nvel de expresso do gene e a
taxa de evoluo de sequncia ou propenso para a perda de genes: genes altamente
expressos, de fato, tendem a evoluir substancialmente mais lento do que os genes expressos
inferiores (254,261). Esta concluso reforada pelas observaes de uma correlao positiva
entre divergncia de sequncia e a divergncia de perfis de expresso entre os genes
ortlogos humanos e de rato (252) e as taxas relativamente baixas de expresso de perfis
divergentes de genes altamente expressos (262).
FIGURA 3 - A genmica Evolutiva e a biologia de sistemas. (A) Variveis evolutiva e phenomic. As variveis
phenomic so vistas como mutuamente dependentes e afetam as variveis evolutivas ( esquerda). Correlaes
positivas so mostradas por setas vermelhas e correlaes negativas so mostradas por setas azuis. (B) O conceito de
estado do gene. Os pontos vermelhos indicam esquematicamente disperso de dados.

A estrutura geral das correlaes entre variveis evolutivas e phenomic sucintamente


capturado no conceito de um 'status' de gene em um genoma (255). Genes de alto nvel
evoluem lentamente, so raramente perdidos durante a evoluo e so, tipicamente, altamente
expresso, com numerosas interaes protena-protena e gentica, e muitos parlogos (Figura
3B). Deve notar-se, contudo, que apesar deste aspecto da ordem na estrutura de correlao,
todas as correlaes so relativamente fracas e no parecem aumentar significativamente com
a melhoria da qualidade de dados (254,255). Essas observaes apontam para a multiplicidade
dos determinantes do curso da evoluo de um gene e sugerem que verdadeiramente
aleatrio, rudo estocstico pode ser um fator importante.
O surgimento da ligao entre a taxa de evoluo de sequncia como a conexo mais
importante entre varivel evolutiva e phenomic levou a um novo conceito dos principais
determinantes da evoluo da protena. Na era pr-genmica, era geralmente aceito que a taxa
de evoluo de sequncia deve ser uma funo da, primeiramente, restries estruturaisfuncionais intrnsecas que afetam a dada protena e, em segundo lugar, a importncia do papel
biolgico da protena no organismo (256). Com o advento dos dados de biologia de sistemas,
percebeu-se que as variveis Phenomic, em particular, a expresso do gene pode ser tanto ou
mais importante do que os fatores considerados tradicionalmente (263.264). Esta constatao
conduziu hiptese da Misfolding Mistranslation-induzida (MIM) de acordo com o nvel de
expresso ou, mais precisamente, a taxa de eventos de translao de fato o determinante
dominante da taxa de evoluo de sequncia. A causa da covariao entre a taxa de evoluo
de sequncia e o nvel de expresso pensado para ser a seleo para resistncia ao
enrolamento incorreto da protena que cada vez mais importante para protenas altamente
expressas devido aos efeitos txicos das protenas deformadas (265,266). A hiptese MIM
poderia ainda explicar a correlao positiva bastante intrigante, mas consistente e forte entre
as taxas de evoluo em posies sinnimas e no-sinnimos (dN e DS, respectivamente) de
sequncias codificantes de protena (267). Com efeito, esta correlao provvel que seja
uma consequncia da evoluo lenta em ambas as classes de stios em genes altamente
expressos que, no caso de locais sinnimas, susceptvel de ser causada por seleo de
cdons que minimizem o erro de traduo (268,269). Simulaes de computador detalhada da
evoluo da protena sugerem que o efeito txico do enrolamento incorreto da protena, na
verdade, pode ser suficiente para explicar a covariao observada do nvel de expresso e da
taxa de evoluo de sequncia (269). Simulaes de computador detalhada da evoluo da
protena sugerem que o efeito txico do enrolamento incorrecto da protena, na verdade, pode
ser suficiente para explicar a covariao observada do nvel de expresso e de taxa de
evoluo de sequncia (269). Uma anlise da evoluo dos vrios domnios das protenas
revelou homogeneizao substancial das taxas evolutivas especficas do domnio em
comparao com o mesmo par de domnios em protenas separadas, possivelmente, atribudas
s taxas de converso equalizados, mas diferenas significativas entre as taxas de evoluo
de domnio especfico persistiu mesmo em protenas de domnio mltiplos (270). Da a
generalizada hiptese MIM de acordo com que a taxa de libertao da protena,
principalmente, depende de dois fatores:
(I) Robustez do enrolamento incorreto intrnseco que depende da estabilidade e da
designabilidade caracterstica de uma dada protena (domnio).
(II) Taxa de traduo que pode ser vista como um amplificador dos custos da aptido de
enrolamento incorreto e, por conseguinte, da seleo para a robustez a incorporao errada de
aminocido.
A biologia de sistemas evolutivos revelou uma nova camada de conexes entre a
evoluo e o funcionamento do genoma. Torna-se evidente que os processos que ligam o
genoma e o fentipo de um organismo, em particular, a expresso do gene, exerce uma reao
substancial sobre a evoluo do gene. A taxa de evoluo dos genes codificadores de
protenas pode depender mais de restries relacionados com a preveno dos efeitos
deletrios do enrolamento incorreto do que em restries associadas com a funo especfica
da protena.
Fundamentos universais da evoluo do genoma

A genmica comparativa e a biologia de sistemas produziram enormes quantidades de


dados, e essa riqueza de informaes implora por uma busca de padres e regularidades. Na
verdade, vrias dessas regularidades que so comuns e podem at ser universal para todo o
curso da evoluo da vida foram descobertas. Na seo anterior, abordei uma dessas
universais aparentes, a correlao negativa entre a taxa de evoluo de sequncia gentica e
o nvel de expresso que parece ter em todos os organismos de que os dados esto
disponveis e leva a uma reavaliao dos fatores que afetam a evoluo do gene (269).
Outras regularidades potencialmente importantes vm na forma de distribuies
conservadas de variveis evolutivas e funcionais. Surpreendentemente, as taxas de
distribuies da evoluo de sequncias de genes ortlogos entre genomas estreitamente
relacionados foram encontradas para ser altamente semelhantes em taxa distante (271),
quando padronizadas, estas distribuies so praticamente indistinguveis em bactrias,
arqueobactrias e eucariotas e so mais aproximadas por um registo normal da distribuio
(Figura 4A). Considerando as diferenas dramticas na complexidade genmica e arquitetura
(ver acima), bem como a biologia destes organismos, o prximo identidade das distribuies
taxa surpreendente e exige uma explicao em termos de fatores universais que afetam a
evoluo do genoma. A robustez ao enrolamento incorrecto da protena discutido acima parece
ser um bom candidato para um fator to universal embora os modelos quantitativos que
explicam a distribuio da taxa continuam a ser desenvolvidos.
Como discutido acima, a duplicao de genes molda todos os genomas, ea distribuio
do tamanho da famlia em todos os genomas seqenciados segue uma distribuio de lei de
potncia semelhante, com a nica diferena significativa o expoente (203.204), assim que
esta distribuio surge como um universal de evoluo genmico. Esta distribuio
estreitamente caber por um modelo de nascimento e morte simples de evoluo gene com o
nascimento equilibrada e as taxas de mortalidade e sem envolvimento direto de qualquer forma
de seleo [(204.272); Figura 4B].
FIGURA 4 - Universais de evoluo. (A) Distribuies de taxas evolutivas entre pares de ortlogos em
genomas estreitamente relacionados de bactrias, archaea e eucariotas. As distncias evolutivas entre as sequncias
alinhadas de nucletidos de genes ortlogos foram calculados utilizando a correco Jukes-Cantor e padronizada de
modo que a mdia de cada distribuio igualada a 0, e o desvio padro igualado a 1. O enredo semi-logartmica.
Metma-Methanococcus maripaludis C5 contra M. maripaludis C7 (Euryarchaeota); Bursp-Burkholderia cenocepacia
MC0-3 contra B. vietnamiensis G4 (Proteobacteria); Salsp-Salinispora arenicola CNS-205 contra S. tropica CNB-440
(Actinobacteria). Todas as sequncias foram de RefSeq a base de dados do NCBI. As curvas de densidade de
probabilidade foram obtidos por Gauss-kernel alisamento dos pontos de dados individuais. (B) Encaixe da distribuies
de tamanho de famlia empricas de genes parlogas para o modelo de nascimento-e-morte equilibrada. Os resultados
so apresentados para a levedura Saccharomyces cerevisiae (Sc, esquerdo) e seres humanos (Hs, direita). Painis
superiores, distribuies finalmente resolvido de tamanhos de famlia parlogas; painis mdia, as distribuies do
tamanho da famlia parlogas em coordenadas logartmicas dupla, painis de fundo, a funo do tamanho das famlias
parlogas de distribuio cumulativa. As linhas mostram as previses do modelo de nascimento e morte equilibrada. A
figura a partir de (204).

O dimensionamento diferenciado das classes funcionais de genes com o tamanho do


genoma que est acima mencionado sugere a existncia de todo um conjunto de constantes
fundamentais da evoluo. As propores das taxas de duplicao para as taxas de eliminao
de genes que determinam os expoentes das leis de potncia para cada classe de genes
parece ser a mesma para todas as linhagens testadas de procariotas e invariantes no que diz
respeito ao tempo, de modo que as classes funcionais de genes parecem possuir "potenciais
evolutivos" universais (245.273).
A universalidade aparente destas e de outras caractersticas centrais da evoluo do
genoma sugere que os modelos simples, relativamente no seletivos, podem ser suficiente
para formar a estrutura de uma teoria evolutiva geral no que diz respeito seleo de
purificao que proporcionaria as condies de contorno (restries), considerando positiva a
seleo Darwiniana (de adaptao) que se manifesta como uma quantitativamente modesta,
ainda que moduladora funcionalmente cruciais do processo evolutivo.
CONCLUSES
Dois sculos depois do nascimento de Darwin, 150 anos aps a publicao da "Origem
das Espcies", e 50 anos aps a consolidao da Sntese Moderna, a anlise comparativa de
centenas de genomas de muitos taxa diversificados oferece oportunidades sem precedentes

para testar as conjecturas do (neo) darwinismo e decifrar os mecanismos da evoluo. A


genmica comparativa revelou uma diversidade impressionante de processos evolutivos que
era inimaginvel na era pr-genmica. Alm de mutaes pontuais que podem ser equiparados
com "variaes infinitesimais" de Darwin, a evoluo do genoma envolve grandes contribuies
de genes e toda a duplicao do genoma, grandes delees, incluindo a perda de genes ou
grupos de genes, a transferncia horizontal de genes e regies genmicas completas, vrios
tipos de rearranjos genmicos e interao entre genomas de formas de vida celular e diversos
elementos genticos egostas. O cenrio emergente da evoluo do genoma inclui a clssica
seleo natural darwiniana como um componente importante, mas , de longe, mais pluralista
e complexa do que implicada pela viso direta de Darwin que foi solidificada na Sntese
Moderna (16.184). A maioria das sequncias em todos os genomas evoluram sob a presso
dea seleo purificadora, ou em organismos com genomas maiores, de forma neutra, com
apenas uma pequena frao de mutaes realmente sendo benficas e fixadas pela seleo
natural como previsto por Darwin. Alm disso, as contribuies relativas das grandes foras
evolutivamente diferentes variam entre linhagens organismal, principalmente, devido as
diferenas na estrutura da populao.
A genmica evolutiva efetivamente demoliu o conceito simples da TOL por revelar
dinmica, e reticulado carter da evoluo, onde HGT, fuso de genoma e interao entre os
genomas de formas de vida celular e diversos elementos genticos egostas tomam conta do
palco central. Nesta viso de mundo dinmico, cada genoma um palimpsesto, um conjunto
diversificado de genes com diferentes destinos evolutivos e muitas diversas probabilidades de
terem sido perdidos, transferidos ou duplicados. Assim, a TOL torna-se uma rede, ou talvez,
mais apropriadamente, a Floresta da Vida, que consiste de rvores, arbustos, matas de cip, e,
claro, muitos troncos e ramos mortos. Se o TOL pode ser recuperadas como tendncia central
na evoluo de vrios genes conservados ou se esse conceito deve ser diretamente
abandonado para a imagem de Floresta da Vida permanece uma questo em aberto (274).
A Tabela 1 apresenta o status dos dogmas centrais da biologia evolutiva clssica na era
da genmica evolutiva e da biologia de sistemas. Todos os conceitos clssicos passaram por
transformao, tornando-se muito mais complexas, as caracterizaes pluralistas do processo
evolutivo (15). Descrevendo a mudana no mais amplo curso possvel, as ideias fundamental
de Darwin sobre a interao entre o acaso e a ordem (introduzido pela seleo natural)
sobreviveram, mesmo que de uma forma nova, muito mais complexa e matizada, com
contribuies especficas dos diferentes tipos de processos aleatrios e tipos distintos de
seleo revelado. Por outro lado, a insistncia na adaptao como o principal modo de
evoluo que evidente na Origin, mas especialmente na sntese moderna, tornou-se
profundamente desconfiada se no completamente obsoleta, abrindo espao para uma nova
viso de mundo que d muito mais destaque ao processos no-adaptativo (184).
Alm da surpreendente, inesperada diversidade de organizao do genoma e os modos
de evoluo revelados pela genmica comparativa, h alguma chance de descobrir princpios
gerais subjacentes? Ou, o nico exemplo do papel central do princpio do acaso e da
contingncia na evoluo, elegantemente capturado por Jacob (55), em sua frmula "evoluo
como consertar? De uma maneira um pouco em linguagem explcita, se est inclinado a
perguntar: uma sntese ps-moderna concebvel e, talvez, ainda em vista?
Vrios desenvolvimentos recentes em genmica evolutiva podem ser candidatos para as
funes de generalizaes de alto nvel subjacentes diversidade dos processos evolutivos.
Talvez, a mais abrangente delas o conceito de gentica de populao da evoluo do
genoma desenvolvido por Lynch (16). De acordo com este conceito, as caractersticas
principais dos genomas so formadas por adaptao, mas no por meio de processos
evolutivos estocsticos que dependem criticamente da intensidade da seleo purificadora na
qual, por sua vez, determinada pelo tamanho da populao efetiva e a taxa de mutao dos
respectivos organismos. Em particular, a complexidade dos genomas de eucariotas
multicelulares interpretada como evoluindo, principalmente, no como uma adaptao
assegurando complexidade organizacional e funcional, mas sim como uma sndrome
genmica" causada pela seleo purificadora ineficiente em pequenas populaes. Alguns dos
elementos da sequncia acumulada atravs de processos neutros so ento recrutados para
funes biolgicas que, coletivamente, de fato, prever a evoluo dos organismos estrutural e
funcionalmente complexos. Por outro lado, alguns genomas compactos de procariotas e

eucariotas unicelulares no pode ser moldado por seleo de 'racionalizao do genoma', mas
sim pela melhoria eficaz de sequncias, mesmo que ligeiramente deletrias em grandes
populaes (83). A viso no-adaptativa da evoluo da complexidade genmica no implica
que nenhum dos recursos complexos sempre evoluem como adaptaes diretas ou
racionalizao do genoma que nunca pode ser uma importante fora motriz da evoluo do
genoma. No entanto, acredito que a evidncia acumulada pela genmica evolutiva suficiente
para exigir a mudana da hiptese nula central da evoluo do genoma de adaptacionista para
o neutro, com o nus da prova transferida para os adeptos da adaptao generalizada (230).
O conceito do carter substancialmente no-adaptativo da evoluo do genoma
realmente parece afetar nossa compreenso bsica do significado da conservao de recursos
genmicos. Como um caso em apreo, a conservao bastante enigmtica das posies de
uma grande frao de ntron ao longo da evoluo dos eucariotos pode no ser uma
consequncia da forte seleo purificadora que poderia causar a eliminao de variantes em
que o respectivo ntron estivesse perdidos (o padro de interpretao implcita na prpria
noo de seleo purificadora e totalmente compatvel com a teoria neutra). Pelo contrrio, a
conservao de ntrons e outras caractersticas genmicas sem funes bvias poderia ser a
consequncia da seleo purificadora fraca em pequenas populaes de organismos
complexos, que no suficiente para remover eficientemente estes elementos. Isto no
pretende afirmar que os muitos caracteres genmicas (como genes individuais, os resduos de
aminocidos ou nucleotdeos) no so conservados durante a evoluo, devido sua
importncia funcional, mas sugere que mesmo este "sagrado" princpio central da biologia
evolutiva - 'o que conservado funcionalmente relevante' - no um absoluto, e a alternativa
no adaptativa para ser levado a srio. Juntamente com a constatao de que a contrao
do genoma, pelo menos, to comum na evoluo como a expanso do genoma, e o aumento
da complexidade genmica no uma tendncia evolutiva central, o conceito de evoluo no
adaptativa do genoma implica que a ideia do progresso evolutivo pode ser colocada de forma
segura para descansar.
s vezes se argumenta que os desenvolvimentos recentes em genmica e biologia de
sistemas produzem um labirinto de conexes entre diferentes tipos de dados que so
intratveis por qualquer forma explcita, eliminando assim qualquer esperana para a
descoberta de simples, 'lei como" regularidades e reduzindo grande parte da pesquisa nestas
reas para o desenvolvimento de algoritmos de previso (275). No entanto, exatamente esse
tipo de regularidade simples e aparentemente universal que surge a partir da anlise conjunta
dos dados da genmicas comparativa e da biologia de sistemas. A distribuio das taxas
evolutivas atravs de conjuntos de genes ortlogos, a distribuio dos tamanhos das famlias
de genes parlogas, a correlao negativa entre o nvel de expresso e a taxa de evoluo da
sequncia de um gene e outras relaes entre as chaves evolutivas e as variveis phenomic
parecem ser verdadeiros fundamentos universais da evoluo. A simplicidade dessas
regularidades universais sugere que elas so formadas por processos evolutivos fundamentais
igualmente simples, e no pela seleo para funes especficas. Em alguns casos, os
modelos explcitos de tais processos j foram desenvolvidos e mostrados para ajustar os
dados. Estes modelos no querem incluir a seleo em tudo ou dar uma nova interpretao a
seleo. Um bom exemplo a hiptese generalizada do enrolamento incorreto da
mistranslation induzida que explica a co-variao da expresso gnica e a taxa de evoluo
pela seleo de sequncia de robustez ao enrolamento incorreto que surge como um dos
principais determinantes da evoluo da protena. A consequncia inesperada deste modelo
que a principal fora motriz da seleo purificadora no pode ser a manuteno de uma funo
biolgica mas antes a preveno de efeitos deletrios no especficos de uma protena
misfolded.
Coletivamente, os desenvolvimentos em genmica evolutiva e biologia de sistemas
descritos aqui parecem sugerir que, embora, atualmente, apenas elementos isolados de uma
nova sntese "ps-moderno" da biologia evolutiva esto comeando a ser formulados, tal
sntese de fato vivel. Alm disso, provvel assumir um modelo definitivo muito antes do
250 aniversrio de Darwin.

Você também pode gostar