Você está na página 1de 22

A EVOLUO DARWINIANA LUZ DA GENMICA

RESUMO A genmica comparativa e a biologia de sistemas oferecem oportunidades sem precedentes para testar os princpios fundamentais da biologia evolutiva formulada por Darwin em A Origem das Espcies, em 1859 e expandida na Sntese Moderna 100 anos mais tarde. Os estudos da Genmicas-evolutiva mostram que a seleo natural apenas uma das foras que moldam a evoluo do genoma e no quantitativamente dominante considerando que os processos no-adaptativos so muito mais proeminente do que se suspeitava anteriormente. As principais contribuies de transferncia de genes horizontal e diversos elementos genticos egostas para a evoluo do genoma minam o conceito da rvore da Vida. Uma adequada discrio da evoluo requer um conceito mais complexo de uma rede ou "floresta" de vida. No h nenhuma tendncia consistente da evoluo para o aumento da complexidade genmica, e quando a complexidade aumenta, esta parece ser uma consequncia no adaptativa da evoluo sob seleo purificadora fraca, em vez de uma adaptao. Vrios fundamentos universais da evoluo do genoma foram descobertos, incluindo as distribuies invariantes das taxas evolutivas entre genes ortlogos de diversos genomas e do tamanho da famlia de genes parlogos, e a correlao negativa entre o nvel de expresso gnica e taxa de sequncia da evoluo. Simples modelos de evoluo noadaptativo explicam alguns destes fundamentos universais sugerindo que uma nova sntese da biologia evolutiva pode se tornar vivel em um futuro no to distante.

INTRODUO O livro A Origem das Espcies de Charles Darwin que apareceu em Londres em 1859 (1) foi o primeiro relato plausvel detalhado da evoluo biolgica j publicada, juntamente com os contornos breves simultneos e independentes de Darwin e Alfred Russell Wallace publicado no ano anterior (2-3). claro que Darwin no descobriu a evoluo e nem sequer ofereceu a primeira descrio coerente da evoluo - sem dvida, essa honra pertence a JeanBaptiste Lamarck, cujo magnum opus Philosophie Zoologique (4) foi, estranhamente, publicado no ano do nascimento de Darwin. No entanto, a imagem da evoluo de Lamarck baseou-se em um impulso inato de organismos evoluindo rumo perfeio, uma ideia que no pode ser aceitvel para uma mente racionalista. Alm disso, Lamarck no proclamar o carter universal da evoluo: ele postulou mltiplos atos de criao, aparentemente, um para cada espcie. Darwin foi o primeiro a apresentar um retrato racional, mecanicista, e sem dvida, magnfico da origem de toda a diversidade de formas de vida 'de um comeo to simples', provavelmente, a partir de um nico ancestral comum (1). A viso de Darwin da evoluo da vida era suficientemente completa e poderosa para conquistar, ou, pelo menos, afetar profundamente as mentes dos maiores biologistas (e cientistas em geral, e o pblico culto em geral), de modo que todas as pesquisas em biologia durante os ltimos 150 anos se desenvolveu dentro da estrutura estabelecida pela Origem (mesmo quando em oposio s ideias de Darwin). A viso de Darwin no tinha a base essencial em gentica porque os mecanismos da hereditariedade eram desconhecidos em seus dias (o trabalho de Mendel passou despercebido, ao passo que as prprias ideias de Darwin nesta rea foram menos produtivas). A base gentica da evoluo foi estabelecida aps a redescoberta das leis de Mendel, com o desenvolvimento da gentica populacional no primeiro tero do sculo 20, principalmente, atravs do trabalho pioneiro de Fisher, Wright e Haldane (5-7). O novo entendimento avanado da evoluo, informado pelo trabalho terico e experimental em gentica, foi consolidado na Sntese Moderna da biologia evolutiva, geralmente, associado com os nomes de Dobzhansky, Julius Huxley, Mayr e Simpson (8-11). Aparentemente, a Sntese Moderna (neo- Darwinismo) aprovou a sua forma madura durante a celebrao do centenrio da origem em Chicago em 1959 (12-14). Agora, 50 anos aps a consolidao da Sntese Moderna, a biologia evolutiva, sem dvida, enfrenta um novo desafio importante e, ao mesmo tempo, a perspectiva de um novo avano conceitual (15). Se a Sntese Moderna pode ser sucintamente descrita como darwinismo Luz de Gentica (muitas vezes referida como neo-darwinismo), ento, a nova fase Biologia Evolutiva luz da Genmica. Neste artigo, vou tentar descrever as alteraes

ocorridas nos princpios bsicos da biologia evolutiva trazidas pela genmica comparativa e funcional e argumentar que, em muitos aspectos, a fase genmica poderia ser uma sada mais radical do neo-darwinismo que o ltimo foi do darwinismo clssico. Claro que, para isso, necessrio primeiro recapitular os principais conceitos da evoluo proposta por Darwin e alterados pelos arquitetos da Sntese Moderna. No resto do artigo, eu voltarei para cada um destes pontos. (i) Sem direo, a variao aleatria o principal processo que fornece o material para a evoluo. Darwin foi o primeiro a propor o acaso como fator importante na histria de vida, e sem dvida, essa foi uma das suas maiores ideias. (ii) A evoluo prossegue por fixao das raras variaes benficas e eliminao das variaes deletrias: este o processo de seleo natural que, juntamente com a variao ao acaso, a principal fora motriz da evoluo segundo Darwin e a Sntese Moderna. A seleo natural, que , obviamente, semelhante ao e inspirado pela "mo invisvel" (do mercado), que governou a economia de acordo com Adam Smith, foi o primeiro mecanismo de evoluo j proposto que era simples, plausvel, e no requeria nenhuma misteriosa tendncia inata. Como tal, esta foi a segunda viso fundamental de Darwin. Os fundadores da gentica de populaes, em particular, Sewall Wright, enfatizou que o acaso poderia desempenhar um papel importante na fixao de mudanas durante a evoluo, no s em seu surgimento, via o fenmeno da deriva gentica, que implica a fixao aleatria de mudanas neutras ou at mesmo prejudicial. A teoria de populao gentica indica que o desvio particularmente importante em pequenas populaes que passam por pontos de estrangulamento (6,16). No entanto, a sntese moderna, na sua forma "endurecida" (13), de forma eficaz, rejeitada a deriva como uma fora evolutiva importante, e aderente a um modelo puramente adaptacionista da evoluo (17). Este modelo leva inevitavelmente ao conceito de "progresso", a melhoria gradual de "rgos" durante a evoluo, uma ideia que Darwin aprovou como uma tendncia geral, apesar de seu claro entendimento de que os organismos so menos do que perfeitamente adaptado, como notavelmente exemplificado por rgos rudimentares, e, apesar de sua averso a qualquer aparncia de uma inata procura pela perfeio da turma lamarckiana. (iii) As mudanas benficas que so corrigidas pela seleo natural so "infinitamente" pequenas, de modo que a evoluo prossegue, atravs do acmulo gradual desses pequenas modificaes. Darwin insistiu em rigoroso gradualismo como numa referncia essencial da sua teoria: "A seleo natural s pode agir pela preservao e acumulao de infinitamente pequenas modificaes hereditrias, cada uma rentvel ao ser preservada. . . Se pudesse ser demonstrado que existiu algum rgo complexo que no poderia ter sido formado por numerosas, sucessivas e ligeiras modificaes, minha teoria seria absolutamente quebrar. '[(1), captulo 6]. Mesmo alguns contemporneos de Darwin acreditava que era uma estenose desnecessrio na teoria. Em particular, as objees iniciais de Thomas Huxley so bem conhecidos: mesmo antes da publicao da Origem Huxley escreveu a Darwin'' Voc tem carregado a si mesmo com uma dificuldade desnecessria na adoo da Natureza no faz salto to incondicionalmente (18). (iv) Um aspecto da biologia evolutiva clssica que est relacionada, mas no idntica aos princpios do gradualismo a uniformitarianismo (absorvido por Darwin a partir da Geologia de Lyell), isto , a crena de que os processos evolutivos permaneceram, essencialmente, os mesmos ao longo da histria de vida. (v) A evoluo da vida pode ser apresentada como uma "grande rvore", como simbolizada pela simples, famosa ilustrao da Origem [(1), captulo 4]. (vi) Um conceito corolrio da nica rvore da vida (TOL) que, no entanto, merece o status de um princpio separado: toda a diversidade existente de formas

de vida evoluram a partir de um nico ancestral comum [ou muito poucas formas ancestrais, sob a frmula cautelosa de Darwin (1) , captulo 14], que mais tarde foi apelidado de ltima Universal comum (Cellular) Ancestral (LUCA) (19).

ENTRE A SNTESE MODERNA E A GENMICA EVOLUTIVA Obviamente, os bilogos evolucionistas no ficaram ociosos durante o espao de 40 anos que separou a consolidao da Sntese Moderna e a chegada da idade da genmica evolutiva; abaixo resumirei o que parecem ser os principais avanos (sem dvida, este breve relato incompleto e pode ser considerado um pouco subjetivo). A evoluo e a filogenia molecular A filogenia tradicional que concretizou o conceito da TOL de Darwin baseou-se em comparaes de caractersticas diagnsticas da morfologia de organismos, tais como, por exemplo, a estrutura do esqueleto de animais e plantas na arquitetura da flor(20). A ideia de que o substrato molecular real da evoluo que sofre as mudanas postas em prtica por meio da seleo natural (os genes, simplesmente) poderia ser comparado com a finalidade de reconstrues filogenia no entrar nas mentes dos bilogos evolucionistas pela razo bvia de que (por pouco) nada foi conhecido sobre a natureza qumica do referido substrato e a maneira como ele codificou o fentipo de um organismo. Alm disso, o paradigma adaptacionista da biologia evolutiva parecia implicar que os genes, seja qual for a sua natureza molecular, no seriam bem conservadas entre organismos distantes, dadas as grandes diferenas fenotpicas entre eles, como enfatizou em particular Mayr, um dos principais arquitetos da Sntese Moderna (21). A ideia de que a sequncia de bases de DNA poderia ser empregada para a reconstruo da evoluo parece ter sido expressa pela primeira vez em papel por Crick, apropriadamente, no mesmo artigo seminal em que ele formulou a hiptese de adaptador (22). Os princpios reais e a primeira implementao de anlise evolutiva molecular foram dados poucos anos mais tarde por Zuckerkandl e Pauling que diretamente falsificou a conjectura de Mayr por mostrar que as sequncias de aminocidos de vrias protenas disponveis no momento, tais como citocromo c e globinas, eram altamente conservada mesmo entre os animais distantemente relacionados (23,24). Zuckerkandl e Pauling tambm propuseram o conceito de relgio molecular, uma taxa relativamente constante da sequncia da evoluo que eles previram serem caractersticas de cada protena na ausncia de alterao funcional. Nos poucos anos depois, principalmente, atravs dos esforos de Dayhoff e colaboradores, foi demonstrado que a conservao da sequncia de protena se estendeu para as mais diversas formas de vida, a partir de bactrias de mamferos (25-27). A fase inicial de pesquisa da evoluo molecular culminou na obra de Woese e colaboradores onde revelaram a conservao das sequncias de certas molculas, acima de tudo, o RNA ribossomal em todas as formas de vida celulares, e a sua adequao para a anlise filogentica (28). O coroamento desta linha de pesquisa foi descoberta totalmente inesperada do terceiro domnio da vida, arquebactrias, que inclui organismos anteriormente agrupados com bactrias, mas mostrou-se altamente distinta pela anlise filogentica de rRNA (29,30). Como resultado destes estudos, uma tendncia crescente se desenvolveu para igualar a rvore filogentica de rRNA, com a sua estrutura de trs domnios (31), com o 'TOL prevista por Darwin e explicada primeiro por Haeckel (28,32,33). No entanto, mesmo na era prgenmica, tornou-se claro que nem todas as rvores de genes codificadores de protenas tm a mesma topologia como a rvore de rRNA, as causas das discrepncias permaneceram obscuras, mas no pensou-se em envolver a transferncia horizontal de genes (HGT) (34). A teoria neutra e seleo purificadora Provavelmente, o maior avano conceitual importante na biologia evolutiva aps a sntese moderna foi a teoria neutra da evoluo molecular que geralmente associada com o nome de Kimura (35,36), embora uma teoria similar foi desenvolvida simultaneamente e de forma independente por Jukes e King (37 ). Originalmente, a teoria neutra foi obtida como um desenvolvimento das ideias de populaes genticas de Wright sobre a importncia da deriva gentica na evoluo. De acordo com a teoria neutra, a grande maioria das mutaes que

foram corrigidas no curso da evoluo so seletivamente neutras de modo que a fixao ocorre atravs de deriva aleatria. Um corolrio dessa teoria que as sequncias de genes evoluem de aproximadamente relgio de maneira semelhante (em apoio hiptese de relgio molecular original do Zuckerkandl e Pauling), enquanto que mutaes benficas episdicas sujeitas seleo natural so suficientemente raras para ser desconsideradas com segurana por uma descrio quantitativa do processo evolutivo. Naturalmente, a teoria neutra no deve ser tomada para significar que a seleo no importante para a evoluo. O que mantm efetivamente a teoria que o modo dominante de seleo no a seleo positiva Darwiniana de mutaes adaptativas, mas a estabilizao ou seleo purificadora que elimina as mutaes deletrias, enquanto que permite a fixao de mutaes neutras por deriva (17). Estudos subsequentes refinou a teoria e fez-se mais realista, que, para ser fixada, uma mutao no precisa ser literalmente neutra, mas apenas precisa exercer um efeito deletrio que seja suficientemente pequeno para escapar da eliminao eficiente atravs da seleo purificadora da moderna teoria 'quase neutras' (38). Quais mutaes so "vistas" pela seleo purificadora como deletria depende criticamente do tamanho das populaes eficazes: em pequenas populaes, a trao pode corrigir mutaes mesmo com um efeito deletrio significativo (16). O principal teste emprico da teoria (quase) neutra vem de medies da constncia das taxas evolutivas em famlias de genes. Embora tenha sido observado repetidamente que o relgio molecular significativamente sobre-dispersa (39,40), esses testes sugerem fortemente que a frao de mutaes neutras entre as amostras fixadas , de fato, substancial (36). A teoria (quase) neutra um importante ponto de partida a partir do paradigma selecionista da Sntese Moderna, uma vez que postula explicitamente que a maioria das mutaes fixadas durante a evoluo no so afetados por seleo (positivo) darwiniana (Darwin parece ter pressagiava o paradigma neutralista observando que seletivamente caracteres neutros serviria melhor para fins de classificao (1), no entanto, ele no entrou em detalhes sobre essa idia, e ele no se tornou parte da Sntese Moderna). Importante, nas elaboraes posteriores da teoria neutra, Kimura e outros perceberam que as mutaes que foram (quase) neutras, no momento da fixao no foram indiferentes evoluo. Pelo contrrio, essas mutaes consistiram-se no conjunto de variao que poderia ser explorado pela seleo natural em condies mudadas, um fenmeno que poderia ser potencialmente importante para a macroevoluo (17,41).
O termo transposon ou elemento gentico mvel refere-se a um conjunto de segmentos lineares de DNA, que so capazes de mudar de posio dentro do genoma, independentemente de homologia entre a regio genmica onde encontram-se inseridos e o local ao qual se destinam.

Em biologia evolutiva e biologia molecular, Junk DNA um rtulo provisrio para as pores da seqncia do DNA de um cromossomo ou genoma uma fun o para a qual no foi identificado.

Genes egostas, junk DNA e elementos mveis Embora isso fosse raramente declarado explicitamente, a gentica clssica certamente implica que (quase) todas as partes do genoma (todos os nucleotdeos, em termos moleculares mais modernos) tem uma funo especfica. No entanto, este entendimento implcito entrou em dvida nas dcadas de 1960-70, devido acumulao de dados sobre a falta de uma correspondncia direta entre e complexidade genmica e fenotpica dos organismos. Foi mostrado que os organismos com aproximadamente o mesmo grau de complexidade fenotpica frequentemente tinham genomas que diferiam em tamanho e complexidade por ordens de magnitude (o assim chamado paradoxo do valor C) (42,43). Este paradoxo foi conceitualmente resolvido por duas ideias fundamentais, relacionadas, os de genes egostas e junk DNA. O conceito de gene egosta foi desenvolvido por Dawkins em seu livro clssico homnimo (44). Dawkins percebeu, em um ponto de partida impressionante do paradigma organismo-central da Sntese Moderna, que a seleo natural pode atuar no apenas no nvel do organismo como um todo, mas tambm ao nvel de um gene individual. De acordo com uma formulao um pouco provocativa deste ponto de vista, o genoma e o organismo so, simplesmente, os veculos para a propagao de genes. Este conceito foi mais avanado por Doolittle e Sapienza (45) e por Orgel e Crick (46) que propuseram que muito, se no a maior parte, do ADN genmico (pelo menos, em organismos complexos) consistiu-se de vrias classes de repeties que se originam a partir da replicao de elementos egostas (parasitas finais, de acordo com Orgel e Crick). Em outras palavras, do ponto de vista do organismo, muito do seu

ADN genmico deve ser considerado refugo (lixo). Este ponto de vista do genoma difere radicalmente da imagem implicada pelo paradigma selecionista sob o qual a maioria, se no todos os nucleotdeos no genoma seriam afetados pela (ou um purificador de positivo) seleo, atuando ao nvel do organismo. Um desenvolvimento importante conceitualmente foi a descoberta, em primeiro lugar em plantas por McClintock, na dcada de 1940 (47), e, subsequentemente, em animais (48), de "genes saltadores ', mais tarde conhecida como elementos mveis, isto , os elementos genticos que eram propensos frequentemente a alterar a sua posio no genoma. A demonstrao da ubiquidade dos elementos mveis sugeriu a imagem de genomas altamente dinmicos, em constante mutao do genoma mesmo antes do advento da genmica modernos (49,50). Evoluo por duplicao de genes e do genoma O princpio central de Darwin, a insistncia gradual de mudanas infinitesimais como o nico material da evoluo, foi contestada pelo conceito de evoluo por duplicao de genes, que foi desenvolvida por Ohno em seu clssico livro de 1970 (51). A ideia de que a duplicao de partes de cromossomos pode contribuir para a evoluo remonta a alguns dos fundadores da gentica moderna, em particular Fisher (52), mas Ohno foi o primeiro a propor que a duplicao de genes foi fundamental para a evoluo dos genomas e dos organismos e apoiou esta proposio por uma teoria qualitativa. A partir da evidncia da duplicao precoce de um genoma inteiro na evoluo dos cordados , Ohno sups que a duplicao do gene pode ser importante, se no o principal, o caminho para o desenvolvimento de novas funes biolgicas, porque aps um duplicao umas cpias de genes estariam livres das restries impostas pela seleo purificadora, e teriam o potencial de desenvolver uma nova funo (um fenmeno mais tarde nomeado neofuncionalizao). Claramente, o surgimento de um novo gene como resultado de uma duplicao, e quanto mais a duplicao de uma regio genmica, incluindo mltiplos genes ou a duplicao do genoma inteiro, esto longe de serem as mudanas "infinitesimais", e se tais eventos maiores so realmente importantes para a evoluo, o paradigma gradualista entra em perigo. Tmpanos, exaptao*, ajustes e a deficincia do paradigma panglossiano da evoluo Uma espirituosa, crtica radical do programa adaptacionista da biologia evolutiva foi montado por Gould e Lewontin nos famosos papeis de "Tmpanos das San Marco (53). Gould e Lewontin sarcasticamente descreveram a viso de mundo adaptacionista como o paradigma panglossiano, depois que o personagem notrio em Cndido de Voltaire, que insistiu em que "tudo era o melhor neste melhor de todos os mundos" (mesmo as grandes catstrofes). Gould e Lewontin enfatizaram que, ao invs de inventar s pressas "apenas assim histrias' de adaptaes plausveis, bilogos evolucionistas deveriam buscar explicaes sobre as caractersticas observadas de organizao biolgica sob uma abordagem pluralista que leva em conta no s a seleo, mas tambm limitaes intrnsecas, deriva aleatria e outros fatores. A metfora do tmpano sustenta que muitos elementos funcionalmente importantes de organizao biolgica no evoluram como dispositivos especficos para desempenhar suas funes atuais mas antes so produtos de restries arquitetnicas no-adaptativos - muito como tmpanos que inevitavelmente aparecem em arcos de catedrais e outros edifcios, e pode ser utilizado para vrias funes, como elementos-chave de habitao do adorno imaginrio da catedral. Ao processo de utilizao de tmpanos para as funes biolgicas foi dado o nome especial de exaptao proposto por Gould como uma importante via de evoluo (54). Em uma ainda mais cedo, o desenvolvimento conceitual relacionado, Jacob promoveu a metfora da evoluo como ajustes (55). O argumento de Jacob, com base, principalmente, dos resultados da anlise comparativa dos mecanismos de desenvolvimento, que a evoluo no atua como um engenheiro ou designer, mas sim como um funileiro que fortemente dependente de imprevistos anteriores para resolver os problemas pendentes e cujas aes so, portanto, imprevisvel e inexplicvel sem o conhecimento detalhado da evoluo anterior. A evoluo no mundo dos micro-organismos e vrus Talvez, o desenvolvimento em biologia que teve o mais profundo efeito sobre as mudanas em nossa compreenso da evoluo foi extenso da investigao evolutiva no

uma adaptao

biolgica que no evoluiu dirigida principalmente por presses seletivas relacionada sua funo atual. Em vez disso evoluiu por presses seletivas diferentes relacionadas a uma adaptao para outras funes, at que eventualmente chegou a um estado ou construo em que veio a ser utilizada para uma nova funo.

reino das bactrias (e archaea) e vrus. A considerao da evoluo de Darwin e todos os desenvolvimentos em biologia evolutiva nas seguintes dcadas trataram exclusivamente com animais e plantas, com eucariotas unicelulares (Protista) e bactrias (Monera) nominalmente colocadas perto da raiz do TOL por Haeckel e seus sucessores (56). Embora em 1950, a anlise gentica de bacterifagos e bactrias era bem avanada, tornando-se bvio que estas formas de vida tinham genomas evoludos (57), a sntese moderna no fez nenhuma notificao destes desenvolvimentos. Que as bactrias (e muito menos vrus) evoluiriam sob os mesmos princpios e com os mesmos mecanismos como animais e plantas, no dada de forma bvia todas as suas diferenas biolgicas marcantes a partir de organismos multicelulares e, especificamente, porque lhes faltam reproduo sexual regular e isolamento reprodutivo que crucial para a especiao em animais e plantas. Efetivamente, os procariontes se tornaram "visveis" para os bilogos evolucionistas, em 1977, com o trabalho pioneiro de Woese e colegas sobre a filogenia de rRNA que levou identificao de archaea e os principais grupos de bactrias (28,29,58). Pouco depois, o campo da genmica comparativa e evolutiva nasceu enquanto vrias sequncias completas do genoma de diversas pequenos vrus se tornaram disponveis. Apesar da sequncia rpida da evoluo que caracterstica dos vrus, esta pesquisa comparativa-genmica precoce foi bem sucedida na delineao de conjuntos de genes que so conservadas em grandes grupos de vrus (59-62). Alm disso, um princpio geral tornou-se evidente: enquanto alguns genes foram conservados atravs de uma variedade impressionante de vrus, arquiteturas genmicas, estruturas virion, e as caractersticas biolgicas de vrus mostraram muito mais plasticidade, de modo que a troca de gene, mesmo entre os vrus altamente desiguais, surgiu como um fator importante da evoluo (62). Endossimbiose A hiptese de que certas organelas das clulas eucariticas, em particular, os cloroplastos de plantas, evoluram a partir de bactrias que no muito mais jovem que a Origem: ela foi proposta por diversos investigadores no final do sculo 19, sobre a base do estudo microscpico das clulas de plantas que revelaram similaridade estrutural evidente entre cloroplastos e cianobactrias (ento conhecida como alga azul-verde) e foi apresentado de forma coerente por Mereschkowsky no incio do sculo 20 (63). Durante os primeiros dois teros do sculo 20, esta hiptese de endosimbiose permaneceu uma especulao de margem. No entanto, essa percepo mudou logo aps o aparecimento da publicao seminal de Sagan (Margulis) em 1967, que resumiu os dados ento disponveis sobre a semelhana entre certas organelas e bactrias, em particular, a descoberta surpreendente de genomas organelares, e chegou concluso de que no s os cloroplastos, mas tambm as mitocndrias evoluram a partir de bactrias endossimbiticas (64). Os trabalhos posteriores, em particular, a anlise filogentica de ambos os genes contidos no genoma mitocondrial, e os genes que codificam protenas dessa funo na mitocndria e, aparentemente, foram transferidos na forma mitocondrial para o genoma nuclear transformou a hiptese endosimbiose em um fato bem estabelecido (65). Alm disso, estes estudos filogenticos demostraram de forma convincente a origem de mitocndrias a partir de um determinado grupo de bactrias, a proteobacteria (66,67). O principal papel evolutivo efetivamente atribudo a eventos nicos como endosimbiose , naturalmente, compatvel com ambos gradualismo e uniformitarianismo.

BIOLOGIA EVOLUTIVA NA ERA DA GENMICA O tesouro de genmica, metagenmica e dados ps-genmicas Os princpios fundamentais da evoluo molecular foram estabelecidos, e muitas observaes especficas de grande importncia e impacto sobre os fundamentos do neodarwinismo foram feitas na era pr-genmica, a filogenia baseada em rRNA foi o primeiro caso no ponto. No entanto, o advento do sequenciamento completo do genoma desenvolvido qualitativamente mudou toda a empresa da biologia evolutiva. A importncia de uma quantidade enorme de sequncias para comparao bvia porque este material permite que os pesquisadores investiguem os mecanismos e eventos especficos da evoluo com o rigor estatstico necessrio e revela tendncias evolutivas ainda sutis. Alm disso, vale ressaltar que

as colees de diversos genomas completos so de enorme utilidade alm da enorme quantidade de dados em sequncia. De facto, apenas por meio da comparao de genomas completos, possvel claramente distinguir a relao entre os genes ortlogos (descendncia comum a partir de um nico gene ancestral) e parlogos (duplicao de genes); para demonstrar de modo convincente a ausncia de um determinado gene num genoma e para identificar eventos de perda de genes; para realizar uma comparao completa das organizaes do genoma e reconstruir eventos de rearranjo do genoma (68-71). Alm disso, para um benefcio mximo da biologia evolutiva, crucial experimentar ambos os espaos do genoma profundidade (ou seja, obter sequncias do genoma de vrios representantes, estreitamente relacionadas com o mesmo taxon) e amplamente (obter sequncias representativas para o maior nmero de taxa diversos quanto possvel). Os genomas separados por diferentes distncias evolutivas so mais adequados para tarefas diferentes, por exemplo, para revelar a faixa de conservao de um gene particular, ou a tentativa de reconstruo de importantes eventos evolutivos genomas distantemente relacionados tm de ser comparados entre si, enquanto que para a caracterizao quantitativa do processo de seleo afetando genomas, conjuntos de genomas estreitamente relacionados so indispensveis (72-75). A coleo de genomas completamente sequenciados que esto disponveis no 200 aniversrio de Darwin consiste em milhares de genomas virais, aproximadamente 1.000 genomas de bactrias e archaea, e cerca de 100 genomas eucariticos (76,77). Embora, certamente, nem todos os principais txons so representados adequadamente, esta coleo crescente satisfaz cada vez mais as demandas de pesquisa, tanto microevolutivo e macroevolutivo. O complemento para os avanos da genmica tradicional o mais recente acmulo de grande quantidade de dados metagenmicos. Embora metagenmicos tipicamente no produzam genomas completos, eles fornecem informaes valiosas sobre a diversidade da vida em vrios ambientes (78,79). Para alm da genmica e metagenmica, uma das marcas da primeira dcada do novo milnio o avano das pesquisas em genmica funcional e biologia de sistemas. Estes campos agora produzem alta qualidade, os dados genmicos sobre a expresso gnica, interaes genticas e protena-protena, localizao de protenas dentro das clulas, e muito mais, abrindo novas dimenses de anlise evolutiva, o que s vezes chamado de Biologia de Sistemas Evolutiva (80-82). Este novo campo de pesquisa tem o potencial para produzir ideias sobre as conexes de grandes genomas entre a evoluo de sequncia e de outras variveis, como a taxa de expresso, e iluminar os componentes seletivos e neutros da evoluo desses aspectos do funcionamento do genoma. Abaixo vou tentar sintetizar brevemente as principais ideias da genmica evolutiva, com nfase nas formas em que essas novas descobertas afetam os princpios centrais da biologia evolutiva, em particular, no que diz respeito s contribuies relativas de processos aleatrios, seletivos e neutros. A conservao evolutiva de sequncias e estruturas de genes versus a fluidez da composio gentica e arquitetura do genoma A observao fundamental suportada por todo o corpo de evidncia acumulada pela genmica evolutiva que as sequncias e as estruturas de genes que codificam protenas e RNAs estruturais so, geralmente, altamente conservadas atravs de grandes vos evolutivas. Com a atual coleo de genomas sequenciados, genes ortlogos em taxa distantes so encontrados pela grande maioria das protenas codificadas no genoma de cada um (83). Por exemplo, o recente sequenciamento do genoma de animais primitivos, anmona do mar e Trichoplax, revelou extensa conservao do repertrio de genes em comparao com mamferos ou aves, com a implicao de que a vida til caracterstica de um gene animal inclui (pelo menos) centenas de milhes de anos (84-86). Os resultados de extensa anlise comparativa dos genomas das plantas, fungos e procariotos so totalmente compatveis com esta concluso (87,83). Alm disso, reconstrues evolutivas profundas sugerem que os ancestrais de centenas de genes existentes j estavam presentes em LUCA (88-92). Reconstrues conservadoras do conjunto de gene dos ancestrais comuns dos dois domnios de procariontes, as bactrias e archaea, parecem indicar que essas formas ancestrais que, provavelmente, existiram a mais de 3 bilhes de anos atrs, foram comparveis em

complexidade gentica, pelo menos, ao mais simples dos procariontes modernos de vida livre (88,93). Do ponto de vista da biologia evolutiva, parece que as sequncias de muitos genes que codificam as funes celulares essenciais, especialmente, traduo, transcrio, replicao e vias metablicas centrais, esto sujeitos a forte seleo purificadora que permaneceu no local por intervalos de tempo prolongado, em muitas ocasies, durante todos os 3,5 bilhes de ano da histria da vida celular. Surpreendentemente, no apenas a sequncia e a estrutura das protenas codificadas, mas tambm as caractersticas da arquitetura dos genes que no so, necessariamente, diretamente relevantes para a funo do gene que so altamente conservadas atravs de longos perodos de histria de vida. Em particular, as posies de uma grande frao de ntrons esto conservadas mesmo entre os mais distantes genomas de eucariotas ricos em ntron (conservao de 25-30% em ortlogos de plantas e cordados) (94-96), e a grande maioria das posies dos ntrons so compartilhadas por mamferos e animais basais, como Trichoplax e a anmona do mar (84,86). A conservao impressionante de sequncias e estruturas de genes contrape a fluidez da composio gentica de genomas de todas as formas de vida que revelada pela genmica comparativa e a reconstruo evolutiva. Os (quase) genes universais compem uma minscula frao do universo inteiro de gene: no total, este ncleo central da vida celular composto por, no mximo, 70 genes, isto , no mais de 10% dos genes mesmo no menor dos genomas das formas de vida celulares, mas normalmente, mais prximos de 1% dos genes ou menos (90,97,98). Embora em cada genoma individual, a maioria dos genes pertence a uma conservada gentica moderadamente "concha", que partilhada com organismos distantemente relacionados, dentro de todo o universo de genes, os genes do ncleo e concha (ou, mais precisamente, conjuntos de genes ortlogos) so uma pequena minoria (83). Dada esta estrutura distinta do universo do gene, reconstrues evolutivas inevitavelmente produzem uma imagem dinmica da evoluo do genoma, com numerosos genes perdidos e muitos outros obtidos atravs de HGT (na maior parte, em procariotas) e duplicao de genes (ver abaixo). Mesmo em maior medida do que a composio gentica dos genomas, a arquitetura do genoma, que o arranjo dos genes de um genoma, mostra instabilidade evolutiva em comparao com sequncias de genes (99). Com a exceo da organizao de pequenos grupos de genes funcionalmente relacionados em operons que so, em alguns casos, partilhadas por bactrias e archaea distantemente relacionadas, em parte, provavelmente, devido a uma extensa HGT (ver a seguir), no , geralmente, relativamente pouco conservao da ordem dos genes mesmo entre organismos estreitamente relacionados (100.101). Em particular, em procariotas, a conservao de longo alcance da ordem do gene desaparece completamente, mesmo em alguns grupos de genomas muito afins que retm quase uma-auma correspondncia de genes ortlogos e mais de 99% de identidade significativa de sequncia entre protenas ortlogas (75). Assim, em procariontes, a organizao dos genes para alm do nvel de operons , principalmente, determinada pelo grande embaralhamento aleatrio, em particular, atravs de inverses centradas na origem da replicao (75102103). Eucariontes mostram uma conservao um pouco maior de longo alcance a sintenia genmica mas, mesmo nesse caso, h poucos elementos comuns da arquitetura do genoma entre, por exemplo, diferentes filos animais, e nenhuma entre todos os diferentes reinos (99). A variabilidade das arquiteturas genmicas apresenta um dilema interessante para os bilogos evolucionistas: os organismos possuem arquiteturas genmicas exclusivos que so especificamente adaptados para satisfazer as demandas funcionais originais dos respectivos organismos, ou a evoluo da arquitetura do genoma um processo principalmente neutro? Embora o agrupamento local dos genes funcionalmente relacionados e outros padres sugestivos de co-expresso gentica funcionalmente relevantes foram observados repetidamente, essas tendncias so relativamente fracas e de nenhuma maneira ubqua (104.105). Assim, o fator dominante na evoluo da arquitetura do genoma parece ser o rearranjo aleatrio, no adaptativa, em vez de uma seleo purificador ou positiva.

Transferncia horizontal de genes, a rede da evoluo e a substituio da TOL para Floresta Mesmo muito antes da era genmica, os microbiologistas perceberam que as bactrias tinham a capacidade de troca informao gentica atravs de HGT, em alguns casos, produzindo resultados de grande importncia, tais como a resistncia aos antibiticos (106). Vrios mecanismos moleculares de HGT foram elucidados, incluindo troca de plasmdeo, transduo (HGT mediada por bacterifagos) e de transformao (107). Estas descobertas de HGT, no obstante, foram geralmente vistas como um fenmeno secundrio que importante apenas em circunstncias especiais e, em todo o caso, no foi considerada para prejudicar o conceito do TOL que pode ser reconstituda por meio de anlise filogentica de rRNA e de outros genes conservados. Esta crena fundamental foi contestada pelos primeiros resultados da comparao do genoma de bactrias e archaea que indicavam que, pelo menos, em alguns genomas de procariotas, uma grande frao de genes foram adquiridos via HGT demonstrvel. As ilhas de patogenicidade e ilhas simbiose (Unidades distintas de alguns GENOMAS que conferem virulncia e simbiose) semelhantes que compem mais de 30% do genoma em muitas bactrias patognicas e simbiticas so o caso privilegiada no ponto (108-110). Alm disso, a anlise comparativa dos genomas de bactrias e archaea hipertermoflicas sugeriu que mesmo HGT interdomnio pode ser dada por extensos habitats partilhados (111.112). Pode ser difcil demonstrar inequivocamente a HGT, e, em particular, diferenciar da grande perda do gene, de modo que a extenso da mobilidade gentica horizontal entre procariotas ainda discutida (113-115). No entanto, como o banco de dados genmica cresce, extensas anlises genmicas comparativas e filogenticas levam cada vez mais concluso de que HGT praticamente onipresente no mundo procaritico no sentido de que existe muito pouco ou nenhum conjunto de genes ortlogos cuja histria livre de HGT (116.117). A taxa de HGT difere substancialmente de genes diferentes, dependendo das funes gnicas, em parte, de acordo com a chamada hiptese de complexidade que postula que possam existir barreiras para HGT em genes que codificam subunidades de complexos proteicos, porque o desequilbrio de dosagem e de mistura de subunidades heterlogas resultante de tais eventos pode ser deletrio (118,119). No entanto, a anlise filogentica indica que mesmo tais genes, por exemplo aqueles para as protenas ribossomais e subunidades de RNA polimerase, no so imunes HGT (120-122). A alta prevalncia de HGT em procariontes pode, em parte, explicar a persistncia da organizao de diversos operons atravs de grandes intervalos de organismos, sob a hiptese de operon egosta (123,124). Embora os operons possam ser inicialmente selecionados para benefcio da co-expresso e co-regulao de genes funcionalmente relacionados, provvel que sejam mantidos e difundidos no mundo procaritico devido ao aumento da probabilidade de fixao de um operon seguindo de HGT, em comparao, por exemplo, a um par de genes no operonicos. Este cenrio apresenta um caso notvel de uma combinao de foras seletivas (co-regulao) e neutras (HGT) contribuindo para a evoluo de um dos principais aspectos da organizao do genoma (76.104). Eucariotos so diferentes dos procariotos com relao ao papel desempenhado pela HGT na evoluo do genoma. Nos eucariotos multicelulares, em que as clulas da linha germinativa so distintas da soma, HGT parece ser rara (125), embora no impossvel (126). Sob certas circunstncias especiais, tais como a persistncia de bactrias endossimbiticas em animais, a transferncia de grandes segmentos de genomas bacterianos para o genoma do hospedeiro so um fato comum (127,128). Os eucariotos unicelulares parecem adquirir genes de bactrias e trocar genes entre si em ocasies relativamente frequentes (129-131). Muito mais importante, contudo, a principal contribuio dos genomas de endosimbiontes para complementos de gene de todos os eucariontes. A descoberta de organelas como mitocndrias e genes de aparente origem mitocondrial em todos os eucariotas unicelulares completamente caracterizados, essencialmente, verificou-se que o ltimo ancestral comum dos eucariontes existentes j possua o endosimbionte mitocondrial (132.133). Em termos das suas afinidades filogenticas aparentes, genes eucariotas que possuam genes ortlogos procariticos prontamente identificveis so acentuadamente divididos em genes de provvel origem arquea (principalmente, mas no exclusivamente, os componentes dos sistemas de processamento de informao) e as de provvel origem bacteriana (principalmente, enzima e componentes metablicos de vrias estruturas celulares) (134,135). frequentemente assumido, em termos

gerais, que a maioria dos genes bacterianos ancestrais em eucariotas so de origem mitocondrial, mas isso difcil de ser demonstrado diretamente porque na anlise filogentica estes genes se agrupam com diversos grupos de bactrias (134). Estes resultados so de difcil interpretao porque a composio do gene da endosimbionte e seu hospedeiro no so conhecidos, e possivelmente, uma ou ambas podem j ter acumulado numerosos genes de diversas fontes (136). Um ponto ainda maior de incerteza o cenrio atual da origem dos eucariotos [uma discusso detalhada sobre este importante assunto est fora do escopo deste artigo, ver comentrios recentes e discusses (133,137-140)]. Em suma, as hipteses concorrentes e muito debatidas so os seguintes: (I) O cenrio simbiogentico segundo o qual um antepassado alfa-proteobacterial de mitocndrias invadiu um hospedeiro Archaea, e este evento desencadeou a eucariognese incluindo a formao das caractersticas estruturais da assinatura da clula eucaritica, tais como o sistema endomembranar, o citoesqueleto e o ncleo (138.141). (II) O cenrio archezoan em que o hospedeiro da endosimbionte mitocondrial foi um eucarioto primitivo que j possua todas as principais caractersticas da clula eucaritica, que evoluiu sem qualquer relao com a endossimbiose, mas que facilitou a ltima atravs da capacidade fagocitria do protoeukaryote (137.142). Independentemente do papel exato desempenhado pela endossimbiose na eucariognese, no h nenhuma dvida razovel de que o complemento do gene de eucariotos uma quimera composta de genes funcionalmente distintos dos descendentes de arqueia e bactria (134.143). Alm disso, a endossimbiose aparentemente fez contribuies substanciais para o complemento de gene de alguns dos principais grupos individuais de eucariotos. Assim, uma forte evidncia foi apresentada a macia HGT de milhares de genes a partir de uma endosimbionte cianobactria (o cloroplasto) para o genoma do hospedeiro (planta) (144). Da mesma forma, os genes de aparente origem algal foram detectados em chromalveolates que engoliram uma alga vermelha em um ato de endossimbiose secundria (145). As observaes de extensa, onipresente e que ocorre atravs de mltiplas rotas HGT descritas acima levam a uma generalizao fundamental: os genomas de todas as formas de vida so colees de genes com diversas histrias evolutivas. A consequncia desta generalizao que o conceito da TOL deve ser substancialmente revisto ou abandonado porque uma topologia de uma nica rvore ou mesmo uma topologia congruente de rvores para vrios genes altamente conservados no pode representar a histria de todos ou mesmo a maioria dos genes (146-149). Assim, uma representao adequada da histria da vida uma rede de trocas genticas, em vez de uma nica rvore, e, consequentemente, a "forte" hiptese da TOL, ou seja, a existncia de uma rvore das espcies para toda a histria da vida celular falsificada pelos resultados da genmica comparativa. Certamente, esta concluso no para ser tomada como uma indicao de que o conceito de rvore evolutiva introduzida por Darwin (1) deve ser completamente abandonado. Em primeiro lugar, as rvores tm o potencial para representar com preciso a evoluo das famlias de genes individuais. Em segundo lugar, existem, sem dvida, partes expansivas da histria da vida que as rvores congruentes podem ser obtidas de grandes conjuntos de genes ortlogos e, consequentemente, a topologia de consenso destas rvores qualifica como uma espcie de rvore. A evoluo dos principais grupos de eucariontes, como animais ou plantas, o caso mais evidente no momento, mas a evoluo em rvore parece aplicar-se tambm a muitos grupos dos procariontes em profundidades filogenticas relativamente rasas. A questo permanece em aberto se a evoluo da vida na sua totalidade mais bem descrita como: - uma rvore de consenso dos genes altamente conservados que representam uma "tendncia central" na evoluo, com eventos de HGT, incluindo aqueles associados com grandes endossimbiose, compreendendo as conexes horizontais entre os galhos das rvores [Figura 1A, (150)], ou - uma rede complexa, onde as fases da evoluo em rvore (com conexes horizontais) so intercaladas com as fases "Big Bang" das troca horizontal desenfreada de informaes genticas que no podem ser representados como rvores em princpio [Figura 1B; (151)].

Figura 1. Duas vises da histria de vida para substituir a rvore da vida. ( A) O "TOL como uma tendncia central" do modelo. A histria de vida representado como uma rvore, com linhas de conexo entre os ramos que retratam trapzios HGT e sombreada representando as fases de comprimido cladognese (276). A origem dos eucariotos representado de acordo com a hiptese archezoan em que o hospedeiro do endosimbiontes mitocondrial era um proto-eucariotas (archezoan). Um ltimo ancestral celular comum universal (LUCA) est previsto. (B) O modelo de 'Big Bang'. A histria de vida representada como uma sucesso de fases de rvores como acompanhado por HGT e no como rvore, Big Bang fases. Linhas de conexo entre os galhos de rvores retratam HGT e trapzios coloridas retratam estrondo fases grandes (151). A origem dos eucariotos representada de acordo com o modelo simbiognese em que o hospedeiro da endosymbiontica mitocondrial foi um archaeon. A Estado pr-celular ltimo Ancestral Universal Comum (LUCAS) est previsto. Ar, archaeon (hospedeiro da mitocndria na alnea b), AZ, archezoan (hospedeiro da mitocndria em a), BB, Big Bang, C, cloroplasto, CC, comprimido cladognese, M, mitocndria. Metagenmica, o mundo em expanso de replicons egostas e fuso de replicon A metagenmica uma nova direo da pesquisa genmica que defende (em geral, parcial, nesta fase) o sequenciamento dos genomas de todas as formas de vida que se desenvolvem em um determinado habitat. Embora seja um campo novo, a metagenmica pode j reivindicar grandes avanos na caracterizao da diversidade bacteriana de uma variedade de ambientes, em particular, aqueles nos oceanos (152-154). A direo que eu gostaria de enfatizar como sendo de particular importncia conceitual para a biologia evolutiva metagenmica de vrus (155). A concluso surpreendente de vrios estudos metagenmicos virais que, pelo menos, em alguns, especialmente, de habitats marinhos, os vrus (bacterifagos) so entidades biolgicas mais abundantes, com o nmero de partculas virais excedendo por ordem de magnitude o nmero de clulas (156,157). Embora genomas virais sejam pequenos em comparao com os genomas das formas de vida celulares, estes resultados indicam que a metagenmica de genomas virais incluem uma grande parte do universo gentico que , pelo menos, comparvel em tamanho com a parte tomada por genomas dos organismos celulares. Alm disso, dado que, nos vrus com grandes genomas, uma frao substancial de genes no possuem homlogos detectveis em bancos de dados de sequncias atuais (158-160), parece mais provvel que os vrus abranjam a maior parte da diversidade gentica do planeta. Estes resultados repercutem com a alta prevalncia de vrias classes de elementos mveis dentro dos genomas de muitos organismos celulares. De facto, em genomas de mamferos, sequncias derivadas a partir de elementos celulares, principalmente, retrotransposes (SINEs e LINEs) parecem constituir, pelo menos, 40% do ADN genmico (161). Vrus e outros replicons egostas (definidos como elementos genticos que no codificam um sistema completo de traduo), tais como diversos plasmdeos e transposons, compreendem um conjunto gentico interligado que tambm conhecido como o mobilome, o virosphere ou o mundo dos vrus (76.162 - 164). A identidade do mundo dos vrus manifesta-se na existncia de um conjunto de genes marcantes" que codificam protenas com funes chave na reproduo de elementos egostas (incluindo as protenas do capsdeo viral) e esto presentes em elementos extremamente diversificados que se propagam em uma ampla variedade de hospedeiros, mas no nas formas de vida celular. A existncia de um conjunto distinto de genes marcantes, que inclui, entre outros, o RNA dependente de RNA e DNA polimerase, enzimas de replicao que, provavelmente, antecedem os grandes genomas de ADN, sugere fortemente que o mundo dos vrus coexiste com formas de vidas celulares ao longo da sua histria, e possivelmente, mesmo se origina de um primordial conjunto de elementos genticos pr-celulares (164). Embora distintos, o mundo do vrus constantemente interage com o conjuto genmico de formas de vida celulares, como ilustrado pelo movimento constante de genes entre bacterifagos transdutores, plasmdeos e cromossomos bacterianos (83), ou pelo mtodo de captura de genes celulares (proto-oncogenes) por retrovrus animais (165). As observaes recentes da transferncia de genes mediada por bacterifago entre bactrias distantemente relacionadas, mesmo sem propagao do fago no organismo receptor, sugerem que o fluxo de genes mediado por replicons egostas poderia ser mais extensa do que at agora se suspeite (166). importante ressaltar que partes dos elementos mveis so frequentemente recrutados

(exaptado) por genes hospedeiros como elementos reguladores (167,168) e, em alguns casos, as partes de sequncias codificadoras de protenas (169). Casos individuais de exaptao de genes completos de elementos mveis so tambm conhecidos como notavelmente exemplificado pela evoluo do gene do ourio, um regulador chave do desenvolvimento animal, a partir de um intein (170.171). Todos os genomas de procariotas, sem exceo, contm traos de integrao de mltiplos plasmdeos e fagos. Ainda mais revelador, que os genomas de arqueia normalmente carregam vrias verses de um operon que codifica os principais componentes da mquina de particionamento plasmdeo, e muitas vezes possuem mais de uma origem de replicao (172). Assim, a fuso de distintos replicons parece ocorrer rotineiramente em procariontes, e ao longo da evoluo, tal fuso pode ter sido um fator importante em definir a observada arquitetura de cromossomos procariotas (83.173). Em resumo, a genmica comparativa e a metagenmica revelam uma grande dinmica mundial de replicons egostas interconectados que interage com os genomas de formas de vida celulares e, ao longo de grandes extenses da evoluo, faz grandes contribuies para a composio dos cromossomos. Em procariontes, a interao entre os cromossomos das bactrias e Archaea e replicons egostas to intensa, e a distino entre cromossomos e megaplasmdios turva, de tal forma que os cromossomos so, provavelmente, melhor vistos como "ilhas" de relativa estabilidade no mar turbulento de elementos mveis (83). Em eucariotos, principalmente, em formas multicelulares que evoluram a separao entre o germinativa e a soma, a distino entre cromossomos e replicons egostas mais ntida. No entanto, a mobilidade intragenmica de elementos transponveis egostas extensa e a mobilidade intergenmica, pelo menos, dentro de uma espcie, realmente facilitada pelo sexo, com rajadas de propagao dos elemento transponveis provavelmente marcando as transies evolutivas (16). O papel central dos elementos mveis no genoma enfraquece ainda mais a evoluo do conceito TOL, embora rvores filogenticas de genes marcantes individuais possam ser altamente informativas para a reconstruo da evoluo dos prprios elementos egostas (174,175). A natureza e o incio das transies evolutivas do ltimo ancestral comum universal A genmica comparativa justifica a conjectura de Darwin sobre a origem de todas as formas de vida existentes a partir de um nico ancestral comum. Na verdade, as reconstrues evolucionistas sugerem que centenas de genes conservados, muito provavelmente, remontam a LUCA (88,89-91). Mais especificamente, estas reconstrues indicam que LUCA j possua um completo sistema de traduo que no era drasticamente diferente das (pelo menos) verses mais simples das mquinas modernas de traduo (isto , constituda por, aproximadamente, 100 molculas de RNA e de protenas), assim como o sistema de transcrio do ncleo e de vrias vias metablicas centrais, tais como a biossntese de nucleotdeos de purina e pirimidina (90). No entanto, os conjuntos de genes atribudos a Luca nestas reconstrues faltam certos componentes essenciais da maquinaria celular moderna. Em particular, os componentes do ncleo da maquinaria de replicao de DNA no so homloga (ou, pelo menos, no ortlogos) em bactrias, por um lado, e arqueobactrias e eucariontes, por outro lado (176). Numa outra diviso ntida, os lpidos da membrana tm estruturas distintas, e as enzimas da biognese de membrana so consequentemente no homloga (no ortlogos) (177). Estas grandes lacunas na reconstruo do conjunto de gene de LUCA apoia a ideia de que diferentes sistemas celulares 'cristalizou' de forma assncrona e sugere "transies de fase" nas primeiras fases de evoluo celular (151.178). Uma categoria de hipteses sustenta que LUCA foi radicalmente diferente das clulas modernas, possivelmente, nem uma clula absolutamente, mas sim um conjunto de elementos genticos que estratgias independente e diversificada de replicao e expresso e pode ter povoado compartimentos inorgnicos como os observados em fontes hidrotermais (179,180). Nestas situaes, os sistemas e membranas dos tipos modernos de replicaes de DNA evoluram pelo menos duas vezes de forma independente em dois domnios da vida (supondo uma origem symbiogentica para os eucariontes). Neste caso, o prprio conceito de um LUCA distinto torna-se ambgua, e que poderia ser mais apropriado falar de LUCAS, o ltimo Estado do Ancestral Universal Comum (181). A classe alternativa de cenrios postula que LUCA era um tipo de clula-moderna tanto

com o arquia ou as variedades de bactrias dos sistemas e membranas de replicao de DNA, ou at mesmo sistemas mistos (177.182). Esta classe de cenrios implica que havia comutadores de um tipo para outro, na evoluo de cada um desses sistemas celulares chave ou diferenciada perda dos genes respectivos. Independentemente de qual o cenrio o preferido, a falta de conservao de sistemas celulares centrais entre os domnios da vida indica que as primeiras fases de evoluo celular envolveram mudanas radicais que so dificilmente compatveis com o uniformitarianismo. Quantificao de seleo de grandes Genomas e junk DNA: regimes evolutivos distintos para os diferentes genomas. H grandes diferenas nos esquemas do genoma entre as diferentes linhas de evoluo da vida. Os procariontes e, principalmente, os vrus tm genomas de "parede a parede" que consistem, principalmente, de genes que codificam protenas e RNAs estruturais, com regies no codificantes que compem, com poucas excees, no mais do que 10-15% do ADN genmico. Os genomas dos eucariotas unicelulares tm baixa densidade de genes caractersticos, mas, em geral, no se afastam muito longe dos princpios procariotas, com a maior parte do ADN dedicado a codificao de protenas, apesar da arquitetura distinta do gene xon-intron. Os genomas de eucariontes multicelulares so radicalmente diferentes em que apenas uma minoria (uma pequena minoria em vertebrados) do DNA genmico composto de sequncias que codificam protenas ou RNAs estruturais. Geralmente, ao longo de toda a gama de formas de vida, h uma dependncia exponencial negativa notvel entre a densidade de genes codificadores de protenas e o tamanho do genoma, embora os desvios significativos a partir desta dependncia geral so vistos como bem, particularmente, em procariotas (Figura 2). Esta diferena dramtica na organizao do genoma entre os genomas de (mais) organismos unicelulares e multicelulares exige uma explicao, e a mais simples e plausvel explicao dada pela teoria gentica de populao segundo a qual a intensidade da seleo purificadora afetando uma populao proporcional ao efetivo tamanho da populao. A fixao de sequncias no-codificantes, como ntrons ou elementos mveis , na melhor das hipteses, neutras, mas, mais provavelmente, pelo menos, um pouco prejudicial, mesmo que apenas por causa do peso extra na maquinaria de replicao. Portanto, a grande acumulao de tais sequncias possvel apenas em populaes relativamente pequenas em que a intensidade da seleo purificadora desce abaixo do "limiar da complexificao '. Mais especificamente, a teoria prev que todas as mutaes com o coeficiente de seleo (s) inferior -6 a 10 seria acumulada como neutro em genomas de eucariotas multicelulares e, em muitos casos de insero de sequncias no codificantes na verdade esto associados com tais valores s baixos (16183184). Considerando o estudo da evoluo da escala genmica, a prxima srie de questes importantes tem a ver com a distribuio dos coeficientes de seleo entre genomas: quanto do DNA no codificante realmente lixo, qual a presso da seleo purificadora em genes diferentes, e como a seleo comum positivo (darwiniana) realmente ? Embora a medio da seleo para genes individuais, sem falar nos stios individuais, especialmente, em regies no codificantes seja tecnicamente desafiador (185.186), vrias anlises do genoma tm sido relatadas. Uma anlise abrangente do conjunto de protenas humanas que combinou os dados sobre mutaes patognicas, SNPs no-sinnimos, e divergncia nos ortlogos de homemchimpanz levou estimativa de que apenas, aproximadamente 12% dos resduos de -5 aminocidos esto associados com s <10 , ao passo que cerca da metade dos stios tm -4 -2 valores s entre 10 e 10 (187). Assim, a maioria das sequncias de protenas parecem estar sujeitas a seleo purificadora substancial. Um estudo complementar sobre os regimes de evoluo dos vrios grupos de bactrias e archaea estreitamente relacionados tambm revelou tipicamente forte seleo purificadora, com os grandes genoma atravs da razo de dN / dS (a razo entre taxas de substituio de nucleotdeos no-sinnimo para sinnimo que a medida tradicional da seleo em sequncias codificadoras de protenas) entre 0,02 e 0,2 (dN / dS << 1 a assinatura da seleo purificadora) (75). Uma pesquisa dos grandes genomas por seleo positiva (medida como a razo de dN / dS especfico gene) em genes que codificam protenas, de seis espcies de mamferos revelou

~400 genes (~2,5%) que parecem ter experimentado seleo positivo em pelo menos um ramo da rvore filogentica das espcies analisadas, sendo os valores para a maioria dos ramos individuais serem muito pequenos (188). Estas estimativas, mas conservadoras mostram que, pelo menos, em mamferos, a seleo positiva afetando toda a sequncia de gene bastante rara, embora muitos genes que so, em geral, sujeitos a seleo purificadora so susceptveis a incluir stios selecionados positivamente. A anlise detalhada de locais de codificao de aminocidos em 12 genomas de Drosophila produziu resultados muito diferentes, o que sugere que uma frao substancial e, talvez, a maioria das substituies de aminocidos so acionados por seleo positiva, apesar dos efeitos benficos da maioria destas substituies parecerem muito pequenas (189.190). Notavelmente, a distribuio dos stios selecionados positivamente fortemente no aleatria entre as categorias funcionais de genes, com os genes envolvidos na imunidade e outras funes de defesa, reproduo, e percepo sensorial sendo particularmente sensvel a seleo positiva; esta distribuio parece ser estvel entre animais amplamente diferentes, incluindo mamferos, moscas e nematoides (188189191). Uma pergunta urgente em estudos evolutivos de todo o genoma, especialmente, para os mamferos com seus enormes genomas, que frao do DNA no-codificante 'realmente' lixo, e quanto est sujeita a limitaes funcionais ainda desconhecidas. A possibilidade de que, apesar da falta de conservao evolutiva detectvel, uma fraco grande se no a maior parte do DNA humano , na verdade, importante funcionalmente e mantido consequentemente por seleo est frequentemente sendo discutido, especialmente, luz das demonstraes que uma frao muito grande do genoma transcrita (192-194). Alm disso, uma fraco considervel do DNA "lixo" pode estar envolvido em papis funcionais que implicam apenas na conservao da sequncia limitada, mas, no entanto, so importantes, em particular, para as manutenes e remodelaes da estrutura de cromatina tais como as regies de ligao ao esqueleto / matriz (RAE / MARS) (197.198). No entanto, uma anlise recente da distribuio da insero e deleo de grandes genoma (em comparaes de genomas de humano, rato e co) sugere que apenas ~3% do DNA humano eucromatina sob constrangimentos seletivos (199). Dado que as sequncias codificantes de protena compreendem apenas ~1,2% da eucromatina, estes resultados indicam que a maioria das sequncias de ADN funcionalmente importantes em mamferos no codificam protenas, mas tambm reivindica as primeiras conjecturas de que a maior parte do genoma humano no funcional que , afinal, lixo (45,46). Claro, deve-se ter em mente que qualquer definio de lixo condicional na qual o lixo de ontem amanh pode ser recrutado para um papel funcional. Em contraste, as comparaes de inter-espcies da regies genmicas no-codificantes em Drosophila indicam que a maioria (70% ou mais dos nucletidos) dessas sequncias evoluram sob constrangimentos seletivos, e uma frao significativa (superior a 20%) parece ser afetada pela seleo positiva (200-202). Certamente, esses estudos so baseados em diferentes hipteses simplificadoras (que no pode ser discutida em detalhe), ento a concluso sobre as principais diferenas em regimes seletivos entre as diferentes linhagens devem ser avaliadas com cautela e est sujeita a uma validao adicional. No entanto, o simples facto de que os organismos com tamanhos comparveis dos conjuntos de genes e nveis de complexidade organizacional, tais como insetos, por um lado, e mamferos, por outro lado, que diferem to dramaticamente em termos de densidade e quantidade de genes do evidente "lixo" genmico (Figura 2), sugerem que os seus genomas evoluram sob diferentes presses seletivas. O estudo da interao entre os processos neutros, seleo de purificao e seleo positiva ainda est em seus estgios iniciais. A coleo de conjuntos de genomas estreitamente relacionados de taxa diversos que essencial para esta anlise pequena atualmente, embora esteja rapidamente crescendo, e os mtodos para discriminar os diferentes modos de evoluo ainda esto em desenvolvimento ativo. No entanto, mesmo os resultados j disponveis tornam claro que a contribuio de cada um destes fatores altamente varivel entre os organismos, dependendo do tamanho efetivo da populao, das caractersticas taxas de mutao e recombinao e, provavelmente, de outros fatores que ainda no foram elucidados. Duplicao de gene e genoma: a principal via de inovao genmica A anlise dos inmeros genomas sequenciados deu razo viso da duplicao de genes de Ohno como um mecanismo evolutivo importante (51), talvez, at mesmo em maior medida do que o autor do conceito poderia antecipar. A maioria dos genes, na maioria dos

genomas de formas de vida celulares (exceto para os menores genomas de parasitas obrigatrios) possuem parlogos indicativos da duplicao, em algum momento durante a evoluo (16,69), e muitos genes pertencem a uma grande famlia de parlogos que formam uma distribuio de lei de potncia caracterstica do nmero de membros [(203.204); ver discusso abaixo]. Quanto contribuio da duplicao na origem de novos genes, importante notar que h pouca evidncia convincente do surgimento de novos genes a partir de sequncias no-codificantes, embora os genes possam expandir-se pelo recrutamento de pequenos segmentos adjacentes de sequncia no codificante [por exemplo, a partir de um ntron (205), nascimento de um novo gene completo por esta via parece ser um acontecimento excepcional (206)]. Por isso, tentador generalizar que a duplicao de genes no apenas importante, mas na verdade a rota dominante que leva origem de novos genes, com a adio importante que a duplicao geralmente seguida por evoluo de sequncia acelerada, bem como rearranjo de um gene, uma modo evolutivo que extingue conexes detectveis fonte original. A idia de Ohno na eliminao ou relaxamento da seleo depois de uma duplicao de genes, permitindo a evoluo acelerada que tem o potencial para produzir novidade funcional, tambm foi apoiado por dados comparativos-genmico, embora com um toque significativo. Isto foi argumentado teoricamente e, em seguida, demonstrado por medida emprica da presso de seleo sobre as sequncias de genes duplicados recentemente que o relaxamento da seleo purificadora mais provvel que seja simtrica, para afetar ambas as duplicaes mais ou menos igual (207.208). Assim, a via mais comum de evoluo de genes duplicados no pode ser por neofunctionalizao postulada por Ohno mas subfuncionalizao atravs do qual novos parlogos retm subconjuntos distintos das suas funes originais do gene ancestral enquanto o resto das funes diferencialmente deterioram (209,210). Anlises mais sofisticados parecem sugerir que os dois regimes de evoluo poderia ser realizados em diferentes fases da histria de genes parlogos, com rpida subfuncionalizao imediatamente aps a duplicao sucedida por subsequente neofunctionalizao mais lenta (211-213). As duplicaes de genes ocorrem ao longo da evoluo de qualquer linhagem, mas a taxa de duplicao no uniforme em grandes escalas evolutivas, de modo que as transies organizacionais em evoluo parecem ser acompanhadas por exploses de duplicao de genes, possivelmente, concebvel pela fraca seleo purificadora durante gargalos populacionais (ver abaixo). Talvez o caso mais ilustrativo em questo o surgimento de eucariontes, que foi acompanhada por uma onda de duplicao em massa, produzindo o caracterstico manyto-um co-ortlogo relao entre genes eucariticos e seus ancestrais procariontes (214). Da mesma forma, o diferencial de duplicao de grupos de genes Hox e outros reguladores de desenvolvimento pensado para ter desempenhado um papel fundamental na diferenciao dos filos animais (215.216 Indiscutivelmente, os casos mais dramticos de duplicao de genes saltatrio" envolve eventos de duplicao do grande genoma (WGD)217). Aps a hiptese original de Ohno, a anlise do genoma revelou vestgios de eventos independentes WGD retidos na distribuio de tamanho de famlias de genes parlogos e/ou nas posies das regies genmicas de parlogos, apesar da extensa perda de genes aps WGD, em leveduras (218,219), cordados (220-223) e as plantas (224.225). Mecanicamente, a alta prevalncia de WGD em eucariotos pode no ser particularmente surpreendente porque resulta de um bem conhecido e difundido fenmeno gentico, a poliploidizao. No entanto, as consequncias evolutivas de WGD parece ser importante j que estes eventos criam a possibilidade de rpidas sub/neofunctionalizao simultaneamente em todo o complemento de genes de um organismo (226). Em particular, WGD pensado para ter desempenhado um papel central na radiao primria de cordados (220). difcil descartar a possibilidade de que os eventos WGD mais antigos no so mais facilmente detectvel devido a inmeras perdas de genes que obscurecem o sinal WGD; em particular, a exploso de duplicaes que se seguiu a eucariognese, mas antecedeu o ltimo ancestral comum dos eucariotos existentes pode ter sido provocada pela primeira WGD na evoluo eucaritica (214). Considerando a grande ocorrncia de WGD em mltiplas linhagens eucariticas, notvel que at agora nenhum desses eventos foram detectados pela anlise dos inmeros genomas de procariotas disponveis, embora a poliploidia transitria foi observada repetidamente (227.228). Concebivelmente, a ausncia de WGD detectvel em procariotas devido seleo purificadora eficiente, que atua em grandes populaes procariticas (ver abaixo) e conduz a uma rpida eliminao de genes duplicados que obliteram vestgios de WGD caso ocorra tal evento.

Ao nvel dos conceitos gerais da biologia evolutiva com a qual eu estou aqui principalmente em questo, os estudos genmicos sobre a duplicao dos genes levam a, pelo menos, duas generalizaes substanciais. Em primeiro lugar, a demonstrao do significado evolutivo primrio de duplicaes, incluindo duplicaes de regies do genoma de grande porte e de genomas inteiros, uma sentena de morte virtual para o gradualismo darwiniano: mesmo uma nica duplicao de genes dificilmente se qualifica como uma infinitamente pequena variao enquanto WGD qualifica-se como um evento saltatrio fidedigno. Em segundo lugar, a supremacia da duplicao de genes com a posterior diversificao (por vezes, rpida) dos parlogos, como a rota de origem de genes novos refora a metfora da evoluo como um funileiro: a evoluo tende claramente para gerar novos dispositivos funcionais por mexer com os antigos depois fazendo uma cpia de segurana em vez de criar novidade a partir do zero. Surgimento e evoluo da complexidade genmica: o paradigma no-seletivo e a falcia do progresso evolutivo Sem dvida, eucariontes multicelulares, como animais e plantas, so caracterizados por uma bem maior complexidade organizacional do que formas de vida unicelulares, e no esprito da sntese moderna, essa complexidade geralmente vista como um resultado de inmeras mudanas adaptativas impulsionadas pela seleo natural, e, sendo assim considerado, pode ser visto como uma manifestao de "progresso" na evoluo. A correspondncia entre a complexidade organizacional e a complexidade genmica uma questo em aberto, em parte, porque a complexidade genmica no fcil de definir. Uma definio simples e plausvel pode ser o nmero de nucleotdeos que carregam a informao funcionalmente relevante, isto , so afetados pela seleo (229.230). Sob esta definio, os genomas de eucariotas multicelulares, claro, so muito mais complexos do que os genomas de formas unicelulares, e este nmero mais elevado de complexidade genmica se traduz em complexidade funcional tambm. Um exemplo notvel no ponto de splicing alternativo, que um dispositivo funcional fundamental em organismos complexos, como mamferos, onde ele cria vrias vezes mais protenas do que os genes existentes para a codificao de protenas (231-233) (assim, o facto de que os seres humanos possuem ~20.000 genes em relao aos ~10.000 genes na bactria Myxococcus xanthus no deve ser traduzido para a afirmao de que "a proteoma humano duas vezes mais complexo que o de uma bactria: a diferena real maior devido ao splicing alternativo). O splicing alternativo possvel atravs de sinais de emenda fracos que so processados ou ignorados pelo spliceossomo com frequncias semelhantes (234). Num certo sentido, o funcionamento importante dos eventos de splicing alternativo so codificados nestas momentos de unio e, em certa medida, tambm em sequncias intrnicas adicionais. No entanto, teria splicing alternativo evoludo como uma adaptao funcional? Em toda a probabilidade, no. Com efeito, demonstrou-se que os genomas ricos em intron possuem tipicamente sinais de splice fracos enquanto que os genomas pobres em intron (principalmente, aqueles de eucariotas unicelulares) tm junes de processamento apertados, presumivelmente, assegurando uma elevada fidelidade de splicing (235). Estudos detalhados recentes demonstraram baixa fidelidade de splicing em organismos ricos em intron, a fim de que numerosas variantes misspliced sejam produzidos e sejam, na maior parte, destrudas pelo sistema de decaimento disparate mediada (NMD) (236). As reconstrues evolucionistas sugerem fortemente que os eucariotos antigos, incluindo o ltimo ancestral comum de formas existentes possuam altas densidades de intron comparveis aos mais modernos genomas ricos em intron, tais como vertebrados (237-239) e, por deduo, tinha sinais de emenda fracos produzindo numerosas transcries alternativas (235). A conservao das mquinas NMD em todos os eucariontes (240) completamente compatvel com esta hiptese. Assim, parece que o splicing alternativo em ergiu como um "defeito genmico do qual osa respectivos organismos no podia se livrar, presumivelmente, devido fraca seleo purificadora, e desenvolveram um mecanismo especial para lidar com ele, nomeadamente, o NMD. Aos poucos, eles tambm desenvolveram maneiras de utilizar este tmpano para mltiplas funes. O relato acima da origem do splicing alternativo poderia resumir a teoria da gentica de populao no adaptacionista da evoluo da complexidade genmica, que foi recentemente exposta por Lynch (16183184). Como j foi mencionado na seo anterior, o princpio central da teoria que as alteraes genticas que levam a um aumento da complexidade, como a duplicao de genes ou inseres de ntron so ligeiramente deletrio e, portanto, pode ser fixado a um ritmo considervel somente quando a seleo purificadora em uma populao fraca. Por conseguinte, dado que a fora da seleo purificadora proporcional ao tamanho

efetivo da populao, o aumento substancial na complexidade genmica possvel apenas durante pontos de estrangulamento da populao. Sob este conceito, a complexidade genmica no , originalmente, adaptativa, mas provocada por processos evolutivos neutros quando a seleo purificadora ineficaz. Em outras palavras, a complexificao comea como uma "sndrome genmica" embora as caractersticas complexas (tmpanos), posteriormente, sejam co-optadas por vrias funes e tornam-se sujeitas a seleo. Em contraste, em grandes populaes altamente bem sucedidas, tal como muitos procariotas a seleo purificadora to intensa que nenhum aumento na complexidade genmica vivel e, de fato, a contrao do genoma mais provvel. Claro, h excees a esses princpios, como genomas bacterianos com mais de 12 000 genes (241), genomas virais com vasta proliferao de genes duplicados (158), e de genomas de eucariontes unicelulares [por exemplo, Chlamydomonas (242) ou Trichomonas (243)] que, pela maioria dos critrios, so to complexos quanto os genomas de animais multicelulares ou plantas. Alm disso, alguns genomas procariticos [por exemplo a crenarchaeon Sulfolobus solfataricus (244)] e genomas de eucariotos unicelulares [por exemplo, Trichomonas vaginalis (243)] esto entre aqueles com o maior teor de elementos transponveis. Aparentemente, o resultado da evoluo do genoma depende do equilbrio entre a presso da seleo purificadora, ela prpria dependente do tamanho da populao e da taxa de mutao, a intensidade de processos de recombinao, a atividade de elementos egostas e adaptao aos habitats especficos (99). Uma hiptese atraente que, pelo menos, nos procariotas, o limite superior para o nmero de genes no genoma, um bom indicador para a complexidade genmica, determinada pela 'sobrecarga reguladora (burocrtica)' (83245246). A existncia de tal sobrecarga implicada pela observao notvel que diferentes classes funcionais de diferente dimenses de genes em relao ao nmero total de genes de um genoma, e em particular, os genes reguladores (tais como repressores e activadores de transcrio) mostram uma (quase ) escala quadrtica (83245247248). concebvel que, em alguma razo entre o nmero de reguladores e o nmero de genes regulados, talvez, perto de 1:1, a carga de reguladores torna-se insustentvel. Assim, a evoluo da complexidade do genoma, sem dvida, depende de uma combinao complexa da estocstica (neutro) e processos adaptativos. Parece, no entanto, que, neste momento, a simples hiptese de nulidade mais consistente da evoluo genmica que a expanso do genoma, um pr-requisito para a complexificao, no um resultado da adaptao, mas sim uma consequncia da fraca seleo purificadora. A prxima grande questo que implora para ser feita no que diz respeito complexidade organizacional e genmica, : houve uma tendncia consistente para o aumento da complexidade durante os ~3,5 bilhes de anos de evoluo da vida na Terra? A resposta mais provvel no. Mesmo reconstrues muito conservadoras de genomas ancestrais de arqueobactrias e bactrias indicam que estes genomas foram comparveis em tamanho e complexidade para aqueles de formas modernas relativamente simples (88,89,91,93). Alm disso, as reconstrues de alguns grupos individuais, e no s parasitas, apontam para perda de genes e encolhimento do genoma como o modo predominante de evoluo (249). Considerando que numerosos grupos procariontes, sem dvida, foram extintas no decorrer da histria de vida, no h qualquer razo para acreditar que, mesmo antes da radiao de todas as grandes linhagens conhecidas atualmente, a distribuio de tamanhos do genoma e a complexidade mdia em procariontes era (quase) o mesmo que agora. Naturalmente, concebvel que as formas mais complexas conhecidas evoluram relativamente tarde na evoluo, mas, se for o caso, pode ser representado pelos processos puramente estocsticos, dado que a vida, nas fases de pr-Lucas da sua evoluo, deve ter comeado 'de um comeo to simples "(1250). Na mesma linha, a descoberta de grandes e complexos genomas em animais estaminais (isto , os animais com simetria radial, tal como Cnidaria, que ramificado do tronco de evoluo metazorio anterior origem dos Bilateria) (84-86) sugere que houve pouco ou nenhum aumento na complexidade genmica, durante a evoluo dos metazorios (embora complexidade organizacional tenha aumentado), em vez disso, a perda de repetio de genes em diferentes linhagens foi o processo evolutivo mais prevalente. Certamente, os episdios de importante aumento da complexidade so conhecidos, tais como a origem de eucariotas, bem como a origem de formas multicelulares, para mencionar exemplos bvios. No entanto, estes no parecem ser partes de uma consistente tendncia gradualista, mas sim eventos singulares mais ou menos catastrficos desencadeados por raros

acontecimentos ao acaso, tais como a domesticao do endosimbionte no caso da origem de eucariotas. No geral, os estudos tericos e empricos sobre a evoluo da complexidade genmica sugerem que no existe uma tendncia para a complexificao na histria de vida, e que, quando se aumenta substancialmente a complexidade, esta no ocorre como uma adaptao, mas como uma consequncia da fraca seleo purificadora em si, por mais paradoxal que isso possa parecer, um sinal revelador de falha evolutiva. Parece que estes resultados so suficientes para acabar com o conceito de "progresso" evolutivo, uma sugesto que foi feita anteriormente por razes mais gerais. Genmica funcional, biologia de sistemas e os determinantes da taxa de evoluo de genes Assim como a ltima dcada do sculo 20 foi a era da genmica, quando a quantidade de sequncias do genoma foi transformada em uma nova qualidade, permitindo uma nova generalizao, como o "desenraizamento" da TOL, a primeira dcada do novo sculo, tornouse a idade da genmica funcional e da biologia de sistemas. Estas disciplinas revelaram dados cada vez mais confiveis de uma nova forma que comea a preencher a lacuna anteriormente gritante entre o genoma e o fentipo de um organismo (variveis Phenomic adiante indicados). As variveis Phenomic dos grandes genomas incluem perfis dos nveis de expresso de genes, mapas detalhados das interaes protena-protena e genticas, informaes sobre os efeitos do gene knockout (dispensabilidade gene, geralmente, definido como essencialidade de um gene de crescimento sobre rich media), e mais (81,82). As primeiras anlises comparativas que se tornaram possvel quando a informao suficiente sobre a expresso do gene se tornou disponvel para vrios organismos revelou uma interao entre processos neutros e seletivos. Embora os nveis de expresso entre os genes ortlogos de humano e do rato mostrem conservao significativa (em comparao com pares de genes ao acaso), a divergncia na expresso mais pronunciada do que aquela entre as sequncias de protena dos ortlogos (251,252). Assim, apesar de, em termos gerais, a evoluo da expresso do gene semelhante sequncia da evoluo em que a seleo purificadora a fora restritiva principal (253), o, componente irrestrito verdadeiramente neutro provvel que mais contribua para a evoluo da expresso. A anlise conjunta das classes novas de variveis Phenomic caracterizadas pela biologia de sistemas e as medidas de evoluo de gene, tais como a taxa de evoluo de sequncia e a propenso para a perda de gene revelou uma estrutura de correlaes bastante inesperada [(81254255); Figura 3A]. Apesar da ligao intuitiva entre a taxa de evoluo e a dispensabilidade de gene [genes "importantes" teria esperado para evoluir mais devagar do que os menos importantes (256)], apenas uma ligao fraca (na melhor das hipteses) entre estas caractersticas foi detectada (257-259). A ligao entre a taxa de evoluo e a importncia funcional de um gene merece uma investigao mais aprofundada, pois uma anlise abrangente revela um efeito fenotpico mensurvel de gene eliminatria (knockout) de praticamente cada gene de levedura sob algumas condies (260). No entanto, independentemente do resultado de tais estudos, claramente, esta ligao sutil, mesmo que isso passe a ser resistente. Em contraste, a correlao mais forte em todas as comparaes entre as variveis evolutivas e phenomic foi observada entre o nvel de expresso do gene e a taxa de evoluo de sequncia ou propenso para a perda de genes: genes altamente expressos, de fato, tendem a evoluir substancialmente mais lento do que os genes expressos inferiores (254,261). Esta concluso reforada pelas observaes de uma correlao positiva entre divergncia de sequncia e a divergncia de perfis de expresso entre os genes ortlogos humanos e de rato (252) e as taxas relativamente baixas de expresso de perfis divergentes de genes altamente expressos (262).
FIGURA 3 - A genmica Evolutiva e a biologia de sistemas. (A) Variveis evolutiva e phenomic. As variveis phenomic so vistas como mutuamente dependentes e afetam as variveis evolutivas ( esquerda). Correlaes positivas so mostradas por setas vermelhas e correlaes negativas so mostradas por setas azuis. (B) O conceito de estado do gene. Os pontos vermelhos indicam esquematicamente disperso de dados.

A estrutura geral das correlaes entre variveis evolutivas e phenomic sucintamente capturado no conceito de um 'status' de gene em um genoma (255). Genes de alto nvel evoluem lentamente, so raramente perdidos durante a evoluo e so, tipicamente, altamente expresso, com numerosas interaes protena-protena e gentica, e muitos parlogos (Figura 3B). Deve notar-se, contudo, que apesar deste aspecto da ordem na estrutura de correlao, todas as correlaes so relativamente fracas e no parecem aumentar significativamente com a melhoria da qualidade de dados (254,255). Essas observaes apontam para a multiplicidade dos determinantes do curso da evoluo de um gene e sugerem que verdadeiramente aleatrio, rudo estocstico pode ser um fator importante. O surgimento da ligao entre a taxa de evoluo de sequncia como a conexo mais importante entre varivel evolutiva e phenomic levou a um novo conceito dos principais determinantes da evoluo da protena. Na era pr-genmica, era geralmente aceito que a taxa de evoluo de sequncia deve ser uma funo da, primeiramente, restries estruturaisfuncionais intrnsecas que afetam a dada protena e, em segundo lugar, a importncia do papel biolgico da protena no organismo (256). Com o advento dos dados de biologia de sistemas, percebeu-se que as variveis Phenomic, em particular, a expresso do gene pode ser tanto ou mais importante do que os fatores considerados tradicionalmente (263.264). Esta constatao conduziu hiptese da Misfolding Mistranslation-induzida (MIM) de acordo com o nvel de expresso ou, mais precisamente, a taxa de eventos de translao de fato o determinante dominante da taxa de evoluo de sequncia. A causa da covariao entre a taxa de evoluo de sequncia e o nvel de expresso pensado para ser a seleo para resistncia ao enrolamento incorreto da protena que cada vez mais importante para protenas altamente expressas devido aos efeitos txicos das protenas deformadas (265,266). A hiptese MIM poderia ainda explicar a correlao positiva bastante intrigante, mas consistente e forte entre as taxas de evoluo em posies sinnimas e no-sinnimos (dN e DS, respectivamente) de sequncias codificantes de protena (267). Com efeito, esta correlao provvel que seja uma consequncia da evoluo lenta em ambas as classes de stios em genes altamente expressos que, no caso de locais sinnimas, susceptvel de ser causada por seleo de cdons que minimizem o erro de traduo (268,269). Simulaes de computador detalhada da evoluo da protena sugerem que o efeito txico do enrolamento incorreto da protena, na verdade, pode ser suficiente para explicar a covariao observada do nvel de expresso e da taxa de evoluo de sequncia (269). Simulaes de computador detalhada da evoluo da protena sugerem que o efeito txico do enrolamento incorrecto da protena, na verdade, pode ser suficiente para explicar a covariao observada do nvel de expresso e de taxa de evoluo de sequncia (269). Uma anlise da evoluo dos vrios domnios das protenas revelou homogeneizao substancial das taxas evolutivas especficas do domnio em comparao com o mesmo par de domnios em protenas separadas, possivelmente, atribudas s taxas de converso equalizados, mas diferenas significativas entre as taxas de evoluo de domnio especfico persistiu mesmo em protenas de domnio mltiplos (270). Da a generalizada hiptese MIM de acordo com que a taxa de libertao da protena, principalmente, depende de dois fatores: (I) Robustez do enrolamento incorreto intrnseco que depende da estabilidade e da designabilidade caracterstica de uma dada protena (domnio). (II) Taxa de traduo que pode ser vista como um amplificador dos custos da aptido de enrolamento incorreto e, por conseguinte, da seleo para a robustez a incorporao errada de aminocido. A biologia de sistemas evolutivos revelou uma nova camada de conexes entre a evoluo e o funcionamento do genoma. Torna-se evidente que os processos que ligam o genoma e o fentipo de um organismo, em particular, a expresso do gene, exerce uma reao substancial sobre a evoluo do gene. A taxa de evoluo dos genes codificadores de protenas pode depender mais de restries relacionados com a preveno dos efeitos deletrios do enrolamento incorreto do que em restries associadas com a funo especfica da protena. Fundamentos universais da evoluo do genoma

A genmica comparativa e a biologia de sistemas produziram enormes quantidades de dados, e essa riqueza de informaes implora por uma busca de padres e regularidades. Na verdade, vrias dessas regularidades que so comuns e podem at ser universal para todo o curso da evoluo da vida foram descobertas. Na seo anterior, abordei uma dessas universais aparentes, a correlao negativa entre a taxa de evoluo de sequncia gentica e o nvel de expresso que parece ter em todos os organismos de que os dados esto disponveis e leva a uma reavaliao dos fatores que afetam a evoluo do gene (269). Outras regularidades potencialmente importantes vm na forma de distribuies conservadas de variveis evolutivas e funcionais. Surpreendentemente, as taxas de distribuies da evoluo de sequncias de genes ortlogos entre genomas estreitamente relacionados foram encontradas para ser altamente semelhantes em taxa distante (271), quando padronizadas, estas distribuies so praticamente indistinguveis em bactrias, arqueobactrias e eucariotas e so mais aproximadas por um registo normal da distribuio (Figura 4A). Considerando as diferenas dramticas na complexidade genmica e arquitetura (ver acima), bem como a biologia destes organismos, o prximo identidade das distribuies taxa surpreendente e exige uma explicao em termos de fatores universais que afetam a evoluo do genoma. A robustez ao enrolamento incorrecto da protena discutido acima parece ser um bom candidato para um fator to universal embora os modelos quantitativos que explicam a distribuio da taxa continuam a ser desenvolvidos. Como discutido acima, a duplicao de genes molda todos os genomas, ea distribuio do tamanho da famlia em todos os genomas seqenciados segue uma distribuio de lei de potncia semelhante, com a nica diferena significativa o expoente (203.204), assim que esta distribuio surge como um universal de evoluo genmico. Esta distribuio estreitamente caber por um modelo de nascimento e morte simples de evoluo gene com o nascimento equilibrada e as taxas de mortalidade e sem envolvimento direto de qualquer forma de seleo [(204.272); Figura 4B].
FIGURA 4 - Universais de evoluo. (A) Distribuies de taxas evolutivas entre pares de ortlogos em genomas estreitamente relacionados de bactrias, archaea e eucariotas. As distncias evolutivas entre as sequncias alinhadas de nucletidos de genes ortlogos foram calculados utilizando a correco Jukes-Cantor e padronizada de modo que a mdia de cada distribuio igualada a 0, e o desvio padro igualado a 1. O enredo semi-logartmica. Metma-Methanococcus maripaludis C5 contra M. maripaludis C7 (Euryarchaeota); Bursp-Burkholderia cenocepacia MC0-3 contra B. vietnamiensis G4 (Proteobacteria); Salsp-Salinispora arenicola CNS-205 contra S. tropica CNB-440 (Actinobacteria). Todas as sequncias foram de RefSeq a base de dados do NCBI. As curvas de densidade de probabilidade foram obtidos por Gauss-kernel alisamento dos pontos de dados individuais. (B) Encaixe da distribuies de tamanho de famlia empricas de genes parlogas para o modelo de nascimento-e-morte equilibrada. Os resultados so apresentados para a levedura Saccharomyces cerevisiae (Sc, esquerdo) e seres humanos (Hs, direita). Painis superiores, distribuies finalmente resolvido de tamanhos de famlia parlogas; painis mdia, as distribuies do tamanho da famlia parlogas em coordenadas logartmicas dupla, painis de fundo, a funo do tamanho das famlias parlogas de distribuio cumulativa. As linhas mostram as previses do modelo de nascimento e morte equilibrada. A figura a partir de (204).

O dimensionamento diferenciado das classes funcionais de genes com o tamanho do genoma que est acima mencionado sugere a existncia de todo um conjunto de constantes fundamentais da evoluo. As propores das taxas de duplicao para as taxas de eliminao de genes que determinam os expoentes das leis de potncia para cada classe de genes parece ser a mesma para todas as linhagens testadas de procariotas e invariantes no que diz respeito ao tempo, de modo que as classes funcionais de genes parecem possuir "potenciais evolutivos" universais (245.273). A universalidade aparente destas e de outras caractersticas centrais da evoluo do genoma sugere que os modelos simples, relativamente no seletivos, podem ser suficiente para formar a estrutura de uma teoria evolutiva geral no que diz respeito seleo de purificao que proporcionaria as condies de contorno (restries), considerando positiva a seleo Darwiniana (de adaptao) que se manifesta como uma quantitativamente modesta, ainda que moduladora funcionalmente cruciais do processo evolutivo. CONCLUSES Dois sculos depois do nascimento de Darwin, 150 anos aps a publicao da "Origem das Espcies", e 50 anos aps a consolidao da Sntese Moderna, a anlise comparativa de centenas de genomas de muitos taxa diversificados oferece oportunidades sem precedentes

para testar as conjecturas do (neo) darwinismo e decifrar os mecanismos da evoluo. A genmica comparativa revelou uma diversidade impressionante de processos evolutivos que era inimaginvel na era pr-genmica. Alm de mutaes pontuais que podem ser equiparados com "variaes infinitesimais" de Darwin, a evoluo do genoma envolve grandes contribuies de genes e toda a duplicao do genoma, grandes delees, incluindo a perda de genes ou grupos de genes, a transferncia horizontal de genes e regies genmicas completas, vrios tipos de rearranjos genmicos e interao entre genomas de formas de vida celular e diversos elementos genticos egostas. O cenrio emergente da evoluo do genoma inclui a clssica seleo natural darwiniana como um componente importante, mas , de longe, mais pluralista e complexa do que implicada pela viso direta de Darwin que foi solidificada na Sntese Moderna (16.184). A maioria das sequncias em todos os genomas evoluram sob a presso dea seleo purificadora, ou em organismos com genomas maiores, de forma neutra, com apenas uma pequena frao de mutaes realmente sendo benficas e fixadas pela seleo natural como previsto por Darwin. Alm disso, as contribuies relativas das grandes foras evolutivamente diferentes variam entre linhagens organismal, principalmente, devido as diferenas na estrutura da populao. A genmica evolutiva efetivamente demoliu o conceito simples da TOL por revelar dinmica, e reticulado carter da evoluo, onde HGT, fuso de genoma e interao entre os genomas de formas de vida celular e diversos elementos genticos egostas tomam conta do palco central. Nesta viso de mundo dinmico, cada genoma um palimpsesto, um conjunto diversificado de genes com diferentes destinos evolutivos e muitas diversas probabilidades de terem sido perdidos, transferidos ou duplicados. Assim, a TOL torna-se uma rede, ou talvez, mais apropriadamente, a Floresta da Vida, que consiste de rvores, arbustos, matas de cip, e, claro, muitos troncos e ramos mortos. Se o TOL pode ser recuperadas como tendncia central na evoluo de vrios genes conservados ou se esse conceito deve ser diretamente abandonado para a imagem de Floresta da Vida permanece uma questo em aberto (274). A Tabela 1 apresenta o status dos dogmas centrais da biologia evolutiva clssica na era da genmica evolutiva e da biologia de sistemas. Todos os conceitos clssicos passaram por transformao, tornando-se muito mais complexas, as caracterizaes pluralistas do processo evolutivo (15). Descrevendo a mudana no mais amplo curso possvel, as ideias fundamental de Darwin sobre a interao entre o acaso e a ordem (introduzido pela seleo natural) sobreviveram, mesmo que de uma forma nova, muito mais complexa e matizada, com contribuies especficas dos diferentes tipos de processos aleatrios e tipos distintos de seleo revelado. Por outro lado, a insistncia na adaptao como o principal modo de evoluo que evidente na Origin, mas especialmente na sntese moderna, tornou-se profundamente desconfiada se no completamente obsoleta, abrindo espao para uma nova viso de mundo que d muito mais destaque ao processos no-adaptativo (184). Alm da surpreendente, inesperada diversidade de organizao do genoma e os modos de evoluo revelados pela genmica comparativa, h alguma chance de descobrir princpios gerais subjacentes? Ou, o nico exemplo do papel central do princpio do acaso e da contingncia na evoluo, elegantemente capturado por Jacob (55), em sua frmula "evoluo como consertar? De uma maneira um pouco em linguagem explcita, se est inclinado a perguntar: uma sntese ps-moderna concebvel e, talvez, ainda em vista? Vrios desenvolvimentos recentes em genmica evolutiva podem ser candidatos para as funes de generalizaes de alto nvel subjacentes diversidade dos processos evolutivos. Talvez, a mais abrangente delas o conceito de gentica de populao da evoluo do genoma desenvolvido por Lynch (16). De acordo com este conceito, as caractersticas principais dos genomas so formadas por adaptao, mas no por meio de processos evolutivos estocsticos que dependem criticamente da intensidade da seleo purificadora na qual, por sua vez, determinada pelo tamanho da populao efetiva e a taxa de mutao dos respectivos organismos. Em particular, a complexidade dos genomas de eucariotas multicelulares interpretada como evoluindo, principalmente, no como uma adaptao assegurando complexidade organizacional e funcional, mas sim como uma sndrome genmica" causada pela seleo purificadora ineficiente em pequenas populaes. Alguns dos elementos da sequncia acumulada atravs de processos neutros so ento recrutados para funes biolgicas que, coletivamente, de fato, prever a evoluo dos organismos estrutural e funcionalmente complexos. Por outro lado, alguns genomas compactos de procariotas e

eucariotas unicelulares no pode ser moldado por seleo de 'racionalizao do genoma', mas sim pela melhoria eficaz de sequncias, mesmo que ligeiramente deletrias em grandes populaes (83). A viso no-adaptativa da evoluo da complexidade genmica no implica que nenhum dos recursos complexos sempre evoluem como adaptaes diretas ou racionalizao do genoma que nunca pode ser uma importante fora motriz da evoluo do genoma. No entanto, acredito que a evidncia acumulada pela genmica evolutiva suficiente para exigir a mudana da hiptese nula central da evoluo do genoma de adaptacionista para o neutro, com o nus da prova transferida para os adeptos da adaptao generalizada (230). O conceito do carter substancialmente no-adaptativo da evoluo do genoma realmente parece afetar nossa compreenso bsica do significado da conservao de recursos genmicos. Como um caso em apreo, a conservao bastante enigmtica das posies de uma grande frao de ntron ao longo da evoluo dos eucariotos pode no ser uma consequncia da forte seleo purificadora que poderia causar a eliminao de variantes em que o respectivo ntron estivesse perdidos (o padro de interpretao implcita na prpria noo de seleo purificadora e totalmente compatvel com a teoria neutra). Pelo contrrio, a conservao de ntrons e outras caractersticas genmicas sem funes bvias poderia ser a consequncia da seleo purificadora fraca em pequenas populaes de organismos complexos, que no suficiente para remover eficientemente estes elementos. Isto no pretende afirmar que os muitos caracteres genmicas (como genes individuais, os resduos de aminocidos ou nucleotdeos) no so conservados durante a evoluo, devido sua importncia funcional, mas sugere que mesmo este "sagrado" princpio central da biologia evolutiva - 'o que conservado funcionalmente relevante' - no um absoluto, e a alternativa no adaptativa para ser levado a srio. Juntamente com a constatao de que a contrao do genoma, pelo menos, to comum na evoluo como a expanso do genoma, e o aumento da complexidade genmica no uma tendncia evolutiva central, o conceito de evoluo no adaptativa do genoma implica que a ideia do progresso evolutivo pode ser colocada de forma segura para descansar. s vezes se argumenta que os desenvolvimentos recentes em genmica e biologia de sistemas produzem um labirinto de conexes entre diferentes tipos de dados que so intratveis por qualquer forma explcita, eliminando assim qualquer esperana para a descoberta de simples, 'lei como" regularidades e reduzindo grande parte da pesquisa nestas reas para o desenvolvimento de algoritmos de previso (275). No entanto, exatamente esse tipo de regularidade simples e aparentemente universal que surge a partir da anlise conjunta dos dados da genmicas comparativa e da biologia de sistemas. A distribuio das taxas evolutivas atravs de conjuntos de genes ortlogos, a distribuio dos tamanhos das famlias de genes parlogas, a correlao negativa entre o nvel de expresso e a taxa de evoluo da sequncia de um gene e outras relaes entre as chaves evolutivas e as variveis phenomic parecem ser verdadeiros fundamentos universais da evoluo. A simplicidade dessas regularidades universais sugere que elas so formadas por processos evolutivos fundamentais igualmente simples, e no pela seleo para funes especficas. Em alguns casos, os modelos explcitos de tais processos j foram desenvolvidos e mostrados para ajustar os dados. Estes modelos no querem incluir a seleo em tudo ou dar uma nova interpretao a seleo. Um bom exemplo a hiptese generalizada do enrolamento incorreto da mistranslation induzida que explica a co-variao da expresso gnica e a taxa de evoluo pela seleo de sequncia de robustez ao enrolamento incorreto que surge como um dos principais determinantes da evoluo da protena. A consequncia inesperada deste modelo que a principal fora motriz da seleo purificadora no pode ser a manuteno de uma funo biolgica mas antes a preveno de efeitos deletrios no especficos de uma protena misfolded. Coletivamente, os desenvolvimentos em genmica evolutiva e biologia de sistemas descritos aqui parecem sugerir que, embora, atualmente, apenas elementos isolados de uma nova sntese "ps-moderno" da biologia evolutiva esto comeando a ser formulados, tal sntese de fato vivel. Alm disso, provvel assumir um modelo definitivo muito antes do 250 aniversrio de Darwin.