Você está na página 1de 15

Modelagem de Sistemas Computacionais Complexos: Em Direo a uma Fundamentao Cientfica e Aplicaes Tecnolgicas*

Lus C. Lamb1, Aline Villavicencio1,Marco Idiart2, Luciana S. Buriol1, Leila Ribeiro1,Roberto da Silva1, 1 2 Instituto de Informtica, Instituto de Fsica Univ. Federal do Rio Grande do Sul 91501-970 Porto Alegre, RS Brazil {lamb,avillavicencio,leila,buriol,rdasilva}@inf.ufrgs.br idiart@if.ufrgs.br Abstract. We present a long term view on scientific and technological challenges in complex systems development. We raise several research hypotheses: (1) the foundations of complex systems are built upon computer science, physics and natural sciences, linguistics, cognitive science, and economics; (2) the development of sound models of complex computational systems leading to technological advances demands researchers with in-depth knowledge of such disciplines; (3) the construction of complex systems leading to relevant technologies requires interdisciplinary research and new ways of soundly combining research results from several disciplines. We briefly describe five related research paths, outlining challenges that may well lead to the construction of large-scale, cognitive and biologically-inspired complex computational systems impacting on social, cognitive and physical sciences. Resumo. Apresentamos uma viso de longo prazo em desafios cientficos e tecnolgicos no desenvolvimento de sistemas complexos. Levantamos diversas hipteses de pesquisa, entre elas: (1) a fundamentao de sistemas complexos construda sobre slida base de cincia da computao, fsica e cincias naturais, lingstica, cincia cognitiva e economia; (2) o desenvolvimento de modelos corretos de sistemas complexos computacionais conduzindo a avanos tecnolgicos demanda conhecimento aprofundado destas disciplinas; (3) o desenvolvimento de modelos de sistemas computacionais complexos conduzindo a avanos tecnolgicos requer pesquisa interdisciplinar e novas formas de corretamente combinar resultados de pesquisa de diversas disciplinas. Descrevemos brevemente cinco linhas de pesquisa relacionadas, destacando desafios que podem levar construo de sistemas computacionais complexos de ampla escala, cognitiva e biologicamente inspirados, com impacto nas cincias fsicas, cognitivas e sociais.

1. Introduo
Historicamente, a cincia da computao construiu sua fundamentao sobre conceitos lgico-matemticos. O impacto desta fundamentao conhecimento comum, pois tecnologias e metodologias, e.g, em engenharia de software, bancos de dados, sistemas distribudos, inteligncia artificial, desenho e projeto de hardware so fortemente baseados em construes lgico-matemticas. Assim como E. Wigner, vencedor do
* Pesquisa parcialmente financiada pelo CNPq.

2113

Nobel de Fsica em 1963, defendeu e demonstrou que o papel da matemtica fundamental na modelagem de fenmenos fsicos [Wigner 1961], em computao a lgica e matemtica tm historicamente desempenhado papel semelhante [Halpern 2001]. Cabe salientar, que em loc.cit. Halpern et al ilustram as aplicaes de lgica em bancos de dados, linguagens de programao, complexidade descritiva, verificao de circuitos digitais, inteligncia artificial e sistemas distribudos. A evoluo da computao tem levado a implicaes e impactos sociais crescentes, como a possibilidade de interao e integrao globais, tanto social, quanto econmica. Alm disso, a crescente interao entre a computao e as cincias naturais, humanas e sociais tem levado construo de sistemas cada vez mais sofisticados, que exigem de pesquisadores e profissionais tanto na academia, quanto na indstria, de conhecimentos multi-disciplinares. Entre estes sistemas, destacam-se os sistemas complexos computacionais. O termo sistema complexo bastante abrangente e se origina da mecnica estatstica. Historicamente, Boltzmann (1844-1906) foi pioneiro ao descrever formalmente a distribuio de probabilidades da energia de um gs. Boltzmann mostrou que o comportamento da energia mdia de um gs relativamente simples era essencialmente a sua temperatura, mostrando talvez pela primeira vez essa a possibilidade emergncia, conceito amplamente utilizado em computao. Existem muitas definies de complexidade. Por esta razo muitos objetos naturais, artificiais e abstratos ou mesmo redes podem ser considerados sistemas complexos. A idia de que um sistema com muitos componentes com regras e caractersticas locais possa fazer emergir regras gerais e muitas vezes universais culminou na chamada teoria dos fenmenos crticos e transies de fase [H. E. Stanley, 1971]. Por outro lado, [Metropolis et al, 1953] incorporou a distribuio de Boltzmann e desenvolveu um algoritmo que obtm as propriedades termodinmicas e, portanto, globais de um gs usando um processo conhecido como amostragem por importncia. Este algoritmo (de Metropolis), um dos 10 algoritmos mais utilizados no sculo, abrangre aplicaes em engenharia, fsica e computao. O algoritmo de Metropolis consiste em uma importante parte de um outro algoritmo extremamente til: Simulated Annealing, uma heurstica eficiente para determinio de mnimos locais prximos a mnimos globais em sistemas desordenados. Em um cenrio de cincia de computao, uma aplicao deste algoritmo ocorre no multidisciplinar problema do caixeiro viajante. A idia destes algoritmos tipo Monte Carlo, culminou nos chamados algoritmos genticos. A incorporao da aprendizagem, nas ditas redes neurais levou ao surgimento de uma teoria mais geral em cincia da computao denominada Machine Learning. Respondendo aos desafios de construir sistemas complexos computacionais, este artigo levanta possibilidades de pesquisa e prope desafios e requisitos para a construo destes sistemas. Estes sistemas apresentam, por exemplo, dimenses que modelam aprendizagem, raciocnio, distribuio, multi-agncia, plausibilidade biolgica, rigorismo formal e preciso matemtica. Alm disso, o seu desenvolvimento exige conhecimento multi e transdisciplinar, pois estes sistemas devem interagir e estar integrados a ambientes com forte participao do homem. A seguir, enumeramos desafios, requisitos e caractersticas desejveis de cinco tipos de sistemas computacionais complexos e seu potencial impacto no desenvolvimento da computao. 2. Desafios no Desenvolvimento de Sistemas Complexos Cognitivos

A computao evoluiu e surgiu de noes fundamentais em lgica e matemtica. Noespecialistas associam o desenvolvimento da computao construo de mecanismos

2114

tecnolgicos de clculo e aritmtica, percebendo a conseqncia do conhecimento cientfico fundamental. Esta situao persiste at hoje, pois, exceto entre especialistas, o desenvolvimento cientfico somente visto como relevante pelo grande pblico se a conseqncia de pesquisas bsicas de longo prazo conduzem a resultados de impacto como, e.g., o desenvolvimento do transistor, o surgimento de computadores, a ubiqidade dos mecanismos de comunicao e o surgimento da web, para nos restringirmos apenas computao. Algumas vezes, o desenvolvimento e pesquisa bsica em cincia conduzem quebra de paradigmas, como, e.g., o resultante dos desenvolvimentos fundamentais em mecnica quntica (de Planck, Dirac e muitos outros), da eletricidade e magnetismo (Maxwell, Faraday e outros), e da prpria mecnica Newtoniana, por sua vez fortemente baseada em desenvolvimentos em anlise (e por conseqncia, no clculo). Na computao, a maior quebra de paradigma foi a prpria construo de computadores nas dcadas de 1930 a 1950, fortemente influenciados por desenvolvimentos em lgica matemtica a partir dos trabalhos de Turing, Gdel e muitos outros. Esta quebra de paradigma foi to marcante que influenciou modelos micro e macroconmicos nas dcadas seguintes. Outra quebra de paradigma aconteceu recentemente com a criao da web, que permitiu integrao e interao rpida entre usurios e posteriormente entre (potencialmente) toda populao. Tambm alterou radicalmente o modelo de cooperao e desenvolvimento cientfico, permitindo integrao e acesso rpido ao conhecimento no vista anteriormente em outros perodos da histria. Nota-se que a atual quebra de paradigma, ao contrrio das anteriores, fortemente baseada em modelos e dimenses cognitivas, intrnsecos no somente ao indivduo, mas tambm a grupos e largas populaes, exigindo anlise social do comportamento de grupos. Modelos de computao para sistemas complexos que contemplem cognio devem ento observar e responder vrias dimenses, individuais e coletivas, e interagir com o mundo exterior. A construo de sistemas complexos cognitivos, considerando habilidades integradas de percepo, comunicao e cooperao so ainda incipientes. Para responder a este desafio, necessrio dominar e compreender os modelos da cognio. A cincia cognitiva construda sobre a psicologia, filosofia, lingstica, neurocincia, antropologia, computao e inteligncia artificial. Portanto, modelos e sistemas que tenham como objetivo modelar a interao homem-mquina com eficincia, adaptabilidade e usabilidade devem considerar aspectos cognitivos. Devemos ento modelar aspectos internos e externos ao sistema, como adaptabilidade e aprendizagem, abstrao lgico-matemtica adequada e mecanismos de raciocnio computacionalmente tratveis. Valiant, em 2003 (em artigo visionrio sobre os prximos 50 anos da computao, publicado no Journal of the ACM, contendo artigos dos ganhadores do Nevanlinna Prize e A.M. Turing Award [Valiant 2003]), defendeu que o desenvolvimento de uma semntica para a computao cognitiva um dos maiores desafios da cincia da computao, juntamente com a caraterizao da computao cortical. Para responder a estes desafios essencial entender os mecanismos de representao de conhecimento, aprendizagem e raciocnio no crebro humano. Neste sentido, diversos autores tm desenvolvido modelos de computao cognitiva que tentem explicar mecanismos de representao do crebro [Hinton 2005], integrem raciocnio e aprendizagem [Garcez e Lamb, 2006; Richardson e Domingos 2006]; e que modelem lgica, fsica ou matematicamente a cognio [Lamb, Borges e Garcez 2007]. [Thagard 1996] apresenta uma introduo ao problema.

2115

A computao cognitiva e o desafio de construir modelos para o raciocnio e aprendizagem, biologicamente plausveis e matematicamente tratveis constitui-se em um desafio de grande dificuldade em sistemas computacionais complexos. Acrescentese a isto, o fato de que normalmente a aprendizagem de mquina e adaptabilidade tm sido estudadas atravs de modelagem probabilstica. No entanto, mecanismos de modelagem e automao do raciocnio so pesquisados atravs de mecanismos lgicos. Assim, conciliar a incerteza intrnseca aos modelos probabilsticos de aprendizagem com a preciso dos mecanismos simblicos, baseados em lgica, constitui-se em um desafio fundamental a ser vencido. Antes disso, a construo de sistemas computacionais complexos cognitivos, que integrem raciocnio e aprendizagem, com benefcios tecnolgicos, permanece como assunto de pesquisas em andamento. A relevncia da construo de modelos da mente e crebro, tambm tem sido destacada e reconhecida historicamente por muitos. Por exemplo, um dos grandes desafios propostos pela British Computer Society justamente a construo de modelos e arquiteturas para a mente e o crebro [Hoare e Milner, 2004]. Entre os desafios enumerados, na construo e modelagem do crebro e mente, esto: a percepo dos tipos de objetos em torno de ns mesmos; a compreenso da linguagem; a aprendizagem de novos conceitos; o controle de nossas aes; a memria dos objetos e percepes; a apreo/desapreo pelas coisas; conscincia de nossos pensamentos e emoes; a aprendizagem e reconhecimento dos estados mentais dos outros; o entendimento de msicas e brincadeiras; a percepo da passagem do tempo. Todos estes, de acordo com [Hoare e Milner 2004] envolvem modelos mentais abstratos e processos fsicos concretos. O desafio seria construir sistemas complexos com estas caractersticas, que nossos crebros e mentes conseguem com eficincia, mas que modelos e sistemas computacionais at hoje no foram capazes de implementar. Assim, a construo de modelos computacionais e sistemas cognitivos complexos tm de considerar a intrnseca complexidade do problema e a complexidade do sistema que est se tentando modelar: em ltima anlise, a mente e crebro humanos. Novos avanos em neurocincia, onde so estudados os mecanismos biolgicos do crebro, lingstica e processamento computacional da linguagem, cincia cognitiva e modelos computacionais biologicamente inspirados so essenciais na construo de mecanismos e arquiteturas que expliquem e simulem o comportamento e a computao da mente humana e do crebro. Alm disso, a construo destes modelos cognitivos computacionais ricos que integrem, e.g., raciocnio e aprendizagem tem forte ligao com mecanismos de computao da linguagem natural um desafio listado na seqncia - uma vez que para interagir e compreender o mundo essencial que modelos eficazes e computacionalmente tratveis da linguagem sejam desenvolvidos. O desafio de construir sistemas complexos de cognio tambm integrado a modelos estudados em econofsica, uma vez que a modelagem de agentes econmicos sob racionalidade limitada exige novos desenvolvimentos em lgica e modelagem da aprendizagem em ambientes distribudos. Estes ambientes contam com a participao de agentes humanos, devem prover interao homem-mquina eficiente e propiciar a interao homem-natureza. Em ltima anlise, estes sistemas devem auxiliar o homem na sua interao com o mundo, pois, hipoteticamente, representariam com maior fidelidade a cognio humana. Assim, antes de propormos solues aos desafios enfrentados na construo de sistemas cognitivos complexos, necessrio identificar requisitos necessrios para a construo destes tipos de sistemas, que envolvem um grande nmero de dimenses e reas de pesquisa.

2116

3.

Aquisio e Processamento Computacional da Linguagem: Usando um Melhor Entendimento da Mente Humana na Criao de Sistemas de Computao Adaptativos

Dado que o meio mais natural para o homem comunicar-se a sua linguagem (Portugus, Ingls, Alemo,...), pesquisadores da rea de Processamento de Linguagem Natural (PLN) tm investigado formas para captur-la computacionalmente. Um dos principais objetivos da PLN possibilitar interaes tais como aquelas apresentadas no filme 2001: Uma Odissia no Espao, na qual um humano dialoga com um computador (HAL) sem qualquer restrio no uso da linguagem, de ambas as partes. Para tanto, recursos, mtodos e ferramentas tm sido desenvolvidos com muito do esforo investigativo sendo empregado na construo de modelos computacionais das linguagens humanas, em particular de como combinar correta sintaxe com pertinncia semntica, para uma subsequente seqncia de aes apropriadas interao. Isto requer no apenas a modelagem de conhecimentos lingsticos como conhecimentos gerais sobre o mundo. Apesar dos rpidos progressos da rea [Jurafsky e Martin 2000, Manning and Schutze 1999], uma interao como a do filme ainda um sonho distante. De fato, como props o matemtico Alan Turing [Turing 1950] com seu celebrado jogo de imitao, a obteno de um manejo satisfatrio de linguagem por parte de uma mquina passa necessariamente pelo entendimento de algo muito mais fundamental: o funcionamento de nossa prpria mente consciente. Conseqentemente a modelagem das linguagens humanas, com toda sua complexidade e dinmica, um grande desafio para o conhecimento humano. Desafio este onde a Cincia da Computao certamente contribuir de forma decisiva. H trs abordagens principais dentro da rea de PLN para modelar estes conhecimentos. A primeira a mais tradicional, a baseada em conhecimento [Jurafski and Martin 2000], que tem influncias da Inteligncia Artificial, e onde os recursos necessrios para o tratamento da linguagem so bases precisas de conhecimento manualmente construdas, ou seja, dicionrios e conjuntos de regras compiladas por lingstas. Porm a construo manual dos recursos lingsticos necessrios um processo muito lento e oneroso, e resulta em recursos estticos que so incapazes de se adaptar constante evoluo da linguagem. Uma alternativa para estes problemas o uso de uma abordagem estatstica onde mtodos estatsticos so utilizados para possibilitar a aquisio automtica de informaes lingsticas a partir de uma coleo de textos, por exemplo, visando a construo (semi-)automtica de recursos lingsticos, tais como dicionrios e gramticas [Korhonen 2003, O'Donovan et al. 2004, Zhang et al. 2006]. Porm as tcnicas utilizadas em geral necessitam de grandes quantidades de dados que podem no estar disponveis para todos os domnios e lnguas. No contexto de pesquisa do Brasil, vrias destas tcnicas, e a eventual aplicabilidade das mesmas Lngua Portuguesa, esto sendo desenvolvidas e testadas em trabalho de colaborao entre os institutos de Informtica e de Fsica da UFRGS (descrito em [Zhang et al. 2006]). A terceira e ltima abordagem, a qual podemos chamar abordagem cognitivista, direciona seu foco no somente aos produtos finais da atividades de linguagem, tais como textos e dicionrios, mas principalmente em como a linguagem adquirida. A aquisio humana da linguagem um processo fascinante. Uma criana aprende sua lngua materna em um tempo curto, bastando estar exposta a ela. Nenhum tipo especial de pedagogia necessrio. Avanos no entendimento deste aspecto da cognio humana

2117

no mbito de disciplinas como a psicologia, a biologia e a lingstica comearam a informar estas investigaes e influenciar os desenvolvimentos na rea. Como resultado surgiram novos modelos cognitivos computacionais de processamento da linguagem descrevendo como se daria aquisio, armazenamento e processamento da linguagem humana [Briscoe 1997-1999, Berwick e Niyogi 1996, Sakas e Fodor 2001, Villavicencio 2002]. E estes por usa vez tm sido utilizados em estudos multidisciplinares de aspectos da cognio humana, como o modelo do lxico mental implementado como uma estrutura de grafos, usado na investigao da aquisio humana de significados das palavras [Gaume 2004]. Nos ltimos anos tambm foram coletados e disponibilizados vrios corpora (textos) de grande magnitude para diversas Lnguas, como o British National Corpus, para a Lngua Inglesa, que contm 100 milhes de palavras. Estes corpora possibilitam o estudo sistemtico de uma lngua e de mtodos para a modelagem e aprendizado automtico das construes lngsticas neles contidas. De particular importncia para os estudos cognitivos computacionais so os corpora contendo transcries de gravaes com crianas na fase de aquisio da linguagem, em geral obtidos no mbito de estudos lingistas e psicolingistas, sendo a coleo de corpora CHILDES (Child Language Data Exchange System) [MacWhinney 2000] a mais amplamente conhecida. Estes corpora so de grande relevncia para estudos que utilizam modelos cognitivos computacionais, pois permitem simular de uma certa maneira o ambiente lingstico ao qual uma criana exposta durante o perodo de aquisio da sua lngua materna. Porm muito poucos corpora esto disponveis para a Lngua Portuguesa. A Linguateca (http://www.linguateca.pt/) uma iniciativa interinstitucional para a coleta de textos jornalsticos. Todavia, corpora similares aos do CHILDES para o Portugus ainda esto em falta, e para que um avano significativo do PLN seja possvel necessrio um esforo conjunto interinstitucional para obter e disponibilizar corpora similares a estes Encontrar modelos fundamentados em estudos psico-lingsticos e que ao mesmo tempo sejam computacionalmente implementveis no s possibilita o avano na construo de tecnologias adaptativas para PLN, como tambm permite avanos na outra direo, na utilizao destes modelos para se chegar a um melhor entendimento sobre a aquisio, armazenamento e uso da linguagem por humanos. Nas ltimas dcadas, a aquisio da linguagem tem se tornado o foco central em disciplinas, como a Lingstica e a Psicologia, sendo Noam Chomsky possivelmente o seu mais conhecido contribuinte. Diferentes modelos de aquisio da linguagem [Chomsky 1965, Pinker 1984, Pollard e Sag 1989] etc. e teorias lingsticas como Government and Binding [Chomsky 1965], Head-Driven Phrase Structure Grammar [Pollard e Sag 1987] e Minimalism [Chomsky 1995] foram propostos para tentar capturar a essncia da linguagem humana. Contudo, em geral, os resultados obtidos se limitam apenas a explicaes tericas de fenmenos bem localizados em um nmero restrito de lnguas, muitas vezes idealizando o uso destas lngua. Alm disto muitos destes estudos abordam fenmenos dentro de uma disciplina isolada (por exemplo a Psicologia), sem levar em considerao evidncias encontradas em outras disciplinas. Apesar da aquisio da linguagem j fazer parte do domnio de investigao de diversas disciplinas, h ainda muitas questes em aberto. So exemplos: Quais so as caractersticas especficas dos mecanismos e dos processos empregados na aquisio da linguagem? Estes so mecanismos mais gerais de aprendizado, ou so especficos para a linguagem? Antes de ser exposta uma lngua, quanto uma criana sabe sobre linguagens em geral ? Seria isto inato ou decorrente do convvio? Existe uma estrutura comum a todas linguagens humanas ? Existe uma relao entre esta estrutura e a

2118

forma particular de processamento existente no crebro humano? J existem muitas propostas para possveis respostas destas perguntas, sem no entanto uma anlise computacional profunda de sua viabilidade como uma explicao de como a aquisio da linguagem ocorre. A cincia da computao dispe dos recursos toricos necessrios para a realizao destes estudos. Atravs de suas tcnicas ser possvel avaliar e comparar quo bem sucedidos estes modelos seriam na tarefa de adquirir linguagem em tempo limitado, a partir da exposio a um ambiente lingstico contendo tambm rudo na forma de sentenas incompletas e no gramaticais, alm da possvel interferncia de outras lnguas, etc. Isto efetivamente o que crianas fazem quando esto aprendendo a sua lngua materna. Estudos sobre a capacidade de aprendizado de modelos ajudam a ressaltar potenciais problemas com eles e indicar possveis caminhos a serem explorados. Porm para que estes modelos possam ajudar a entender melhor o processo de aquisio humana da linguagem, devem empregar somente algoritmos e recursos que um humano possa empregar. Consequentemente, a construo de modelos computacionais de aquisio, armazenamento e uso da linguagem bem fundamentados em estudos psico-lingsticos e compatveis com a aquisio humana da linguagem um dos grandes desafios para a computao. Estes modelos no s auxiliaro no avano da Cincia da Computao e de suas tcnicas de interao homem-mquina atravs da linguagem natural como tambm permitiro obter um melhor entendimento sobre a parte da mente humana que lida com processamento de linguagem. Para finalizar, no que se refere especificamente Lngua Portuguesa, o seu estudo atravs destas novas perspectivas ainda est em um estgio precrio se compararmos com o ingls ou o francs, entre outras. Assim, o Brasil como maior pas de Lngua Portuguesa e, portante seu maior usurio, no pode fugir da responsabilidade de acelerar suas pesquisas especificamente em portugus. Se poder falar com uma mquina um desafio investigativo da humanidade, poder falar em portugus com uma mquina um desafio nosso.

4. Anlise e Modelagem do Webgraph


O Webgraph o grafo formado pela estrutura de links das pginas web, ou seja, as pginas e seus links representam os ns e arcos deste grafo, respectivamente. O Webgraph representa um sistema complexo devido a sua grande dimenso. Em 2005, Gulli e Signorini estimaram que o Webgraph possuia mais de 11.5 bilhes de ns, sendo que atualmente este grafo no mnimo dobrou de tamanho. Em 2004, Boldi e Vigna haviam estimado tal dimenso em 3.5 bilhes ns. Certamente uma das maiores redes sob pesquisa no mundo e, alm disso, de grande interesse cientfico e comercial. Devido sua grande dimenso, mesmo algoritmos polinomiais representam tarefas rduas devido ao tempo e recursos computacionais requeridos. Alm disso, as pginas web so inseridas sem regras, a qualquer momento e por qualquer pessoa, crescendo sem uma organizao prdefinida e gerando um grafo sem estrutura conhecida. Por esta razo, muitos dos algoritmos usados para computaes no Webgraph so exclusivamente desenvolvidas para ele. Pode-se citar como exemplo as tcnicas de compresso que so desenvolvidas especificadamente para comprimir o Webgraph [Boldi e Vigna, 2003; Raghavan e Garcia-Molina, 2003]. Alm de ser um grafo de grande dimenso, o Webgraph possui caractersticas nicas em relao a outros grafos. A sua expanso e estrutura no apresentam modelos definidos e no segue as mesmas regras comum a outras redes. Mesmo que sua anlise esttica de grande

2119

importncia, sua transformao no tempo pode adicionar caractersticas descritivas essenciais. Conhecer este grafo de fundamental importncia para muitos estudos. Por exemplo, quando se usa uma ferramenta de busca (Google, por exemplo), a ordem em que as pginas resultantes de uma busca aparecem depende significativamente da estrutura deste grafo. Uma grande dificuldade dos grupos de pesquisa nessa rea a disponibilidade de bases de dados para teste. Aliado a este problema, existe a dificuldade de isolar um sub-Webgraph que mantenha as caractersticas originais do mesmo. Alm disso, poucas so as bases de dados com informao temporal. Para obter um sub-grafo, define-se qual ser o conjunto de ns do grafo mais geral, e ento considera-se os links entre ns deste conjunto. Um exemplo de sub-grafo so as pginas web do Brasil, e o grafo resultante seria o Webgraph brasileiro. Para coletar tal subgrafo necessita-se de uma mquina de busca de grande dimenso, banda de rede o suficiente para coleta (atividade esta onerosa em termos financeiros e computacionais), e capacidade de armazenamento e organizao dos dados. Ou seja, em geral uma tarefa realizada entre colaborao de grupos de pesquisa. Outra possibilidade seria isolar um sub-grafo menor, as pginas da UFRGS, por exemplo. Mas quando o sub-conjunto de ns fica muito restrito, a perda dos links externos pode representar a descaracterizao do grafo. Bases de dados temporais so praticamente inexistentes. Por exemplo, para ter-se informao da data de criao e datas das atualizaes das pginas do Webgrafo brasileiro, seria necessrio fazer sucessivas coletas das pginas e comparao do que mudou entre cada par de coletas. O que certamente resultaria em custos onerosos. Ou usar bases de dados alternativas, como o caso da maior enciclopdia do mundo, Wikipdia [Zambiasi et al., 2007], ou informao de blogs [Kumar et al., 2003]. Finalmente, uma outra possibilidade a gerao de grafos sintticos, cuja maior dificuldade definir as regras para gerao de grafos que mantenham a estrutura dos Webgraph. Existem algumas propostas conhecidas na literatura, das quais podemos citar evolving network model [Albert, Jeon e Barabasi, 1999], copying model [Kumar et al., 2000] e network growth model [Pennock et al., 2002]. No primeiro modelo, novos arcos so inseridos ligando ns selecionados proporcionalmente ao seu grau de sada, enquanto que no segundo modelo, alm da possibilidade usada no primeiro, um arco tem uma probabilidade de ser copiado, mudando apenas o n origem. J o terceiro modelo, os links de sada de cada novo n apontam para ns de acordo com outros fatores, como conectividade e tamanho do conjunto de ns iniciais, alm do grau de sada do mesmo. Desta forma, como desafios para estudo de propriedades e modelagem de Webgraph podemos citar: (i) a localizao de comunidades dentro Webgraph; (ii) a definio de regras de crescimento do Webgraph. Estes dois itens esto fortemente relacionados. A localizao e determinao de comunidades web dentro do Webgraph seria de extrema importncia para caracterizao deste grafo. Mas os mtodos atuais disponveis permitem determinar apenas comunidades web de pequena dimenso [Kumar et al., 1999]. A deteco de comunidades web importante porque foi verificado, empiricamente, que os dados das comunidades web so mais atualizados e em geral mais completos. Dessa forma, o ranking de pginas das comunidades web poderiam ser beneficiados e ganhar prioridade. Um alternativa para o estudo de Webgraphs menores seria se algumas comunidades web amplamente conhecidas apresentarem caractersticas semelhantes a grafos muito maiores. o caso do wikigraph, por exemplo, que o grafo extrado da estrutura de links dos artigos da enciclopdia online Wikipdia. Estudos recentes

2120

apontam semelhanas entre tais grafos [Zambiasi et al., 2007]. Existe uma facilidade muito maior em estudar um grafo do tamanho da wikipdia (poucos milhes de ns), que o webgraph (bilhes de ns). Em vista do que foi discutido acima, prope-se a seguinte abordagem para este estudo: (1) extrao e estudo de sub-webgraphs que mantenham as caractersticas encontradas no webgraph; (2) analisar tais grafos e definir as principais propriedades encontradas; (3) gerar grafos maiores baseados nestas propriedades; (4) verificar se o grafo resultante caracteriza um webgraph. Embora as tarefas listadas acima sejam claras, o como elas sero realizadas ainda no claro. Cada um desses itens tem sido um desafio para pesquisadores de diversas reas, resultando numa gama de publicaes nos ltimos anos. Diversas conferncias e workshops foram recentemente criados para discutir assuntos relacionadas a estes tpicos. Apesar dos avanos, o estudo de propriedades e a modelagem do Webgraph ainda um desafio para a comunidade cientfica.

5. Modelagem e Anlise Formal de Sistemas Biolgicos


Os organismos vivos so sistemas reativos: dependendo de estmulos (condies ambientais e presena ou ausncia de certas substncias), a clula produz uma reao (produzindo as protenas/enzimas adequadas para tratar o estmulo). A informao sobre quais protenas/enzimas devem ser geradas para cada situao est guardada no ncleo, no DNA. A rea de Biologia Molecular comeou a se desenvolver mais intensamente desde o descobrimento da estrutura do DNA, como uma dupla hlice de seqncias de bases (Adenina, Guanina, Citosina e Timina) e do chamado Dogma Central da Biologia Molecular, que explica como a clula transforma informaes contidas no DNA em protenas ou enzimas. O DNA contido em nossas clulas contem informaes precisas sobre as seqncias de bases que geram cada protena, e como e quando essas protenas devem ser produzidas. Fazendo uma analogia, poderamos ver o DNA como o software (englobando dados e programa), e a clula com o hardware biolgico. Com o seqenciamento dos genomas de vrias espcies, temos as listas de bases que esto guardadas nos ncleos das clulas de indivduos dessas espcies. Conhecendo o DNA (software) e o funcionamento da clula (hardware), poderamos entender/prever o comportamento fisiolgico dos seres vivos. Isso possibilitaria, por exemplo, o projeto de remdios e terapias muito mais eficazes. Porm, ainda h um grande caminho a ser percorrido. Este projeto tem como objetivo dar uma contribuio essa rea. Biologia Sistmica [Chong e Ray 2006, Ideker et al 2001] o estudo de um organismo visto como uma rede integrada e interativa de genes, protenas e reaes qumicas que do origem vida. Ao invs de analisar componentes ou aspectos individuais do organismo, como metabolismo de acar ou o ncleo celular, os bilogos desta rea focam em todos os componentes e na interao entre eles, tudo como parte de um nico sistema. Estas interaes so responsveis pela forma e funes de um organismo. O sistema imunolgico, por exemplo, no o resultado de um nico gene ou mecanismo. Na verdade, as interaes de numerosos genes, protenas, mecanismos e o ambiente externo do organismo produzem respostas imunolgicas para combater doenas e infeces. medida que cientistas desenvolvem ferramentas e tecnologias que nos permitem procurar pelas bases da atividade biolgica genes e protenas , aprendemos que estes componentes quase sempre funcionam em conjunto. Eles interagem uns com os outros e com outras molculas de maneiras altamente estruturadas mas incrivelmente

2121

complexas. A Biologia Sistmica procura entender estas interaes complexas, pois elas so a chave para entender a vida. A funo individual e a interao coletiva dos genes, protenas e outros componentes de um organismo so freqentemente caracterizadas em conjunto como uma rede de interao. Na verdade, entender esta interao do genoma de um organismo e as influncias ambientais externas crucial para desenvolver o entendimento sistmico de um organismo. A compreenso das interaes de diversas hierarquias de informao biolgica DNA, RNA, protenas, complexos macromoleculares, redes de sinalizao, clulas, rgos, organismos, espcies dentro de seu contexto ambiental promover novos conceitos e inovaes prticas. Uma questo fundamental como construir modelos abstratos fidedignos para analisar e prever o comportamento de sistemas to complexos. Vrias caractersticas bsicas de sistemas biolgicos (compostos por um nmero enorme de componentes, reatividade, mobilidade dos componentes, comportamento no-determinstico, etc.) so tambm caractersticas encontradas com freqncia crescente em sistemas computacionais. Assim, tcnicas de modelagem adequadas para esses sistemas computacionais poderiam ser utilizadas para modelar sistemas biolgicos. Isso parece ainda mais natural se considerarmos que sistemas biolgicos so tambm programados: o DNA contm o cdigo que governa todo o comportamento desses sistemas (sendo sistemas essencialmente reativos, o controle se d escolhendo as reaes que devem ser realizadas). Na Computao, a rea de software evoluiu de sistemas muito simples, implementaes de funes simples, para sistemas bastante complexos, com milhares de linhas de cdigo em linguagens de alto nvel. Estamos acostumados a desenvolver software em fases, usando tcnicas de refinamentos e modularizao. Na biologia molecular, os processos ainda so descritos ou atravs de conjuntos de equaes matemticas ou atravs de mtodos ad hoc. Existem idias de como modularizar ou descrever refinamentos, mas as tcnicas de engenharia de software, principalmente as baseadas em mtodos formais, poderiam contribuir muito nessa rea. J existem muitos modelos formais para simular redes de interaes biolgicas. Os mtodos mais difundidos so baseados em equaes diferenciais e suas variaes [de Jong 2002]. Porm, estes mtodos procuram modelar as redes em nveis de abstrao bastante baixos, o que dificulta a modelagem de sistemas muito complexos (somente partes muito pequenas podem ser descritas assim, pois o nmero de variveis equaes seria imenso de outra forma). Modelos hbridos, como XS-Systems [Antoniotti et. al. 2003], ou simblicos, como baseados em redes de Petri [Reddy 1994,Goss e Peccound 1998] so mais flexveis nesta caracterstica, mas em geral no permitem descries modulares. Modelos baseados em lgebras de processos, como [Regev et. al. 2004, Pinto et. al. 2007, Danos e Krivine 2003, 2004, Leccal et. Al 2004, Curti et. al. 2004], descrevem bem o comportamento interativo do sistema. Estes modelos so adequados para descrever e analisar as sries de interaes que um sistema pode apresentar. Mas, como no existe uma representao explcita dos estados, a descrio de alguns tipos de sistemas e propriedades dos mesmos (por exempo, propriedades sobre estados alcanveis) difcil. Alm disso, as linguagens de modelagem formal usadas so normalmente bastante difceis de entender para os especialistas da rea biolgica, o que pode ser um grande problema, j que eles deteem o conhecimento da rea na qual a modelagem computacional est sendo utilizada, e portanto so eles que devem validar o modelo proposto. Algumas caractersticas parecem ser fundamentais para um mtodo adequado para a

2122

modelagem de sistemas biolgicos: Reatividade: Componentes de um sistema biolgico reagem a estmulos de outros componentes ou do ambiente. Modelos computacionais para sistemas reativos so a base de modelos para sistemas biolgicos; No-determinismo: Normalmente, existe mais de um caminho para uma reao ser atingida, bem como existe a possibilidade da reao no ser realizada. Assim, um modelo computational adequado deve levar em considerao as probabilidades de ocorrncia de cada ao; Compartimentalizao: Os agentes dos processos biolgicos interagem quando esto fisicamente prximos, em uma mesma regio da clula. Como a clula dividida em compartimentos, precisa-se levar em considerao o local onde o agente est para descrever seu comportamento (os agentes podem se mover entre os compartimentos). Alm dessas caractersticas, outras, como economia de energia e falhas nos processos (processos biolgicos so bastante suscetveis a erros), tambm podem ter papel importante na modelagem. Para que se consiga construir modelos abstratos realmente fidefignos dos processos biolgicos, alguns requisitos do mtodo de modelagem so necessrios: Modularidade: A tcnica bsica para permitir a descrio de sistemas complexos a diviso do modelo em componentes. Cada componente deve ter sua interface bem definida, e tcnicas de abstrao e refinamento devem ser usadas durante o processo de construo do modelo. User-friendlyness: Qualquer modelo formal deve ser validado para ser til. Pode-se utilizar tcnicas de verificao formal para auxiliar neste processo (provando-se, por exemplo, que o modelo tem determinadas propriedades). Porm, seria extremamente importante que os especialistas da rea biolgica pudessem entender e discutir o modelo, ao invs de apenas acreditar que ele realmente a abstrao da realidade que se est tentando representar. Neste sentido, linguagens formais adequadas, ou seja, que facilitem o entendimento do modelo a profissionais desta rea de aplicao, so um requisito desejvel. A definio de uma ou um conjunto de tcnicas para modelagem de sistemas biolgicos que permita a descrio integrada das caractersticas listadas acima, atenda os requisitos e ainda permita a anlise do modelo gerado (usando no somente simulao, mas tambm tcnicas de prova de propriedades sobre os modelos) um grande desafio para a rea de Computao. Os impactos da pesquisa nesta rea so imensos, indo desde o melhor entendimento do nosso corpo (entendendo como a natureza computa), at o desenvolvimento de drogas e terapias realmente eficazes no tratamento de doenas (somente entendendo realmente um processo somos capazes de interferir nele para gerar com segurana os resultados que queremos).

6. Modelagem de Sociedades Financeiras Artificiais: Tpicos em Economia Computacional


Reproduzir resultados reais relativos a previses do mercado financeiro atravs de algoritmos, tem sido o sonho de muitos cientistas, como matemticos, cientistas de computao e fsicos. Embora essa idia seja tentadora, no menos importante observar o comportamento emergente de aspectos financeiros do mercado ou mesmo de sociedades, fazendo simulaes computacionais de agentes sob diferentes estratgias. Embora este ltimo no traga uma importncia imediata para muitos seres ela pode trazer importantes resultados que imitem sociedades reais em importantes aspectos, como a distribuio de riqueza, medidas das desigualdades sociais (atravs do chamado coeficiente de Gini1), comportamento de grupos que tendem a investir em relao a bem
1 (Por exemplo: http://pt.wikipedia.org/wiki/Coeficiente_de_Gini)

2123

pblicos [R. da Silva et al 2006] dentre outros, o que geralmente pode ser feito "inventando" sociedades financeiras artificiais, sob certos vnculos e regras em uma rede ou mesmo em um regime onde todos interagem com todos, conhecido na literatura como regime de campo mdio. Dentre as principais vertentes onde supomos que cientistas de computao possam dar importantes contribuies para a modelagem ou anlise de sistemas econmicos com grande necessidade computacional, destacamos trs linhas principais: (1) Anlise de sries financeiras reais; Neste caso usam-se modelos de ajuste e previso para modelar sries de retorno, preo e outros importantes indicativos do mercado. Nesta linha encontram-se mais os estatsticos concentrando-se principalmente na inferncia de parmetros de por exemplo, distribuies dos retornos, autocorrelaes em sries temporais financeiras dentre outros bem como utilizar estas sries para realizar previses utilizando modelos de regresso [P. A. Morettin, 2006]. Nesta linha os cientistas de computao podem e devem interferir por exemplo com mtodos de data mining dentre outros bem como a introduo de novos algoritmos de previso, que levem em conta aspectos gerais e locais na previso etc. (2) Modelo multi-agente em sistemas econmicos: Aqui os cientistas de computao j vem dando importantes contribuies em conjunto com fsicos e matemticos [H. Takahashi, T. Terano 2003, E. Samanidou 2007]. Trata-se de modelos onde os agentes seguem regras para comprar e vender aes e ento se pode estudar a dinmica financeira que emerge deste sistema complexo. Neste caso pode-se colocar uma srie de adendos, tais como aprendizagem por reforo, diferentes regras para os agentes decidir a compra ou venda etc. Ressaltamos como um ponto importante a ser simulado, sistemas com portiflio variado [L.A.M. Garcia, R. da Silva 2007] ainda foi pouco explorado na literatura e merece uma ateno especial, pois ainda no foi considerado em aclamados (veja por exemplo [H. Takahashi, T. Terano 2003, E. Samanidou 2007]). Definitivamente a idia fundamental para quem quer trabalhar com economia computacional trazer economistas para que estas idias comecem a ser incorporadas na rgida teoria econmica, tradicionalmente desenvolvida apenas por economistas. (3) A teoria evolucionria dos jogos para descrever sociedades financeiras: Neste caso pode-se estar interessados em simular qual o ganho mdio e as possveis flutuaes disso em uma sociedade hetergenea (multi-estratgica) cujas negociaes por comida, ou por recursos, sejam descritas por protocolos prescritos pela teoria clssica de jogos e que evoluem temporalmente com evoluo de estratgias [R.da Silva, G.A. Kellermann 2007, G. A. Kellermann, R. da Silva 2007]. A idia observar diagramas bi e tridimensionais de parmetros que indicam regies onde uma estratgia seja dominante sobre as outras. Alm disso, pode-se estudar a evoluo das densidades de estratgias e at mesmo a sobrevivncia de estratgias em redes ou simplesmente em regimes de campo mdio (onde um jogador interage com todos os outros jogadores) escolhidos aleatoriamente para enfrentarem-se. Sob um grande nmero de repeties conveniente e importante observar as possveis distores destas verses evolucionrias de jogos com relao aos equilbrios de Nash existentes na verso clssica.

7. Concluses
Em resposta aos desafios propostos pela Sociedade Brasileira de Computao, este artigo prope cinco linhas de pesquisa relevantes no desenvolvimento de sistemas computacionais complexos. Estas linhas de pesquisa tm impactos potenciais cientficos e sociais altos, pois esto diretamente relacionados cognio humana, ao

2124

desenvolvimento de sistemas para a web, biologia computacional, econofsica e modelos scio-econmicos, interao do homem com computadores e com a natureza. A construo de sistemas complexos artificiais, biologicamente inspirados ou no, constitui-se em um grande desafio cincia da computao e s demais cincias, pois evidncias cientficas e tecnolgicas apontam para o aumento da interao entre a computao e virtualmente todos os domnios do conhecimento humano. No entanto, para que a hipottica promessa de impacto tecnolgico seja realizada, necessrio que pesquisadores e profissionais estejam preparados para modificar e adaptar suas prticas de trabalho. Isto corrobora a necessidade de novas prticas de pesquisa, exigindo equipes multi-disciplinares e com forte conhecimento cientfico fundamental. Este conhecimento essencial, na nossa opinio, para permitir a construo de sistemas computacionais complexos.

8. Referncias
Antoniotti, M., Policriti, A., Ugel, N., and Mishra, B. (2003). Model building and model checking for biochemical processes. Cell Biochem Biophys, 38(3):27186. Berwick, R. and Niyogi, P. (1985) Learning from Triggers. Linguistic Inquiry, 27(4): 605-622. Boldi, P., and S. Vigna (2004), The WebGraph Framework I: Compression Techniques, Proc. of the 13th World Wide Web Conference, p. 595-601. Briscoe, T. (1999) The Acquisition of Grammar in an Evolving Population of Language Agents. Machine Intelligence 16: Elec. Trans. in Artificial Intelligence. Chomsky, Noam (1965) Aspects of the Theory of Syntax. MIT Press. Chomsky, Noam (1995) The Minimalist Program. MIT Press,. Chong, L. and Ray, L.B. (2002). Whole-istic Biology. Science, 295(5560):1661 Curti, M., Degano, P., Priami, C., and Baldari, C. T. (2004). Modelling biochemical pathways through enhanced -calculus. Theor. Comput. Sci. 325(1):111140. Danos, V. and Krivine, J. (2003). Formal molecular biology done in CCS-R. In BioConcur03, satellite workshop of CONCUR03, ENTCS. Danos, V. and Krivine, J. (2004). Reversible communicating systems. In CONCUR 2004 - Concurrency Theory, volume 3170 of LNCS, pages 292307. Springer-Verlag. de Jong, H. (2002). Modeling and simulation of genetic regulatory systems: A literature review. Journal of Computational Biology, 9(1):67103. O'Donovan, R., Burke, M., Cahill, A., Van Genabith, J., Way, A. (2004). Large-Scale Induction and Evaluation of Lexical Resources from the Penn-II Treebank. Proc. of the 42nd Annual Meeting of the Association for Computational Linguistics, p. 319-326. Garcez, A. S. and Lamb, L.C. (2006). A Connectionist Computational Model for Epistemic and Temporal Reasoning. Neural Computation 18(7):1711-1738. MIT Press. Garcia, L.A.M. and da Silva, R. (2007), A new look about statistical modelling of financial artificial markets via multi-agent systems. in preparation Gaume, B. (2004). Balades Alatoires dans les Petits Mondes Lexicaux. In I3 Information Interaction Intelligence , CEPADUES d. : 39-96.

2125

Goss, P.J.E. and Peccoud, J. (1998). Quantitative modeling of stochastic systems in molecular biology by using stochastic Petri nets. PNAS, 95(12):67506755. Gulli, A. and Signorini, A. (2005), The indexable web is more than 11.5 billion pages, Proc. of the 14th World Wide Web Conference, p. 902-903. Halpern, J.Y., Harper, R., Immerman, N., Kolaitis, P., Vardi, M.Y., Vianu, V. (2001) On the Unusual Effectiveness of Logic in Comp. Science.Bull. Symb. Logic. 7(2):213-236. Hinton, Geoffrey E. (2005). What Kind of Graphical Model is the Brain?. Proc. of the Intl. Joint Conf. on Artificial Intelligence (IJCAI-05), pp. 1765-1775. Hoare, C.A.R. and Milner, A.J.R. (2004) (eds.) Grand Challenges in Computing Research. ISBN 1-902505-62-X. British Computer Society. Ideker, T., Galitski, T., and Hood, L. (2001). A new approach to decoding life: Systems biology. Annu. Rev. Genomics Hum. Genet., 2:343372. Jurafsky,D. and Martin, J.H. (2000). Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition. Prentice-Hall. Kellerman, G.A. and da Silva, R. (2007) Statistical aspects of payoff over mean field regime in a heterogeneous population of the ultimatum players, preprint, Elsevier. Kumar, R., Novak, J., Raghavan, P., Tomkins, A. (2003), On the bursty evolution of blogspace, Proc. of the 12th World Wide Web Conference, p. 568576. Kumar, R., Raghavan, P., Rajagopalan, S., Sivakumar, D., Tomkins, A., Upfal, E. (2000) Stochastic Models for the Web Graph. Proc. of the 41st FOCS, p. 57-65. Kumar, R., Raghavan, P., Rajagopalan, S., Tomkins, A. (1999), Trawling the Web for Emerging Cyber Communities. Proc. 8th World Wide Web Conference, p. 403-416. Lamb, Luis C., Borges, R.V., Garcez, Artur S. (2007). A Computational Cognitive Model for Temporal Synchronisation and Learning. 22nd Conf. AAAI-07. AAAI Press. Lecca, P., Priami, C., Quaglia, P., Rossi, B., Laudanna, C., and Costantin, G. (2004) A stochastic process algebra approach to simulation of autoreactive lymphocyte recruitment. SIMULATION 80:273288. MacWhinney, B. (2000) The CHILDES project: Tools for analyzing talk. Erlbaum. Manning, C. and Schtze, H. (1999). Foundations of Statistical Natural Language Processing. MIT Press. Metropolis, N., Rosenbluth, A., Rosenbluth, M., Teller, A., Teller, E. (1953) Equations of State calculations by fast computing machines. J. Chem. Phys. 21, 1087. Moretin, P.A. (2006) "Um curso em sries temporais financeiras", 17 SINAPE, ABE. Pennock, D.M., Flake, G.W., Lawrence, S., Glover, E.J., Giles, C.L. (2002), Winners don't take all: Characterizing the competition for links on the web, PNAS 99(8): 5207-. Pinker, S. (1984) Language Learnability and Language Development. Harvard University Press. Pinto, M.C., Foss, L., Mombach, J.C.M., and Ribeiro, L. (2007). Modelling, property verification and behavioural equivalence of lactose operon regulation. Computers in

2126

Biology and Medicine, 37:134148. Pollard, C. and Sag, I.A. (1989). Information-Based Syntax and Semantics. CSLI Pub. Raghavan, S. and Garcia-Molina, H. (2003), Representing Web Graphs, Proc. of the 19th Conference on Data Engineering. p. 405-416 Reddy, V.N. (1994). Modeling biochemical pathways: a discrete event systems approach. MS thesis, University of Maryland. Regev, A., Panina, E.M., Silverman, W., Cardelli, L. and Shapiro, E. (2004). Bioambients: an abstraction for biological compartments. Theoretical Computer Science 325(1):141167. Richardson, M. and Domingos, P. (2006): Markov logic networks. Machine Learning 62(1-2): 107-136. Sakas, W. and Fodor, J. (2001). The Structural Triggers Learner. Language Acquisition and Learnability. S. Bertolo ed., p. 172-233, Cambridge University Press,. Samanidou, E., Zschischang, E., Stauffer, D., and Lux, T. (2007) Agent-based models of financial markets. Rep. Prog. Phys. 70, 409--450 da Silva, R., Bazzan, A.L.C., Baraviera, A.T., Dahmen, S.R. (2006) Emerging collective behavior and local properties of financial dynamics in a public investment game, Physica. A, 371, 610-626 da Silva, R., Bazzan, A.L.C., Baraviera, A.T., Dahmen, S.R. (2006), Dynamics of a Public Investment Game: from Nearest-Neighbor Lattices to Small-World Networks. Lecture Notes in Economics and Mathematical Systems, 584:211-233 da Silva, R. and Kellerman, G. A. (2007), Analyzing the payoff of a heterogeneous population in the ultimatum game. submitted to Physical Review E. Stanley, H.E. (1971), Introduction to Phase Transitions and Critical Phenomena. Oxford University Press. Takahashi, H., Terano, T. (2003), Agent-Based Approach to Investors' Behavior and Asset Price Fluctuation in Financial Markets. JASSS, 6(3). Thagard, P. (1996). Mind: Introduction to Cognitive Science. MIT Press. Turing, A.M. (1950). Computing machinery and intelligence. Mind, 59, 433-460. Valiant, L.G. (2003). Three problems in computer science. J. ACM, 50(1):96-99. Villavicencio, A. (2002) The Acquisition of a Unification-Based Generalised Categorial Grammar. PhD Thesis. Computer Laboratory, University of Cambridge,. Wigner, E.P. (1960) On the Unreasonable Effectiveness of Mathematics in the Natural Sciences. Communications in Pure and Applied Mathematics 13:1-14. Zambiasi, M., Presa, T.A., Buriol, L.S., Orengo, V.M. (2007) Anlise quantitativa e temporal do Wikigrafo-PT, Anais da Escola Regional de Banco de Dados. p. 22-31. Zhang, Y., Kordoni, V., Villavicencio, A., Idiart, M. (2006). Automated multiword expression prediction for grammar engineering. Proc. of the Workshop on Multiword Expressions:, p. 3644, Sydney, Australia. Association for Computational Linguistics.

2127