Você está na página 1de 7

Breve histria da Inteligncia Artificial

Guilherme Bittencourt Departamento de Automao e Controle Universidade Federal de Santa Catarina 88040-900 Florianpolis SC Brasil Fone: +55 (48) 331 9202 Fax: +55 (48) 331 9770 E-mail: gb@lcmi.ufsc.br Internet: http://www.lcmi.ufsc.br/~gb

Introduo
As correntes de pensamento que se cristalizaram em torno da IA j estavam em gestao desde os anos 30 [BF81]. No entanto, oficialmente, a IA nasceu em 1956 com uma conferncia de vero em Dartmouth College, NH, USA. Na proposta dessa conferncia, escrita por John McCarthy (Dartmouth), Marvin Minsky (Hardward), Nathaniel Rochester (IBM) e Claude Shannon (Bell Laboratories) e submetida fundao Rockfeller, consta a inteno dos autores de realizar ``um estudo durante dois meses, por dez homens, sobre o tpico inteligncia artificial''. Ao que tudo indica, esta parece ser a primeira meno oficial expresso ``Inteligncia Artificial'' [McC79]. Desde seus primrdios, a IA gerou polmica, a comear pelo seu prprio nome, considerado presunoso por alguns, at a definio de seus objetivos e metodologias. O desconhecimento dos princpios que fundamentam a inteligncia, por um lado, e dos limites prticos da capacidade de processamento dos computadores, por outro, levou periodicamente a promessas exageradas e s correspondentes decepes. Dada a impossibilidade de uma definio formal precisa para IA, visto que para tanto seria necessrio definir, primeiramente, a prpria inteligncia, foram propostas algumas definies operacionais: ``uma mquina inteligente se ela capaz de solucionar uma classe de problemas que requerem inteligncia para serem solucionados por seres humanos'' [MH69]; ``Inteligncia Artificial a parte da cincia da computao que compreende o projeto de sistemas computacionais que exibam caractersticas associadas, quando presentes no comportamento humano, inteligncia'' [BF81]; ou ainda ``Inteligncia Artificial o estudo das faculdades mentais atravs do uso de modelos computacionais'' [CM85]. Outros se recusam a propor uma definio para o termo e preferem estabelecer os objetivos da IA: ``tornar os computadores mais teis e compreender os princpios que tornam a inteligncia possvel'' [Win84].

Histria
Existem duas linhas principais de pesquisa para a construo de sistemas inteligentes: a linha conexionista e a linha simblica . A linha conexionista visa modelagem da inteligncia humana atravs da simulao dos componentes do crebro, isto , de seus neurnios, e de suas interligaes. Esta proposta foi formalizada inicialmente em 1943, quando o neuropsiclogo McCulloch e o lgico Pitts propuseram um primeiro modelo matemtico para um neurnio. Um primeiro modelo de rede neuronal , isto , um conjunto de neurnios interligados, foi

proposto por Rosenblatt. Este modelo, chamado Perceptron , teve suas limitaes demonstradas por Minsky e Papert [MP69] em livro onde as propriedades matemticas de redes artificiais de neurnios so analisadas. Durante um longo perodo essa linha de pesquisa no foi muito ativa, mas o advento dos microprocessadores, pequenos e baratos, tornou praticvel a implementao de mquinas de conexo compostas de milhares de microprocessadores, o que, aliado soluo de alguns problemas tericos importantes, deu um novo impulso s pesquisas na rea. O modelo conexionista deu origem rea de redes neuronais artificiais. A linha simblica segue a tradio lgica e teve em McCarthy e Newell seus principais defensores. Os princpios dessa linha de pesquisa so apresentados no artigo Physical symbol systems de Newell [New80]. O sucesso dos sistemas especialistas (SE) (do ingls, ``expert system''), a partir da dcada de setenta, estabeleceu a manipulao simblica de um grande nmero de fatos especializados sobre um domnio restrito como o paradigma corrente para a construo de sistemas inteligentes do tipo simblico. Para facilitar a apresentao, vamos dividir a histria da IA simblica em ``pocas'', conforme proposto em relatrios internos do MIT (Massachusetts Institute of Technology): Clssica (1956-1970)

Objetivo: simular a inteligncia humana Mtodos: solucionadores gerais de problemas e lgica Motivo do fracasso: subestimao da complexidade computacional dos problemas

Romntica (1970-1980)

Objetivo: simular a inteligncia humana em situaes pr-determinadas. Mtodos: formalismos de representao de conhecimento adaptados ao tipo de problema, mecanismos de ligao procedural visando maior eficincia computacional. Motivo do fracasso: subestimao da quantidade de conhecimento necessria para tratar mesmo o mais banal problema de senso comum.

Moderna (1980-1990)

Objetivo: simular o comportamento de um especialista humano ao resolver problemas em um domnio especfico. Mtodos: Sistemas de regras, representao da incerteza, conexionismo. Motivo do fracasso: subestimao da complexidade do problema de aquisio de conhecimento.

Clssica
Inicialmente, a pesquisa em manipulao de smbolos se concentrou no desenvolvimento de formalismos gerais capazes de resolver qualquer tipo de problemas. O sistema GPS, General Problem Solver, projetado por Ernst e Newell [EN69], um exemplo deste tipo de pesquisa. Estes esforos iniciais ajudaram a estabelecer os fundamentos tericos dos sistemas de smbolos e forneceram rea da IA uma srie de tcnicas de programao voltadas manipulao simblica, por exemplo, as tcnicas de busca heurstica. Os sistemas gerais desenvolvidos nesta poca obtiveram resultados interessantes, por vezes at impressionantes,

mas apenas em domnios simplificados, onde o objetivo era principalmente a demonstrao da tcnica utilizada, e no a soluo de um problema real. O problema com os sistemas gerais que a sua extenso a domnios de problemas reais se mostrou invivel. Isto se deveu a duas razes, uma relacionada com caractersticas tericas dos mtodos utilizados, e outra associada natureza do conhecimento do mundo real. A razo terica conseqncia do uso, nos sistemas gerais, de modelos baseados em lgica de primeira ordem como formalismo bsico. A utilizao desses modelos leva chamada exploso combinatria : a memria e o tempo necessrios para resolver um determinado problema cresce exponencialmente com o tamanho do problema. Este problema, descrito por Cook em seu artigo The complexity of theorem proving procedures [Coo71], inerente aos mtodos baseados em lgica, independentemente das tcnicas de programao utilizadas. A segunda razo est associada ao fato de que, freqentemente, o conhecimento disponvel sobre o mundo real incompleto e parcialmente incoerente, e que por vezes a nica forma de soluo conhecida para determinados problemas reais consiste em uma srie de regras prticas no fundamentadas por nenhum tipo de teoria geral do domnio que pudesse ser usada para orientar a soluo. Esta situao levou a dois tipos diferentes de soluo: (i) uso de mtodos formais de inferncia mais fracos do que a lgica de primeira ordem que garantissem uma certa eficincia aos programas, por exemplo, lgicas multivalores [PS85], [Bel77] e linguagens terminolgicas [BW77]. (ii) Desenvolveram-se mtodos heursticos e lgicas no convencionais para permitir a representao de crenas, incoerncias e incompletudes, por exemplo, lgica modal [HM85], lgica de excees [Rei80] e lgica nebulosa [Zad79].

Romntica
Durante a dcada de setenta, a IA estava praticamente restrita ao ambiente acadmico. Os objetivos da pesquisa eram, principalmente, a construo de teorias e o desenvolvimento de programas que verificassem estas teorias para alguns poucos exemplos. interessante notar que o fato de que no havia interesse em construir programas de IA ``de verdade'', isto , com aplicaes prticas, no se deve a uma eventual incompetncia em programao dos pesquisadores em IA. Pelo contrrio, foi a inspirao desses ``hackers'' que levou a conceitos hoje integrados cincia da computao, como: tempo compartilhado, processamento simblico de listas, ambientes de desenvolvimento de ``software'', orientao objeto, etc., alm da mudana da relao usurio-computador ao eliminar a intermediao de um operador e colocar cada usurio diante de sua estao de trabalho. Uma mudana importante ocorreu ao longo da dcada de setenta em relao aos critrios acadmicos de julgamento de trabalhos em IA: houve uma crescente exigncia de formalizao matemtica. Se no incio dos anos setenta, um programa, mesmo tratando de alguns poucos exemplos de um problema at ento no tratado, j era considerado IA, isto no acontecia mais em 1980. O programa em si passou a ser a parte menos importante; a anlise formal da metodologia, incluindo decidibilidade, completude e complexidade, alm de uma semntica bem fundada, passou a ser o ponto fundamental [Hay77], [McD78]. A dcada de setenta marcou tambm a passagem da IA para a ``vida adulta'': com o aparecimento dos primeiros SE's, a tecnologia de IA passou a permitir o desenvolvimento de sistemas com desempenho

intelectual equivalente ao de um ser humano adulto, abrindo perspectivas de aplicaes comerciais e industriais.

Moderna
A tecnologia de SE disseminou-se rapidamente e foi responsvel por mais um dos episdios ligados a promessas no cumpridas pela IA: o sucesso dos primeiros SE's chamou a ateno dos empresrios, que partiram em busca de um produto comercializvel que utilizasse esta tecnologia. No entanto, um SE no era um produto: um produto, na viso dos empresrios, no deveria ser um sistema especfico para um dado problema, mas algo que fosse implementado uma nica vez e vendido em 100.000 unidades, por exemplo, uma ferramenta para a construo de sistemas especialistas (ASE) . Com isso foram colocadas no mercado uma grande quantidade de ASE's que prometiam solucionar o problema de construo de SE's. A conseqncia foi uma grande insatisfao por parte dos usurios, pois, apesar de uma ferramenta de programao adequada ajudar muito a construir um sistema complexo, saber o que programar continua sendo o ponto mais importante. Se os ASE's deveriam ser vendidos como produtos de IA, ento em algum lugar deveria haver IA, e o lugar escolhido foi o motor de inferncia , que passou a ser considerado como sinnimo de IA. Isto levou iluso de que para construir um SE bastaria comprar um ASE, enquanto que a verdade que a IA em um SE est basicamente na forma como representado o conhecimento sobre o domnio, isto , onde a IA sempre esteve: na tentativa de entender o comportamento inteligente a ser modelado, no caso o comportamento do especialista ao resolver um problema. Uma outra conseqncia desta viso distorcida dos ASE's foi a pouca nfase dada inicialmente aquisio de conhecimento , certamente a parte mais difcil do desenvolvimento de um SE. Se exageros existiram na publicidade dos ASE's, por certo houve tambm trabalhos descrevendo com fidelidade o potencial e as limitaes da nova tecnologia (por exemplo, [DK77], [HRWL83] e [Wat86]). Atualmente, os ASE's so considerados como parte de uma tecnologia de desenvolvimento de ``software'' estabelecida, sendo objeto de diversas conferncias internacionais e submetida a avaliaes rigorosas de desempenho (por exemplo, [SMS92]). Entre os diversos benefcios associados ao desenvolvimento de SE's podem-se citar: distribuio de conhecimento especializado, memria institucional, flexibilidade no fornecimento de servios (consultas mdicas, jurdicas, tcnicas, etc.), facilidade na operao de equipamentos, maior confiabilidade de operao, possibilidade de tratar situaes a partir de conhecimentos incompletos ou incertos, treinamento, entre outros. Atualmente, existem milhares de SE's em operao nos mais variados domnios, e a influncia da IA em outros campos da computao, como engenharia de ``software'', bancos de dados e processamento de imagens vem crescendo constantemente. As principais reas de pesquisa em IA simblica so atualmente: sistemas especialistas, aprendizagem, representao de conhecimento, aquisio de conhecimento, tratamento de informao imperfeita, viso computacional, robtica, controle inteligente, inteligncia artificial distribuda, modelagem cognitiva, arquiteturas para sistemas inteligentes, linguagem natural e interfaces inteligentes. Alm das linhas conexionista e simblica, observa-se hoje o

crescimento de uma nova linha de pesquisa em IA, baseada na observao de mecanismos evolutivos encontrados na natureza, tais como a auto-organizao e o comportamento adaptativo. Nesta linha, os modelos mais conhecidos so os algoritmos genticos e os autmatos celulares [Bar75], [FTW83], [GH88], [Hol75] e [Hol86]. A gradativa mudana de metas da IA, desde o sonho de construir uma inteligncia artificial de carter geral comparvel do ser humano at os bem mais modestos objetivos atuais de tornar os computadores mais teis atravs de ferramentas que auxiliam as atividades intelectuais de seres humanos, coloca a IA na perspectiva de uma atividade que praticamente caracteriza a espcie humana: a capacidade de utilizar representaes externas, seja na forma de linguagem, seja atravs de outros meios [Hil89]. Deste ponto de vista, a computao em geral e a IA em particular so o ponto culminante de um longo processo de criao de representaes de conhecimento, iniciado com as primeiras pinturas rupestres. Esta nova perspectiva coloca os programas de IA como produtos intelectuais no mesmo nvel dos demais, ressaltando questes cuja importncia central para os interesses atuais da IA, por exemplo, como expressar as caractersticas individuais e sociais da inteligncia utilizando computadores de maneira a permitir uma maior produtividade, e como as propriedades das representaes utilizadas auxiliam e moldam o desenvolvimento de produtos intelectuais?

Bibliography
Bar75 A.G. Barto. Cellular Automata as Models of Natural Systems. The University of Michigan, 1975. Bel77 N.D. Belnap. A useful four-valued logic. In J.M. Dunn and G. Epstein, editors, Modern Uses of Multiple-Valued Logics. D. Reidel Pub. Co., 1977. BF81 A. Barr and E.A. Feigenbaum, editors. The Handbook of Artificial Intelligence, volume I-II. William Kaufmann Inc., Los Altos, California, 1981. BW77 D.G. Bobrow and T. Winograd. An overview of KRL, a knowledge representation language. Cognitive Science, 1(1):3-46, 1977. CM85 E. Charniak and D. McDermott. Introduction to Artificial Intelligence. Addison-Wesley Publishing Company, Reading, MA, 1985. Coo71 S.A. Cook. The complexity of theorem-proving procedures. In Proceedings of the 3rd Annual ACM Symposium on Theory of Computing, ACM, New York, pages 151-158, 1971. DK77

R. Davis and J.J. King. An overview of productions systems. In E. Elcock and D. Michie, editors, Machine Intelligence, volume 8, pages 300-332. Ellis Horwood, Chichester, England, 1977. EN69 G. Ernst and A. Newell. GPS: A Case Study in Generality and Problem Solving. Academy Press, New York, 1969. FTW83 J.D. Farmer, T. Toffoli, and S. Wolfram. Cellular Automata: Proceedings of an Interdisciplinary Workshop at Los Alamos. New Mexico, North-Holland, Amsterdam, March 7-11 1983. GH88 D.E. Goldberg and J.H. Holland. Genetic algorithms and machine learning: Introduction to the special issue on genetic algorithms. Machine Learning, 3, 1988. Hay77 P.J. Hayes. In defense of logic. In Proceedings of IJCAI 5, pages 559-565, 1977. Hil89 W.C. Hill. The mind at ai: Horseless carriage to clock. The AI Magazine, pages 29-41, Summer 1989. HM85 J.Y. Halpern and Y.O. Moses. A guide to the modal logics of knowledge and belief. In Proceedings of IJCAI 9, pages 480-490, 1985. Hol75 J.H. Holland. Adaptation in Natural and Artificial Systems. University of Michigan Press, Ann Arbor, 1975. Hol86 J.H. Holland. Escaping brittleness: The possibilities of general purpose learning algorithms applied to parallel rule-based systems. In R.S. Mishalski, J.G. Carbonell, and T.M. Mitchell, editors, Machine Learning 2, pages 593-623. Kaufman, 1986. HRWL83 F. Hayes-Roth, D.A. Waterman, and D.B. Lenat. Building Expert System. Addison-Wesley Publishing Company, Reading, MA, 1983. McC79 P. McCorduck. Machines Who Think. Freeman, San Francisco, 1979. McD78

J. McDermott. Tarskian semantics, or no notation without denotation. Cognitive Science, 2(3):277-282, July-September 1978. MH69 J. McCarthy and P.J. Hayes. Some philosophical problems from the standpoint of artificial intelligence. In D. Michie and B. Meltzer, editors, Machine Intelligence 4, pages 463-502. Edinburgh University Press, Edinburgh, GB, 1969. MP69 M.L. Minsky and S.A. Papert. Perceptrons: An Introduction to Computational Geometry. M.I.T. Press, 1969. New80 A. Newell. Physical symbol systems. Cognitive Science, 4:135-183, 1980. PS85 P.F. Patel-Schneider. A decidable first-order logic for knowledge representation. In Proceedings of IJCAI 9, pages 455-458, 1985. Also AI Technical Report Number 45, Schlumberger Palo Alto Research. Rei80 R. Reiter. A logic for default reasoning. Artificial Intelligence, 13(1-2):81-132, April 1980. SMS92 A.C. Stylianou, G.R. Madey, and R.D. Smith. Selection criteria for expert system shells: A socio-technical framework. Communications of the ACM, 35(10):32-48, October 1992. Wat86 D.A. Waterman. A Guide to Expert Systems. Addison-Wesley Publishing Company, Reading, MA, 1986. Win84 P.H. Winston. Artificial Intelligence (2nd Edition). Addison-Wesley Publishing Company, Reading, MA, 1984. Zad79 L.A. Zadeh. A theory of approximate reasoning. In D. Mitchie J.E. Hayes and L.I. Mikulich, editors, Machine Intelligence 9. Wiley Masson, New York, 1979.

Você também pode gostar