Você está na página 1de 6

Estudos Lingsticos XXVI (Anais de Seminrios do GEL) Trabalho apresentado no XLIV Seminrio do GEL na UNITAU - Taubat, em 1996 UNICAMP-IEL

Campinas (1997), 352-357

PARSER: UM ANALISADOR SINTTICO E SEMNTICO PARA SENTENAS DO PORTUGUS

Joo Lus Garcia ROSA (PUCCAMP)

ABSTRACT: This work aims at the analysis and implementation of a semantic parser for oral portuguese sentences. Its approach is based in word thematic role networks. A subset of Portuguese grammar is implemented in Prolog, a programming language based on predicate logic. The system includes morphological analysis, syntactic analysis, and semantic analysis that generates a logical form of the input sentence. KEY WORDS: parser, semantic analysis, logical form, natural language processing.

0 - INTRODUO O objetivo deste projeto propor a anlise e implementao de um parser semntico para sentenas da lngua portuguesa oral, utilizando uma abordagem baseada nas redes de papis temticos das palavras. Est em desenvolvimento no Instituto de Estudos da Linguagem da UNICAMP, um projeto de um sintetizador de fala em conjunto com a Faculdade de Engenharia Eltrica da UNICAMP. A idia deste projeto gerar a linguagem oral, a partir de um texto escrito. necessrio um parser que transformar o texto escrito, num determinado padro, com marcas hierrquicas, que alimentar um outro mdulo, que se encarregar do restante da anlise (anlise fonolgica, etc.). Como parte do meu projeto de tese de Doutorado, devo participar deste parser, que dever estabelecer fronteiras sintticas (relaes entre as palavras) e informaes relativas s relevncias das palavras, etc. O parser pode ser assim descrito:

Lxico

Semntica

PARSER
O lxico deve conter o vocabulrio usado pelo parser. Deve conter elementos de anlise lingstica, estrutura e inter-relacionamento das palavras. A semntica deve incluir a

forma lgica, etc., mecanismos para permitir a inferncia lgica. Em relao ao parser propriamente dito, vrias abordagens podem ser consideradas.

1 - IMPLEMENTAO A implementao computacional de um fragmento de gramtica foi feita atravs da linguagem de programao lgica Prolog (do francs, Programmation em Logique), onde os comandos da linguagem so transposies de frmulas da lgica de predicados de primeira ordem. Justamente por este fato preferiu-se implementar uma gramtica livre de contexto, baseada em eventos e papis temticos. Este analisador semntico fornece vrias formas lgicas possveis de sentenas declarativas da lngua portuguesa, analisando o determinante usado e fornecendo o quantificador para o mesmo. A gramtica inclui a conjuno de sentenas, possibilitando a utilizao de anforas (pronomes pessoais) na segunda sentena da conjuno. Inclui tambm sintagmas preposicionais, atravs das chamadas com-SN, isto , um sintagma nominal iniciando com a palavra com . Isto permite com que o analisador fornea duas leituras para sentenas como O homem abateu o menino com a maleta obtendo-se uma forma lgica onde maleta o instrumento de abateu e tambm a forma onde maleta objeto de posse de menino. O programa inclui tambm, uma anlise morfolgica, que classifica cada verbo regular, em todos os tempos verbais e cada substantivo, adjetivo, etc. em gnero e nmero. Alguns verbos irregulares foram includos, como ser, estar, etc. Deve-se considerar, entretanto, que se trata apenas de uma primeira verso de um parser, que certamente servir de base para o projeto maior. Vrias consideraes lingsticas tero de ser revistas. O sistema inclui diversos advrbios, segundo a classificao de Ilari et alli (1990), entre os quais os predicativos qualitativos e intensificadores, os sentenciais (modalizadores e aspectualizadores) e os no-predicativos (negao). Como a anlise fornece a forma lgica baseada em eventos, optou-se por declarar como adjunto o advrbio que acompanha o verbo, o nome ou o adjetivo. Na linguagem Prolog, no trivial, talvez nem mesmo possvel, a implementao de predicao de segunda ordem. Optou-se por usar a notao baseada em eventos, onde o verbo o elemento principal da sentena que atribui papis temticos aos outros elementos que o acompanham. A implementao consiste de um lxico pequeno, onde se define apenas as formas singulares das palavras (a anlise morfolgica se encarregar de descobrir o nmero). Consiste tambm das terminaes dos verbos regulares, para todos os tempos do modo indicativo. Foram includos tambm alguns verbos irregulares. O programa dispe de uma tela de informao sobre o lxico armazenado. A anlise se baseia numa gramtica

353

sintagmtica, a Gramtica de Clusulas Definidas, de Pereira e Warren (1980). Caso a sentena seja agramatical, ou caso o sistema no possua previso de anlise, o parser rejeita a sentena.

RESUMO: Este trabalho prope a anlise e implementao de um parser semntico para sentenas da lngua portuguesa oral, utilizando uma abordagem baseada nas redes de papis temticos das palavras. Foi implementado um fragmento de gramtica em Prolog, uma linguagem de programao baseada em lgica. O sistema inclui uma anlise morfolgica, uma anlise sinttica e uma anlise semntica que gera uma forma lgica para a sentena de entrada. PALAVRAS-CHAVE: parser, anlise semntica, forma lgica, processamento de linguagem natural

ANEXO O programa , quando executado, fornece a seguinte janela de entrada:

******************** * PARSER * ********************

Anlise Morfolgica Anlise Sinttica Gerao de Forma Lgica

********************* * Joo Lus Garcia Rosa * *********************

Deseja informaes sobre o lxico (i) ou entrar com uma frase? (f):

Caso se entre com um i (informaes), o sistema fornece o seguinte:

354

PARSER BASEADO EM EVENTOS E PAPIS TEMTICOS

Sentena declarativa, clusula relativa, sintagma preposicional e anfora. Lxico disponvel: Determinantes: Substantivos: Nomes Prprios: Adjetivos: Advrbios: um, uma, algum, alguma, o, a, todo, toda homem, menino, menina, mulher, bola, maleta, faca, gente. joo, maria bonito, bonita, posta. bem, muito, mais, demais, meio, no, felizmente, normalmente, realmente, humanamente. Verbos Transitivos: abater, matar. Verbos Intransitivos: viver, partir. Verbos de Cpula: ser, estar. Pronomes Pessoais. Outras: que, e, com.

Quer terminar? (s/n)

Se o usurio digitar n, o sistema volta a pedir a entrada de uma frase (f). As entradas do usurio esto em itlico, para diferenciar das sadas do sistema.

Deseja informaes sobre o lxico (i) ou entrar com uma frase? (f): f Digite a frase para a gerao da(s) forma(s) lgica(s) (entre aspas): O menino bonito matou as mulheres.

Forma(s) Lgica(s): existe(x): (menino(x) & bonito(x)) & qualquer(y): mulher(y) -> existe(e,pret_perf): matar(e) & agente(e,x) & tema(e,y)

Quer terminar? (s/n)

355

Caso se digite uma sentena ambgua, o sistema d as leituras possveis (uma de cada vez). Suponha a entrada de uma sentena, na qual maleta pode ser instrumento da ao de abater ou posse de menina:

Deseja informaes sobre o lxico (i) ou entrar com uma frase? (f): f Digite a frase para a gerao da(s) forma(s) lgica(s) (entre aspas): O menino abateu a menina com a maleta.

Forma(s) Lgica(s): existe(x): (menino(x) & existe (z): maleta(z) & existe(y): menina(y) & existe (e,pret_perf): abater(e) & agente(e,x) & tema(e,y) & instr(e,z)

Quer terminar? (s/n) n existe(x): (menino(x) & existe (z): maleta(z) & existe(y): menina(y) & existe (e,pret_perf): abater(e) & agente(e,x) & tema(e,y) & possui(y,z)

Quer terminar? (s/n) n

Deseja informaes sobre o lxico (i) ou entrar com uma frase? (f):

356

Uma outra sentena ambgua, na qual a palavra faca tambm pode ser interpretada como instrumento ou posse:

Deseja informaes sobre o lxico (i) ou entrar com uma frase? (f): f Digite a frase para a gerao da(s) forma(s) lgica(s) (entre aspas): Joo matou a mulher bonita com a faca.

Forma(s) Lgica(s): existe(x): joo(x) & existe(z): faca(z) & existe(y): (mulher(y) & bonita(y)) & existe(e,pret_perf): matar(e) & agente(e,x) & tema(e,y) & instr(e,z)

Quer terminar? (s/n) n existe(x): joo(x) & existe(z): faca(z) & existe(y): (mulher(y) & bonita(y)) & existe(e,pret_perf): matar(e) & agente(e,x) & tema(e,y) & possui(y,z)

Quer terminar? (s/n) n

Deseja informaes sobre o lxico (i) ou entrar com uma frase? (f):

__________________________
REFERNCIAS BIBLIOGRFICAS ILARI, R. et allii (1990). Consideraes sobre a Posio dos Advrbios. In Gramtica do Portugus Falado Volume I: A Ordem . Editora da Unicamp/Fapesp. PEREIRA, F. C. N. & WARREN, D. H. D. (1980). Definite Clause Grammars for Language Analysis - A Survey of the Formalism and a Comparison with Augmented Transition Networks. Artificial Intelligence 13, 231-278.

357

Você também pode gostar