Você está na página 1de 8

Classificador de Poemas

Paulo A. Arajo(*) e Nuno J. Mamede(**) L F / Instituto Superior de Engenharia de Lisboa R. Conselheiro Emdeo Navarro, 1, 1949-014 Lisboa E-mail: paraujo@isel.pt, Telefone: 218317217, Fax: 218317114 L F / Instituto Superior Tcnico Rua Alves Redol, 9, 1000-029 Lisboa E-mail: Nuno.Mamede@inesc-id.pt, Telefone: 213100367, Fax: 213145843
Resumo. Descreve-se um classificador para poemas da potica portuguesa. A classificao dos poemas realizada com base nos conceitos de estrofe, verso, slaba e rima definidos no dicionrio de termos literrios [1] e no dicionrio de literatura [2]. Foi implementado um conjunto de regras que tem em conta o nmero de versos por estrofe, o nmero de slabas de cada verso e a rima utilizada. O prottipo desenvolvido agrega um mdulo que contm o lxico, um mdulo que realiza a interface com uma aplicao externa que gera transcries fonticas e gera divises silbicas das palavras, e 3 mdulos funcionais. So utilizadas tcnicas de processamento da lngua natural para realizar a correco ortogrfica do poema, tendo tambm sido desenvolvidos algoritmos para classificar os poemas. feita uma avaliao do prottipo descrito, utilizando diferentes tipos de poemas. Por ltimo so apresentadas algumas concluses relativamente s potencialidades e limitaes do classificador descrito.
(**) 2 (*) 2

1. Motivao
Cada vez mais se utilizam ferramentas de apoio escrita, como por exemplo os correctores ortogrficos e gramaticais. A sua utilizao reflecte-se quer na qualidade final dos documentos quer nas facilidades que proporcionam. Os poemas podem ser considerados um caso mais especfico de documentos em que a sua estrutura e regras de construo so mais rgidas. Para a lngua Portuguesa no foram encontradas ferramentas para tratamento de poemas. No entanto foram encontradas pginas na internet onde possvel ler e discutir poesia. Tambm para a lngua inglesa existem este tipo de pginas na internet mas tambm existem outras onde possvel jogar com palavras. O The Gardener Kit [3] um jogo de palavras em que o objectivo final a construo de poemas. Este jogo corresponde a uma verso para a internet inspirada na verso original Magnetic Poetry de Dave Kapell [4]. Tambm foram encontrados sistemas mais complexos que permitem a gerao automtica de poesia como o caso do Ray Kurzweils Cybernetic Poet [5] embora neste caso se utilizem modelos de linguagem para representao de poemas pr-fornecidos. A motivao para a realizao deste trabalho foi a implementao de um sistema capaz de classificar poemas e servir de incentivo para a realizao, leitura e estudo da poesia. Poder ser utilizado como uma ferramenta

didctica de apoio ao estudo de poesia nas escolas, para poetas que realizam poesia, e que podero ver algumas das tarefas de verificao dos poemas simplificadas e, ainda, como auxiliar de leitura em voz alta de poemas.

2. Arquitectura
A arquitectura agrega um processo central que responsvel por coordenar os vrios mdulos que compem o prottipo construdo. Foi inspirada na plataforma Galaxy-II [6] e resumida na Figura 1.
Interface Sistema Classificador de Poemas Transcrio Fontica Diviso Silbica

Identificador Conceitos

Identificador Regras

Lxico

Figura 1 Arquitectura do prottipo realizado.

O mdulo que realiza a interface com a aplicao externa designa-se por mdulo de interface externa (MIE). A aplicao externa gera transcries fonticas e divises silbicas e o seu funcionamento est baseado no sistema DIXI [7] que tem como base um sistema de regras. Este mdulo tem duas funes principais que podem ser aplicadas a uma palavra ou a um conjunto de palavras. Uma funo invoca os procedimentos necessrios para realizar a transcrio fontica, e a outra para realizar a diviso silbica. O mdulo que realiza interface com o lxico designa-se por mdulo de interface do lxico (MIL). O lxico inclui as transcries fonticas e as divises silbicas fornecidas pela aplicao externa e qual se acrescenta informao adicional para facilitar o processo de classificao. O mdulo que realiza a interface com o utilizador designa-se por mdulo de interface do sistema (MIS). As operaes de interface com o utilizador incluem a edio de poemas, guardar e ler em ficheiros os poemas editados e recepo dos comandos do utilizador para validao de vocabulrio e para classificao dos poemas. O mdulo que identifica os conceitos da potica portuguesa, designa-se por mdulo identificador de conceitos (MIC), responsvel por reconhecer e assinalar num poema os conceitos estruturais e a rima do poema. O mdulo que atribui a classificao final do poema designa-se por mdulo identificador de regras (MIR). Este mdulo implementa um conjunto de regras de classificao.

O processo coordenador dos mdulos foi designado por processo classificador de poemas (PCP).

3. Implementao
O PCP realiza a classificao de poemas em 4 etapas. Na primeira etapa, o MIS responsvel por realizar a aquisio do poema para uma estrutura interna e armazena o poema num formato que identifica as linhas do poema e destaca as palavras finais dos versos. Este formato simplifica a etapa de classificao seguinte. Pode, opcionalmente, ser realizada a verificao de vocabulrio do poema, utilizando as funes do MIL, para garantir que as palavras que compem o poema existem no lxico. Se tal no acontecer, as palavras em falta podem ser acrescentadas ao lxico utilizando funes do MIE. Na segunda etapa o MIC acrescenta a informao de identificao de conceitos. Esta informao inclui a identificao das estrofes, dos versos e das rimas. Tambm acrescentada a informao da transcrio fontica e diviso silbicas das palavras. Na terceira etapa o MIR realiza a classificao do poema com base em regras que incluem a classificao das estrofes, a classificao dos versos e a classificao da rima. Tem ainda como base a informao de identificao de conceitos da etapa anterior. Na quarta e ltima etapa, o MIS responsvel por apresentar o resultado final de classificao ao utilizador. 3.1. Identificao dos Conceitos de Poema, Estrofe e Verso O MIC identifica os conceitos de poema, poesia, estrofe e verso. As definies que foram usadas para definir estes conceitos podem ser analisados a 2 nveis que correspondem ao detalhe e objectividade da definio. Por poema entende-se um organismo verbal que contm, suscita ou segrega poesia [1]. Como a definio de poema est baseada na definio de poesia ento para poesia adoptou-se a seguinte definio: Se eu chamar prosa a um discurso mnimo, veculo mais econmico do pensamento, e chamar, a, b, c, a atributos particulares da linguagem, inteis mas decorativos, tais como o metro, a rima ou o ritual das imagens, toda a superfcie das palavras se encaixar na dupla equao de M. Jourdain: Poesia = Prosa + a + b + c Prosa = Poesia - a - b - c Da resulta evidentemente que a Poesia sempre diferente da Prosa. Mas tal diferena no de essncia, de quantidade [1]. Pode-se concluir destas duas definies que poesia diferente de prosa e essa diferena encontra-se nos atributos particulares da linguagem, tais como o metro e a rima. Daqui resulta o primeiro compromisso em relao implementao destes conceitos que restringe o domnio dos poemas que podem ser analisados pois apenas se consideram poemas vlidos aqueles em que existe poesia. Os conceitos de estrofe e verso esto relacionados com a estrutura do poema. Por estrofe entende-se cada uma das seces que constituem um poema, ou seja cada agrupamento de versos, rimados ou no, com unidade de contedo e de ritmo [1]. Verso a sucesso de slabas ou fonemas formando unidade rtmica e meldica, correspondente a uma linha do poema. Cada verso subdivide-se ainda em sub unidades

caracterizadas pelo agrupamento de slabas chamado de p na versificao greco-latina [1]. A partir das duas definies apresentadas se conclui que um poema est organizado em seces que se designam de estrofes e as linhas do poema so designadas por versos. A Figura 2 mostra a estrutura de um poema.
Poema
Estrofe
Verso Verso

...
Estrofe
Verso Verso

...

...

Figura 2 Estrutura do poema

O algoritmo que implementa a identificao dos conceitos resumido na Tabela 1. Este algoritmo est implementado no MIC. Comea por iniciar as variveis numEstrofe e numVerso com 0 para depois realizar um ciclo de leitura das linhas do poema. Por cada linha lida incrementa a varivel numVerso que indica o nmero de versos numa estrofe. Por cada mudana de linha em branco no texto incrementada a varivel numEstrofe que indica o nmero de estrofes. Por cada mudana de estrofe iniciada a varivel numVerso com 0.
Tabela 1 Algoritmo de identificao de Conceitos
// Inicia variveis numEstrofe=0 numVerso=0 // Inicia estrutura interna NovoPoema(); // Ciclo de idntificao de conceitos while((txtLinha=bufRead.readLine())!=null) { // ... pr processamento da linha if(txtLinha.compareTo("")!=0) {// caso a linha no seja nula numVerso=numVerso+1 // incrementa o n verso Processa(txtLinha, numVerso) } else { // caso a linha seja nula if(numVerso>0) { // salta linhas brancas consecutivas // incrementa o nmero de estrofe numEstrofe=numEstrofe+1; ActualizaEstrofe(numEstrofe, numVerso); // actualiza a estrofe e reinicia o numVerso numVerso=0; } } }

3.2. Identificao de Rima A Identificao da Rima tambm realizada pelo MIC e realiza-se em duas fases. A primeira fase realizada na instruo Processa(txtLinha, numVerso) que faz parte do algoritmo da Tabela 1. Esta instruo decompe cada linha do poema em palavras, e para a ltima palavra acrescenta a informao adicional necessria para a rima. A segunda fase realizada no fim da aquisio do poema e feita da seguinte forma. Comeando pela ltima palavra do 1 verso do poema, atribui-se a letra A a essa palavra. Para todas as

palavras finais dos versos do poema que rimem com essa palavra, tambm se atribui a mesma letra. Procurase a prxima palavra final que ainda no tenha letra associada e atribui-se outra letra, por exemplo B e repete-se sucessivamente este procedimento at todas as palavras finais terem letra atribuda. O conceito de rima foi definido a partir da seguinte forma: Depara-se-nos uma rima (final) quando, em duas ou mais palavras, a ltima vogal acentuada, com tudo o que se lhe segue, tem idntica sonoridade [1]. A Figura 3 esquematiza a definio apresentada.
Palavra
Slaba

...

Vogal Tnica

... ...

...

Slaba

ltima Palavra do verso

igual sonoridade a partir da vogal tnica


Palavra
Slaba Vogal Tnica

...

... ...

...

Slaba

ltima Palavra do verso

Figura 3 Rima

A comparao sonora das palavras realizada com baase na transcrio fontica das palavras. A aplicao externa utiliza o alfabeto fontico SAM-PA para realizar as trancries fonticas. A ttulo de exemplo as palavras traduo e abalaram tm a transcrio fontica respectivamente de [tr6dus"6~w~] e [6b6l"ar6~w~]. Estas tradues correspondem transcrio fontica no alfabeto fontico SAM-PA e a vogal tnica precedida do caracter ". Para verificar se duas palavras rimam basta comparar as transcries fonticas a partir do caracter ". 3.3. Regras de classificao de Poemas O mdulo MIR realiza a classificao dos poemas com base em regras. Para isso foram implementadas um conjunto de tabelas de classificao a partir das quais se classifica os poemas. O nmero de versos em cada estrofe condiciona a classificao das estrofes que compem o poema. O nmero total de slabas de cada verso pode variar ao longo do poema. Consoante o nmero de silabas que compem o verso assim se obtm diferentes tipos de verso. A escolha das palavras finais e a forma como a rima enlaada define o tipo de rima utilizada. Comeando pela classificao das estrofes quanto ao nmero de versos a Tabela 2 mostra as vrias designaes de classificao possveis e a designao escolhida:
Tabela 2 Classificao das estrofes quanto ao n de versos N de Designaes possveis Designao Versos Adoptada 1 montico montico 2 dstico, parelha ou pareado parelha 3 trstico ou terceto terceto 4 tetrstico, quadra ou quarteto quadra 5 pentstico, quinteto ou quintilha quinteto 6 hexstico, sextilha, sexteto ou septena sexteto 7 heptstico, stima, septilha, septena ou hepteto stima

8 9 10 n

octstico ou oitava nona, eneagsima ou novena decstico, dcada ou dcima n versos

oitava nona dcima n versos

Devido necessidade de utilizao de apenas uma das designao na classificao de poemas, foi escolhida a mais comum. A linha n corresponde a uma generalizao no caso do nmero de versos de uma estrofe ser maior que 10 e generaliza os restantes casos. A prxima classificao depende do nmero de slabas que existe em cada verso, e para cada caso tambm se existem vrias designaes possveis. A Tabela 3 resume os casos possveis.
N de Slabas 1 2 3 4 5 6 7 8 9 10 11 12 m 20 n Tabela 3 Classificao dos versos quanto ao n de versos Designaes possveis 1 slaba disslabo ou bisslabo trisslabo, quebrado de redondilha maior, redondilho quebrado ou cola Tetrasslabos pentasslabo ou redondilha menor hexasslabo, herico quebrado ou herico menor heptasslabo ou redondilha maior Octosslabo eneasslabo, verso de gregrio de matos decasslabo, herico, sfico ou provenal hendecasslabo ou verso de arte maior alexandrino m slabas vintisslabos n slabas Designao Adoptada 1 slaba bisslabo trisslabo tetrasslabos pentasslabo hexasslabo heptasslabo octosslabo eneasslabo decasslabo hendecasslabo alexandrino m slabas vintisslabos n slabas

Tambm neste caso se adoptou a designao mais comum para ser utilizada. As linhas m e n correspondem generalizao para os casos que em que o nmero de versos no se encontra na tabela e que correspondem aos valores entre 13 e 19 e aos maiores que 20. A ltima palavra de cada verso determina o tipo de rima utilizado. Existem trs tipos possveis de classificao que so resumidas na Tabela 4:
Tabela 4 Classificao quanto ao tipo de rima Designaes possveis Designao adoptada oxtona ou aguda aguda paroxtona ou grave grave proparoxtona ou esdrxula esdrxula

Tambm aqui o critrio de escolha para a designao a adoptar foi a que mais usual. Para classificar a posio relativa dos versos e a forma como esto enlaados foi realizada a Tabela 5 com as vrias hipteses possveis:
Tabela 5 Classificao quanto posio relativa dos versos que enlaa Enlace da Rima Designao Quando os versos que rimam se encontram juntos e aos pares emparelhadas (ABB CDD EFF) Quando entre dois versos que rimam se encontra outro de cruzadas diferente rima (ABCB ou ABAB) Quando entre dois versos que rimam se encontram dois versos de abraadas diferente rima (ABBA ou ABCA) Quando entre dois versos que rimam se encontram trs ou mais interpolada

versos de diferente rima (ABBBA ou ABCDA) Quando rimam mais de dois versos seguidos (AAA) Quando est sujeito a uma s rima que pode tambm ser cruzada (ABCB)

seguida monrrimos

4. Exemplo de Classificao
4.1. Tipos de Poemas Assume-se como diferentes tipos de poemas, poemas que apresentem diferentes hipteses de classificao nas tabelas apresentadas. Para exemplificar diferentes tipos de poemas, foram utilizados poemas com diferentes provenincias, sendo o primeiro exemplo 2 quadras populares de Antnio Aleixo, o segundo exemplo 1 estrofe dos lusadas e o terceiro exemplo duas estrofes realizadas por crianas em idade escolar. 4.2. Resultados de Classificao Na Tabela 6 apresentam-se os exemplos de classificao dos poemas.
Tabela 6 Classificao de Poemas Poemas Eu no tenho vistas largas, Nem grande sabedoria, Mas do-me as horas amargas Lies de Filosofia. H luta por mil doutrinas. Se querem que o mundo ande, Faam das mil pequeninas Uma s doutrina grande. As armas e os bares assinalados Que da ocidental praia lusitana Por mares nunca de antes navegados Passaram ainda alm da Taprobana, Em perigos e guerras esforados Mais do que prometia a fora humana, E entre gente remota edificaram Novo Reino, que tanto sublimaram; menina que leva a vida sentadinha a escrever, faa favor de ensinar, eu tambm quero aprender. Brincar, brincar s para brincar e alegrar Classificaes Classificao do Poema Resumo linhas: 9 ; versos: 8 ; estrofes: 2 slabas: [8,8,8,8,0,8,9,8,8] rimas: [A,B,A,B, ,C,D,C,D] Classificao das estrofes 1 estrofe - quadra [4 versos] - rima cruzada 2 estrofe - quadra [4 versos] - rima cruzada Classificao do Poema Resumo linhas: 8 ; versos: 8 ; estrofes: 1 slabas: [12,12,12,13,12,13,13,11] rimas: [A,B,A,B,A,B,C,C] Classificao por estrofes 1 estrofe - oitava [8 versos] - rima cruzada, rima emparelhada. Classificao do Poema Resumo linhas: 8 ; versos: 7 ; estrofes: 2 slabas: [9,8,8,8,0,4,5,4] rimas: [A,B,C,B, ,C,C,C] Classificao por estrofes 1 estrofe - quadra [4 versos] - rima cruzada 2 estrofe - terceto [3 versos] - rima seguida

O resultado de classificao divide-se em duas partes. Na primeira parte feito um resumo do poema onde se pode verificar que o nmero de linhas total do poema, o nmero de versos e o nmero de estrofes. O resumo inclui tambm a informao do nmero de slabas em cada verso do poema e ainda o enlace da rima. Na segunda parte feita a classificao das vrias estrofes que compem o poema.

A informao de classificao das estrofes inclui a classificao quanto ao nmero de versos e quanto rima utilizada. Podem existir vrias hipteses de rima na mesma estrofe. Existe uma opo de classificao que permite aumentar o detalhe de classificao. A Tabela 7 mostra o resultado que se obteria para a primeira quadra do primeiro exemplo apresentado. A informao de detalhe mostra a classificao de cada verso quanto ao nmero de silabas e quanto ao tipo da ltima palavra. Inclui ainda o enlace da rima e o tipo de rima.
Tabela 7 Detalhe de classificao 1 estrofe - quadra [4 versos] - rima cruzada 1 Verso - octosslabo [8 slabas] - grave - A 2 Verso - octosslabo [8 slabas] - grave - B 3 Verso - octosslabo [8 slabas] - grave - A 4 Verso - octosslabo [8 slabas] - grave - B

5. Concluses
Em relao aos objectivos iniciais, o prottipo realiza a classificao de diferentes tipos de poema sem ser necessrio partida fornecer exemplos de poemas. Utiliza-se o mesmo processo de classificao para classificar os diferentes tipos de poemas e com diferentes provenincias. medida que se foram fazendo experincias de classificao com diferentes tipos de poesia, apenas no incio se notou mais a falta de vocabulrio no lxico que, medida que foi sendo acrescentada fez diminuir as palavras em falta. Para poemas mais extensos nota-se que a performance do sistema diminui devido ao aumento do nmero de palavras que obrigam a um maior processamento.

6. Referncias
[1] Moiss, M., Dicionrio de Termos Literrios, So Paulo: Brasil, Editora Coltrix, 1974. [2] Coelho, J., Dicionrio de Literatura, Porto-Figueirinhas: Portugal, Editora do Minho 3 Edio, 1987 [3] The Gardener Kit, Magnetic Poetry Inc., 2001 http://www.magneticpoetry.com/magnet/index.html [4] The Magnetic Poetry Story, Magnetic Poetry Inc., 2001 http://www.magneticpoetry.com/story.html [5] Ray Kurzweil, Ray Kurzweils Cybernetic Poet, Kurzweil CyberArt Technologies, 1999 http://www.kurzweilcyberart.com/poetry/rkcp_overview.php3 [6] Seneff, S., Hurley, E., Lau, R., Pao, C., Schmid, P. e Zue, V., Galaxy-II: A Reference Architecture for Conversational System Development in Proc. ICSLP 98, Sydney, Australia, 30 Nov.-4 Dec. 1998, 3:931-934. http://www.sls.lcs.mit.edu/sls/publications/1998/icslp98-galaxy.pdf [7] Oliveira L., DIXI - Sistema de sntese de fala a partir de texto.

Você também pode gostar