Você está na página 1de 8

Classificador de Poemas

Paulo A. Arajo
(*)
e Nuno J. Mamede
(**)

(*)
L
2
F / Instituto Superior de Engenharia de Lisboa
R. Conselheiro Emdeo Navarro, 1, 1949-014 Lisboa
E-mail: paraujo@isel.pt, Telefone: 218317217, Fax: 218317114
(**)
L
2
F / Instituto Superior Tcnico
Rua Alves Redol, 9, 1000-029 Lisboa
E-mail: Nuno.Mamede@inesc-id.pt, Telefone: 213100367, Fax: 213145843
Resumo. Descreve-se um classificador para poemas da potica portuguesa. A classificao dos poemas realizada
com base nos conceitos de estrofe, verso, slaba e rima definidos no dicionrio de termos literrios [1] e no dicionrio
de literatura [2]. Foi implementado um conjunto de regras que tem em conta o nmero de versos por estrofe, o
nmero de slabas de cada verso e a rima utilizada.
O prottipo desenvolvido agrega um mdulo que contm o lxico, um mdulo que realiza a interface com uma
aplicao externa que gera transcries fonticas e gera divises silbicas das palavras, e 3 mdulos funcionais.
So utilizadas tcnicas de processamento da lngua natural para realizar a correco ortogrfica do poema, tendo
tambm sido desenvolvidos algoritmos para classificar os poemas.
feita uma avaliao do prottipo descrito, utilizando diferentes tipos de poemas. Por ltimo so apresentadas
algumas concluses relativamente s potencialidades e limitaes do classificador descrito.
1. Motivao
Cada vez mais se utilizam ferramentas de apoio escrita, como por exemplo os correctores ortogrficos e
gramaticais. A sua utilizao reflecte-se quer na qualidade final dos documentos quer nas facilidades que
proporcionam. Os poemas podem ser considerados um caso mais especfico de documentos em que a sua
estrutura e regras de construo so mais rgidas.
Para a lngua Portuguesa no foram encontradas ferramentas para tratamento de poemas. No entanto foram
encontradas pginas na internet onde possvel ler e discutir poesia. Tambm para a lngua inglesa existem
este tipo de pginas na internet mas tambm existem outras onde possvel jogar com palavras. O The
Gardener Kit [3] um jogo de palavras em que o objectivo final a construo de poemas. Este jogo
corresponde a uma verso para a internet inspirada na verso original Magnetic Poetry de Dave Kapell [4].
Tambm foram encontrados sistemas mais complexos que permitem a gerao automtica de poesia como
o caso do Ray Kurzweils Cybernetic Poet [5] embora neste caso se utilizem modelos de linguagem para
representao de poemas pr-fornecidos.
A motivao para a realizao deste trabalho foi a implementao de um sistema capaz de classificar poemas
e servir de incentivo para a realizao, leitura e estudo da poesia. Poder ser utilizado como uma ferramenta
didctica de apoio ao estudo de poesia nas escolas, para poetas que realizam poesia, e que podero ver
algumas das tarefas de verificao dos poemas simplificadas e, ainda, como auxiliar de leitura em voz alta de
poemas.
2. Arquitectura
A arquitectura agrega um processo central que responsvel por coordenar os vrios mdulos que compem
o prottipo construdo. Foi inspirada na plataforma Galaxy-II [6] e resumida na Figura 1.
Transcrio
Fontica
Transcrio
Fontica
Diviso
Silbica
Diviso
Silbica
Lxico Lxico
Interface
Sistema
Interface
Sistema
Identificador
Conceitos
Identificador
Conceitos
Identificador
Regras
Identificador
Regras
Classificador
de Poemas

Figura 1 Arquitectura do prottipo realizado.
O mdulo que realiza a interface com a aplicao externa designa-se por mdulo de interface externa (MIE).
A aplicao externa gera transcries fonticas e divises silbicas e o seu funcionamento est baseado no
sistema DIXI [7] que tem como base um sistema de regras. Este mdulo tem duas funes principais que
podem ser aplicadas a uma palavra ou a um conjunto de palavras. Uma funo invoca os procedimentos
necessrios para realizar a transcrio fontica, e a outra para realizar a diviso silbica.
O mdulo que realiza interface com o lxico designa-se por mdulo de interface do lxico (MIL). O lxico
inclui as transcries fonticas e as divises silbicas fornecidas pela aplicao externa e qual se acrescenta
informao adicional para facilitar o processo de classificao.
O mdulo que realiza a interface com o utilizador designa-se por mdulo de interface do sistema (MIS). As
operaes de interface com o utilizador incluem a edio de poemas, guardar e ler em ficheiros os poemas
editados e recepo dos comandos do utilizador para validao de vocabulrio e para classificao dos
poemas.
O mdulo que identifica os conceitos da potica portuguesa, designa-se por mdulo identificador de
conceitos (MIC), responsvel por reconhecer e assinalar num poema os conceitos estruturais e a rima do
poema.
O mdulo que atribui a classificao final do poema designa-se por mdulo identificador de regras (MIR).
Este mdulo implementa um conjunto de regras de classificao.
O processo coordenador dos mdulos foi designado por processo classificador de poemas (PCP).
3. Implementao
O PCP realiza a classificao de poemas em 4 etapas. Na primeira etapa, o MIS responsvel por realizar a
aquisio do poema para uma estrutura interna e armazena o poema num formato que identifica as linhas do
poema e destaca as palavras finais dos versos. Este formato simplifica a etapa de classificao seguinte.
Pode, opcionalmente, ser realizada a verificao de vocabulrio do poema, utilizando as funes do MIL,
para garantir que as palavras que compem o poema existem no lxico. Se tal no acontecer, as palavras em
falta podem ser acrescentadas ao lxico utilizando funes do MIE.
Na segunda etapa o MIC acrescenta a informao de identificao de conceitos. Esta informao inclui a
identificao das estrofes, dos versos e das rimas. Tambm acrescentada a informao da transcrio
fontica e diviso silbicas das palavras.
Na terceira etapa o MIR realiza a classificao do poema com base em regras que incluem a classificao das
estrofes, a classificao dos versos e a classificao da rima. Tem ainda como base a informao de
identificao de conceitos da etapa anterior.
Na quarta e ltima etapa, o MIS responsvel por apresentar o resultado final de classificao ao utilizador.
3.1. Identificao dos Conceitos de Poema, Estrofe e Verso
O MIC identifica os conceitos de poema, poesia, estrofe e verso. As definies que foram usadas para definir
estes conceitos podem ser analisados a 2 nveis que correspondem ao detalhe e objectividade da definio.
Por poema entende-se um organismo verbal que contm, suscita ou segrega poesia [1]. Como a definio
de poema est baseada na definio de poesia ento para poesia adoptou-se a seguinte definio:
Se eu chamar prosa a um discurso mnimo, veculo mais econmico do pensamento, e chamar, a, b, c, a
atributos particulares da linguagem, inteis mas decorativos, tais como o metro, a rima ou o ritual das
imagens, toda a superfcie das palavras se encaixar na dupla equao de M. Jourdain:
Poesia = Prosa + a + b + c
Prosa = Poesia - a - b - c
Da resulta evidentemente que a Poesia sempre diferente da Prosa. Mas tal diferena no de essncia,
de quantidade [1].
Pode-se concluir destas duas definies que poesia diferente de prosa e essa diferena encontra-se nos
atributos particulares da linguagem, tais como o metro e a rima. Daqui resulta o primeiro compromisso em
relao implementao destes conceitos que restringe o domnio dos poemas que podem ser analisados pois
apenas se consideram poemas vlidos aqueles em que existe poesia.
Os conceitos de estrofe e verso esto relacionados com a estrutura do poema. Por estrofe entende-se cada
uma das seces que constituem um poema, ou seja cada agrupamento de versos, rimados ou no, com
unidade de contedo e de ritmo [1]. Verso a sucesso de slabas ou fonemas formando unidade rtmica e
meldica, correspondente a uma linha do poema. Cada verso subdivide-se ainda em sub unidades
caracterizadas pelo agrupamento de slabas chamado de p na versificao greco-latina [1]. A partir das
duas definies apresentadas se conclui que um poema est organizado em seces que se designam de
estrofes e as linhas do poema so designadas por versos. A Figura 2 mostra a estrutura de um poema.
Poema
Estrofe
Verso
Verso
...
Estrofe
Verso
Verso
...
...
Poema Poema
Estrofe Estrofe
Verso Verso
Verso Verso
...
Estrofe
Verso
Verso
...
Estrofe
Verso
Verso
...
...

Figura 2 Estrutura do poema
O algoritmo que implementa a identificao dos conceitos resumido na Tabela 1. Este algoritmo est
implementado no MIC. Comea por iniciar as variveis numEstrofe e numVerso com 0 para depois realizar
um ciclo de leitura das linhas do poema. Por cada linha lida incrementa a varivel numVerso que indica o
nmero de versos numa estrofe. Por cada mudana de linha em branco no texto incrementada a varivel
numEstrofe que indica o nmero de estrofes. Por cada mudana de estrofe iniciada a varivel numVerso
com 0.
Tabela 1 Algoritmo de identificao de Conceitos
// Inicia variveis
numEstrofe=0
numVerso=0
// Inicia estrutura interna
NovoPoema();
// Ciclo de idntificao de conceitos
while((txtLinha=bufRead.readLine())!=null) {
// ... pr processamento da linha
if(txtLinha.compareTo("")!=0)
{// caso a linha no seja nula
numVerso=numVerso+1 // incrementa o n verso
Processa(txtLinha, numVerso)
}
else { // caso a linha seja nula
if(numVerso>0) { // salta linhas brancas consecutivas
// incrementa o nmero de estrofe
numEstrofe=numEstrofe+1;
ActualizaEstrofe(numEstrofe, numVerso);
// actualiza a estrofe e reinicia o numVerso
numVerso=0;
}
}
}
3.2. Identificao de Rima
A Identificao da Rima tambm realizada pelo MIC e realiza-se em duas fases. A primeira fase realizada
na instruo Processa(txtLinha, numVerso) que faz parte do algoritmo da Tabela 1. Esta instruo
decompe cada linha do poema em palavras, e para a ltima palavra acrescenta a informao adicional
necessria para a rima. A segunda fase realizada no fim da aquisio do poema e feita da seguinte forma.
Comeando pela ltima palavra do 1 verso do poema, atribui-se a letra A a essa palavra. Para todas as
palavras finais dos versos do poema que rimem com essa palavra, tambm se atribui a mesma letra. Procura-
se a prxima palavra final que ainda no tenha letra associada e atribui-se outra letra, por exemplo B e
repete-se sucessivamente este procedimento at todas as palavras finais terem letra atribuda.
O conceito de rima foi definido a partir da seguinte forma: Depara-se-nos uma rima (final) quando, em
duas ou mais palavras, a ltima vogal acentuada, com tudo o que se lhe segue, tem idntica sonoridade [1].
A Figura 3 esquematiza a definio apresentada.
igual sonoridade a partir da vogal tnica
ltima
Palavra
do
verso
Slaba
Palavra
... ...
Slaba
Palavra
...
ltima
Palavra
do
verso
...
...
Slaba
Vogal Tnica
...
...
Slaba
Vogal Tnica
...

Figura 3 Rima
A comparao sonora das palavras realizada com baase na transcrio fontica das palavras. A aplicao
externa utiliza o alfabeto fontico SAM-PA para realizar as trancries fonticas.
A ttulo de exemplo as palavras traduo e abalaram tm a transcrio fontica respectivamente de
[tr6dus"6~w~] e [6b6l"ar6~w~]. Estas tradues correspondem transcrio fontica no alfabeto fontico
SAM-PA e a vogal tnica precedida do caracter ". Para verificar se duas palavras rimam basta comparar
as transcries fonticas a partir do caracter ".
3.3. Regras de classificao de Poemas
O mdulo MIR realiza a classificao dos poemas com base em regras. Para isso foram implementadas um
conjunto de tabelas de classificao a partir das quais se classifica os poemas. O nmero de versos em cada
estrofe condiciona a classificao das estrofes que compem o poema. O nmero total de slabas de cada
verso pode variar ao longo do poema. Consoante o nmero de silabas que compem o verso assim se obtm
diferentes tipos de verso. A escolha das palavras finais e a forma como a rima enlaada define o tipo de
rima utilizada.
Comeando pela classificao das estrofes quanto ao nmero de versos a Tabela 2 mostra as vrias
designaes de classificao possveis e a designao escolhida:
Tabela 2 Classificao das estrofes quanto ao n de versos
N de
Versos
Designaes possveis Designao
Adoptada
1 montico montico
2 dstico, parelha ou pareado parelha
3 trstico ou terceto terceto
4 tetrstico, quadra ou quarteto quadra
5 pentstico, quinteto ou quintilha quinteto
6 hexstico, sextilha, sexteto ou septena sexteto
7 heptstico, stima, septilha, septena ou hepteto stima
8 octstico ou oitava oitava
9 nona, eneagsima ou novena nona
10 decstico, dcada ou dcima dcima
n n versos n versos
Devido necessidade de utilizao de apenas uma das designao na classificao de poemas, foi escolhida a
mais comum. A linha n corresponde a uma generalizao no caso do nmero de versos de uma estrofe ser
maior que 10 e generaliza os restantes casos.
A prxima classificao depende do nmero de slabas que existe em cada verso, e para cada caso tambm se
existem vrias designaes possveis. A Tabela 3 resume os casos possveis.
Tabela 3 Classificao dos versos quanto ao n de versos
N de
Slabas
Designaes possveis Designao
Adoptada
1 1 slaba 1 slaba
2 disslabo ou bisslabo bisslabo
3 trisslabo, quebrado de redondilha maior, redondilho quebrado ou cola trisslabo
4 Tetrasslabos tetrasslabos
5 pentasslabo ou redondilha menor pentasslabo
6 hexasslabo, herico quebrado ou herico menor hexasslabo
7 heptasslabo ou redondilha maior heptasslabo
8 Octosslabo octosslabo
9 eneasslabo, verso de gregrio de matos eneasslabo
10 decasslabo, herico, sfico ou provenal decasslabo
11 hendecasslabo ou verso de arte maior hendecasslabo
12 alexandrino alexandrino
m m slabas m slabas
20 vintisslabos vintisslabos
n n slabas n slabas
Tambm neste caso se adoptou a designao mais comum para ser utilizada. As linhas m e n correspondem
generalizao para os casos que em que o nmero de versos no se encontra na tabela e que correspondem
aos valores entre 13 e 19 e aos maiores que 20.
A ltima palavra de cada verso determina o tipo de rima utilizado. Existem trs tipos possveis de
classificao que so resumidas na Tabela 4:
Tabela 4 Classificao quanto ao tipo de rima
Designaes possveis Designao adoptada
oxtona ou aguda aguda
paroxtona ou grave grave
proparoxtona ou esdrxula esdrxula
Tambm aqui o critrio de escolha para a designao a adoptar foi a que mais usual.
Para classificar a posio relativa dos versos e a forma como esto enlaados foi realizada a Tabela 5 com as
vrias hipteses possveis:
Tabela 5 Classificao quanto posio relativa dos versos que enlaa
Enlace da Rima Designao
Quando os versos que rimam se encontram juntos e aos pares
(ABB CDD EFF)
emparelhadas
Quando entre dois versos que rimam se encontra outro de
diferente rima (ABCB ou ABAB)
cruzadas
Quando entre dois versos que rimam se encontram dois versos de
diferente rima (ABBA ou ABCA)
abraadas
Quando entre dois versos que rimam se encontram trs ou mais interpolada
versos de diferente rima (ABBBA ou ABCDA)
Quando rimam mais de dois versos seguidos (AAA) seguida
Quando est sujeito a uma s rima que pode tambm ser cruzada
(ABCB)
monrrimos
4. Exemplo de Classificao
4.1. Tipos de Poemas
Assume-se como diferentes tipos de poemas, poemas que apresentem diferentes hipteses de classificao
nas tabelas apresentadas.
Para exemplificar diferentes tipos de poemas, foram utilizados poemas com diferentes provenincias, sendo
o primeiro exemplo 2 quadras populares de Antnio Aleixo, o segundo exemplo 1 estrofe dos lusadas e o
terceiro exemplo duas estrofes realizadas por crianas em idade escolar.
4.2. Resultados de Classificao
Na Tabela 6 apresentam-se os exemplos de classificao dos poemas.
Tabela 6 Classificao de Poemas
Poemas Classificaes
Eu no tenho vistas largas,
Nem grande sabedoria,
Mas do-me as horas amargas
Lies de Filosofia.

H luta por mil doutrinas.
Se querem que o mundo ande,
Faam das mil pequeninas
Uma s doutrina grande.
Classificao do Poema
Resumo
linhas: 9 ; versos: 8 ; estrofes: 2
slabas: [8,8,8,8,0,8,9,8,8]
rimas: [A,B,A,B, ,C,D,C,D]
Classificao das estrofes
1 estrofe - quadra [4 versos] - rima cruzada
2 estrofe - quadra [4 versos] - rima cruzada
As armas e os bares assinalados
Que da ocidental praia lusitana
Por mares nunca de antes navegados
Passaram ainda alm da Taprobana,
Em perigos e guerras esforados
Mais do que prometia a fora humana,
E entre gente remota edificaram
Novo Reino, que tanto sublimaram;
Classificao do Poema
Resumo
linhas: 8 ; versos: 8 ; estrofes: 1
slabas: [12,12,12,13,12,13,13,11]
rimas: [A,B,A,B,A,B,C,C]
Classificao por estrofes
1 estrofe - oitava [8 versos] - rima cruzada,
rima emparelhada.
menina que leva a vida
sentadinha a escrever,
faa favor de ensinar,
eu tambm quero aprender.

Brincar, brincar
s para brincar
e alegrar
Classificao do Poema
Resumo
linhas: 8 ; versos: 7 ; estrofes: 2
slabas: [9,8,8,8,0,4,5,4]
rimas: [A,B,C,B, ,C,C,C]
Classificao por estrofes
1 estrofe - quadra [4 versos] - rima cruzada
2 estrofe - terceto [3 versos] - rima seguida
O resultado de classificao divide-se em duas partes. Na primeira parte feito um resumo do poema onde se
pode verificar que o nmero de linhas total do poema, o nmero de versos e o nmero de estrofes. O resumo
inclui tambm a informao do nmero de slabas em cada verso do poema e ainda o enlace da rima. Na
segunda parte feita a classificao das vrias estrofes que compem o poema.
A informao de classificao das estrofes inclui a classificao quanto ao nmero de versos e quanto rima
utilizada. Podem existir vrias hipteses de rima na mesma estrofe.
Existe uma opo de classificao que permite aumentar o detalhe de classificao. A Tabela 7 mostra o
resultado que se obteria para a primeira quadra do primeiro exemplo apresentado.
A informao de detalhe mostra a classificao de cada verso quanto ao nmero de silabas e quanto ao tipo
da ltima palavra. Inclui ainda o enlace da rima e o tipo de rima.
Tabela 7 Detalhe de classificao
1 estrofe - quadra [4 versos] - rima cruzada
1 Verso - octosslabo [8 slabas] - grave - A
2 Verso - octosslabo [8 slabas] - grave - B
3 Verso - octosslabo [8 slabas] - grave - A
4 Verso - octosslabo [8 slabas] - grave - B

5. Concluses
Em relao aos objectivos iniciais, o prottipo realiza a classificao de diferentes tipos de poema sem ser
necessrio partida fornecer exemplos de poemas.
Utiliza-se o mesmo processo de classificao para classificar os diferentes tipos de poemas e com diferentes
provenincias.
medida que se foram fazendo experincias de classificao com diferentes tipos de poesia, apenas no
incio se notou mais a falta de vocabulrio no lxico que, medida que foi sendo acrescentada fez diminuir
as palavras em falta.
Para poemas mais extensos nota-se que a performance do sistema diminui devido ao aumento do nmero de
palavras que obrigam a um maior processamento.
6. Referncias
[1] Moiss, M., Dicionrio de Termos Literrios, So Paulo: Brasil, Editora Coltrix, 1974.
[2] Coelho, J., Dicionrio de Literatura, Porto-Figueirinhas: Portugal, Editora do Minho 3 Edio, 1987
[3] The Gardener Kit, Magnetic Poetry Inc., 2001
http://www.magneticpoetry.com/magnet/index.html
[4] The Magnetic Poetry Story, Magnetic Poetry Inc., 2001
http://www.magneticpoetry.com/story.html
[5] Ray Kurzweil, Ray Kurzweils Cybernetic Poet, Kurzweil CyberArt Technologies, 1999
http://www.kurzweilcyberart.com/poetry/rkcp_overview.php3
[6] Seneff, S., Hurley, E., Lau, R., Pao, C., Schmid, P. e Zue, V., Galaxy-II: A Reference Architecture for
Conversational System Development in Proc. ICSLP 98, Sydney, Australia, 30 Nov.-4 Dec. 1998, 3:931-934.
http://www.sls.lcs.mit.edu/sls/publications/1998/icslp98-galaxy.pdf
[7] Oliveira L., DIXI - Sistema de sntese de fala a partir de texto.

Você também pode gostar