Você está na página 1de 12

MORFOLOGIA LEXICAL EM SISTEMA DE TRADUÇÃO

LUAN MACIEL DUARTE DINIZ


RAFAEL SILVA TEIXEIRA
LEVANTAMENTO BIBLIOGRÁFICO

 O artigo utilizado como fonte foi "Lexical Morphology in Machine Translation: a


Feasibility Study", feito por Bruno Cartoni da Universidade de Geneva
PROBLEMAS A SEREM TRATADOS

 Solucionar um sistema de tradução automático, para interpretar palavras


desconhecidas
 O tema principal do artigo é justamente analisar a viabilidade deste projeto,
mostrando os pontos que precisam ser desenvolvidos para conseguir implementar o
sistema.
PROBLEMAS A SEREM TRATADOS

 De acordo com os estudos feitos no início deste século, entre 5 e 10% das palavras
de um texto são desconhecidas
 Normalmente as palavras desconhecidas se baseiam em nomes próprios, erros de
ortografia e neologismos
 No projeto apresentado neste artigo, a proposta principal é implementar cenários de
morfologia lexical em Tradução de Máquina
PROPOSTA DE SOLUÇÃO

 Um neologismo em uma língua deve primeiramente ser analisado a fim de


encontrar a regra que o gera e depois a base léxica a qual ela é construída.
 Segundamente, através de um mecanismo de transferência (baseado na regra e
na base citados anteriormente), uma tradução consegue ser gerada reconstruindo
uma palavra construída.
 Em um lado mais teórico, o processo todo é formalizado em um conjunto de
regras bi linguais, chamados no inglês de Lexeme Formation Rules (LFR), ou Regras
de formação lexical no português.
PROPOSTA DE SOLUÇÃO

 Apesar desta aproximação parecer simples e atrativa, estudos de viabilidade e


avaliação devem ser feitos com cuidado. Para fazê-lo foi feito um sistema que traduz
neologismos de uma língua a outra, e para delimitar este projeto e concentrar em
quais queres problemas metodológicos, o processo de prefixação foi focado, e isso
em duas línguas relacionadas (Italiano e Francês)
PROPOSTA DE SOLUÇÃO

 De forma a avaliar a aproximação descrita anteriormente, foi construído um


protótipo de máquina que possui um sistema especializado em tradução para
neologismos construídos.
 O primeiro checa qualquer palavra desconhecida para ver se ela é potencialmente
construída e se for, é performada uma análise morfológica para individualizar a base
léxica e a regra atrelada a ela.
 O segundo módulo é o módulo de tradução em si, que analisa o neologismo
construído e gera uma tradução possível.
PROPOSTA DE SOLUÇÃO

 O protótipo inteiro se apoia em uma mão em recursos léxicos e na outra em um


conjunto bi lingual de Regras de formação lexical (LFR).
 Quando um neologismo é olhado, o sistema checa para ver se ele é construído com
algum dos LFRs e se a sua base léxica está no dicionário. Se este for o caso, a
transferência leva relevantes informações léxicas e morfológicas na linguagem alvo.
 O passo de geração constrói a tradução equivalente, usando a informação provida do
LFR e dos recursos léxicos. Consequentemente o sistema inteiro se apoia na
qualidade de ambos os recursos léxicos e LFR.
IMPLEMENTAÇÃO

 A implementação do LFR (Regras de formação lexical) é configurada através de um


banco de dados em formato de guia, de onde são retiradas as informações para
análise e geração dos neologismos
 No exemplo utilizado no artigo, o primeiro setor do banco de dados representa os
prefixos da língua analisada (italiano neste caso), o segundo setor representa o corpo
da palavra e o terceiro setor sufixo.
IMPLEMENTAÇÃO

 Neste processo de tradução o prefixo é muito importante, mas não o suficiente, por
isso é necessário um grande acervo de bases, que podem ou não ser “super
especificadas”
 No artigo, a análise feita em italiano levava em consideração o sufixo da palavra, e em
seguida fazia uma rotina que procurava uma base correspondente.

Você também pode gostar