Você está na página 1de 25

Dicionrios

Introduo
Papel Dicionrios
Tipos de Informaes Palavra
Dicionrios e Morfologia
Inflexo
Derivao
Compostos
Terminologia
Resumo
Leitura adicional
Introduo
ste cap!tulo " so#re o papel desempen$ado pelos dicionrios em MT% &ossa deciso
de dedicar um cap!tulo inteiro a esta discusso reflete a import'ncia de dicionrios
em MT(
Dicionrios so os maiores componentes de um sistema de MT em termos de
)uantidade de informao )ue possuem%*e eles so listas de palavras mais do
)ue simples +e eles devem ser, se um sistema " para um #om desempen$o-,
ento eles podem muito #em ser os componentes mais caros para construir%
Mais do )ue )ual)uer outro componente, o taman$o e )ualidade do dicionrio
limita o 'm#ito de aplicao de um sistema, e a )ualidade de traduo )ue pode
ser esperada%
.s dicionrios so onde o usurio final pode esperar para ser capa/ de
contri#uir mais para um sistema 000 na verdade, um usurio final pode esperar
ter de fa/er algumas adies a dicionrios do sistema para fa/er um sistema
realmente 1til%n)uanto MT fornecedores raramente permitem )ue os usurios
modifi)uem os outros componentes, )ue normalmente espera )ue eles fa/em
adies ao dicionrio% 2ssim, do ponto de vista de um usurio, uma
compreenso #sica do dicionrio construo e sensi#ilidade para as )uestes
envolvidas na 3palavras )ue descrevem 4" um trunfo importante%
2o discutir dicionrios a)ui, tam#"m incluem algum de#ate so#re
terminologia 000 " com respeito ao tratamento de terminologia MT )ue fornece
alguns de seus #enef!cios mais 1teis%
5amos a#ordar a )uesto de dicionrios em MT o#li)uamente, por considerar com
algum detal$e as informaes contidas, e as )uestes levantadas pelos, os dicionrios
de papel com o )ual todos estamos familiari/ados% 6 uma s"rie de ra/es para isso,
mas o mais importante " )ue os dicionrios em sistemas de MT existentes so
diferentes em termos de formatos, co#ertura, n!vel de detal$e e preciso formalismo
para a descrio lexical% sta diversidade no deve ser uma surpresa%Diferentes
teorias da representao lingu!stica pode dar origem a diferentes vises do dicionrio,
e diferentes estrat"gias de implementao pode fa/er at" mesmo visuali/aes
fundamentalmente semel$antes de dicionrio muito diferente em detal$e%2l"m disso,
os diferentes tipos de motor MT, o#viamente, colocar #astante diferentes exig7ncias
so#re o conte1do do dicionrio% Por exemplo, dicionrios em um interling8!stica
sistema no precisa conter nen$uma informao de traduo em si,tudo o )ue "
necessrio " associar palavras com as apropriadas +colees de- interling8!stica
conceitos% Por outro lado, o transformador sistemas normalmente do informaes
so#re os itens de l!ngua de origem, e suas tradues, incluindo talve/ a informao
)ue " realmente so#re a l!ngua0alvo, e )ue " necessrio para desencadear certas
transformaes +por exemplo, a ver com a colocao de part!culas como em procur0
lo, e procurar a resposta-% 9ma ve/ )ue a transfer7ncia sistemas geralmente usam
n!veis mais a#stratos de representao, os dicionrios associados tem )ue cont7m
informaes so#re esses n!veis% 2l"m disso, num sistema de transfer7ncia,
especialmente um )ue se destina a tratar vrias l!nguas, " comum para separar
unil!ng8e dicionrios para os idiomas de origem e destino +)ue do informaes
so#re os vrios n!veis de representao envolvidos na anlise e s!ntese -, 2 partir
#il!ng8e dicionrios )ue so envolvidos em transfer7ncia +:ue normalmente se
relacionam origem e de destino itens lexicais, e )ue normalmente cont7m
informaes apenas so#re os n!veis de representao )ue esto envolvidos na
transfer7ncia-%
;ostar!amos de a#strato longe dessas diverg7ncias e )uestes de pormenor, a fim de
concentrar0se so#re as principais )uestes% 2ssim, vamos comear com uma #reve
discusso de entradas t!picas )ue se pode encontrar em um #om monolingue 3Papel
4dicionrio, e um #om #il!ng8e 34Dicionrio de papel% &<s, ento, discutir
#revemente o tipo de informao so#re as palavras )ue se encontra normalmente nos
dicionrios MT, destacando algumas das diferentes maneiras, tais informaes podem
ser representadas% Como = dissemos, uma viso simples " )ue um dicionrio " uma
lista de palavras% &o entanto, " impraticvel, e talve/ imposs!vel fornecer uma lista
exaustiva de palavras para a maioria dos idiomas% Isso " por causa da possi#ilidade de
formar novas palavras para fora dos = existentes, por vrios processos
morfol<gicos% &a *eo vamos ol$ar #revemente para estes, e proporcionar uma
discusso de como eles podem ser tratados, e os pro#lemas )ue eles levantam em um
contexto de MT% &a *eo vamos descrever #revemente a diferena entre
terminologia e voca#ulrio geral%
Papel Dicionrios
. mel$or lugar para comear a nossa discusso " ol$ando entradas t!picas )ue se
pode encontrar em um monolingue Dicionrio Ingl7s +cf% pgina - um #il!ng8e
dicionrio +cf% pgina -%

5amos comear por ol$ar para o la>out da primeira metade do monolingue entrada% 2
entrada para o #oto comea com a pr<pria palavra em negrito% Isso " c$amado
a palavra ca#ea% . ponto na palavra indica onde a palavra pode ser interrompida
+por exemplo, para $ifeni/ao-% Depois disso, $ um fon"tica transcrio da
pron1ncia da palavra % m seguida, a entrada se divide em duas partes principais,
descrevendo pela primeira ve/ o nome e depois no #oto ver#o%Definies identificar
dois significados diferentes, ou leituras do #oto su#stantivo, com exemplos de uso
dadas em itlico% . remete o leitor a uma entrada relacionada% Idiomtico
expresses so dadas em 3. :uanto ao ver#o, o c<digo ?Tn, Tn%p@ indica )ue o ver#o
" transitivo, ou se=a, aparece em uma frase com um su=eito e um o#=eto +Tn-, ou "
transitivo com uma part!cula adver#ial +Tn%p-% &este caso, a part!cula adv"r#io " a
preposio acima% *o# b outro uso " descrito em )ue o #oto" um ver#o intransitivo
e, assim, leva apenas um assunto +I-, ou um assunto mais a
preposio up +IP-% xpresso idiomtica aparecem em 2. 2 caixa no meio da entrada
sinali/a o in!cio de uma lista de formas complexas, um p$rasal ver# +#oto para
cima-, e vrios compostos s, )ue n<s discutiremos mais tarde neste cap!tulo% . ver#o
e su#stantivo, ver#os frasais e composto s so dados em um formulrio padro +a
forma de citao-, com informaes so#re estresse +dado por ap<strofos aumentados
ou redu/idos-% Por conveno, isto " normalmente a forma singular de su#stantivos, e
a forma infinitiva de ver#os +ou se=a, a forma )ue se encontra, depois de, como no
#oto, para ser, etc-

. #il!ng8e entrada para a impressora su#stantivo comea com a palavra ca#ea, sua
pron1ncia e classe de palavras, neste caso, su#stantivo% Logicamente, a entrada, em
seguida, divide0se em tr7s componentes (a), (b) e (c), distinguindo essencialmente
tr7s usos diferentes ou significado do su#stantivo em Ingl7s, )ue t7m tradues
diferentes para o franc7s %.nde um significado particular pode ser identificado por
refer7ncia a um campo, esta informao " dada +entre colc$etes, em itlico- 000 a)ui
computao e fotografia so identificados como campos% *e o contexto de utili/ao
" outro )ue estes dois campos, em seguida, a traduo dada so# (a), assume0se como
sendo apropriados% Para cada leitura, o g7nero da traduo "
dado( m ou f +para masculino ou feminino, mf indica um " poss!vel, onde as formas
masculinas e femininas so diferentes, am#os so indicados 000 leitor da impressora ",
portanto, tanto correcteur ou correctrice-% *e duas tradues diferentes so poss!veis
am#os so dadas, separado por uma v!rgula +assim,
)uer t>pograp$e ou imprimeur so poss!veis tradues 3geraisA-% 2 entrada tam#"m
cont"m alguns exemplos de expresses idiomticas , ou outros usos, de novo com as
tradues apropriadas%
&ormal, 3dicionrios de papel 4, so colees de entradas como estas% .u se=a, eles
so #asicamente listas de palavras, com informaes so#re as diversas
propriedades% n)uanto as regras gramaticais definir todas as poss!veis estruturas
ling8!sticas em uma linguagem, as descries das palavras individuais )ue so
encontradas no dicionrio ou dicionrios o estado )ue as palavras podem aparecer em
)ual das diferentes estruturas% 2 comum +em#ora no completamente correto- vista "
)ue os dicionrios cont7m todas as informaes 3idiossincrtico 4,4 irregular 4, ou
imprevis!vel de palavras, en)uanto gramticas fornecer regras gerais so#re classes de
palavras e frases +isto s< " verdade se excluirmos morfol<gica regras e linguagem s
do dicionrio 000 o primeiro pode ser visto como lidar com classes de palavra, eo
1ltimo so frases-%
Pode0se ter uma id"ia do volume de informaes deste tipo )ue pode ser necessrio,
considerando )ue, para fins comerciais, um l"xico com BC CCC entradas " muitas
ve/es considerado como o m!nimo% ste, por"m, ainda " apenas uma pe)uena
porcentagem de palavras existentes 000 o Dicionrio de Ingls Oxford cont"m cerca
de BDC CCC entradas, sem ser exaustivo, mesmo de uso geral% &a verdade, nen$um
dicionrio pode nunca ser realmente completa% &o s< dicionrios geralmente
limitam0se a um ou outro em geral, ou voca#ulrio t"cnico especialista +mas no
am#os-, al"m disso, novas palavras esto constantemente a ser cun$ado, emprestado,
usado em novos sentidos, e formado por processos morfol<gicos normais%
Tipos de Informaes Palavra
E o#servamos )ue os dicionrios so um, talve/ o componente central de sistemas de
MT% &os cap!tulos anteriores, apresentamos uma viso altamente simplificada de
dicionrios 000 por exemplo, no cap!tulo o dicionrio era, por ve/es, pouco mais do
)ue uma lista de regras, como v andar, )ue s< permite )ue as informaes so#re
parte do discurso a ser representado, e no cap!tulo demos regras de traduo )ue
simplesmente emparel$ado as formas de citao de origem e de destino palavras +por
exemplo, temperatura temperatur-% &o entanto, apesar de algumas das informaes
)ue se encontra em um dicionrio de papel t!pico " de valor limitado em MT +por
exemplo, informaes so#re a pron1ncia s< " 1til em discurso para sistemas de fala-,
em geral, a )ualidade e detal$e da informao )ue se precisa para MT " pelo menos
igual ao )ue se encontra nos dicionrios de papel% &esta seo, vamos discutir as
vrias peas de informao so#re as palavras )ue um #om sistema de MT deve
conter, #aseando0nos nas entradas do dicionrio acima% 9ma )uesto )ue no vamos
a#ordar neste cap!tulo " o tratamento de idioma s, )ue se encontra normalmente em
entradas do dicionrio de papel% Discute0se o tratamento da linguagem s no
Cap!tulo %
F 1til fa/er uma distino entre as caracter!sticas da pr<pria palavra +suas
propriedades inerentes- e as restries )ue coloca em outras palavras em seu
am#iente gramatical% m#ora esta distino no " explicitamente desen$ada em
dicionrios de papel, a informao de am#os os tipos esto dispon!veis nos
mesmos% Informaes so#re as propriedades gramaticais inclui a indicao de sexo no
franc7s parte do #il!ng8e dicionrio de entrada, ea indicao do n1mero em
su#stantivos +em geral, a forma de citao dos su#stantivos " a forma singular, e as
informaes so#re o n1mero s< " dado explicitamente para su#stantivos )ue possuem
apenas formas plurais, como tesouras e calas-%
Informaes so#re o am#iente gramatical uma palavra pode aparecer em "
normalmente considerada como dividindo0se em dois tipos( subcategorizao
informao, )ue indica os am#ientes sintcticas )ue uma palavra pode ocorrer em,
e selecional restries )ue descrevem propriedades sem'nticas do meio
am#iente% Informaes t!picas so#re su#categori/ao " a informao )ue o #oto "
um ver#o transitivo% Isto " expresso no c<digo ver#o ?Tn@ na entrada de dicionrio na
pgina %Mais precisamente, isso indica )ue ele " um ver#o )ue aparece como c$efe
de frases com a +sintagma nominal- assunto e um +sintagma nominal- .GET.% 2
seguir d alguns exemplos, =untamente com os c<digos ver#ais apropriadas a partir
.2LD(
. presidente morreu% ?I@
.s romanos destru!ram a cidade% ?T&@
*am deu rosas para Him% ?Dn%pr@
*am deu Him rosas% ?Dn%n@
*am convenceu Him para ficar em casa% ?Cn%t@
Him acreditava )ue a #i#lioteca foi fec$ada% ?TI@
2 )ualidade " #aixo% ?La@
*am apareceu o mel$or $omem para o tra#al$o% ?L&@
&ote0se )ue ?I@ refere0se a ver#os intransitivos )ue s< precisa de um assunto para
formar uma frase gramatical, ?Tn@ para transitivo ver#os +como o #oto- )ue
precisam de um su=eito e um o#=eto, ?Dn%pr@ para #itransitivo ver#os )ue t7m um
su=eito e dois o#=etos, onde o segundo " introdu/ido pela preposio a, ?Dn%n@ para
#itransitivo ver#os )ue levam um su=eito mais dois nomes de o#=etos, ?Cn%t@ para
ver#os transitivos complexos )ue exigem um su=eito, o#=eto e um infinitivo +no0
tenso- clusula introdu/ida por a, ?TI@ para transitivo ver#os tomar um su=eito, o#=eto
e finito +tenso- frase introdu/ida por isso, ?La@ para ligar ver#os )ue ligam uma frase
ad=etiva +)ue descreve, de alguma forma o assunto-, para o assunto, e ?Ln@ refere0se a
ver#os de ligao )ue ligam uma frase de su#stantivo para o assunto%
.s ver#os no so as 1nicas categorias de palavras )ue su#categori/ar para certos
elementos, no seu am#iente% *u#stantivos exi#em o mesmo fenJmeno, como os
su#stantivos )ue foram derivados de ver#os +su#stantivos dever#ais-%
2 morte do presidente c$ocou a todos%
2 destruio da cidade pelos romanos era completa%
Da mesma forma, existem alguns ad=etivos )ue su#categori/ar para certos
complementos% &ote0se )ue nos exemplos a#aixo, encontramos tr7s tipos diferentes
de complemento, e )ue # e c diferem umas das outras, por)ue em # o su=eito da
orao principal " tam#"m o tema entendido da su#seo, en)uanto )ue em c o
su=eito da orao principal " o o#=eto entendido da su#seo%
Maria estava orgul$oso de seu desempen$o%
le estava ansioso para desem#rul$ar o seu presente%
ssa )uesto " fcil de lidar%
9m dicionrio de Ingl7s ade)uado provavelmente teria de recon$ecer pelo menos
vinte su#categori/ao diferente classes de ver#o, e um n1mero semel$ante de
ad=etivos e su#stantivos%
2 ra/o pela )ual no se pode ser mais preciso so#re o n1mero de diferentes classes
su#categori/ao " )ue depende +a- de como #em as distines so de )ue se )uer
desen$ar, e +#- so#re o )uo longe se #aseia em regras ou princ!pios gerais para
capturar regularidades% Por exemplo, provavelmente todos os ver#os permitem )ue os
voluntrios coordenados, como *am e Leslie, mas $ alguns, como se
encontram, onde isso " e)uivalente a um transitivo su=eito0ver#o0o#=eto comum
construo +cf% + a-, e + #- significa o mesmo, mas
+ c- e + d- no fa/er-% Pode0se
decidir recon$ecer esta distino, criando uma su#categori/ao separado classe,
estendendo, assim, o n1mero de classes% Mas tam#"m se poderia argumentar )ue este
fato se encontram e so#re ver#os similares est provavelmente relacionada com a sua
sem'ntica +)ue descrevem as relaes sim"tricas, no sentido de )ue, se 2 satisfa/ G,
ento G atende 2-, e ", assim, regular e previs!vel% 2 a#ordagem ade)uada poderia,
ento, ser a trat0lo por meio de uma regra de lingu!stica geral +talve/ um )ue
transforma estruturas como + a- para os da forma + #-- Claro, a menos )ue se
pode confiar na informao sem'ntica para escol$er ver#os como se encontram, a
pessoa ter )ue apresentar alguma marca em tais ver#os para garantir )ue eles, e s<
eles, so su#metidos a essa regra% &o entanto, este no " necessariamente o mesmo
)ue a introduo de um su#categori/ation classe%
*am con$eceu Mar>
*am e Mar> con$eceu
*am viu Maria
*am e Mar> serra
*u#categori/ao informaes indicam )ue, por exemplo, o #oto ver#o ocorre com
um o#=eto sintagma nominal% De fato, sa#emos muito mais so#re o ver#o do )ue isso
000 do o#=eto, ou em termos de pap"is sem'nticos , . paciente, do ver#o tem )ue ser
uma coisa 3#uttona#le 4, como uma pea de roupa, e )ue o assunto +mais precisamente
2;&T- do ver#o " normalmente animar% Tal informao " comumente referido
como as restries seletivos )ue as palavras colocar em itens )ue aparecem em
construes onde eles so a ca#ea% sta informao est impl!cita na entrada de
dicionrio papel acima 000 a informao de )ue o o#=eto de #oto " inanimado, e,
normalmente, uma pea de roupa tem )ue ser tra#al$ada a partir da utili/ao
de st$ +K 3alguma coisa 4- na definio, eo exemplo, o )ue d casaco, =a)ueta,
camisa como possi#ilidades% 2 entrada em nen$um lugar di/ )ue o su=eito do ver#o
tem )ue ser uma entidade animada +provavelmente $umano-, uma ve/ )ue nen$uma
outra entidade pode executar a ao de 3a#otoadura% *upe0se +com ra/o- )ue o
leitor $umano pode tra#al$ar esse tipo de coisa por si mesma% sta informao tem de
ser explicitado, se " para ser utili/ado na anlise , Transfer7ncia ou s!ntese , Claro%
Informao inerente #sico e informaes so#re su#categori/ao e restries
seletivos pode ser representado diretamente para fins de MT% ssencialmente, as
entradas em um dicionrio de MT ser e)uivalente a colees de atri#utos e valores
+ou se=a, recursos-% Por exemplo, algu"m poder ter algo como o seguinte para
o #oto de su#stantivo, indicando )ue a sua #ase, ou forma de citao " o #oto, )ue "
um su#stantivo comum, )ue " de concreto +em ve/ de a#stratos, como a
felicidade, ou sinceridade-
lex K #oto
cat K n
nT>pe K comum
num#er K
$umano K nen$uma
concreto K >es
9ma forma <#via de implementar tais coisas " conforme registros em um #anco de
dados , Com atri#utos de nomenclatura campos +por exemplo cat-, e os valores como
os conte1dos das reas +por exemplo, n-% Mas nem sempre " necessrio nomear o
campo 000 pode0se, por exemplo, adotar uma conveno de )ue o primeiro campo em
um registro cont"m sempre a forma de citao +neste caso, o valor
da lex caracter!stica- , :ue o segundo campo indica a categoria, e )ue o terceiro
campo de algum tipo de su#diviso da categoria%
.l$ando para a entrada de dicionrio para o #oto su#stantivo torna0se claro )ue as
diferentes partes do discurso ter um con=unto diferente de atri#utos% Por exemplo, os
ver#os ter um vt>pe, ao inv"s de uma caracter!stica ntipo , en)uanto os ver#os
pode ter campos para as indicaes de n1mero , Pessoa e tensa , &o se poderia
esperar encontrar tais campos para preposies% &a entrada temos dado encontramos
tam#"m um atri#uto 000 n1mero 000 sem um valor% 2 id"ia a)ui " para indicar )ue um
valor para este atri#uto " poss!vel, mas no " inerente ao #oto palavra, )ue pode ter
um n1mero diferente valores em diferentes ocasies +ao contrrio por
exemplo, calas, o )ue " sempre plural-% F claro, este tipo de campo em #ranco "
essencial para )ue os campos so indicados pela posio, em ve/ de nome% m
sistemas )ue nome atri#uir campos ela pode simplesmente ser e)uivalente L omisso
do atri#uto, mas mantendo o campo ainda " 1til por)ue a=uda a algu"m )ue tem para
modificar o dicionrio para entender as informaes no dicionrio% 9ma alternativa
para dar um valor em #ranco, " seguir a prtica de alguns dicionrios de papel e
preenc$a o padro, ou +em algum sentido- do valor normal% Para um atri#uto,
como n1mero, este seria presumivelmente singular% sta alternativa, no entanto, "
fora de moda nos dias de $o=e, uma ve/ )ue vai contra a ideia geralmente aceite )ue
na mel$or das $ip<teses processamento ling8!stico s< aumenta, e nunca muda
informaes% 2 atrao de uma tal a#ordagem " )ue fa/ a ordem em )ue as coisas so
feitas menos cr!tico +cf% nossas o#servaes so#re a conveni7ncia de separar
declarativa e informaes processuais no cap!tulo -%
2 fim de incluir informaes so#re su#categori/ao e selecional restries, tem duas
opes% 2 primeira " a de )ue atrav"s de codificar con=untos de atri#utos com valores
at<micas, tais como a)ueles acima% &a prtica, isto significa )ue um pode ter recursos
como su#cat K su#=Mo#= e semMpatient K roupas% &o )ue di/ respeito
su#categori/ao informao, este " essencialmente a a#ordagem utili/ada no
monolingue dicionrio de papel acima% 2 entrada de dicionrio resultante poderia,
ento, algo parecido com o seguinte(
lex K #oto
cat K v
vt>pe K main
K finitos
pessoa K
num#er K
su#cat K su#=Mo#=
semMagent K $umano
semMpatient K roupas
m alguns sistemas, esta pode ser a 1nica opo% &o entanto, alguns sistemas
podero permitir )ue os valores para a con=untos ou listas, no caso em )ue se tem
uma maior flexi#ilidade% Por exemplo, pode0se representar a informao
su#categori/ao por meio de uma lista de categorias, por exemplo su#cat K ?np, np,
np@ pode indicar um ver#o )ue permite tr7s P& +comodar-, e ?np, np, pp@ pode indicar
um ver#o )ue leva dois &Ps e um PP +novamente como dar-%
*am deu rosas para Him% +*u#cat K ?np, np, pp@-
*am deu Him rosas% +*u#cat K ?np, np, np@-
9m refinamento adicional seria para indicar as relaes efectivas gramaticais
envolvido, talve/ como em su#cat K ?*9GE( np, .GE( np, I.GE( pp@% 2 notao )ue
permite )ue o lexic<grafo para indicar outras propriedades dos itens seria ainda mais
expressivo% Por exemplo, seria 1til para indicar )ue a elasticidade, a preposio no PP
tem de ser% Isto significa )ue em ve/ de 3pp 4e4 np 4um teria colees de recursos ,
talve/, at" mesmo pedaos de estrutura sinttica% +2 tend7ncia atual em ling8!stica
computacional envolve o desenvolvimento de formalismos )ue permitem )ue tais
entradas lexicais muito detal$adas, e vamos falar um pouco mais so#re eles no
cap!tulo -%
Passando agora para o tratamento de informaes em dicionrios de traduo MT,
uma possi#ilidade " a tentativa de representar todas as informaes relevantes por
meio de atri#utos e valores% 2ssim, como um complemento para a entrada de
dicionrio para o #oto indicado acima, um sistema de transformador poderia
especificar um recurso de traduo 34 )ue tem como valor a palavra l!ngua0alvo
apropriadoN por exemplo, trans K Gouton para a traduo para o franc7s % Pode
tam#"m incluir recursos )ue desencadeiam certas transformaes +por exemplo, para
alterar a ordem das palavras para determinadas palavras-% &o entanto, este no " o
o#=ectivo particularmente atraente% Por um lado, " claramente orientada em uma
direo , vai ser dif!cil de produ/ir entradas relativas L outra direo da traduo de
tais entradas% Mais geralmente, se )uer um #il!ng8e dicionrio para permitir a
su#stituio de certas informaes orientada idioma de origem com informaes de
idioma de destino correspondente 000 ou se=a, su#stituir a informao se o#t"m a
partir do dicionrio fonte de informao derivada do dicionrio alvo% Isto sugere o
uso de regras de traduo )ue se relacionam palavras Confrontos palavras% .u se=a,
regras do tipo )ue introdu/imos no Cap!tulo , Como temperatura temperatur%
Como o#servamos antes, nem todas as regras de traduo pode ser um simples
mapeamento de palavras da l!ngua de origem para seus e)uivalentes da l!ngua0
alvo% 9m vai ter )ue colocar condies so#re as regras%
Por exemplo, um gostaria de ser capa/ de descrever no #il!ng8e entrada )ue lida
com como e plaire, a mudana gramatical relaes )ue ocorre se um est tra#al$ando
com n!veis relativamente rasas da representao,% Com efeito, a transfer7ncia regra
)ue n<s demos para este exemplo no cap!tulo pode ser visto como uma entrada
lexical #il!ng8e% .utras regras de traduo )ue podem exigir mais do )ue apenas um
simples par de origem e de destino palavras so a)ueles )ue tratam fenJmenos como
idioma s e composto s, e em alguns casos, de l"xico #uracos +cf% Cap!tulo -% Para
lidar com estes fen<menos #ilingues entradas do dicionrio pode ter um 1nico item
lexical no lado de uma l!ngua, ao passo )ue o outro lado descreve um +possivelmente
#astante complexo- estrutura lingu!stica%
2 entrada para o #oto tirado de um dicionrio de papel no in!cio do presente cap!tulo
ilustra uma )uesto de grande import'ncia para o processamento automtico de
alguns idiomas, incluindo Ingl7s% sta " a ocorr7ncia muito generali/ada
deo!ogra"ia na l!ngua% ;rosseiramente falando, $om<grafos so palavras )ue so
escritas da mesma forma% &o entanto, " importante distinguir diversos casos
diferentes +por ve/es o termo $omografia se restringe a apenas uma delas-%
O%. caso em )ue " intuitivamente uma 1nica su#stantivo +por exemplo- tem
vrias leituras diferentes% Isto pode ser visto com a entrada para o #oto na
pgina , .nde uma leitura relacionada L roupa se distingue de uma 4leitura4
#oto%
B%. caso onde se tem relacionado com itens de diferentes categorias )ue so
escritos da mesma forma% Por exemplo, o #oto pode ser um su#stantivo ou um
ver#o%
P%. caso onde se tem o )ue parece ser itens no relacionados )ue acontecer a
ser escritos da mesma forma% . exemplo clssico disso " o #anco su#stantivo,
)ue pode designar um ou outro lado de um rio, ou uma instituio financeira%
ssas distines t7m significado prtico )uando se est escrevendo +criando,
ampliando ou modificando- um dicionrio, uma ve/ )ue eles se relacionam com a
)uesto de )uando se deve criar uma nova entrada +definindo um novo n1cleo-% 2s
)uestes envolvidas so #astante diferentes )uando se est criando um dicionrio
3papel 4+onde as )uestes de legi#ilidade so fundamentais- ou um dicionrio para
MT, mas " em )ual)uer caso, muito mais uma deciso pragmtica% 9m #om princ!pio
orientador pode0se adotar " a entradas de grupo $ierar)uicamente em termos de
)uantidade de informaes compartil$adas%Por exemplo, $ relativamente pouco )ue
os dois sentidos da participao do #anco al"m de sua forma de citao e ao fato de
)ue am#os so su#stantivos comuns, de modo )ue pode0se tam#"m associ0los a
diferentes entradas% m um am#iente computacional onde se tem )ue dar nomes
exclusivos para entradas diferentes, isso vai envolver a criao de palavras c$aves
como #anQMO e #anQMB, ou +#anQMfinance e #anQMriver-% :uanto ao #oto su#stantivo
e ver#o, em#ora se pode )uerer ter alguma forma de indicar )ue eles esto
relacionados, eles no compartil$am muitas informaes, e pode, portanto, ser
tratados como entradas separadas% Para vrias leituras de uma palavra, por exemplo,
as duas leituras do #oto su#stantivo, por outro lado, a maioria das informaes "
compartil$ada 000 eles diferem principalmente em sua sem'ntica% &este caso, ele pode
ser 1til para impor uma organi/ao no l"xico em )ue a informao pode ser $erdada
de uma entrada em su#0entradas +ou mais geralmente, a partir de uma entrada para
outra-, ou v70los como su#entries de um resumo 3 protoentr> 4de algum tipo%Isso
certamente vai poupar tempo e esforo no dicionrio construo 000 em#ora a
economia )ue se fa/ pode parecer pe)ueno em um caso, torna0se significativo )uando
multiplicado pelo n1mero de itens )ue t7m diferentes leituras +este " certamente na
casa dos mil$ares, talve/ centenas de mil$ares, = )ue a maioria das palavras listadas
nos dicionrios normais t7m pelo menos duas leituras-% 2s )uestes Isto levanta so
complexas e no podemos fa/er0l$es =ustia a)ui, no entanto, a seguir l$e dar uma
id"ia do )ue est envolvido%
De modo mais geral, o )ue se est falando a)ui " erana de propriedades entre
entradas +ou de entradas em su#entries-%Isto " ilustrado na figura % Poder!amos
imaginar estendendo isso, a introduo de entradas a#stratas )ue expressam
informao verdadeira de classes de entrada +real-% Por exemplo, pode0se )uerer
especificar determinados fatos so#re todos os su#stantivos +todas as leituras
su#stantivo- apenas uma ve/, em ve/ de afirmar0los separadamente em cada
entrada% 2 entrada de um su#stantivo comum pode ento ser muito simples, no $
mais a di/er do )ue o 3este " um su#stantivo comumA, e dando a forma de citao +e
sem'ntica, e traduo, se for o caso-% 9ma permite su#regularities +isto " elementos
lexicais )ue so regulares em algumas mas no todas as unidades-, ao permitir )ue os
elementos de $erdar algumas informaes ao expressar a informao especial ou
irregular directamente na pr<pria entrada% m muitos casos, a mel$or organi/ao
pode vir a ser #astante complicado, com entradas )ue $erdam um n1mero de
diferentes fontes% Tal a#ordagem se torna ainda mais atraente se a $erana padro "
poss!vel% .u se=a, )ue a informao " $erdada, a menos )ue se=a explicitamente
contradisse em uma entrada R leitura 000 seria ento poss!vel di/er, por exemplo, 3este
" um su#stantivo comum, exceto para a forma como ele fa/ o seu plural 4%

Iigura( 6erana
9m componente final e importante de um dicionrio de MT, )ue " totalmente
desprovido de dicionrios de papel +pelo menos na sua impressa, forma p1#lica- " a
documentao% 2l"m da documentao geral )ue descreve as decises de design, e
terminologia fornecendo listas e definies +incluindo testes operacionais- para os
atri#utos e valores )ue so usados no dicionrio +)ue ", o#viamente, essencial )ue
tais termos so utili/ados de forma consistente 000 e consist7ncia " um pro#lema
desde a criao e manuteno de um dicionrio " no " uma tarefa )ue pode ser
reali/ada por um 1nico indiv!duo-, " importante )ue cada entrada inclui comentrios
de alguns lexic<grafos 000 informaes so#re )uem criou a entrada, )uando era revisto
pela 1ltima ve/, os tipos de exemplo se #aseia em )ue, existem pro#lemas com ela, e
os tipos de mel$oria )ue so necessrios% Tal informao " vital para )ue um
dicionrio " para ser mantido e ampliado% De um modo geral, em#ora a )ualidade e
)uantidade de tais documentos no tem )ual)uer efeito so#re o desempen$o real do
dicionrio, )ue " cr!tico se o dicionrio " para ser modificado ou ampliado%
Dicionrios e Morfologia

Morfologia est preocupado com a estrutura interna de palavras, e como as palavras
podem ser formadas% F comum recon$ecer tr7s processos de formao de palavras
diferentes%
O
Processos "le#ivas , Por meio do )ual uma palavra " derivada de outra forma da
palavra, ad)uirindo certas caracter!sticas gramaticais, mas mantendo a mesma
parte do discurso ou de uma categoria +por exemplo, camin$ada, passeios-N
B
Derivational processos em )ue uma palavra de uma categoria diferente "
derivado de uma palavra ou fragmento de palavra por aplicao de algum
processo +por exemplo, a gramtica gramatical, gramatical
gramaticalidade-N
P
Para piorar, em )ue as palavras independentes se re1nem em alguma maneira
de formar uma nova unidade +#otoeira-%
m Ingl7s, inflectional e derivacional processos envolvem pre"i#os +como
em desfa/er- e su"i#os +como na estupide/-, e )ue " c$amado de converso, ou zero$
a"i#ao onde $ uma mudana de categoria, mas nen$uma mudana de forma +e
exemplo seria o processo )ue se relaciona com o su#stantivo #oto para o ver#o-% m
outras linguagens, uma gama de dispositivos, tais como mudanas nos padres de
vogais de palavras, do#rando ou reduplicao de s!la#as, etc, tam#"m so
encontrados% Claramente, esses prefixos e sufixos +con$ecidos coletivamente
como a"i#os) no podem 3ficar so/in$oA como palavras% Composto ing " #astante
diferente em )ue as partes podem, cada ocorrer como palavras
individuais% Compondo " um fenJmeno muito produtivo no germ'nica l!nguas, e
apresenta alguns pro#lemas particulares em MT, )ue discutiremos mais tarde%
Inflexo
Derivao
Compostos
In"le#o

Como regra geral, papel dicionrios a#strato longe de inflexo% Palavras na ca#ea
so geralmente no flexionado, isto ", su#stantivos aparecem em forma singular e
ver#os t7m a #ase +ou infinitivo- formulrio% 6 um n1mero de ra/es para isto% .
primeiro " )ue a flexo " um processo relativamente regular, e uma ve/ )ue os casos
excepcionais foram separadas, flexional processos se aplicam a todos os mem#ros de
uma determinada categoria% Por exemplo, para formar a terceira pessoa do singular
do presente do indicativo de ver#os um simplesmente sufixos s +ou suas
variantes- es para a forma de citao do ver#o% 6 muito poucas excees a essa
regra% 9ma ve/ )ue " um processo regular, o usurio dicionrio pode ser invocado
para formar palavras regularmente flexionadas das formas de citao no dicionrio
dadas L vontade% Claro, irregularidades, tais como plurais irregulares +ovel$as, #ois,
fenJmenos, etc- e apenas su#stantivos no plural +calas- deve ser explicitamente
mencionado% 9ma segunda ra/o importante " eminentemente prtico 000 ele
economi/a espao, tempo e esforo na construo de entradas% Desde Ingl7s
inflectional morfologia " #astante po#re, essas economias no so enormes% Mas
span$ol , Por exemplo, tem seis formas ver#ais diferentes para o tempo presente ,
se somarmos as do passado +*e=a imperfecto ou pret"rito em espan$ol- isso e)uivale
a OS formas ver#ais diferentes% .utras l!nguas tornam ainda mais o uso de inflexes,
como, por exemplo, o finland7s onde no esto a ser dito na regio de BCCC constitui
para a maioria dos su#stantivos, e OB CCC formulrios para cada ver#o% *er evidente
)ue a necessidade de descrever flexional variao por meio de regras est
pressionando em tais casos%
Dentro do contexto da T2, " claramente dese=vel )ue $a=a uma a#ordagem
semel$ante, onde unil!ng8e e transferir dicionrios conter apenas as palavras de
ca#ea e as palavras no flexionadas% 2 fim de alcanar este o#=ectivo um sistema
deve ser capa/ de capturar os padres normais de inflexo % Isto pode ser feito atrav"s
da adio de um componente morfol<gico para o sistema, )ue descreve todas as
inflexes regulares em regras gerais, com regras expl!citas adicionais para inflexo
irregular, permitindo assim dicionrio escritores a#strair a partir de formas
flexionadas, tanto )uanto poss!vel% . componente morfol<gica ser capa/ de mapear
palavras flexionadas so#re as palavras de ca#ea apropriadas e vai manter a
informao fornecida pelo inflectional apor, adicionando as caracter!sticas relevantes%
5amos considerar novamente o ver#o afeta na temperatura afeta a densidade frase
simples% m primeiro lugar, )ueremos )ue o nosso componente morfol<gica
recon$ecer afeta como uma forma flexionada de afeto% m segundo lugar, )ueremos
reter a informao levada pelo afixo para )ue possamos us0lo posteriormente ao
gerar a sentena de sa!da% &o caso dosafetos, isso significa )ue )ueremos afirmar )ue
o ver#o " finito, ou tenso d +de facto, o tempo presente -% Isso " importante, pois
permite )ue o ver#o ocorra como o 1nico ver#o de uma orao principal% . tenso
tam#"m impede )ue o ver#o ocorra atrs ver#os auxiliares, como vontade% .utras
informaes )ue recol$emos a partir da inflexo " o facto de )ue o ver#o " terceira
pessoa +como oposio a primeira pessoa, ocorrendo com I ou n<s, e em oposio
com a segunda pessoa, )ue ocorre com voc7-, e )ue " singular +em ve/ de terceira
pessoa plural, o )ue ocorre com eles , ou com um su#stantivo plural-%
xistem vrias formas de descrever isso, mas talve/ o mais simples " usar as regras
da seguinte forma(
+Lex K 5, cat K v, T finito, pessoa K P, n1mero K cantar, tenso K presso- 5 T s
2)ui n<s introdu/imos uma regra )ue di/ )ue os ver#os finitos )ue so terceira
pessoa do singular e ter tempo presente +Cat K v, T finito, pessoa K P, n1mero K
cantar, tenso K presso- pode ser formado por adio de s na forma de #ase +na forma
de #ase " representado como o valor do atri#uto lex-% 2 regra tam#"m pode ser lida
na direo oposta( se uma palavra pode ser dividida em uma s"rie de personagens
e s, ento ele pode ser um ver#o finito com terceira pessoa do singular no tempo
presente % .utras regras teriam de ser dadas para indicar )ue o fim do T s pode ser
adicionado a todos os ver#os, exceto para a)ueles )ue terminam em T s, eles
pr<prios, es em )ue casos " adicionado +cf% #ei=o, #ei=os-%
*e algo " de fato a forma #ase do ver#o pode ser verificado no dicionrio monol!ngue
% 2ssim, se o morfol<gico analisador encontra uma palavra como afeta, ele ir
verificar se o dicionrio monol!ngue cont"m uma entrada com as caracter!sticas cat K
v, lex K afetar % Desde )ue ele fa/, afeta pode ser representado por meio da entrada
lexical, com algumas das informaes fornecidas pelo resultado rule%T$e de anlise
morfol<gica, em seguida, " uma representao )ue consiste tanto a informao
fornecida pelo dicionrio e as informaes provenientes de o apor%
lex K afetar
cat K v
vt>pe K main
su#cat K su#=Mo#=
semMagent KU
semMpatient KU
vform K finito
pessoa K Prdsing
K tensos pres
2 fim de recon$ecer as formas irregulares do componente morfol<gico tem )ue
conter regras expl!citas% 9ma a#ordagem a)ui " tentar normali/ar a ortografia , De
modo )ue as regras morfol<gicas comuns podem lidar com o resultado% Por exemplo,
pode0se ter regras como o seguinte para lidar com as formas singulares terceira
pessoa irregulares de ser e ter%
T s ser " ter T s tem
*egundo esta a#ordagem, a anlise morfol<gica para " e tem " um processo de dois
estgios%
2 alternativa " afirmar a relao entre as formas " e tem diretamente, atrav"s de
regras como as seguintes(
+Lex K ser, cat K v, T finito, pessoa K P, n1mero K cantar, tenso K presso- " +lex K
t7m, cat K v, T finito, pessoa K P, n1mero K cantar, tenso K presso- tem

9ma interpretao grfica das duas a#ordagens alternativas " dada na Iigura %

Iigura( Tratamento de ver#os irregulares
.#serve )ue temos de assegurar )ue essas regras se aplicam nos casos de direito% Por
exemplo, matri/es no devem ser analisados como di % es% ste no " pro#lemtico,
proporcionando podemos garantir )ue as anlises )ue produ/imos conter itens
lexicais reais%
m s!ntese , 6 um pro#lema relacionado de certificar0se de )ue as regras normais
no produ/em V #es e V $aves% 9ma a#ordagem para isso " tentar dividir em grupos
de regras excepcionais e padro, e ter certe/a de )ue nen$uma regra padro se aplica
se pode aplicar a uma norma excepcional% 2ssim, por exemplo, o fato de )ue $ uma
regra especial para a forma singular terceira pessoa " impediria a aplicao da regra
normal ou padro )ue simplesmente acrescenta s L forma #ase do ver#o%
Como alternativa, pode0se acrescentar funcionalidade s para controlar )uais as regras
aplicveis Ls entradas lexicais, e ter as regras morfol<gicas verificar a presena do
recurso especial % sta a#ordagem " particularmente atraente nos casos em )ue a
l!ngua tem um n1mero de classes de con=ugao ou declinao 000 itens lexicais
podem conter recursos indicando a sua classe de con=ugao R declinao, )ue as
regras morfol<gicas podem verificar%
2t" agora, temos falado so#re regras morfol<gicas como coisas )ue realmente se
aplicam como uma sentena est sendo analisado% .utra forma em )ue se poderia
us0los " compilar um formulrio dicionrio completo de um dicionrio de palavras
no declinados, essencialmente, executando as regras morfol<gicas so#re o dicionrio
de formas no declinados% &ote, no entanto, )ue esta estrat"gia iria construir uma
monolingue dicionrio de um taman$o enorme para idiomas como espan$ol , .u
finland7s %
Derivao
Processos de derivao formar novas palavras +geralmente de uma categoria
diferente- a partir de palavras existentes, em Ingl7s isso " feito, principalmente,
atrav"s da adio de afixos% Por exemplo, a industriali/ao, e destruio pode ser
pensado como sendo derivadas da forma ilustrada a#aixo% Como se pode ver
da destruio, no " necessariamente a forma de citao de uma palavra )ue aparece
na derivaes, por esta ra/o, " comum falar de processos derivacionais envolvendo
caules e afixos +em ve/ de palavras e afixos-%
ind1stria T Ial
T I/e T Wo
destruir Io
m um dicionrio de papel, algumas palavras derivadas so listados, so# a palavra
ca#ea relevante% Isto " em parte por)ue afixos diferem na sua produtividade e na
regularidade do efeito )ue t7m so#re as palavras ou $astes )ue se com#inam com% Por
exemplo, no parece $aver nen$uma #ase real so#re a )ual prever )ual dos afixos )ue
formam su#stantivos produ/ir su#stantivos de determinados ver#os% Isto " ilustrado
a#aixo pelos ver#os c$egar, destruir, e deportar(

&o entanto, alguns derivational processos so #astante regular e pode ser descrita por
meio de uma palavra #f gramtica% ste envolve( +i- )ue entra na afixo no
dicionrioN +Ii- )ue l$e permite categori/ar para o )ue com#ina com +com#ina ex0
veis com ver#os transitivos( Testemun$a ler 0 leg!vel- 000 este " apenas como
su#categori/ao sinttica normais N +Iii- garantir )ue as regras para com#inar
palavras e afixos do a palavra derivada as caracter!sticas corretas pelo resultado, e
cuidar de )ual)uer ortografia mudanas na palavra ou afixoN +Iv- encontrar alguma
maneira de especificar o significado em termos dos significados da palavra e afixo%
Tal como acontece com inflexo , 2s regras devem ser configurados de modo a
produ/ir itens lexicais apenas genu!nas% Por exemplo, pode0se assegurar )ue as regras
)ue analisam cordialidade como cordial %$dade no produ/em )uali0
dade % de)ualidade, por)ue no $ nen$um item lexical V )ual%
9ma a#ordagem para lidar com derivacional morfologia em MT " simplesmente
listar todas as palavras derivadas, e para algumas palavras derivadas +por exemplo, de
desem#ar)ue, no sentido da rea no topo da escada-, esta " claramente a a#ordagem
certa, por)ue o seu significado " imprevis!vel% Mas nem todos morfologia
derivacional " imprevis!vel% 2lguns afixos )uase sempre t7m apenas um sentido,
como o prefixo )ue un +)uando com#inado com um ad=etivo- normalmente significa
4no X4 +meio infeli/es no feli/- , para outros, $ certas tend7ncias ou
regularidades( com os exemplos + - 2 adio do radical ver#al ao sufixo0
mento parece ter a mesma conse)87ncia, regular para o significado da palavra, de
modo )ue a palavra derivada denota a ao ou processo associado ao ver#o +o ato de
Xing-% .radores explorar esse fato, criando novas palavras )ue eles esperam ouvintes
a entender%
2 matana de elefantes " proi#ido%
Dirigir fora foi sem pro#lemas%
2 pintura de ainda vive nunca me atraiu%
m contraste com os exemplos + -, Deve0se considerar os su#stantivos em + -, .nde
o significado, em#ora comum, no " previs!vel a partir do sufixo0ing(
Pintura( a imagem produ/ida com tinta
2#rangendo( algo )ue co#re algo
Corte( algo )ue foi cortado
Travessia( um lugar onde, por exemplo, as estradas cru/am
5emos a)ui )ue um ver#o T ing su#stantivo pode se referir a um produto + a-, uma
coisa )ue executa uma ao + #-, uma coisa )ue sofre uma ao + c-, ou um lugar
+ d-% 2o mesmo tempo, no entanto, se " verdade )ue na maioria dos casos, a
interpretao normal 3o acto de Xing 4est tam#"m dispon!vel% . )ue isto significa "
)ue $ )uase sempre um pro#lema de am#ig8idade com palavras derivadas%
2l"m disso, $ casos em )ue se pode tradu/ir palavras derivadas por tradu/ir a $aste,
e tradu/ir o afixo% Por exemplo, o franc7s traduo de adv"r#ios ingleses formadas a
partir de um ad=etivo mais 0 mente " muitas ve/es feita de traduo do ad=etivo plus
0 mento +por exemplo, T l> rpida rapide T mento, T l> fcil facile T mento-, etc
Mas isso s< " poss!vel para alguns afixos, e somente )uando a interpretao da
palavra derivada " previs!vel% 2s dificuldades de tradu/ir palavras derivadas por
tradu/ir caules e afixos pode pode ser visto a partir da traduo dos exemplos
anteriores em neerland7s %
matana doden
conduo fora Yegri=den
pintura +o ato- sc$ilderen
pintura +o produto- sc$ilderen, mas sc$ilderi=
co#ertura #edeQQen, mas #edeQQing
corte Qnippen, mas Qnipsel
cru/amento Qruisen, mas Hruispunt
2ssim, em#ora a id"ia de fornecer regras para tradu/ir palavras derivadas pode
parecer atraente, levanta muitos pro#lemas e por isso ", atualmente, mais de um
o#=etivo de pes)uisa para MT do )ue uma possi#ilidade prtica%
&o!postos

9m composto " uma com#inao de dois ou mais palavras, )ue funciona como uma
s< palavra% m Ingl7s, o tipo mais comum de composto " provavelmente um
composto formado por dois su#stantivos +compostos su#stantivo0su#stantivo-, como
os da entrada de dicionrio para o #oto(
#otoeira(
#oto #uraco
a#otoadeira(
#oto ganc$o
#oto cogumelo(
#oto cogumelo
m espan$ol , Por exemplo, outros tipos de composto s so igualmente importantes,
incluindo compostos de ad=etivo0ad=etivo(
guardacostas +3guarda costeiraA-(
;uarda
c
ostas
ro=i#lanco +3vermel$o e #ranco-(
ro=i #lanco
.rtograficamente , l!nguas diferentes seguem diferentes convenes para
compostos % Por exemplo, em alemo compostos so geralmente escrito como uma
palavra, mas em Ingl7s alguns so escritos como uma palavra
+como #oto e a#otoadeiraacima-, algumas palavras como $!fen +por exemplo, em
pe)uena escala- e algumas palavras como =ustapostos +ex% cogumelos #oto-%
Tal como acontece com derivaes, " poss!vel descrever a gama de compostos
poss!veis por meio de uma palavra gramtica, e como com derivaes a possi#ilidade
de )ue algu"m pode ser capa/ de tradu/ir compostos por tradu/ir as partes
componentes " muito atraente 000 especialmente uma ve/ )ue ", em princ!pio, no "
poss!vel listar todos os compostos em ingl7s, por)ue composio pode dar su#ir para
palavras )ue so ar#itrariamente longo% Para ver isso, considere )ue se pode formar,
al"m da sociedade filme(
filme de estudante
cineclu#e estudante
comit7 cineclu#e estudante
esc'ndalo comit7 sociedade filme de estudante
comit7 cineclu#e estudante in)u"rito esc'ndalo
Infeli/mente, por"m $ casos em )ue a decomposio de um composto e tradu/ir
suas partes d resultados corretos +por exemplo, o alemo
composto Zassersportverein tradu/ como esporte clu#e de gua-, os pro#lemas de
interpretao e de traduo so ainda piores do )ue para compostos por derivao
s% 2l"m do fato de )ue alguns compostos t7m interpretaes completamente
idiossincrticos +por exemplo, uma ruiva " uma pessoa com gengi#re ca#elos
coloridos-, $ pro#lemas de am#iguidade % Por exemplo, cineclu#e estudante poderia
ter uma das estruturas indicadas, com interpretaes diferentes +o primeiro pode
denotar uma sociedade para filmes de estudantes, o segundo filme de uma sociedade
para estudantes-(
filme de estudante sociedade
estudante cineclu#e
9m tipo diferente de am#iguidade pode ser ilustrado, dando um exemplo( o#servao
por sat"lite pode, em certa ocasio de uso significa o#servao por sat"lite, en)uanto
)ue em outra ocasio de us0lo pode significar a o#servao dos sat"lites% 2 maioria
dos seres $umanos de tempo so capa/es de confiar em nosso con$ecimento ou
mundial ou no contexto de desvendar um composto de significado% 2l"m disso, "
fre)8entemente importante para fins de traduo para tra#al$ar a relao exata
expressa por um composto% &o romance l!nguas, por exemplo, esta relao pode ser
explicitamente reali/ada por uma preposio% Por exemplo, a infra0estrutura de
pes)uisa em espan$ol tradu/ como infraestructura para la investigaci<n+literalmente,
4infra0estrutura para pes)uisa A-% &em podemos alegremente supor )ue uma
am#ig8idade em um idioma ser preservada em outro% 2ssim o#servao por
sat"lite tem duas poss!veis tradues em espan$ol , Dependendo o seu
significado( sat"lite P.R o#servaci<n +3o#servao por sat"lite 4- e o#servaci<n de
sat"lites +3 o#servao de sat"lites4-%
9m outro pro#lema com os compostos " )ue uma grande variedade de relaes
poss!veis entre os elementos de um composto% 2ssim #otoeira " um #uraco para os
#otes, mas cogumelo #oto " um cogumelo )ue se assemel$a a um #oto%&o est
claro como capturar essas relaes%
2ssim, como com derivao s, uma a#ordagem muito geral para o tratamento de
compostos continua a ser um o#=etivo de pes)uisa para MT%
Terminologia

2 discusso at" agora tem sido so#re )uestes relacionadas com o voca#ulrio
geral% &o entanto, um pouco diferente, e um pouco menos pro#lemtico, con=unto de
pro#lemas surgem )uando um vira para o voca#ulrio especiali/ado )ue se encontra
em certos tipos de texto em determinados campos de assunto +o voca#ulrio da
previso do tempo " um exemplo extremo, outros exemplos podem ser a voca#ulrio
de relat<rios so#re os ensaios para os relat<rios m"dicos, relat<rios de testes de
drogas farmac7uticas, ou relat<rios de determinados tipos de evento esportivo-% sses
campos, muitas ve/es t7m uma terminologia relativamente #em definida, )ue " Ls
ve/es at" mesmo codificada, e dado o recon$ecimento oficial pelos organismos
profissionais% . )ue isto envolve codificao est se instalando em uma coleo de
conceitos, e atri#uindo a cada um nome +ou talve/ vrios nomes, um em cada uma
das vrias l!nguas-% :uando uma palavra +ou um con=unto de palavras em vrias
l!nguas- designar um 1nico conceito, desta forma, ele " c$amado de pra/o% xemplos
de termos incluem os nomes para os o#=etos materiais, mas tam#"m as entidades
a#stratas +processos, propriedades, funes, etc%- Conceitos e, conse)uentemente, os
termos associados, podem ser organi/ados em estruturas conceptuais, com #ase na
relao entre eles%Por exemplo, mesas, cadeiras, armrios, etc, podem ser agrupadas
como m<veis, com uma poss!vel su#diviso em mo#ilirio dom"stico e mo#ilirio de
escrit<rio%
.s termos podem ser simples palavras ou expresses multiYord% *intaticamente, no
$ nada para distinguir termos da linguagem comum, em#ora $a=a uma forte
tend7ncia de termos de ser su#stantivos, fre)uentemente composto su#stantivos%
Termos so potencialmente mais d<cil para os sistemas de MT )ue voca#ulrio da
l!ngua geral, uma ve/ )ue para a maior parte, eles tendem a ser menos
am#!guo % n)uanto uma palavra da l!ngua geral pode representar mais do )ue um
conceito em um sistema de conceitos, $ fre)8entemente um mapeamento um0para0
um entre os termos e os conceitos )ue representam%Tomemos por exemplo a
palavra graduao, )ue na terminologia de m)uinas0ferramenta tem o significado
muito preciso( 33 distri#uio de divises da escala de um aparel$o +linear,
logar!tmica, )uadrtica, etc-44 2 graduao palavra da l!ngua geral, por outro lado ,
tem muitos mais significados, incluindo 33 a cerimJnia na )ual graus so
conferidos%44 . )ue isto significa, " claro, " )ue se pode, em princ!pio, adoptar uma
interling8!stico aproximar a terminologia% Por exemplo, mesmo numa transfer7ncia
sistema, no " preciso lidar com termos em uma #ase par de l!nguas 000 tudo se pode
precisar " ter anlise e s!ntese regras )ue relacionam as palavras para termos
individuais a um interling8!stica nomear para o conceito associado +o )ue poderia ser
um c<digo num"rico ar#itrrio, uma coleo de recursos , .u at" mesmo o pr<prio
termo usado em uma das l!nguas, " claro-%
&em sempre " o caso de um termo representa um e s< um conceito 000 $ exemplos
de termos )ue so am#!guas % Por exemplo, na terminologia da m)uina0ferramenta
do parafuso termo " definido como se segue( 33 um fio m)uina cu=o elemento
essencial " uma rosca de parafuso% 9m parafuso ou " um parafuso externo ou um
parafuso interno44% +Da mesma forma, a sinon!mia entre termos ocorrer, em#ora muito
menos fre)8ente do )ue na l!ngua geral% &a terminologia de m)uinas0ferramenta,
por exemplo, ci#ras e #raadeira parece designar o mesmo conceito%- &o entanto, os
pro#lemas de am#iguidade so pe)uenos )uando comparados com os pro#lemas )ue
se tem com o voca#ulrio geral%
6 ainda alguns pro#lemas de translao com a terminologia, no entanto% m
particular, $ pro#lemas, sempre )ue $ uma incompati#ilidade entre os sistemas
conceituais das duas l!nguas a ser tradu/ido% 9m exemplo de um conceito de
incompati#ilidade de terminologia vin!cola " a diferena entre o cido Ingl7s e do
Iranc7s acide )ue so definidos como se segue(
cido' termo aplicado ao vin$o contendo uma )uantidade excessiva
de , ;eralmente um vin$o feito de uvas no completamente maduras%
acide' caract[re d4un vin no la teneur "lev"e en provient
;"n"ralement de passas m\rs incompl[tement%
n)uanto o Iranc7s definio fala de 2CID* organi)ues +3cidos org'nicosA-, o
Ingl7s fala apenas de cidos% *e o desfasamento for considerado significativo o
suficiente, o termo pode precisar de ser parafraseado na outra l!ngua% m tais casos,
tradu/ir terminologia levanta os mesmos pro#lemas )ue lidar com voca#ulrio geral%
Ieli/mente, casos pro#lemticos em traduo terminologia so muito menos
fre)8entes do )ue no voca#ulrio geral%
Do ponto de vista do tradutor $umano, e, mais particularmente, os grupos de
tradutores $umanos )ue cola#oram na traduo de documentos, terminologia
apresenta outros tipos de pro#lema% m primeiro lugar, $ o pro#lema do taman$o 000
o grande n1mero de termos )ue existem para lidar com eles% m segundo lugar, existe
o pro#lema de consist7ncia%
&o )ue di/ respeito ao segundo pro#lema, MT oferece uma vantagem
considervel% Isso ocorre por)ue uma ve/ um termo foi tradu/ido, " poss!vel
arma/enar o termo e sua traduo, e garantir )ue o termo " tradu/ido de forma
consistente ao longo de textos%
Claro, isso " em parte uma soluo para o pro#lema de taman$o tam#"m, por)ue
garante )ue a pes)uisa eo esforo )ue vai em #usca de uma traduo para um termo
no " repetido por outros tradutores )ue tra#al$am com o mesmo sistema% &o
entanto, " apenas uma soluo parcial, pois $ um aumento aparentemente inexorvel
na terminologia em muitas reas% Muitas $oras de pes)uisa so colocados no
recon$ecimento e documentao dos novos termos e seus e)uivalentes de translao
em outros idiomas% Para minimi/ar esse pro#lema, muitos tradutores e traduo
ag7ncias fa/em uso de ter!ban(s , .u pr"0existente, ou constru!dos em casa%
Term#anQs so #asicamente dados s )ue cont7m mil$ares de entradas, uma para cada
termo% ssas entradas consistem, assim como as entradas do dicionrio, de diversas
reas, mas o tipo de informao dada nestes campos " #astante diferente do )ue se
encontra em um dicionrio comum% m parte, isso ocorre por)ue a documentao
ade)uada de um termo re)uer informaes espec!ficas so#re a origem da entrada, e
so#re )uando ela foi criada, e )uando modificados +claro, seria de esperar para
encontrar este tipo de informao dispon!vel para os construtores de uma dicionrio
devidamente documentadas tam#"m-% .utras informaes normalmente respeito a
termos relacionados +sinJnimos, antJnimos , a#reviaturas, termos e $ip<nimos
superordenados -, ]rea temtica +por exemplo, produtos farmac7uticos contra artigos
de desporto-, e fontes de informaes adicionais +por exemplo, dicionrios
especiali/ados ou livros de refer7ncia-% Por outro lado, as informaes so#re as
propriedades gramaticais e pron1ncia normalmente " #astante escassa% Isto " em parte
por)ue os termos so muitas ve/es palavras novas, ou palavras de empr"stimo, e,
normalmente, seguir as regras morfol<gicas regulares de um idioma% Da mesma
forma, a falta de fonol<gica informaes " em parte por)ue as entradas esto
orientadas para o material escrito, mas tam#"m por)ue se espera )ue os termos sero
p$onologicall> regular +ou se=a, eles vo seguir as regras normais para a linguagem,
ou as regras normais )ue se aplicam a empr"stimos palavras-%
2l"m de term#anQs internos )ue so locais para uma 1nica organi/ao, $ uma s"rie
de grandes term#anQs )ue oferecem acesso a#erto +Ls ve/es por um pe)ueno
custo-% xemplos so urodicautom +Comisso uropeia- , TRMI9M +;overno
canadense-, &ormaterm +2 organi/ao de padres franc7s- e Irantext +Instituto
&acional da L!ngua Irancesa-, )ue oferecem uma gama de reas de terminologia,
incluindo ci7ncia, tecnologia, administrao, agricultura, medicina, direito e
economia%
Deve ser evidente a partir mesmo essa #reve discusso )ue garantir uma utili/ao
clara e consistente e traduo da terminologia " um fator importante no processo de
traduo, o )ue, na maioria dos dom!nios t"cnicos exige a criao e manuteno de
term#anQs 0000*e um esforo dispendioso e demorado% &o " surpreendente, portanto,
)ue, com o aumento da disponi#ilidade de grandes )uantidades de textos em lin$a, os
investigadores comearam a experimentar com a extraco automtica de termos de
texto corrente, utili/ando uma variedade de m"todos estat!sticos para determinar a
pro#a#ilidade de )ue uma palavra, ou se)87ncia de palavras, constitui um
termo% Claro, listas de termos +poss!veis- no pode ser feita a surgir magicamente a
partir de um corpus de textos 0 o processo leva em conta a fre)87ncia de itens nos
textos e muitas ve/es " guiado por alguma informao fornecida pelo usurio, como
uma enciclop"dia de conceitos ou $ierar)uia conceito ou uma lista de termos =
identificados, ou uma lista de padres sintticos t!picos para termos% &o $ ra/o
para esperar )ue tais t"cnicas deve ser limitado a extrao de monolingue
terminologia, e de fato a id"ia de automati/ar at" certo ponto, a compilao de
#il!ng8e e term#anQ multilingue s tam#"m est gan$ando terreno%
)esu!o
ste cap!tulo tem lidado com uma s"rie de )uestes relacionadas com dicionrios em
MT, incluindo )uestes relativas a vrios tipos de estrutura das palavras +morfologia-
terminologia% 2l"m de salientando a sua import'ncia, n<s descrevemos os
principais tipos de informao )ue se encontra normalmente nos dicionrios, e
levantou algumas )uestes so#re a forma como essa informao deve ser
representada%
*eitura adicional
9ma conta leg!vel do )ue est envolvido na produo de um dicionrio pode ser
encontrada em ?*inclairO^_`@ 000 neste caso o dicionrio " monol!ngue , destina0se a
leitores $umanos, mas muitos dos pro#lemas so semel$antes% 9ma discusso geral
so#re o )ue so tidas como as principais )uestes te<ricas na concepo e construo
de dicionrios para fins de P&L " dada em ?Ritc$ieO^_`@%
&a morfologia , ?*pencerO^^O@ fornece uma excelente descrio up0to0date de teoria
ling8!stica atual% Para uma discusso mais ampla da composio ve=a ?GauerO^_P@%
9ma descrio mais completa do estado da arte no )ue se refere tratamentos
computacionais de morfol<gica fen<menos " dada em ?Ritc$ie et al% O,^^B @% :uase a
1nica discusso da morfologia )ue " especificamente relacionado com MT "
?GennettO^^P@%
Para uma introduo geral ao estudo da terminologia, ve=a ?*agerO^^C@ , m
term#anQs , 5e=a ?O^_S Gennett et
al% ,Mc&aug$tO^__# , Mc&aug$tfort$coming , Mc&aug$tO^__a@% Para a discusso de
term#anQs computadori/ados e traduo, ve=a ?T$omasO^^B@% xperi7ncia de usar uma
terminologia #anco de dados no processo de traduo " relatado em ?PailletO^^C@%
stes dias, muitos dicionrios de papel existem em forma leg!vel por m)uina +ou
se=a, )ue ten$am sido criados como 3documentos eletrJnicosA no sentido do
cap!tulo , 2#aixo-% .2LD , Dicionrio .xford 2dvanced Learners 4?6orn#> et
al% O,^`a @, a partir do )ual as pessoas monolingues entrada na pgina " tomada, e
LD.C, Dicionrio de Ingl7s do Longman Contemporar> ?ProctorO^`_@ so t!picas a
este respeito% les so suficientemente consistente e expl!cita ter sido usado em uma
s"rie de experimentos )ue tentam levar dicionrios de papel 3A +ou mel$or, a m)uina
verses leg!veis deles-, e convert70los em um formulrio )ue pode ser usado
diretamente em sistemas de PL&% Parte desse tra#al$o " relatado em ?Goguraev e
GriscoeO^_^@%
2 representao e uso da informao lexical em P&L " o foco de uma grande
)uantidade de pes)uisas atualmente% 2lguma id"ia do alcance deste pode ser o#tida a
partir de ?vensO^__@ e ?Puste=ovsQ> e GerglerO^^B@% 2 id"ia de estruturao de um
dicionrio $ierar)uicamente, de modo )ue as entradas individuais podem $erdar
informaes +e assim ser simplificada-, )ue mencionamos #revemente, "
particularmente importante nesta pes)uisa% 2 id"ia mais clara do )ue est envolvido
pode ser ad)uirida a partir de ?Pollard e *agO^_` , cap!tulo _,@%

Você também pode gostar