Você está na página 1de 164

ASPECTOS SEMNTICOS DA DEFINIO TERMINOLGICA (DT): DESCRIO LINGUSTICA E PROPOSTA DE SISTEMATIZAO

Dayse Simon Landim Kamikawachi

SO CARLOS 2009

UNIVERSIDADE FEDERAL DE SO CARLOS CENTRO DE EDUCAO E CINCIAS HUMANAS PROGRAMA DE PS-GRADUAO EM LINGUSTICA

ASPECTOS SEMNTICOS DA DEFINIO TERMINOLGICA (DT): DESCRIO LINGUSTICA E PROPOSTA DE SISTEMATIZAO

Dayse Simon Landim Kamikawachi Bolsista FAPESP

Dissertao apresentada ao Programa de Ps-Graduao em Lingustica da Universidade Federal de So Carlos, como parte dos requisitos para a obteno do Ttulo de Mestre em Lingustica. Orientadora: Profa. Dra. Gladis Maria de Barcellos Almeida

So Carlos, So Paulo, Brasil Abril 2009

Ficha catalogrfica elaborada pelo DePT da Biblioteca Comunitria da UFSCar

K15as

Kamikawachi, Dayse Simon Landim. Aspectos semnticos da definio terminolgica (DT) : descrio lingustica e proposta de sistematizao / Dayse Simon Landim Kamikawachi. -- So Carlos : UFSCar, 2010. 161 f. Dissertao (Mestrado) -- Universidade Federal de So Carlos, 2009. 1. Lingustica - processamento de dados. 2. Terminologia. 3. Lingustica de corpus. 4. Linguagem humana e tecnologia. 5. Anlise semntica. I. Ttulo. CDD: 410.285 (20a)

BANCA EXAMINADORA

Profa. Dra. Gladis Maria de Barcellos Almeida Prof. Dr. Bento Carlos Dias da Silva Profa. Dra. Sandra Maria Aluisio

minha querida Anna Clara.

Agradecimentos
Prof.a Gladis Maria de Barcellos Almeida, por me apresentar ao fascinante mundo da Terminologia. Agradeo-lhe pela confiana depositada, pela orientao e principalmente pela amizade e apoio em vrios momentos da minha trajetria. Prof.a Sandra Maria Alusio e ao Prof. Bento Carlos Dias da Silva, pela leitura atenta do trabalho e pelas contribuies muito produtivas dadas no exame de qualificao e na defesa. Aos professores do PPGL: Prof. Oto Vale, pela indicao de autores e por assistir a exposio deste trabalho de mestrado por muitas vezes, sem perder, ainda assim, o olhar crtico, sempre disposto a contribuir com a pesquisa e com o meu crescimento acadmico; e Prof.a Lucia Rino, pelo olhar de informata quanto lngua e pela exmia e desafiante aula. Ao Marcelo Adriano Amancio, pesquisador do NILC, pela elaborao de dois programas computacionais especficos para esta pesquisa. Aos meus colegas do GETerm - Jacqueline Souza, Daniela Mattos, Fernando Alves, Solange Bazzon, Leandro Oliveira - pelo dilogo e aprendizado constantes. Agradeo especialmente ao Douglas Pino, pela velha amizade, pelas discusses acerca da Linguagem e pela reviso deste trabalho de mestrado; e ao paciente e didtico Joel Coleti, pela presteza na assessoria computacional fornecida especialmente quanto metodologia empregada na pesquisa. secretria do PPGL, Nani, pela disposio e engajamento de levar o programa adiante e pela seriedade dedicada ao trabalho dirio realizado, tornando a nossa passagem pelo Mestrado mais suave e consciente das nossas responsabilidades como aluno e pesquisador. Aos meus amigos, pelo apoio e pela compreenso quanto minha ausncia nas reunies, viagens, defesas, por diversas vezes. Em especial, s minhas amigas de disciplinas, risos e riscos: Maria Cristina Andrade, Cludia Dias de Barros e Lvia Cucatto. FAPESP, pelo auxlio financeiro que possibilitou a realizao deste trabalho. Aos meus pais, Cleide e Edilson, e aos meus irmos David e Debora, pelo amor dedicado e pela torcida em mais uma etapa da minha vida. Sou eternamente grata por tudo que fizeram e que ainda fazem por mim. minha sogra Aparecida por me propiciar condies de estudo e pela afeio dedicada ao longo dos anos. Ao meu querido Everton, pela pacincia, carinho, cumplicidade e dedicao durante todo esse tempo. Obrigada pelo seu sorriso, por me ensinar e por me amar. minha sempre Clarinha, a quem devo mais que um agradecimento. Dedico este trabalho a ela, que, embora seja uma pequenina, acompanhou muito de perto o percurso para a realizao deste Mestrado. quele que mesmo antes de nascer, me fez companhia.

Finalmente, agradeo a Deus, por cuidar de mim e por ter me dado foras para a concluso deste trabalho.

A constituio de uma terminologia prpria marca, em toda cincia, o advento ou o desenvolvimento de uma conceitualizao nova, assinalando, assim, um momento decisivo de sua histria. Poder-se-ia mesmo dizer que a histria particular de uma cincia se resume na de seus termos especficos. Uma cincia s comea a existir ou consegue se impor na medida em que faz existir e em que impe seus conceitos, atravs de sua denominao. Ela no tem outro meio de estabelecer sua legitimidade seno por especificar seu objeto denominando-o, podendo este constituir uma ordem de fenmenos, um domnio novo ou um modo novo de relao entre certos dados. Benveniste, 1989.

When I use a word, Humpty Dumpty said, in rather a scornful tone, it means just what I choose it to mean -neither more nor less. The question is, said Alice, whether you can make words mean so many different things. The question is, said Humpty Dumpty, which is to be master -- that's all. Lewis Carroll (Alice's adventures in Wonderland).

Resumo
A elaborao da definio a etapa mais complexa e custosa numa pesquisa terminolgica que objetiva a elaborao de dicionrios especializados, j que um bom dicionrio se avalia, principalmente, pela qualidade das suas definies. Assim como h diferena entre termo e palavra, tambm h diferenas entre os modos de definir termos e palavras. Enquanto a definio lexicogrfica descreve e delimita os sentidos das palavras enquanto unidades do sistema, oferecendo todas as acepes possveis, a definio terminolgica (DT) oferece a identificao do termo somente com referncia ao sistema conceitual do qual faz parte. esse segundo tipo de definio, portanto, que objeto desta pesquisa de mestrado. Na experincia adquirida durante nossa pesquisa terminolgica realizada durante a Iniciao Cientfica, junto ao Grupo de Estudos e Pesquisas em Terminologia (GETerm), deparamo-nos com diversas dificuldades para a elaborao da DT. O mtodo de trabalho foi por diversas vezes alterado, adaptado, ampliado, revisto, de forma a dar conta dos desafios que iam surgindo. A partir dessa experincia, chegamos a um conjunto de procedimentos metodolgicos teis para a redao da definio, em qualquer domnio de conhecimento. Pretendeu-se, pois, nesta pesquisa de mestrado, sistematizar esses procedimentos, de modo a proporcionar conhecimento lingustico que ser implementado num ambiente computacional baseado na Web, de maneira a auxiliar demais grupos que desenvolvem pesquisas terminolgicas em lngua portuguesa a elaborar a DT de forma mais sistemtica.

Palavras-chave: definio terminolgica, corpus, relaes semnticas

Abstract
The making of the definitions is the most complex step in terminological research which aims to compile specialized dictionaries, for the good ones are evaluated mainly as to the quality of their definitions. As there are differences between terms and words, there are also differences between defining them. While the lexicographic definition specifies and describes the meanings of words as language units, giving all their possible senses, the terminological definition (TD) identifies and describes terms only in reference to the specific conceptual system to which they belong. Therefore, the TD is the object of this Masters study. Our undergraduate experience in terminological research in the Group of Studies and Research in Terminology (GETerm), revealed several difficulties associated with the TD process. The defining method was changed, adapted, extended, and revised to handle the challenges of the research. From that experience, we came to a set of methodological procedures to aid the TD routines in any domain knowledge. Accordingly, this Masters dissertation research aims to systematize those procedures to be implemented into a Web-based, computational environment (E-Termos) to aid research groups in their terminological endeavor.

Keywords: terminological definition, corpus, semantic relations

Lista de Figuras
Figura 1 Exemplo de DT no modelo GPDE....................................................................... 23 Figura 2 - Tipologia das relaes conceituais possveis (extrada de Seppl, 2004)........... 33 Figura 3 - Tela da Ontologia do DiRC .................................................................................. 43 Figura 4 - Tela da Base Definicional do DiRC ..................................................................... 45 Figura 5 - Tela do Scipo (Resumo Seleo da Estrutura) .................................................. 55 Figura 6 - Tela do e-Termos (Principal).............................................................................. 58 Figura 7 - Ficha Terminolgica do e-Termos...................................................................... 59 Figura 8 - Editor de Definio do e-Termos ....................................................................... 60 Figura 9 - Exemplo de armazenamento do corpus ................................................................ 64 Figura 10 Padro de nomeao de arquivos ....................................................................... 65 Figura 11 - Tela inicial do Editor de Cabealho.................................................................... 67 Figura 12 - Cabealho com etiquetas xml gerado pelo Editor de Cabealho .................... 67 Figura 13 - Anotao lingustica em xml gerado pelo Editor de Cabealho ..................... 69 Figura 14 - Telas Concord e WordList do programa WordSmith Tools......................... 74 Figura 15 - Telas sobre tags do programa WordSmith Tools............................................. 75 Figura 16 - Extrator semiautomtico de xml ..................................................................... 76 Figura 17 Arquivos referentes ao Anotador semiautomtico de xml ............................. 77 Figura 18 - Sistematizao proposta para o Editor de Definio do e-Termos................. 104 Figura 19 - Como ler os dados?........................................................................................... 120

Lista de Quadros
Quadro 1 - Tipologia das relaes propostas por Sager (1993) ............................................ 30 Quadro 2 - Tipologia das relaes conceituais utilizadas em Seppl (2004) ...................... 34 Quadro 3 - Relaes conceituais propostas por Feliu (2004)................................................ 35 Quadro 4 - Protocolo da relao Causalidade.................................................................... 36 Quadro 5 - Papis Qualia de Pustejovsky (1995).................................................................. 37 Quadro 6 Tipologia das relaes propostas por Jordan (1992) .......................................... 40 Quadro 7- Adequabilidade do tipo de ferramenta, quanto ao conhecimento do usurio ...... 54 Quadro 8 - Tipologia proposta (1)......................................................................................... 61 Quadro 9 - Tipologia proposta (2)......................................................................................... 61 Quadro 10 - Composio do corpus ...................................................................................... 63 Quadro 11 - Etiquetas utilizadas na anotao lingustica ...................................................... 68 Quadro 12 - Expresses lingusticas: AGENTIVO............................................................... 90 Quadro 13 - Expresses lingusticas: ASSOCIAO .......................................................... 91 Quadro 14 - Expresses lingusticas: CIRCUNSTNCIA ................................................... 91 Quadro 15 - Expresses lingusticas: CONSEQUNCIA .................................................... 92 Quadro 16 - Expresses lingusticas: CONSTITUTIVO ...................................................... 92 Quadro 17 - Expresses lingusticas: CONSTITUTIVO (continuao) ............................... 93 Quadro 18 - Expresses lingusticas: EXEMPLO................................................................. 94 Quadro 19 - Expresses lingusticas: MEIO ......................................................................... 94 Quadro 20 - Expresses lingusticas: SEMELHANA ........................................................ 95 Quadro 21 - Expresses lingusticas: TLICO ..................................................................... 95 Quadro 22 - Expresses lingusticas: TLICO (continuao) .............................................. 96 Quadro 23 Termos com sufixo -OSE ................................................................................. 98 Quadro 24 - Termos com sufixo -ITE ................................................................................... 98 Quadro 25 - Termos com sufixo -METRO ........................................................................... 99 Quadro 26 - Termos com sufixo -GRAFIA........................................................................... 99 Quadro 27 - Termos com sufixo -AGEM............................................................................ 100 Quadro 28 - Termos com sufixo -MENTO ......................................................................... 100 Quadro 29 - Termos com sufixo -O ............................................................................... 100 Quadro 30 - Termos com sufixo -IDADE ........................................................................... 101

Lista de Tabelas
Tabela 1 - Quantidade de DEns analisadas............................................................................. 79 Tabela 2 - Quantidade de DEns por DT................................................................................. 80 Tabela 3 - Relaes semnticas no corpus de acordo com a frequncia............................... 80 Tabela 4 - Sequncias produtivas das relaes semnticas.................................................... 81 Tabela 5 - Relaes semnticas na posio DE1................................................................... 82 Tabela 6 - Relaes semnticas na posio DE2................................................................... 82 Tabela 7 - Dados sobre as relaes ASSOCIAO e SEMELHANA............................... 83 Tabela 8 - Relaes semnticas na posio DE3................................................................... 83 Tabela 9 - Relaes semnticas na posio DE4................................................................... 84 Tabela 10 - Relao x + SEMELHANA............................................................................. 84 Tabela 11 - Relao x + ASSOCIAO............................................................................... 84 Tabela 12 - Relaes semnticas na posio DE5................................................................. 85 Tabela 13 - Relaes semnticas do campo DEFEITO................................................... 85 Tabela 14 - Relaes semnticas do campo DISFUNO..............................................86 Tabela 15 - Relaes semnticas do campo ENSAIO..................................................... 86 Tabela 16 - Relaes semnticas do campo TESTE E MEDIDA..................................... 86 Tabela 17 - Relaes semnticas do campo EXAME COMPLEMENTAR...................... 87 Tabela 18 - Relaes semnticas do campo INSTRUMENTO OU EQUIPAMENTO...... 87 Tabela 19 - Relaes semnticas do campo INSTRUMENTO DE MEDIDA................... 87 Tabela 20 - Dados quanto quantidade de itens lxicos por relao semntica................. .88 Tabela 21 - Dados quanto quantidade de itens lxicos por DEn.......................................................... .89

Sumrio

1 2

INTRODUO ........................................................................................................... 13 FUNDAMENTOS TERICOS.................................................................................. 16 2.1 2.2 2.3 2.4 2.5 2.5.1 ORIGENS E DESENVOLVIMENTO DA TERMINOLOGIA ............................................... 16 A DEFINIO .......................................................................................................... 19 A DEFINIO TERMINOLGICA (DT) ..................................................................... 21 RELAES SEMNTICAS ......................................................................................... 28 ALGUNS MODELOS E APLICAES SEMNTICAS...................................................... 31 Selja Seppl (2004)......................................................................................... 32

2.5.2 Judit Feliu (2004) ................................................................................................ 34 2.5.3 James Pustejovsky (1995).................................................................................... 36 2.5.4 3 3.1 3.1.1 3.1.2 3.1.3 Michael P. Jordan (1992)................................................................................. 38

FUNDAMENTOS PRTICOS ................................................................................. 42 MTODO DE ELABORAO DA DT NO MBITO DO GETERM .................................. 42 Ponto de partida: ontologia ............................................................................. 42 Base definicional .............................................................................................. 44 Observao e seleo dos traos semnticos................................................... 45

3.1.4 Redao da DT .................................................................................................... 47 3.1.5 Validao da DT................................................................................................... 48 3.2 INFORMTICA E ESCRITA ........................................................................................ 49

3.2.1 AMADEUS (Amiable Article Development for User Support)............................. 51 3.2.2 SciPo (Scientific Portuguese) ............................................................................... 54 3.3 4
E-TERMOS (TERMOS ELETRNICOS)........................................................................ 57

METODOLOGIA........................................................................................................ 61 4.1 4.2 4.3 4.4 4.5 4.6 PROPOSTA DE TIPOLOGIA DAS RELAES SEMNTICAS .......................................... 61 COMPOSIO DO CORPUS ....................................................................................... 62 ARMAZENAMENTO DO CORPUS ............................................................................... 64 NOMEAO DOS ARQUIVOS .................................................................................... 65 MANIPULAO DO CORPUS (EDITOR DE CABEALHO) ........................................... 65 PROTOCOLO DE ANOTAO DO CORPUS .................................................................. 69

4.6.1 Algumas regras quanto segmentao das DEns ................................................ 71 4.7 PROGRAMAS UTILIZADOS NA ANLISE DO CORPUS ................................................. 73 4.7.1 Wordsmith Tools................................................................................................... 73 4.7.2 Extrator semiautomtico de etiquetas xml....................................................... 75 4.7.3 Anotador semiautomtico de etiqueta xml....................................................... 76 5 6 7 ANLISE DO CORPUS.............................................................................................. 79 SISTEMATIZAO DO CONHECIMENTO OBTIDO NA PESQUISA ......... 102 CONSIDERAES FINAIS.................................................................................... 106

REFERNCIAS ................................................................................................................ 109 ANEXO I ............................................................................................................................ 115 ANEXO II........................................................................................................................... 116 ANEXO III ......................................................................................................................... 117 APNDICE A RELAES SEMNTICAS I E II .................................................... 118 APNDICE B ANLISE DAS DTS POR CAMPO SEMNTICO.......................... 120

Introduo

A Terminologia tem como foco privilegiado de investigao o termo, porm, o desenvolvimento terico e aplicado levou os estudos terminolgicos a tratarem tambm, por exemplo, das unidades fraseolgicas, textos de especialidades e da prpria definio, at mesmo porque cada um desses objetos, distintamente, projeta os fundamentos do conhecimento especializado. Nos ltimos 40 anos, vrios estudiosos, linguistas e no linguistas, vm se dedicando a esses objetos inerentes s lnguas de especialidade. Consequentemente, com o avano das reas de PLN (Processamento Automtico de Lngua Natural) e da Lingustica de Corpus, observaes de um grande volume de dados esto sendo realizadas, o que torna as anlises mais ricas e descritivas. Ao mesmo tempo, o uso de terminologias sistematizadas contribui para tornar a transferncia de conhecimento e a comunicao entre seus usurios mais eficazes. Com a associao entre Terminologia e a Informtica, possvel gerar com mais rapidez produtos terminolgicos mais fiveis, como vocabulrios, dicionrios, etc. No Brasil, a aproximao entre essas duas reas ainda incipiente, e os poucos terminlogos que desenvolvem esses produtos utilizam ferramentas computacionais no elaboradas especificamente para este fim. Nesse cenrio, caminha para a fase de finalizao, um ambiente computacional colaborativo baseado na web, denominado e-Termos, que prev seis etapas (desde compilao do corpus at edio do verbete), cujo propsito semiautomatizar as tarefas de criao e gerenciamento do trabalho terminolgico. Uma das etapas que ser acoplada ao eTermos constitui um Editor de Definio, que tem como objetivo auxiliar o terminlogo a redigir a definio terminolgica (DT) de forma sistemtica. A partir da hiptese de que as DTs seguem determinados padres semnticos, nossa proposta observar e descrever esses padres e, conseqentemente, sistematiz-los a fim de servirem como conhecimento lingstico a ser implementado no Editor de Definio do eTermos. A fim de que a etapa dedicada DT, de fato, facilite a tarefa da redao da definio de modo eficiente, necessrio o cumprimento de alguns objetivos especficos, os quais so propostos para essa pesquisa:

13

I.

identificao das relaes semnticas constitutivas das DTs do tipo gnero prximo e diferena especfica (GPDE), cujos termos esto organizados em campos semnticos pertencentes a reas de conhecimento distintas: Revestimento Cermico (domnio das Engenharias) e Fisioterapia (domnio das Cincias da Sade)1;

II.

observao e seleo das expresses lingusticas empregadas para expressar as relaes semnticas identificadas;

III.

observao e seleo de determinados morfemas que constituem os termosentradas para a identificao e recuperao do seu campo semntico e, por conseguinte, do seu hipernimo;

IV.

sistematizao dos aspectos lingusticos envolvidos na elaborao da DT.

Para a realizao desse estudo descritivo das DTs, foi necessrio o cumprimento de algumas etapas metodolgicas, quais sejam: i) composio do corpus, o qual foi formado por 500 DTs e seus respectivos termos, seguindo determinados critrios de escolha, referentes a sete campos semnticos da rea de Revestimento Cermico (tais como defeito, propriedade, equipamento, etc.), e a oito campos da rea da Fisioterapia (articulao, disfuno, teste e medida, etc.); ii) tratamento do corpus para que este pudesse ser manipulado computacionalmente. Esta etapa compreendeu o armazenamento e a limpeza do corpus, a nomeao padronizada de todos os arquivos que constituem o corpus e a anotao estrutural e lingstica do corpus; iii) observao e descrio dos aspectos semnticos das DTs, segundo uma tipologia de relaes semnticas elaborada nesta pesquisa; iv) descrio de determinados aspectos morfolgicos pertinentes para a identificao a qual campo semntico o termo pertence. Como resultado, foi realizada uma proposta geral de sistematizao quanto redao da DT de forma a integrar o Editor de Definio. O trabalho est organizado na forma descrita a seguir. No Captulo 2, so apresentadas a rea dos estudos terminolgicos e a teoria a qual nos filiamos a Teoria Comunicativa da Terminologia (TCT). Os tpicos seguintes so sobre a definio e a definio terminolgica. Em seguida, so apresentadas as relaes semnticas presentes na Terminologia e, ao final do captulo, as aplicaes semnticas na Terminologia:
1

O corpus da pesquisa ser detalhado no item 4.1.

14

Feliu (2004) e Seppl (2004); as relaes semnticas no nvel do lxico: Pustejovsky (2005), e no nvel do texto: Jordan (1992) so abordadas. No Captulo 3, so expostos os aspectos prticos que integram essa pesquisa. A saber: o mtodo de trabalho na redao da DT no mbito do GETerm; a relao informtica e escrita, por meio de dois ambientes computacionais de auxlio escrita acadmica (AMADEUS e SciPo) e o e-Termos. O Captulo 4 faz referncia metodologia empregada na pesquisa que teve por fim a observao e a descrio das DTs: proposta de tipologia das relaes semnticas empregada na anotao do corpus, composio e armazenamento do corpus, nomeao dos arquivos, manipulao do corpus, protocolo de anotao do corpus, alm da descrio dos programas computacionais utilizados: Editor de Cabealho, Wordsmith Tools e programas criados especialmente para essa pesquisa (Extrator semiautomtico de etiquetas xml e Anotador semiautomtico de etiquetas xml). O Captulo 5 destina-se anlise do corpus. No Captulo 6, exposta a sistematizao do conhecimento obtido na pesquisa. No Captulo 7, so apresentadas as consideraes finais. O Apndice A apresenta as relaes semnticas utilizadas como etiqueta no corpus e por fim, o Apndice B apresenta informaes das DTs de acordo com seu campo semntico.

15

Fundamentos tericos

2.1

Origens e desenvolvimento da Terminologia


A Terminologia, como prtica, data do sculo XVIII, com os trabalhos de Lavoisier e

Berthold no domnio da Qumica e Linn nos domnios da Botnica e Zoologia. O objetivo desses especialistas concentrava-se, sobretudo, na fixao das denominaes para os conceitos cientficos. O interesse dos especialistas pelos conceitos e denominaes continuou no sculo seguinte. Devido ao desenvolvimento progressivo das cincias, os prprios especialistas manifestaram particular interesse em sistematizar regras de formao de termos para cada domnio de especialidade (CABR, 1993, p. 21). No sculo XX, perodo em que o progresso das cincias e das tcnicas se intensificou, assim como o desenvolvimento crescente da tecnologia, os cientistas passam a se preocupar com questes inerentes s linguagens de especialidade: denominao e harmonizao de conceitos novos (CABR, 1993, p. 22). Nesse cenrio, surgem, na Europa, os primeiros trabalhos que se propuseram a estabelecer a Terminologia como uma disciplina: D.S. Lotte (1889-1950), pai da Escola Sovitica de Terminologia, e o engenheiro austraco E. Wster (1898-1977), fundador da Escola de Viena. Esses autores constituem os precursores da disciplina (CABR, 1993, p.22). Embora seja discutido qual dos dois inaugurou os estudos terminolgicos, de fato, a tese de doutoramento de Wster foi a primeira exposio sistematizada de uma teoria da Terminologia, intitulada de A normalizao internacional da terminologia, em 1931. Essa tese a primeira obra de Wster que apresenta sinais da elaborao da chamada Teoria Geral de Terminologia (TGT). Mais tarde, na dcada de 70, quando ele lecionou na Universidade de Viena, no curso de Introduo Teoria Geral de Terminologia e Lexicografia Terminolgica, Wster apresentou os pressupostos da TGT, os quais foram publicados, aps seu falecimento, no livro Introduo Teoria Geral de Terminologia e Lexicografia Terminolgica. A TGT tem como primazia o conceito e apresenta como proposta a compilao de conceitos e termos para a normalizao, com o objetivo de assegurar a univocidade da comunicao profissional. Para garantir esse mtodo prescritivo de tratar as terminologias, questes de sinonmia, homonmia e polissemia no so consideradas. Isso se relaciona com

16

o fato de que Wster postula que as linguagens de especialidade so dissociadas das lnguas naturais. Desta forma, conforme Cabr (in Prefcio da obra de Wster, 1998, p. 11), a TGT internamente coerente, pois se baseia no logicismo, na busca da lngua universal e na uniformidade da comunicao (traduo nossa)2. Contudo, a TGT vlida para resolver somente um tipo de comunicao: a estandardizada, ou seja, a comunicao padronizada, a qual apenas uma das possibilidades de comunicao real (CABR, 1999, p.129). As ltimas dcadas foram determinantes para que ocorresse uma reflexo acerca das insuficincias da TGT, j que houve um aumento significativo nas descries das terminologias, elaborao de obras terminogrficas, desenvolvimento de tecnologia adequada ao tratamento computacional de terminologias e ao planejamento lingustico. A partir dos anos 80, junto s crticas TGT, comeam a surgir perspectivas tericas novas, as quais apresentam como interseco o mesmo ponto de origem os estudos da linguagem, tais como:

I.

Socioterminologia (GAMBIER, 1987; BOULANGER, 1991, 1995; GAUDIN 1993, 2003): tem como foco a descrio dos termos em seus mais diferentes contextos de usos. A variao terminolgica estudada em movimentos sincrnico e diacrnico;

II.

Terminologia de Base Textual (HOFFMANN, 1998; CIAPUSCIO, 2003): tem como objetivo a compreenso minuciosa dos textos especializados, tanto em nvel macro como microestrutural;

III.

Teoria Comunicativa da Terminologia (TCT) (CABR, 1999, 2003): tem como princpio a viso lingustica sobre a linguagem especializada. Nessa abordagem, o termo integra um determinado mbito especfico, sem perder as caractersticas prprias de qualquer unidade pertencente ao sistema lingustico das lnguas naturais. Desta forma, um termo considerado um signo lingustico em funcionamento numa situao de comunicao especializada. A seguir, a TCT ser mais detalhada, j que a perspectiva adotada nesta investigao;

la TGT es internamente coherente, porque se basa en el logicismo, en la bsqueda de la lengua universal y en la uniformidad de la comunicacin.

17

IV.

Teoria Sociocognitiva da Terminologia (TEMMERMANN, 2000): apresenta como destaque o papel dos modelos cognitivos, procurando mostrar as relaes entre os processos de categorizao e a linguagem. A abordagem fundamentada na semntica cognitiva e questiona a centralidade da estandardizao em detrimento de uma descrio autntica dos significados dos termos tal como aparecem nos textos. As quatro perspectivas citadas se destacam por conceber as terminologias3 como

campos de investigao pertinentes linguagem, contudo, cada qual possui um foco especfico, se servindo de um aparato (no somente lingustico) que fornea contribuies apuradas de acordo com o que se est pesquisando; o mesmo ocorre com vrias correntes lingusticas (Anlise do Discurso, Sociolingustica, Semntica da Enunciao) e com os distintos nveis de anlise (morfolgico, sinttico, semntico lexical, textual). Como mencionado, dentre esses paradigmas, optamos pela Teoria Comunicativa da Terminologia (TCT) apresentada por Cabr (1999, 2003) e sua equipe do Instituto Universitrio de Lingustica Aplicada (IULA) da Universidade Pompeu Fabra (UPF) em Barcelona/Espanha. Ao contrrio da TGT, a TCT articula-se baseada na valorizao dos aspectos comunicativos das linguagens especializadas em detrimento dos propsitos normalizadores. De acordo com Almeida (2006, p. 86 e 87), um projeto terminolgico vinculado TCT deve refletir na sua prtica os seguintes pressupostos gerais:

I. o objeto central da Terminologia so as unidades terminolgicas e no os conceitos. Eleger as unidades como objeto central significa reforar uma perspectiva lingustica e uma abordagem semiolgica; II. no h uma diferena a priori entre termo e palavra, o que h so signos lingusticos que podem realizar-se no discurso como termo ou palavra dependendo da situao comunicativa; III. os nveis lexical, morfolgico, sinttico e textual podem veicular conhecimento especializado; IV. os termos devem ser observados no seu ambiente natural de ocorrncia, ou seja, nos discursos especializados; V. a variao conceitual e denominativa deve ser considerada; VI. do ponto de vista cognitivo, as unidades terminolgicas: i) esto subordinadas a um contexto temtico; ii) ocupam um lugar preciso num mapa conceitual, iii) o
3

consenso na rea grafar terminologia com t minsculo no sentido de conjunto de termos, e com T maisculo quando se refere ao campo de estudos ou disciplina.

18

seu significado especifico determinado pelo lugar que ocupam nesse mapa (CABR, 2003, apud ALMEIDA, 2006, p. 86 e 87).

Desta forma, na realizao desta pesquisa, fundamentamo-nos nos pressupostos tericos e prticos da TCT, pois julgamos que essa a abordagem mais apropriada na observao dos termos, suas definies e todas as suas implicaes (variao denominativa, ontologia, percurso semasiolgico ao onomasiolgico, significado, etc.). importante assinalar que a Terminologia, como uma rea da Lingustica Aplicada, pode apoiar-se em teorias lingusticas diversas, desde que essas propiciem subsdios para a construo da sua prpria teoria. Ainda sim, os estudos terminolgicos alimentam-se de outras grandes reas como Cincia da Informao, Computao, Traduo, Cognitivismo e, sobretudo, da prpria Lingustica.

2.2

A Definio
A definio est presente em diversos nveis do nosso cotidiano: em um nvel menos

formal, ao definirmos um dado objeto, sentimento ou ao para um simples interlocutor; como tambm comum em materiais didticos, manuais, textos de divulgao cientfica, etc.; at chegar ao seu alto nvel de formalizao, quando inserida em verbetes de dicionrios, glossrios, etc. Uma definio natural e uma definio dicionarstica diferenciam-se muito mais pela forma de apresentao do que pelo seu contedo. Enquanto na primeira permitido o uso de uma metalinguagem como definido como, poder ser considerado, designado como, significa, ou seja, expresses que evidenciam que se trata de um excerto definitrio; a definio dicionarstica se caracteriza por determinadas convenes que regem sua estrutura. No mbito da Terminologia e da Terminologia Computacional (ou Termintica), alguns pesquisadores analisaram de que forma a definio apresenta-se nos textos que constituem o corpus de pesquisa em um trabalho terminogrfico. No geral, essas pesquisas tm como foco a extrao semiautomtica de contextos definitrios, os quais podem corroborar com as etapas da elaborao do mapa conceitual (ontologia) e da prpria redao do texto definitrio4.
4

So exemplos desse tipo de pesquisa, os trabalhos de Auger (1998) e Sierra & Alarcn (2003).

19

Quanto a definies dicionarizadas, essas podem ser classificadas em definio lexicogrfica, definio enciclopdica e definio terminolgica. Larivire (1996, p. 409) discrimina os trs tipos:

I. definio lexicogrfica (DL): utilizada nos dicionrios de lngua e nos dicionrios enciclopdicos, prope-se explicitar os significados distinguindo os sentidos e os empregos dos signos (ou palavras) de uma lngua; II. definio enciclopdica (DE): utilizada nas enciclopdias e nos dicionrios enciclopdicos, prope-se fornecer um conjunto de conhecimento sobre uma coisa; III. definio terminolgica (DT): utilizada nos vocabulrios especializados, propese caracterizar (delimitar e distinguir de outras noes) as noes denominadas por um termo e que representam uma coisa no interior de um sistema organizado (traduo nossa)5.

Portanto, de se esperar que essas diferenas influenciem na constituio do texto definitrio. Pois, como afirma Barros (2004, p.159): no existe uma definio vlida para dois dicionrios, uma vez que a cada tipo de obra correspondem algumas caractersticas especficas que determinam o contedo e a organizao do enunciado definicional. Com essa afirmao, reitera-se a noo de que, assim como ocorre nos diversos gneros textuais citados (materiais didticos, manuais, textos de divulgao cientfica, etc.), a etapa que corresponde definio exige um certo planejamento anterior sua redao, principalmente quanto ao pblico-alvo e finalidade da obra em questo. Ou seja, o autor de um manual ou livro didtico tem como objetivo transmitir um dado assunto ou fazer com que o usurio execute uma dada tarefa, e para tal, o autor, necessariamente, apresenta uma linguagem que seja adequada a esse usurio, em termos estruturais e de contedo. O mesmo acontece na redao da DT, em que terminlogos preveem as necessidades dos consulentes em potencial e, a partir disso, adequam o texto definitrio.

la dfinition lexicographique (DL): utilise dans les dictionnaires de langue et les dictionnaires encyclopdiques, qui se propose d'expliciter des signifis en distinguant les sens et les emplois des signes (ou mots) d'une langue; la dfinition encyclopdique (DE): utilise dans les encyclopdies et les dictionnaires encyclopdiques, qui se propose de fournir un ensemble de connaissances sur une chose; la dfinition terminologique (DT): utilise dans les vocabulaires spcialiss, qui se propose de caractriser (i.e. de dlimiter et de distinguer des autres notions) des notions dnomimes par un terme et reprsentant une chose l'intrieur d'un systme organis.

20

2.3

A Definio Terminolgica (DT)


Mas afinal, como a DT pode ser definida? Alguns pontos de vista sobre a DT, os quais

sero descritos a seguir, devem ser considerados como produtos da movimentao da Terminologia de se firmar cada vez mais como disciplina lingustica. Entre as vises menos lingusticas sobre a DT, podemos destacar Wster, fundador dos estudos terminolgicos, que afirma: em seu sentido amplo, uma definio a descrio de um conceito mediante conceitos conhecidos, expressos geralmente por meio de palavras.6 (WSTER7, 1998, p. 65, traduo nossa). A TGT tem como foco principal o componente conceitual, em detrimento do significado. Se os conceitos, nesta perspectiva, so estveis, paradigmticos e universais, como idealiza o lgico-positivismo, a DT no realizada como um texto, e sim como um espelho do definiendum. As insuficincias e inviabilidades da TGT em situaes reais de comunicao especializada despertaram o interesse de grupos de pesquisadores, sobretudo do Canad, da Espanha e da Frana. Robert Dubuc um dos representantes mais renomados da famosa Escola Canadense de Terminologia e foi professor de Terminologia na Universidade de Montreal durante quase 30 anos. O seu livro intitulado Manuel pratique de terminologie (1992), que em 1999 foi traduzido para a lngua espanhola, apresenta, em 16 captulos, temas relevantes como: O que terminologia? Termos e noes, A terminologia bilngue e plurilngue, A ficha terminolgica,Definio, entre outros. No captulo referente Definio, o autor afirma que o objetivo da definio dar uma imagem mental exata de um conceito (...) que permita sua identificao, baseando-se em seus traos essenciais (DUBUC, 1999, p. 119, traduo nossa)8. Com relao s caractersticas da DT, o autor afirma que um texto definitrio satisfatrio deve ter clareza, adequao e conciso. Dubuc (1999) tambm aponta o que deve ser evitado numa DT: o texto no deve ser tautolgico, nem circular, e preferencialmente no deve ser escrito na forma negativa. Mais adiante, Dubuc (1999) dedica um subitem a frmulas de incio que servem para comear a definio de determinadas categorias morfossintticas. Um exemplo
en su sentido amplio, una definicin es la descripcin de un concepto mediante conceptos conocidos, expresados generalmente por medio de palabras. 7 A primeira edio dessa obra foi escrita em alemo e publicada em 1979. 8 dar una imagen mental exacta de un concepto (...) que permita su identificacin, basndose en sus rasgos esenciales.
6

21

que consta do captulo (DUBUC, 1999, p.125) refere-se definio do termo destilao: Ao e efeito de separar por meio do calor (...) (traduo nossa)9. Outro autor que merece destaque Juan Carlos Sager, estudioso argentino radicado na Inglaterra. Vale a pena mencionar que inicialmente ele se esforou no iderio da Escola de Viena para s depois chegar a contest-la. Em seu livro Curso prctico sobre el procesamiento de la terminologia (1993), traduo espanhola do ingls, obra originalmente publicada em 1990, no captulo La Dimensin Cognoscitiva, o autor aborda sequencialmente a teoria da referncia, a teoria dos conceitos e, em seguida, definies e alternativas e definies terminolgicas e relaes. Na obra, o autor afirma que a DT, enquanto produto, uma descrio lingustica de um conceito, constituda pela enumerao de um conjunto de caractersticas que do conta do significado do conceito (Sager, 1993, p. 68) (traduo nossa)10. O autor faz referncia ao tipo clssico de definio composto pelo gnero prximo e diferena especfica (GPDE), que se constituiu como referncia para a elaborao de definio desde os estudos filosficos, passando pela Terminologia Clssica, at alcanar lugar de destaque nos estudos terminolgicos nos dias de hoje. A definio que segue esse modelo GPDE, apresenta-se da seguinte forma: a DT encabeada pelo gnero prximo (GP), ou seja, um hipernimo (ou termo-pai), o qual geralmente recuperado observando-se o termo superordenado na ontologia.

Imediatamente, segue a diferena especfica (DE), que estabelece a diferena entre os termos-entradas que possuem o mesmo GP. Segue, na Figura 1, exemplo contendo 2 DTs que apresentam o mesmo GP11.

Accin y efecto de separar por medio del calor () es una descripcin lingustica de un concepto. Basada en el listado de un nmero de caractersticas que transmiten el significado del concepto. 11 DTs extradas do DiRC (Dicionrio de Revestimento Cermico), em fase de finalizao no mbito do GETerm.
10

22

Forno contnuo:

Forno utilizado na queima de peas cermicas, caracterizado por apresentar ciclo de queima constante, sem interrupo.

Forno tnel:

Forno utilizado na fabricao de revestimentos pelo processo de biqueima. Tem o formato de um tnel prismtico de seo retangular.
Figura 1 Exemplo de DT no modelo GPDE

Porm, como Sager acredita que esse modelo no adequado para definir todos os tipos de termos, prope a seguinte tipologia12:

I.

definio mediante anlise. Exemplo: estomatite = inflamao da boca;

II.

definio mediante sinnimos. Exemplo: margarida do campo = margaridaanual (Novo Dicionrio Eletrnico Aurlio verso 5.0);

III.

definio mediante parfrase. Exemplo: brancura = estado de branco;

IV.

definio mediante sntese (mediante relao identificativa, mediante descrio). Exemplo: margarida2 = em algumas mquinas de escrever e impressoras, disco com palhetas dispostas radialmente, na extremidade das quais h tipos em relevo para a impresso de caracteres (Novo Dicionrio Eletrnico Aurlio verso 5.0);

V.

definio mediante implicao (mediante o uso da palavra em um contexto explicativo). Exemplo: diagnstico = se faz um diagnstico quando se identificam certos sintomas como caractersticos de uma condio especial;

12

Alguns exemplos foram modificados, outros foram retirados do dicionrio eletrnico Novo Dicionrio Eletrnico Aurlio verso 5.0 (2004).

23

VI.

definio mediante denotao (mediante a enumerao de exemplos, mediante extenso). Exemplo: oceano = os oceanos so o Atlntico, o Pacfico e o ndico;

VII.

definio mediante demonstrao (definio ostensiva). Exemplo: desenhos, fotografias, referncia situacional.

Algumas definies podem ser mistas, como, por exemplo: mediante anlise e descrio; mediante sinnimo e descrio; mediante sinnimo e anlise.

Para Sager (1993), as definies terminolgicas cumprem trs funes:

I.

situam corretamente o termo em seu lugar dentro da estrutura de conhecimento. Isso pressupe certo conhecimento da rea, que se obteve a partir da leitura das definies j existentes, dos contextos, das consultas a especialistas;

II.

fixam o significado especializado do termo. Deve ser flexvel e menos rgida em certas reas do conhecimento como as recentes tecnologias; em oposio s taxonomias da Biologia, Qumica, Medicina;

III.

oferecem aos usurios no-especializados a compreenso do termo.

Segundo Cabr (1993), as definies devem ser elaboradas de acordo com uma srie de princpios e convenes, que so divididos em trs grupos: I. Adequaes gerais; II. Adequaes especficas e III. Expresso. Observem-se a seguir:

I. Adequaes gerais As definies devem: a) ser verdadeiras; b) permitir a distino dos outros conceitos; c) reconhecer as dimenses pertinentes de cada campo de especialidade; d) situar-se na perspectiva do campo nocional a que pertence o conceito; e) adequar-se a finalidades do trabalho de que faz parte.

II. Adequaes especficas

24

As definies devem: a) acoplar-se ao sistema de definies de um campo concreto, partindo da estrutura prvia deste campo; b) explicitar todas as caractersticas (traos) essenciais de cada conceito, de acordo com a estrutura nocional estabelecida; c) refletir as relaes sistemticas que cada conceito mantm com os demais conceitos do mesmo campo; d) incluir todas as caractersticas que, ainda que no sejam essenciais, so importantes para uma descrio completa do conceito; e) apresentar os traos dos conceitos de forma sistemtica, especialmente quando se trata de conceitos que pertencem a um mesmo campo do mapa conceitual.

III. Expresso As definies devem: a) ser expressas corretamente; b) ser formalmente adequadas, de acordo com as normas de construo de definies; c) utilizar a expresso adequada aos destinatrios do trabalho; d) constar de uma s orao, evitando pontos internos13; e) respeitar os princpios da lexicografia no que diz respeito a sua apresentao formal, que se resumem aos seguintes pontos: o descritor inicial deve ser da mesma categoria gramatical do termo descrito; devem-se utilizar palavras conhecidas pelos usurios em geral e, ao utilizar vocbulos mais especficos, eles tambm tm de ser entradas; a definio no deve ser circular; evitar a negao, a utilizao de parfrases desnecessrias e de frmulas metalingusticas.

13

Embora nem sempre seja possvel dar a exata fotografia do conceito com uma nica orao.

25

A tese de doutoramento de Maria Jos Bocorny Finatto (Universidade Federal do Rio Grande do Sul - UFRGS), denominada Definio terminolgica: fundamentos tericometodolgicos para sua descrio e explicao (2001), se prope observar as condies de subjetividade reveladas do texto definitrio, utilizando, para isso, os conceitos basilares da semntica enunciativa cunhados por mile Benveniste. A pesquisa demonstra a viabilidade e produtividade do reconhecimento de relaes mantidas quer entre o enunciado-texto da definio e seu ambiente de significao, quer entre o enunciado definitrio e seus sujeitos enunciadores (FINATTO, 2001, p. 14). Conforme Almeida et al. (2007) Ao trazer tona reflexes acerca da Terminologia e principalmente da DT, Finatto (2001) oferece um renovado paradigma terico, abrindo novos olhares sobre a DT como um objeto lingustico multifacetado:
preciso voltar a ateno para o texto definitrio em si mesmo, sem tomar um modelo prvio de observao, de modo a inscrev-lo relacionalmente em algo mais amplo, o que poderia ser algo como um frame de significao, simultaneamente construdo pelo indivduo-autor e pela coletividade que ele representa, recuperando-se, enfim, sua autoria, ambincia e, fundamentalmente, sua natureza lingustica (FINATTO, 2001, p.139).

Para alm das caractersticas desejveis que deve ter a DT, as quais j foram apontadas neste captulo, como afirma Almeida et al. (2007) parece-nos que cada vez mais necessrio admitir a presena de um sujeito enunciador no texto definitrio. Embora o redator da definio tenha uma certa liberdade quanto redao da DT (o que faz, alis, com que dois redatores redijam a mesma DT de formas distintas), ele est circunscrito num dado contexto de trabalho (pblico-alvo, objetivo da obra terminogrfica e etc.), e isso faz com que a tarefa da redao da DT possa ser otimizada. Como o objetivo final dessa pesquisa fornecer conhecimento lingustico acerca da DT para que se componha o Editor de Definio do ambiente e-Termos, os principais princpios e convenes da redao da definio terminolgica sero estruturados a fim de servirem como guia aos usurios do Editor. A seguir, sero apresentadas algumas noes que esto implicadas na DT e que so imprescindveis para a sua compreenso. Os conceitos/termos so descritos e se distinguem por meio da presena ou ausncia de traos ou caractersticas14. Orden-los em campos (como numa ontologia) um incio para

14

Trao e caracterstica, neste trabalho, so utilizados como termos sinnimos. Conforme assinala Barros (2004, p. 107): a identificao, a distino e a descrio dos diferentes conceitos so feitos por meio de traos de sentido, chamados em Terminologia de caracterstica....

26

que se compreenda o objeto, porm, no suficiente para que um termo seja discriminado dos demais. Em Cabr (1993, p. 198), as caractersticas, segundo a relevncia que manifestam na conformao de um conceito, podem ser:

I. II.

essenciais: em que descrita a essncia, a natureza do termo; no-essenciais ou complementares: so as que acrescentam elementos no relevantes descrio. Porm, a autora lembra que dependendo do campo de especialidade e dos objetivos do trabalho terminolgico, uma caracterstica noessencial pode converter-se em essencial.

Cabr (1993, p. 199) ainda assinala que as caractersticas podem ser intrnsecas e extrnsecas15, segundo a relao que mantm com o objeto que representam:

I.

intrnsecas: so inerentes ao objeto descrito. Exemplos: forma, cor, medida, material, etc.;

II.

extrnsecas: so externas ao objeto descrito. Exemplos: funo, origem, destino, localizao, inventor, etc.

Em muitos casos (especialmente quando se trata de substantivos concretos), podemos afirmar que uma caracterstica extrnseca ou intrnseca. Por exemplo, uma caracterstica intrnseca de um CD compact disc ser uma circunferncia com um furo no meio e metalizado (forma e material), ou seja, caractersticas constituintes da prpria natureza do termo. Ao mesmo tempo, possui caracterstica extrnseca de tocar msica e ser produzido na China (funo e origem). Contudo, muitas vezes as caractersticas intrnsecas no so suficientes para a descrio e distino de um termo, por isso faz-se necessrio que tambm se agreguem definio as caractersticas extrnsecas. Logo, se essencial ou no-essencial, vai depender se o termo exige (essencial) ou no (no-essencial) as caractersticas para ser definido.

15

Em Terminologia, a noo de caractersticas intrnseca e extrnseca iniciada por Wster (1998, p. 46), e que est presente na ISO 740/1987.

27

Assim, no mbito do GETerm, no que concerne prtica terminogrfica, consideramos que:


(...) no seja possvel, nem produtivo, insistir na ciso entre traos [caractersticas] intrnsecos e traos extrnsecos, propondo que os primeiros figurem na definio e os ltimos na informao enciclopdica (IE16). Ora, nem sempre se pode classificar com segurana o que so traos distintivos intrnsecos e extrnsecos do conceito cujo termo est sendo definido. Alm do mais, possvel que aquilo que julgamos ser um trao extrnseco , muitas vezes, a informao que faltava para o consulente compreender o termo-entrada. (Almeida et al., 2007)

Alm de no ser produtivo considerar essa ciso entre caractersticas intrnsecas e extrnsecas, relevante, num projeto terminogrfico, que a equipe estabelea um modelo de definio do termo, seguindo determinados critrios, e que esse modelo seja eficiente aos propsitos da pesquisa. Quanto a essa questo, Barros (2004, p. 109) destaca que como alternativa, a TCT defende a livre escolha do modelo lingustico para a anlise dos termos em todos os nveis, inclusive o semntico.

2.4

Relaes semnticas
Conforme Bodson (2004), os termos relao semntica e relao conceitual so

duplamente empregados nos estudos da rea. A escolha de um termo em detrimento do outro reflete, entre outras coisas, o ponto de vista adotado. O autor afirma que na verdade, a relao semntica explicita uma ligao entre dois significados, enquanto que a relao conceitual pe em relevo a estrutura de conhecimento [ontologia do domnio]17 (Bodson, 2004, p. 36, traduo nossa). Nesse sentido, assumimos, juntamente com Jackendoff (1983, p. 95), que, apesar de haver os dois nveis de representao mental (conceitual e semntico), essa distino no to produtiva, pois acaba denotando o mesmo fenmeno. Em razo disso, o autor vai preferir o termo estrutura semntica. Adotaremos, ento, em nosso trabalho, o termo semntico para compor as lexias trao semntico, relao semntica e campo semntico.

16

A informao enciclopdica um campo da ficha terminolgica, utilizada pelos terminlogos para inserir informaes que auxiliam na compreenso do termo, mas que no so consideradas imprescindveis. 17 En effet, la relation smantique exprime un lien entre deux sens, alors que la relation conceptuelle met plutt laccent sur la structure de la connaissance.

28

As relaes semnticas esto presentes nos estudos terminolgicos desde a tipologia de relaes hierrquicas inaugurada por Wster (1998), a qual at hoje considerada como referncia na rea. Essas relaes, sintetizadas por Sager (1993, p. 56 e 59), podem ser de dois tipos:

I.

relao genrica (espcie-gnero): que pode ser descrita como tipo de, mediante frmulas: X um tipo de A X, Y, Z so tipos de A A contm X, Y, Z A contm o subtipo X

II.

relao partitiva (parte-todo): que indica ligao entre os conceitos, os quais consistem em mais de uma parte e suas partes constitutivas. Ocorre mediante frmulas: X um componente de A X,Y,Z so componentes de A A consiste em X A consiste em X,Y,Z

Essas relaes, embora sejam relevantes para a Terminologia, ainda assim so insuficientes, fato esse que levou autores como Arnzt e Pitch (1989), e posteriormente Sager (1993), a considerarem tambm as relaes denominadas no-hierrquicas ou complexas, pois frequentemente os conceitos se inter-relacionam por suas proximidades situacionais, o que exige uma estruturao diferente das relaes genricas e partitivas. As relaes possveis propostas por Sager (1993, p. 62 e 63) podem ser:

29

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Relaes Causa Efeito Material Produto Material Propriedade Material Estado Processo Produto Processo Instrumento Processo Mtodo Processo Paciente Fenmeno Medida Objeto Contra-agente Objeto Recipiente Objeto Material Objeto Qualidade Objeto Operao Objeto Caracterstica Objeto Forma Atividade Lugar

Quadro 1 - Tipologia das relaes propostas por Sager (1993)

As relaes complexas entre os conceitos no se limitam a essa lista. Outras criaes so possveis e vo depender da rea que est sendo descrita. Os tipos de relaes podem ser evidenciados nos textos definitrios, por meio de expresses lingusticas que propiciem o estabelecimento das relaes propostas acima. Exemplo: causada por (1), propriedade de (3), instrumento para (6), lugar para (17), etc. No caso da Termintica, pesquisas tm sido realizadas a partir da eleio de determinadas relaes semnticas na extrao de informao semiautomatizada em corpus, tanto para a gerao de ontologia como para a extrao de enunciados definitrios. Essas investigaes revelam que existem quatro categorias de relaes muito produtivas, a saber: relao hiperonmica, relao meronmica, relao causal e relao de finalidade (Davidson et al. (1998), Marshman (2002), Marshman et al. (2002) e Condamines (2003)). Como tais relaes j foram objetos de estudo de vrias pesquisas da rea e, portanto, foram amplamente definidas, pretendemos no nos aprofundarmos nesse tpico. Contudo, alguns esclarecimentos acerca de cada relao so importantes para que, posteriormente, seja possvel eleger nossa tipologia de relaes a ser aplicada no corpus.

30

I.

relao hiperonmica/hiponmica18: relao que vincula um item especfico ao seu correspondente genrico ou um genrico ao seu especfico; relao meronmica19: relao que expressa vnculo entre um todo e suas partes;

II.

III.

relao causal: relao que vincula uma causa a seu efeito. As seguintes frmulas (genricas) podem ser empregadas para validar essa relao: X causa Y, em que X o agente causal e Y o efeito; ou X foi causado por Y, em que X o efeito e Y o agente causal;

IV.

relao de finalidade: relao que expressa a utilidade de uma entidade. A frmula (genrica) X serve para Y, em que X a entidade e Y a funo.20

O estudo acerca das relaes semnticas revela-se til na descrio, gerao e extrao de informao, sendo que para cada propsito de pesquisa relacionada ao tema empregado um modelo ou um rol de relaes semnticas que permita atingir determinados objetivos. Desse modo, no subcaptulo 2.5, sero apresentados e discutidos sobre alguns modelos e aplicaes semnticas no mbito da Lingustica e da prpria Terminologia que contriburam para esta pesquisa.

2.5

Alguns modelos e aplicaes semnticas


Ao longo do primeiro ano de pesquisa, em apresentaes realizadas do projeto de

mestrado, alguns questionamentos foram feitos sobre a validade das relaes semnticas elencadas na nossa descrio dos termos referentes s duas reas do conhecimento utilizadas no estudo, quais sejam: Fisioterapia e Revestimento Cermico. Dito de outro modo: as relaes elencadas esto de fato presentes em textos definitrios de outros domnios do conhecimento, de forma que os resultados obtidos nesta pesquisa possam ser replicados em outros domnios?
18 19

O mesmo que a relao genrica proposta por Wster. O mesmo que a relao partitiva proposta por Wster. 20 Ressalte-se que cada uma dessas relaes, especialmente as trs ltimas, podem ainda apresentar alguns desdobramentos.

31

Percebemos que relaes como: causa, finalidade, consequncia so mais usuais21, enquanto que traos como recomendao, diagnstico, indicao (DicFisio22) so mais especficos para determinados campos semnticos de algumas reas de especialidade. Ao mesmo tempo, graas s disciplinas cursadas e s leituras realizadas, pudemos entrar em contato com alguns autores que tratam de relaes semnticas, ou ainda, que aplicaram tais relaes em suas pesquisas, sob diferentes perspectivas. Deste modo, este captulo destina-se a discutir as relaes semnticas e/ou conceituais23 presentes em obras de determinados autores da Terminologia e da Lingustica Geral, e de que forma essas pesquisas podem contribuir com o estudo acerca da descrio da DT.

2.5.1 Selja Seppl (2004)


Entre os autores pesquisados, Seppl (2004), da Universit de Genve, foi a nica que tratou das relaes conceituais no mbito da definio terminolgica. Em seu trabalho Composition et formalisation conceptuelles de la dfinition terminographique, a autora prope, a partir da estruturao das relaes conceituais presente em Simmen (2002)24, uma tipologia de relaes conceituais utilizada para assinalar as diferenas especficas (DE) que compem as DTs do seu corpus, a fim de descrever padres recorrentes no texto definitrio, tais como: tipos de relaes, quantidades de DEs por DT e ordem da informao. Ela parte das seguintes relaes, explicitadas na Figura 2 (traduo nossa)25:

21 22

Dado esse j demonstrado pelos estudos terminolgicos (conforme captulo 2.1 desse trabalho). Dicionrio de Fisioterapia produzido no mbito do GETerm. 23 Ainda que j tenhamos postulado nossa posio quanto a essa ciso, neste captulo ser respeitada a terminologia empregada por cada autor, at mesmo como modo de recuperar o contexto de produo de cada um. 24 Simmen (2002), por sua vez, resgata relaes conceituais propostas por Arntz et Picht (1995), Dahlberg (1983), Gaudin (2003), Gouadec (1990), ISO (1987), Otman, (1989) e Sager (1993). 25 O original consta do Anexo I.

32

Figura 2 - Tipologia das relaes conceituais possveis (extrada de Seppl, 2004)

A partir dessas relaes e da observao do corpus, a pesquisadora props uma tipologia de relaes conceituais utilizadas na anotao das diferenas especficas (DEs). Ela ainda afirma que essa lista foi modificada e completada medida que a anlise do corpus avanava. O elenco de relaes conceituais proposto foi:

33

Relaes conceituais Agente Beneficirio Causa Condio Consequncia Contedo Destinatrio Domnio Extenso Funo Gnero Instrumento Objeto visado Parte Paciente Propriedade abstrata Propriedade mtrica Propriedade fsica Espacial Temporal Todo Utilidade Quadro 2 - Tipologia das relaes conceituais utilizadas em Seppl (2004)

A pesquisa de Seppl (2004) mostra-se extremamente relevante para este trabalho de mestrado, pois assim como se constitui a nossa proposta, ela partiu de um corpus constitudo por textos definitrios, analisou os traos e sistematizou-os com a finalidade de serem formalizados computacionalmente. Embora a nossa pesquisa tenha especificidades prprias, o mtodo de investigao dos textos definitrios se inspira no percurso de trabalho pelo qual Seppl (2004) passou (tais como: estudo acerca das relaes semnticas, elaborao e manipulao do corpus, listagem das relaes utilizadas, anlise dos dados).

2.5.2 Judit Feliu (2004)


Em sua tese de doutoramento, intitulada Relacions conceptuals i terminologia: anlise i proposta de deteccin semiautomtica, da Universitat Pompeu Fabra (UPF) em 34

Barcelona/Espanha, Feliu (2004) pesquisou as relaes semnticas com o propsito de observar em que medida essas relaes esto configuradas no corpus, a fim de elaborar um prottipo de sistema de deteco semiautomtica das relaes conceituais, que poder alimentar banco de dados e ontologias. Assim como Seppl (2004), o estudo baseou-se em relaes semnticas de obras terminolgicas at chegar a uma tipologia de relaes definitivas. A pesquisadora enfatizou o uso das expresses lingusticas pertinentes a cada relao e criou tambm um protocolo para cada uma. As relaes contempladas foram:

Relaes conceituais Semelhana (positiva ou negativa) Incluso (de classe ou hiponmica) Sequencialidade (espacial ou temporal) Causalidade (causal) Instrumental Meronmia (parte-todo) Associao (geral ou especializada) Quadro 3 - Relaes conceituais propostas por Feliu (2004)

Como a nossa anlise das DTs implicar, posteriormente, apresentar essas mesmas relaes aos usurios do Editor de Definio, o rol de Feliu (2004), embora seja aparentemente restrito (com 7 relaes principais), apresenta em cada relao uma noo mais abrangente e, consequentemente, uma variedade de expresses lingusticas arroladas em cada item, o que pode demandar maior formalizao computacional do Editor de Definio. Como exemplo, segue, no Quadro 4, o protocolo da relao Causalidade (traduo nossa)26.

26

O original consta do Anexo II.

35

SMBOLO: CAUS DESCRIO: Relao de causalidade: relao que se estabelece entre uma causa e o seu efeito. PROPRIEDADES: No simtrica e no necessariamente transitiva OBSERVAES: Apresenta subtipos: causal e procedimental ARGUMENTOS: 2 o > 2 segundo os subtipos RECURSIVIDADE: sim CARACTERSTICAS a: entidade. atividade. propriedade CARACTERSTICAS b: entidade. atividade. propriedade OBSERVAES (a/b): no necessariamente idnticas EXPRESSES DE RELAO: depender de; produzir; ser a causa (principal) de; deve-se a; implicar; aparecer; contribuir para; ocultar, dar lugar a; <cond.> encontrar:: reforar; provocar; aumentar; produzir; transformar-se em; aumentar; obter-se (+ger); dar lugar a; permitir (+inf) Quadro 4 - Protocolo da relao Causalidade

Por outro lado, um aspecto muito til do trabalho de Feliu (2004), do qual nos valeremos na formalizao das relaes, diz respeito organizao de um protocolo (semelhante ao Quadro 4), onde dever conter a definio, propriedades da relao e a descrio das expresses lingusticas.

2.5.3 James Pustejovsky (1995)


Uma perspectiva que vem sendo aproveitada pelos estudos da linguagem em geral, em especial pela Terminologia e pela Lexicologia27, a Estrutura Qualia proposta por Pustejovsky (1995), em sua obra intitulada The Generative Lexicon. Nesse livro, o autor postula que o significado de uma unidade lxica seja estruturado, na sua gramtica, em quatro nveis interligados. E um desses nveis a Estrutura Qualia, na qual esto contidas informaes semnticas bsicas de uma palavra. Conforme Pustejovsky (1995), a Estrutura Qualia define atributos essenciais de objetos, eventos e relaes, em funo dos quale:

27

Como em trabalhos de Hfling (2000), Zavaglia (2002) e Seppl (2004).

36

Formal: que distingue um objeto dentro de um conjunto; Agentivo: que apresenta fatores envolvidos na origem de um objeto; Tlico: que apresenta finalidade e funo de um objeto; Constitutivo: que apresenta relao entre um objeto e suas partes constituintes.

Nesta pesquisa, esse construto da Estrutura Qualia parece apropriado na observao preliminar das DTs, j que esses papis constituem-se questionamentos bsicos que se faz, geralmente, acerca de unidades lexicais, e que portanto tornam-se pertinentes constarem das DTs.

Papis Qualia Formal: o que x? Constitutivo: x feito de qu? Tlico: qual a funo de x? Agentivo: qual foi a causa de x? Quadro 5 - Papis Qualia de Pustejovsky (1995)

Segue um exemplo da definio de neuropraxia e da mesma DT anotada de acordo com os Papis Qualia:
Neuropraxia: disfuno neuromuscular caracterizada pela diminuio de alguns tipos de sensao, pela preservao distal do nervo e pela ausncia de potenciais de fibrilao nos msculos, causada por bloqueio, interrupo ou retardamento de conduo nervosa.

<QUALIA FORMAL > <QUALIA CONSTITUTIVO>

disfuno neuromuscular caracterizada pela diminuio de alguns tipos de sensao, pela preservao distal do nervo e pela ausncia de potenciais de fibrilao nos msculos, causada por bloqueio, interrupo ou retardamento de conduo nervosa.

<QUALIA AGENTIVO>

Se pensarmos nas duas etapas que andam juntas na redao da definio a ontologia e a base definicional conseguimos as respostas para as perguntas acima. De fato, so os questionamentos primrios que so feitos acerca de um termo, contudo, como afirma

37

Pustejovsky (1995): i) toda categoria expressa uma Estrutura Qualia e; ii) nem todos os itens lexicais carregam consigo valores para cada papel. Sobre esse dois pontos, Zavaglia (2002) declara que o primeiro item importante para se entender como um lxico gerativo sustenta uma representao semntica uniforme composicionalmente de todos os elementos de uma frase. J o segundo aplicvel e especfico para classes semnticas particulares (Zavaglia (2002, p. 114). Porm, a DT no se esgota aqui. Ela , acima de tudo, um texto em que esto implicadas outras relaes, no qual, geralmente, extrapola-se o conjunto categorial proposto pelo pesquisador. Compartilhamos da mesma opinio de Hfling (2000, p. 128), estudiosa que aplicou a Estrutura Qualia na anlise de definies lexicogrficas de nomes concretos:

Como vemos, a descrio da estrutura qualia pode ser aproveitada na definio lexicogrfica. Porm, no podemos esquecer que, ao contrrio de Pustejovsky que procura chegar a um ncleo significativo geral que permita a insero do item em diferentes contextos o lexicgrafo quer chegar a uma descrio dos diferentes usos e acepes. Por isso, o verbete do dicionrio no pode limitar-se apresentao da estrutura qualia, que deve ser complementada por especificaes adicionais que permitam ao consulente o emprego do item nos diferentes contextos de uso.

Desta forma, julgamos que esse modelo de Pustejovsky (1995) possa ser vivel na descrio inicial das DTs, entretanto, no se considera que somente os papis qualia sejam suficientes na descrio da maioria das DTs.

2.5.4 Michael P. Jordan (1992)


Para Jordan28 (1992), uma relao semntica constitui uma noo semntica textual de conexo binria entre quaisquer duas partes de um texto (apud Pardo, 2005, p. 18) e estas relaes capturam a forma como os conhecimentos contidos em um texto se relacionam, sendo completamente desvinculadas das intenes do escritor (Pardo, 2005, p. 19). Em seu artigo An integrated three-pronged analysis of a fund-raising letter, publicado em 1992, no livro Discourse Description Diverse linguistic analyses of a fund-raising text, Jordan (1992, p. 174) afirma que as oraes e sentenas so ligadas entre si por
Pesquisador do qual tomamos conhecimento na disciplina do mestrado sobre RST (Rhetorical Structure Theory) ministrada pela Profa. Dr. Lucia Helena Machado Rino. Jordan linguista da Queens University at Kingston. Suas pesquisas mais conhecidas so nas reas de Teorias Discursivas (da linha americana) e de PLN. Seu trabalho poder ser bastante aproveitado nesta pesquisa na parte de descrio das DTs.
28

38

significados especficos. O autor ainda oferece um exemplo, a fim de demonstrar como suas relaes se configuram num texto:

1. (Christ) has now reconciled you (to God) 2. by means of dying physically 3. in order that you will be holy MEANS de 1 PURPOSE de 1

As relaes propostas por Jordan (1992) podem ser observadas no Quadro 6 (traduo nossa)29.

29

O original consta do Anexo III.

39

Tipo de Relao Detalhe

Relaes identificao Classificao Especificao Aparncia Caractersticas Funo Material Partes

Tipo de Relao Tempo

Relaes Anterior Posterior Simultneo Tempo invertido Tempo

Manipulao textual

Elaborao Resumo Repetio Parfrase Previ Transio

Geral

Ativo Passivo Agente Fonte Especial

Inverso colateral Concesso Compatibilidade Contraste Comparao Condicionais Estrutura documental Real-hipottico Transio de dsticos

Lgica

Avaliao Base Causa Efeito Efeito emocional Finalidade Meios Problema Soluo Outras

Acompanhamento Circunstncia Circunstncia invertida Conexo Habilidade Exemplo Extenso Localizao Localizao invertida Maneira Verdade

Modal

Possibilidade Capacidade Preciso Exatido Necessidade Falta Concluso Realizao Futuro Inteno Ordem Autoridade

Quadro 6 Tipologia das relaes propostas por Jordan (1992)

Enquanto Seppl (2004) e Feliu (2004) apresentam uma representao mais conceitual, e Pustejovsky (1995) aproxima-se mais do paradigma categorial, a perspectiva de Jordan diferencia-se das demais por apresentar um carter mais textual, ou seja, o que est em jogo para o pesquisador so as relaes implicadas entre as partes do texto. Como se observa no Quadro 6, as relaes podem ser diversas, sendo que algumas delas tm

40

correspondncia com os outros autores explorados anteriormente (como causa, efeito ou consequncia, caractersticas, funo, e etc.). Como j foi mencionado, a DT constitui-se um texto e, alm das relaes semnticas e categoriais, ela apresenta caractersticas inerentes ao prprio texto. Desta forma, sero consideradas nessa pesquisa tambm as relaes de Jordan (1992) que se mostrarem profcuas. A proposta de tipologia das relaes utilizadas na descrio das DTs ser apresentada no Captulo 4 da dissertao, o qual destinado metodologia aplicada na pesquisa.

41

Fundamentos prticos
Esse captulo ser dedicado explicitao da prtica de elaborao da DT no mbito

do GETerm, apresentao dos ambientes web de auxlio escrita (AMADEUS e SciPo) e, finalmente, exposio do e-termos, ambiente colaborativo no qual sero implementados os resultados desta pesquisa. Esses itens explorados so de suma importncia para o desenvolvimento desse trabalho, pois a partir da perspectiva: de quais so os passos para a redao da DT (cap. 3.1), de que forma pode ser dado um suporte lingustico a um ambiente de auxlio escrita (cap. 3.2) e, de como o e-Termos se realiza (cap. 3.3), que direcionaremos a metodologia quanto s anlises das DTs.

3.1 Mtodo de elaborao da DT no mbito do GETerm


O GETerm vem desenvolvendo projetos terminogrficos desde 1999, em conformidade com a TCT. A DT sempre foi objeto de estudo do grupo, j que de todas as etapas que compem a elaborao de uma obra terminogrfica, como dicionrios, glossrio, etc., a definio se destaca por ser a mais custosa e complexa. Como para o GETerm a DT constitui-se um tema de pesquisa e uma prtica constante, o mtodo da sua redao foi por diversas vezes testado e alterado (quando preciso), com o propsito de tornar a prtica mais sistemtica, menos morosa e, sobretudo, com o menor ndice de erros. Neste captulo, sero apresentados os passos metodolgicos quanto elaborao da DT, os quais so seguidos pelo GETerm em seus projetos terminogrficos. So eles: i) Ponto de partida: ontologia; ii)Base definicional; iii)Observao e seleo dos traos semnticos; iv)Redao da DT e v)Validao da DT

3.1.1 Ponto de partida: ontologia


Inicialmente se parte da ontologia, a qual permite a visualizao das relaes de hiperonmia, hiponmia e co-hiponmia30 entre os termos que compem o domnio que est
30

Relao entre dois termos que esto no mesmo nvel da ontologia, tendo, portanto, o mesmo hipernimo. Exemplo: dentro do campo fruta (hipernimo), encontramos as unidades ma, laranja, banana, etc.,

42

sendo trabalhado. interessante selecionar o campo semntico com seus respectivos termos, que ser definido. Esse procedimento torna a atividade terminogrfica mais gil, pois proporciona: i) recuperao imediata do hipernimo (ou gnero prximo); ii) buscas por contextos explicativos e definitrios31 sobre o termo de forma mais otimizada, devido aproximao semntica entre os termos do mesmo campo; iii) sistematizao dos traos semnticos que comporo a DT devido a uma compreenso mais minuciosa do campo. Observe-se, na Figura 3, um trecho da ontologia do Dicionrio de Revestimento Cermico (DiRC) armazenada no formato Folio Views32.

Figura 3 - Tela da Ontologia do DiRC

Na ontologia acima, poder-se-ia, por exemplo, a partir do campo semntico Mtodo utilizado na queima, selecionar seus termos hipnimos monoqueima, biqueima (com os

constituindo todos hipnimos de fruta. Assim, a relao entre ma, laranja e banana uma relao de cohiponmia. 31 Segundo Aubert (1996), os excertos extrados de textos especializados podem ser classificados das seguintes formas: contexto associativo: apresenta o termo, mas no indica os traos semnticos dele; contexto explicativo: apresenta alguns traos semnticos como material, finalidade, funcionamento, similares; contexto definitrio: conjunto complexo dos traos semnticos distintos do termo, com certa abstrao. 32 Trata-se de uma infobase na qual as informaes so organizadas em registros, nveis, campos e grupos. O Folio Views permite, desta forma, a estruturao hierrquica dos termos.

43

subitens biqueima tradicional, biqueima rpida), terceira queima e quarta queima, para que sejam definidos.

3.1.2 Base definicional


O passo seguinte diz respeito base definicional. Tal denominao foi criada no prprio GETerm, a fim de nomear um repositrio de contextos definitrios e/ou explicativos referentes ao termo, compilados de diversas e variadas fontes, tais como: o prprio corpus da pesquisa, como tambm outras fontes no includas no corpus, mas que podem revelar-se fontes teis para a obteno de contextos, a saber: manuais, revistas cientficas, dicionrios de reas conexas, dicionrios de lngua geral, stios da Internet e demais fontes que se mostrarem teis para a obteno de textos pertinentes sobre os termos que sero definidos. A base definicional composta por uma tabela com 4 colunas, podendo ser executada no Microsoft Word ou no Microsoft Excel, por exemplo.33 As 4 colunas contm as seguintes informaes:

I. II.

1 coluna: o termo; 2 coluna: os contextos explicativos ou definitrios extrados do repertrio citado anteriormente;

III. IV.

3 coluna: as fontes a partir das quais os contextos foram obtidos; 4 coluna: a data da insero do contexto na base.

A base definicional deve ser compreendida como uma etapa importante do trabalho, j que dela que so extradas as informaes para elaborar as definies. Observe-se, na Figura 4, um trecho retirado da base definicional do DiRC.

No ambiente e-termos, h uma etapa prevista para o preenchimento da base definicional, o que torna o uso dos programas citados (Word e Excel) desnecessrio.
33

44

Figura 4 - Tela da Base Definicional do DiRC

Almeida et al. (2007) destacam algumas diferenas entre a base definicional e o corpus, comprovando que ambos no se confundem:
A base pode receber excertos em distintas lnguas, porque o que interessa a informao sobre o termo e no tanto o contexto de uso. Alm disso, no se exige que a base seja representativa, ou seja, que contenha os distintos usos do termo, nem balanceada, isto , que contemple distintos gneros textuais (ALMEIDA

et al., 2007). Portanto, a base definicional uma etapa adicional composio do corpus, na qual so inseridos contextos provenientes do corpus e de outras fontes, como j mencionado.

3.1.3 Observao e seleo dos traos semnticos


Na base definicional, a partir da leitura desses contextos referentes a vrios termos de mesmo campo semntico, so observados quais so os traos recorrentes na explicao

45

desses termos. Em seguida, realizada a sistematizao desses traos, a fim de estabelecer quais so importantes para compor a DT e qual a melhor ordem. Observe-se, a seguir, um conjunto de contextos do termo carbonato de clcio. Em cada um dos excertos, foram observados os traos semnticos recorrentes, assinalados nos textos entre colchetes vermelhos34:

[Precipitated calcium carbonate, in low micron sizes]2, [is used as na inorganic filler in "basing cements"]5.

[These cements consist of a two-stage phenol-formaldehyde resin, calcium carbonate filler ans enough hexameth-ylenetetramine to catalyze the reaction of the resin with heat]2. Sometimes various organic dyes are added.[Material can also be used for insulating coatings for ceramic capacitors and printed circuits]5.

[Sal clcica del cido carbnico, de frmula CaCO3]2. [Polvo blanco, insoluble en agua. Por efecto del calor (825 graus Celsius) desprende CO2, transformndose en xido clcico (cal viva).]3 [Se encuentra en la naturaleza como aragonito, calcita, piedra caliza, mrmol, etc.]4 [Se emplea en construccin, fabricacin de cementos y cal viva, y en la industria qumica.]5

(CaCO3): [es la metria prima ms usada para introducir calcio em pastas y esmaltes]5 . [Se expende em dos formas: na tural y artificial.]3 [La primera proviene del mineral calcita o rocas calizas molidas a malla No 200]2, [y es la preferida para la fabricacin de pastas]5 (suele llamarse carbonato de calcio "pesado"). [Existe tambin una forma ms pura, obtenida qumicamente por precipitacin ( es el carbonato de calcio"liviano").]2(...)

xido de Clcio. [Fundente, insolvel, refratrio e branqueador, torna o esmalte mais duro e resistente alm de baixo coeficiente de expanso.]3 [Usado na composio da maioria dos esmaltes.]5 [Fuso: 2095 a 2485 graus Celcius.]3

34

Exemplo extrado de Almeida et al. (2007).

46

[um slido branco, de frmula CaCO3, que pouco solvel na gua.]2 [O carbonato de clcio decompe-sepor aquecimento formando-se xido de clcio ( cal viva) e dixido de carbono.]3 [Ocorre na natureza como os minerais calcita e aragonita. As rochas contendo carbonato de clcio dissolvem-se lentamente sob a ao de chuvas cidas (contendo CO2 dissolvido) provocando dureza temporria.]4 No laboratrio, o carbonato de clcio precipitado borbulhando dixido de carbono na soluo aquosa de cal viva. [O carbonato de clcio usado na produo de cal (xido de clcio) por aquecimento]5 (decomposio trmica ), segundo a reao: CaCO3 CaO + CO2

Os traos recorrentes permitiram-nos agrupar um conjunto de quatro traos: constituio, propriedades, origem (como ou onde se obtm, ou como se origina a matriaprima) e emprego. Observem-se:

[1] o que (ou termo superordenado/hipernimo) [2] constituio [3] propriedades [4] origem [5] emprego

A partir do conjunto composto por esses traos, estabelece-se uma ordem de relevncia e de sequncia dos traos mais ou menos fixa. elaborada uma espcie de modelo ou gabarito que dever orientar a redao da DT de todos ou da maioria dos termos do campo semntico escolhido. Tal modelo se mostrou to til para a definio de substantivos, que ele aplicado em todos os projetos desenvolvidos no GETerm.

3.1.4 Redao da DT
Em seguida, a DT redigida, de acordo com os seguintes parmetros:

I.

a adequao do texto definitrio conforme o pblico-alvo e a finalidade da obra terminogrfica em questo;

II.

os traos semnticos estabelecidos;

47

III. IV.

os contextos inseridos na base definicional; as convenes quanto estrutura textual35.

Quanto complexidade da DT, Almeida et al. (2007) afirma:

(...) a tarefa da redao da DT das mais complexas numa pesquisa terminogrfica, j que o terminlogo precisa dominar uma multiplicidade de conhecimentos e habilidades. Primeiramente, fundamental que o pesquisador conhea a rea-objeto para a qual elabora o dicionrio ou glossrio. necessrio, tambm, que domine aspectos tericos e metodolgicos da Terminologia enquanto disciplina. Alm disso, espera-se que o terminlogo tenha noes de Lingustica, posto que so acionados conhecimentos de Lingustica Textual, Anlise do Discurso e demais subreas que tm o texto como objeto de estudo, afinal, a DT , antes de tudo, um texto. Por fim, o pesquisador deve conhecer a lngua em que desenvolve o produto terminolgico, j que a tarefa de elaborao da DT um verdadeiro exerccio de redao (Almeida et al., 2007)

Observe-se, a seguir, a definio de carbonato de clcio elaborada no GETerm para o DiRC, de acordo com os procedimentos descritos acima:

carbonato de clcio: [carbonato]1 [slido branco, insolvel em gua, decompe-se por aquecimento, formando-se xido de clcio (cal viva) e dixido de carbono]2. [Branqueador, torna o esmalte mais duro e resistente, alm de propiciar baixo coeficiente de expanso trmica.]3 [Ocorre na natureza como os minerais calcita e aragonita.]4 [ a matria-prima mais utilizada para introduzir clcio em massas e esmaltes. Empregado na composio da maioria dos esmaltes (fuso: 2095 a 2485C).]5

3.1.5 Validao da DT
Depois de redigida, a DT analisada e revista pelo coordenador do projeto em pauta. Ressalte-se a importncia da ontologia e da base definicional na reviso das DTs, j que o coordenador, muitas vezes, vale-se desses dois instrumentos para se certificar se os possveis problemas no texto so de ordem conceitual ou redacional, pois possvel recorrer

35

Destacamos que as seguintes convenes no foram utilizadas: a DT deve ser composta por uma nica orao; deve-se evitar a utilizao de parfrase ou glosa, como tambm as definies negativas. Anteriormente etapa da redao da DT, importante que a equipe envolvida tome decises acerca de quais convenes sero consideradas, levando em conta o pblico-alvo e a finalidade da obra terminogrfica.

48

facilmente s informaes originais. Depois dessa reviso, as DTs so submetidas aos especialistas de domnio. Somente aps a sua aprovao que ela inserida na ficha terminolgica. Essa sistematizao do trabalho na elaborao de DT revela-se vantajosa, pois o terminlogo no ir definir termos de modo aleatrio (como em ordem alfabtica, por exemplo), mas sim seguindo uma linha coerente que favorece a compreenso do termo e, consequentemente, a qualidade da DT. Como se observa pela descrio acima, os recursos informticos utilizados so adaptados a cada objetivo, de acordo com a etapa a qual se destina:

I. II. III.

ontologia: aplicativo Folio Views; base definicional: Word ou Excel; observao e seleo dos traos e redao da DT: editor de texto (Word, Bloco de notas, ou qualquer outro editor de texto);

IV.

validao da DT: editor de texto que tenha recursos semelhantes a inserir comentrios, por exemplo, como o caso do Word.

Contudo, o mtodo de trabalho deve ser constantemente aperfeioado. Como ser exposto mais adiante, o e-Termos, est sendo desenvolvido justamente para auxiliar a equipe de projetos terminogrficos em lngua portuguesa a desenvolver todas essas etapas com recursos especficos e de modo integrado e colaborativo, facilitando o intercmbio entre as informaes. Como ser observado no captulo 3.2, a rea de PLN tem contribudo com o desenvolvimento de recursos, ferramentas e ambientes que auxiliem os usurios na elaborao, correo e aprimoramento de seus textos.

3.2

Informtica e escrita
Atualmente, existem ferramentas que auxiliam usurios no processo da escrita a

melhorarem a qualidade do texto produzido. De acordo com Alusio (1995, p. 8), elas podem ser classificadas de acordo com diferentes critrios:

49

I.

com relao ao grupo de usurios a que so destinadas (escritores acadmicos, editores, secretrias, estudantes);

II.

com relao ao uso (para melhorar vrios aspectos de um texto, para escrever um texto que segue uma especificao, para aprender como se escreve um tipo de texto);

III. IV.

com relao tarefa a que so destinadas (auxlio escrita ou ensino da escrita); com relao ao tipo de texto a que servem (comerciais, acadmicos, instrucionais);

V.

com relao a qual estgio do processo da escrita so adequadas.

A pesquisadora ainda sublinha que, sobre o estgio do processo de escrita (item V), trs classes de ferramentas podem ser discriminadas (Alusio, 1995, p.8). So elas:

I.

ferramentas de pr-processamento do texto: auxiliam na fase de gerao de ideias e compreendem os editores grficos de redes de notas, os editores grficos de estrutura em forma de rvore e os outliners textuais que permitem expandir ou esconder os diferentes nveis de organizao de um texto;

II.

ambientes para a escrita: compreendem um conjunto de ferramentas destinadas a dar suporte a uma grande parte do processo de escrita (geralmente, da fase de gerao e agrupamento de ideias at a composio de um texto contnuo), ou a todo o processo. Combinam, geralmente, um editor grfico para as notas/ideias, um editor de estruturas e um editor de textos em um nico ambiente; e

III.

ferramentas para ps-processamento do texto: so destinadas a melhorar a qualidade do texto e compreendem ferramentas para checagem de estilo, corretores ortogrficos e gramaticais, ferramentas estatsticas e corretores de erros mecnicos.

Interessa-nos, nesta investigao, conhecer esses recursos, assim como compreender o percurso (sobretudo o de aspecto lingustico) realizado pelos envolvidos nos projetos. Ressalte-se que as ferramentas que sero apresentadas nos itens 3.2.1 e 3.2.2 nos serviram como motivao para a proposio do futuro Editor de Definio. Aqui, destacaremos dois

50

ambientes, os quais foram desenvolvidos no mbito do Ncleo Interinstitucional de Lingustica Computacional (NILC)36.

3.2.1 AMADEUS (Amiable Article Development for User Support)37


Projeto coordenado pelos pesquisadores Sandra Maria Alusio e Osvaldo Novais de Oliveira Jr. Trata-se de um ambiente computacional de auxlio ao ensino e produo da escrita acadmica em lngua inglesa para no-nativos. O AMADEUS foi o desdobramento de um estudo feito com alunos brasileiros no exterior, realizado por Fontana et al. (1993), cujo resultado demonstrou que alguns problemas na escrita dos alunos estavam relacionados ao uso inadequado ou ausncia de expresses especficas do gnero acadmico em lngua inglesa. Uma sada para esse problema, e que foi implementado no ambiente, a disponibilizao de expresses-padro utilizadas em textos reconhecidos como bons para que, no caso de dvida na escrita, o escritor tivesse uma base de bons exemplos da qual ele pudesse se valer. Para a gerao dessa estratgia, foi necessria a compilao de expresses e oraes extradas de artigos e livros cientficos. O ambiente, em seu mdulo lingustico, conta com quatro ferramentas interrelacionadas (ferramenta de referncia, ferramenta de suporte, ferramenta de crtica e ferramenta tutorial), as quais so ativadas pelos usurios de acordo com seu nvel de dificuldade em relao lngua inglesa e escrita acadmica. A seguir, cada uma das ferramentas ser detalhada:

I.

Ferramenta de Referncia

Essa ferramenta tem como finalidade servir de referncia para o escritor, no caso, um no-nativo, provendo uma base de expresses-padro que podem ser utilizadas na escrita cientfica, especificamente em artigos acadmicos. Na compilao dessas expresses, foi utilizado como corpus artigos do domnio da Fsica, a fim de verificar as expresses
36

O Ncleo Interinstitucional de Lingustica Computacional (NILC) est sediado no Instituto de Cincias Matemticas e de Computao (ICMC) da Universidade de So Paulo (USP), campus So Carlos. O grupo formado por pesquisadores cientistas da computao e lingistas - da USP/So Carlos, da Universidade Federal de So Carlos (UFSCar) e da Universidade Estadual Paulista (UNESP), campus Araraquara. Desde 1993 vem desenvolvendo projetos nas reas de Lingustica Computacional e Processamento de Linguagem Natural, tais como sumarizao e traduo automtica, ferramentas de suporte escrita e desenvolvimento de lxicos e corpora. Pode se acessado em: http://www.nilc.icmc.usp.br/nilc/index.html 37 http://www.nilc.icmc.usp.br/nilc/projects/amadeus.htm

51

lingusticas pertinentes aos componentes e subcomponentes da estrutura esquemtica de um artigo. De acordo com Feltrim (2004, p. 45), a ferramenta utiliza quatro recursos/bases:

a base de expresses-padro, chamada de Base de Padres; uma lista de componentes e subcomponentes da estrutura esquemtica para artigos proposta por Deyes (1982), com ponteiros para a Base de Padres; uma lista de funes retricas (p.e. definies, exemplificaes, etc.) que tambm apontam para as entradas correspondentes na Base de Padres; uma lista de palavras-chave caractersticas do gnero (p.e. report, paper, model, technique, etc.) que permite acesso rpido s entradas da Base de Padres, por meio de uma busca simples que retornar todas as expresses contendo a palavra-chave pesquisada.

II.

Ferramenta de Suporte

Como afirma Alusio (1995), embora a ferramenta de Referncia seja til para quebrar o bloqueio inicial com relao escrita, ainda assim se faz necessria a orientao quanto aos problemas textuais de escolha e ordenao dos componentes do artigo e do melhor padro de orao para o texto que est sendo redigido. Dessa forma, a ferramenta de Suporte cumpre esse papel de auxiliar o escritor a escrever com certa fluncia introdues de artigos do domnio da Fsica. O material lingustico assim como a estrutura esquemtica que compe esse estgio, devido ao grau de detalhamento, foi restrito seo Introduo de artigos cientficos do domnio da Fsica, os quais compem o corpus, sendo que a granularidade adotada para a anlise foi a oracional. Para tanto, segundo Feltrim (2004), Alusio (1995) utiliza dois mecanismos principais: i) instanciao de um esquema detalhado de introduo com material lingustico de textos autnticos; ii) aplicao de adaptaes interativas que flexibilizam as opes do esquema instanciado, sendo que o primeiro mecanismo fornece a estrutura retrica do texto real para que o escritor veja como os mecanismos de coeso so expressos na lngua. O segundo adapta essa estrutura s necessidades atuais do novo escritor.

52

Contudo, como afirma Alusio (1995), a ferramenta s deve fornecer suporte escrita de um texto inicial que, muito provavelmente, deve ser novamente revisado. A deciso final sobre a qualidade do texto est nas mos dos usurios.

III.

Ferramenta de Crtica

Segundo Alusio (1995, p. 5), pode-se dizer que crticas so sistemas que trabalham em cooperao com humanos para resolver algum problema, sendo que o papel desses sistemas apresentar uma opinio/crtica, no necessariamente negativa, sobre o produto ou ao gerada pelo humano (Alusio, 1995, p. 5). Assim, o usurio inicia a interao gerando um texto que ser criticado pelo sistema; em seguida, com as sugestes fornecidas, faz as alteraes que ele considera adequadas, ou ainda, pode procurar obter explicaes adicionais. Assim como as outras ferramentas, a crtica tambm se baseou na anlise da seo introdutria de artigos do mesmo corpus e suas estruturas retricas e mais outras informaes retricas particulares da rea.

IV.

Ferramenta Tutorial

Esse mdulo foi idealizado para o ambiente AMADEUS, porm, ainda se encontra em fase de estudo. Ele difere das outras ferramentas do ambiente por ser adequada quando o usurio completamente novato ou quando existe algum tpico que ele desconhea inteiramente. Nesse caso, desejvel uma interao tutor/aprendiz, pois o sistema tem mais conhecimento que o usurio (Feltrim, 2004). No Quadro 7, exibida a adequabilidade do tipo de ferramenta, de acordo com o conhecimento do usurio (Barros, 2000, apud Feltrim, 2004).

53

Quadro 7- Adequabilidade do tipo de ferramenta, quanto ao conhecimento do usurio

3.2.2 SciPo (Scientific Portuguese)38

O SciPo constituiu-se pesquisa de doutorado de Valria Delisandra Feltrim, sob coordenao de Maria das Graas Volpe Nunes e Sandra Maria Alusio, sendo que as trs so pesquisadoras do NILC-ICMC/USP - So Carlos. Trata-se de um ambiente web de auxlio escrita acadmica, baseado em corpus e em sistemas de crticas que visa auxiliar, sobretudo escritores iniciantes, na tarefa de estruturao e redao de duas sees de textos acadmicos Resumo e Introduo. O uso da abordagem baseada em corpus foi herdada do AMADEUS e parte do princpio de que os textos acadmicos so passveis de reuso do ponto de vista de sua estrutura retrica ou de seu material lingustico (expresses padronizadas). Como corpus foram utilizados resumos e introdues de teses e dissertaes da Cincia da Computao nas seguintes subreas: Banco de Dados, Inteligncia Computacional, Engenharia de Software, Hipermdia, Sistemas Digitais, Sistemas Distribudos e Programao Concorrente, Computao Grfica e Processamento de Imagens. O SciPo apresenta uma lista ordenada de componentes de estrutura esquemtica (como Contexto, Lacuna, Propsito, etc.) e suas respectivas estratgias retricas39 para a elaborao textual de um resumo ou de uma introduo, os quais sero criticados pelo sistema. Observe-se, na Figura 5, uma tela do ambiente:

38 39

O SciPo pode ser acessado no endereo: http://www.nilc.icmc.usp.br/nilc/projects/scipo.htm Por exemplo, na seo Contexto, como estratgias retricas apresentam-se os itens: Declarar proeminncia do tpico, Familiarizar termos e conceitos e Familiarizar a pesquisa a partir da grande rea.

54

Figura 5 - Tela do Scipo (Resumo Seleo da Estrutura)

Inicialmente, quanto Redao, h duas formas distintas de interao, as quais alcanam a mesma sada o texto pronto. A partir dos links Recriar estrutura e Crtica automtica, o usurio direcionado para a produo e a avaliao do seu texto:

I.

recriar estrutura: local onde o usurio iniciar seu texto a partir da escolha dos componentes e estratgias que iro compor a estrutura textual (Figura 5). Essa orientao do planejamento da estrutura para a redao do texto denominada top-down. Aps a seleo dos componentes e estratgias, ao clicar em Iniciar redao, o usurio direcionado tela Criao de texto, onde ele inicia a redao do texto, em formulrios, cada qual para um componente, de acordo com as escolhas realizadas. Caso o usurio deixe de selecionar algum componente indispensvel, ou ainda, que altere a ordem dos componentes (Exemplo: metodologia concluso propsito), ao clicar em Iniciar redao, abrir-se- uma janela com Crticas e Sugestes. Entende-se por Crticas as alteraes necessrias que o usurio necessita fazer em sua estrutura, de acordo com a estrutura mnima aceita pelo sistema. J Sugestes, como o prprio nome diz, so dicas que visam ao enriquecimento da estrutura esquemtica, as quais o usurio pode aceitar ou no;

55

II.

crtica automtica: local onde o usurio encaminhado para uma tela denominada Classificao e Crtica automtica. Aqui, o texto j pronto (ou rascunho) submetido a um campo a fim de ser classificado pelo sistema (nvel sentencial) quanto aos componentes da estrutura, sendo possvel tambm a edio do texto. Essa orientao partindo do texto pronto denominada bottom-up. Ressalte-se que o classificador automtico apresenta uma preciso mdia de 70% e que, dessa forma, possvel que haja uma classificao equivocada de algumas sentenas, contudo, o sistema permite que o usurio corrija eventuais equvocos. Em seguida, o texto submetido a Crticas.

O ambiente apresenta ainda outros recursos que podem auxiliar o usurio durante o processo da escrita acadmica. So eles:

I.

base de exemplos: exemplos autnticos (resumos ou introdues) de teses e dissertaes em Cincias da Computao (anotados e comentados), que podem ser acessados em qualquer momento da interao com o ambiente. O usurio ainda tem a opo de reutilizar alguma estrutura apresentada pela base em seu prprio texto;

II.

definio de componentes e exemplos de estratgias: cada componente e suas respectivas estratgias esto dispostas na ordem em que devem configurar o texto acadmico. Ao clicar no ponto de interrogao (?), uma janela com a explicao da Estratgia abrir-se-; clicando nas estratgias, o usurio direcionado a uma base com exemplos da estratgia solicitada, com expresses-padro destacadas;

III.

marcadores discursivos: expresses organizadas pela funo que desempenham no texto (adio, contraste, restrio, etc.);

IV.

revisor gramatical: pode ser acionado pelo link Revisar Texto durante a fase de edio do texto. O usurio pode ainda configurar o revisor de acordo suas preferncias. O sistema, ao detectar o erro, pode fornecer sugestes que o usurio pode aceitar ou ignorar.

56

Ao final da redao e reviso do texto, o sistema ainda oferece trs modos de armazenamento do arquivo: I. II. III. com o texto e a estrutura, no formato ASCII; com o histrico de crticas e sugestes, no formato HTML; somente com o texto, no formato RTF.

Semelhante aos dois ambientes de auxlio escrita apresentados neste trabalho, que prevemos o Editor de Definio. Ainda assim, imprescindvel que sejam expostas tambm as principais caractersticas do e-termos (Captulo 3.3), especialmente quanto s funcionalidades que se relacionam diretamente com a redao da DT.

3.3

e-Termos (Termos Eletrnicos)


Amparado pelos pressupostos tericos da TCT, o e-Termos40 um ambiente web

colaborativo que contempla as atividades de desenvolvimento de terminologias. Como uma aplicao Computer Supported Collaborative Work (CSCW), o ambiente prev seis etapas (mdulos) de trabalhos independentes, mas inter-relacionadas, cujo propsito automatizar ou semiautomatizar as tarefas de criao e gerenciamento do trabalho terminolgico. Sobre o e-Termos, Oliveira (2006) afirma:

O e-Termos como um Ambiente Colaborativo Web , sob uma perspectiva genrica, um sistema Web cuja entrada principal um crpus de especialidade de um determinado domnio do conhecimento, e a sada um produto terminolgico (glossrio, dicionrio, lista de termos, ontologia, etc.) do domnio em questo. Todas as funcionalidades que o sistema fornecer tm a funo primria de servir como suporte a todas as tarefas envolvidas na criao destes produtos. No entanto, tais funcionalidades sero abrigadas em uma nica ferramenta computacional (Ambiente) sendo transparente aos usurios. Os usurios, por sua vez, tm a participao colaborativa, interagindo com o sistema em diferentes fases do processo de elaborao do produto, a partir das interfaces Web que o Ambiente fornecer, tendo acesso compartilhado aos subprodutos gerados pelos mdulos, se assim for conveniente ou necessrio (Oliveira, 2006, p. 94 e 95).

O e-Termos contempla todo o processo de gerao de um produto terminolgico: desde a criao automtica de corpora especializados (etapa 1) at a distribuio e intercmbio do conjunto de verbetes (etapa 6).

40

Disponvel em: http://www.etermos.ufscar.br

57

Figura 6 - Tela do e-Termos (Principal)

O grande diferencial do e-Termos que ele

permite ainda que os diferentes integrantes de uma mesma equipe de pesquisa possam acessar, editar, atualizar, inserir e retirar informaes de todos os mdulos (corpus, ontologia, fichas terminolgicas, base definicional, redao de definies, edio de verbetes), bastando conectar-se internet, buscar a URL e utilizar uma senha de acesso. O mesmo procedimento pode ser utilizado para a interao com os especialistas do domnio, ou seja, especialistas previamente selecionados podem opinar, criticar, sugerir alteraes, ratificar os dados (lista de termos, definies, etc.) por meio de acesso internet (Almeida et al.,2006, p.44).

De modo sintetizado, a cada etapa do e-Termos so atribudas as seguintes atividades:

Etapa 1: compilao automtica de corpus Etapa 2: compilao e suporte para anlise de corpus Etapa 3: extrao automtica de candidatos a termos Etapa 4: edio da ontologia e insero de termos Etapa 5: criao e gerenciamento da base de dados terminolgica Etapa 6: edio dos verbetes e intercmbio dos produtos terminolgicos

Cada uma das etapas citadas acima prev uma srie de ferramentas de PLN que iro auxiliar em cada atividade do trabalho terminolgico. Destaca-se que a Etapa 5 a responsvel pela criao e preenchimento da ficha terminolgica, da elaborao da base

58

definicional e da redao da DT. E exatamente com essa ltima tarefa (redao da DT) que este trabalho de mestrado visa colaborar. Nesta etapa 5, aps o preenchimento da Base Definicional, o linguista ou terminlogo segue para a tarefa da Criao e Preenchimento dos campos da Ficha Terminolgica (Figura 7). No campo Definio, tem-se a opo de inserir logo o texto definitrio ou possvel ser direcionado para o Editor de Definio (Figura 8).

Link para o Editor de Definio

Figura 7 - Ficha Terminolgica do e-Termos

O Editor de Definio atualmente conta somente com o campo Definio ao lado esquerdo da tela, e os contextos definitrios acerca do termo a ser definido (cermica branca, como no exemplo da Figura 8), os quais foram coletados e armazenados na Base Definicional do ambiente.

59

Editor de Definio

Figura 8 - Editor de Definio do e-Termos

Assim, o desdobramento desta pesquisa de Mestrado ser a sistematizao dos procedimentos referentes redao da DT e sua posterior implementao41 no Editor de Definio do e-Termos. O prximo captulo ser dedicado explicitao de toda a metodologia empregada nesta pesquisa, incluindo a apresentao do corpus.

41

Lembramos que a implementao ser efetuada pelo informata Leandro Henrique Mendona de Oliveira, idealizador do e-termos.

60

Metodologia

4.1

Proposta de tipologia das relaes semnticas

Aps a pesquisa realizada com os quatro autores apresentados no subcaptulo 2.5 e com a anlise preliminar do corpus, chegamos seguinte tipologia de relaes semnticas utilizadas na descrio das DTs. Primeiramente, so considerados os papis qualia de Pustejovsky e, em seguida, outras relaes semnticas que se apresentam no texto definitrio. Como se observa no Quadro 8, em todos os papis qualia, h exemplos de relaes semnticas que os constituem, provenientes de Seppl (2004).

Papis Exemplos de relaes semnticas

Formal Hiperonmia Sinonmia

Constitutivo Propriedades Partes Material Aparncia

Tlico Funo Objetivo Utilizao

Agentivo Origem Causa

Quadro 8 - Tipologia proposta (1)

Em seguida, so consideradas outras relaes que tambm se mostram produtivas na DT. Foram extradas de Feliu (2004) e Jordan (1992). Ressalte-se que, em cada uma, podem ainda ser includas determinadas relaes, observem-se no Quadro 9.

Relaes semnticas42 Consequncia Efeito Produto Resultado Meio Instrumento Mtodo Circunstncia Semelhana Tempo Espao Exemplo Associao Elaborao Descrio Indicao Recomendao Deteco Quadro 9 - Tipologia proposta (2)

Co-hiponmia Hiponmia

As relaes CONSEQUNCIA, MEIO, CIRCUNSTNCIA, SEMELHANA, EXEMPLO, ASSOCIAO, ELABORAO, CONSTITUTIVO, AGENTIVO, TLICO, com exceo da FORMAL, sero efetivamente anotadas na anlise das DTs.

42

61

As relaes semnticas utilizadas na descrio do corpus, assim como a definio e exemplo de cada uma consta do Apndice A desta dissertao. Para a realizao da anlise das DTs, foi preciso, inicialmente, constituir um corpus do nosso objeto de estudo. A seguir, so apresentadas as etapas metodolgicas envolvidas: composio do corpus, armazenamento do corpus, nomeao dos arquivos e manipulao do corpus (incluindo a anotao). Tais etapas foram cumpridas respeitando uma sequncia, contudo, por falhas em geral, muitas vezes, foi necessrio retornar a uma etapa anterior da metodologia, a fim de que o erro fosse sanado, impedindo, assim, equvocos na anlise dos dados.

4.2

Composio do corpus
De acordo com Berber Sardinha (2004, p. 17), corpus uma coletnea de pores de

linguagem que so selecionadas e organizadas de acordo com critrios lingusticos explcitos, a fim de serem usadas como uma amostra da linguagem. Embora seja formado por pores de linguagem autnticas, o corpus , em si, artificial, criado para cumprir fins especficos. O corpus utilizado na pesquisa formado por 500 DTs e seus respectivos termos ou entradas, referentes a sete campos semnticos do Dicionrio de Revestimento Cermico e a oito campos do Dicionrio de Fisioterapia. O corpus possui no total 28.117 itens lxicos (entre termos e DTs), sendo que, desse nmero: 26.911 so relativos s DTs constitudas por gnero prximo e diferena especfica43 (GPDE) e 25.592 relativos apenas diferena especfica (DE). Ressalte-se que as DTs utilizadas como corpus so textos que j passaram pela reviso lingustica/terminolgica e pela apreciao minuciosa dos especialistas de ambas as reas. A eleio desses dois domnios (Revestimento Cermico e Fisioterapia) se deu por trs motivos: o primeiro pela facilidade ao acesso s DTs, j que foram obtidas no mbito do GETerm, no havendo, portanto, dificuldades quanto obteno das DTs por parte dos autores-pesquisadores. Isso permitiu que no se demandasse tempo em pedido de autorizao a pesquisadores-autores de DTs externos. A outra razo, mais terminolgica, reside no fato de que as reas escolhidas Revestimento Cermico e Fisioterapia so completamente distintas. Enquanto a primeira se insere no domnio maior das Engenharias de Materiais, a
43

Conceito j explicitado no item 2.3 deste trabalho.

62

segunda se insere no da Sade. E, certamente, esse dado provoca uma riqueza na anlise do corpus, j que a proposta final desta pesquisa a elaborao de um Editor de Definio que auxilie os terminlogos redigirem DTs em geral. O ltimo motivo e, sobretudo, o mais importante, que o corpus constitudo de DTs que foram redigidas de acordo com os procedimentos descritos anteriormente. Tais procedimentos envolvem etapas do processo terminogrfico que envolvem a redao da DT, conforme j apresentados no item 3.1. Esses dados sero retomados na anlise do corpus e subsidiaro a construo do Editor. As DTs esto distribudas conforme apresentado no Quadro 10.
Domnio DTs 21 36 35 Revestimento Cermico 51 60 13 34 4 8 91 9 Fisioterapia 8 13 43 74 Total 500 Quadro 10 - Composio do corpus Instrumento de Medida Movimento Articular Teste e Medida Tcnica e Recurso Teraputico IM MA TM TR Campo semntico Defeito Ensaio Etapa ou Mtodo de Fabricao Instrumento ou Equipamento Matria-Prima Produto Acabado Propriedade Ao Muscular Articulao Disfuno Exame Complementar Sigla DE EN EP IN MP PA PR AM AR DI EC

Como se pode observar, superficialmente o corpus no est balanceado, j que h campos com 4, 8, ou mesmo 13 DTs; e outros com 60, 74, 91 DTs. Isso ocorre devido ao fato de que o corpus reflete duas situaes acerca das duas reas: uma que os campos semnticos possuem termos em quantidades diferentes; e a outra quanto quantidade de DTs j elaboradas pelos terminlogos e revisadas pelos especialistas das reas. As DTs foram escolhidas de acordo com os seguintes critrios: 63

I. II. III. IV.

DTs revisadas quanto aos aspectos lingustico e semntico; DTs concernentes a termos da classe morfolgica substantivo; DTs elaboradas que seguem o padro gnero prximo e diferena especifica; DTs elaboradas de acordo com os traos semnticos previstos.44

Ressalte-se que a anlise foi realizada por grupos de DTs de mesmo campo semntico, e que a gerao de conhecimento realizada nesta pesquisa se aplicar a definies relativas a termos da classe gramatical SUBSTANTIVO, as quais seguem o padro GPDE, pois este se revelou como o mais produtivo na elaborao das DTs dos domnios eleitos.

4.3

Armazenamento do corpus
Aps a seleo das DTs, a etapa seguinte foi a de armazenamento do corpus. Cada

termo e sua respectiva DT foi armazenado individualmente em um arquivo txt (notepad ou bloco de notas), pois como o corpus seria tratado posteriormente por programas computacionais, esse o formato de arquivo ideal para a manipulao do corpus. Segue um exemplo na Figura 9, a ttulo de ilustrao.

Figura 9 - Exemplo de armazenamento do corpus

44

Esse critrio se refere eleio de DTs que foram elaboradas segundo o modelo proposto para cada campo semntico (como o exemplo do campo MP do domnio de Revestimento Cermico apresentado no subcaptulo 3.1.3). Embora tais modelos direcionem a redao das DTs, nem sempre todos os traos que os constituem se configuram no texto definitrio. Ainda assim, esse critrio relevante, pois se determinados traos no so contemplados na DT, pode ser devido a fatores como: ausncia de contextos definitrios ou explicativos melhores, reviso do especialista, trao no considerado como consenso pelas linhas de pesquisa da rea, etc.

64

Dessa forma, ao final do armazenamento, o corpus foi distribudo em 500 arquivos de extenso txt, sendo que, nesse momento, o formato eleito foi o ANSI (American National Standards Institute), pois uma exigncia do Editor de Cabealho e do Wordsmith Tools, programas computacionais utilizados na pesquisa.

4.4

Nomeao dos arquivos


Em seguida, os arquivos passaram pelo processo de nomeao. Seguiu-se o padro

abaixo:

DOMNIO45_CAMPO SEMNTICO46_NMERO DO ARQUIVO

sendo que, para os dois primeiros itens acima, foram criadas siglas, a fim de que o nome do arquivo no ficasse muito extenso. Exemplo:

F_AR_01

Fisioterapia

Articulao

No do arquivo

Figura 10 Padro de nomeao de arquivos

Esse padro de nomeao facilitou sobremaneira a recuperao da informao.

4.5

Manipulao do corpus (Editor de Cabealho)


Aps o armazenamento do corpus e a nomeao dos arquivos, o passo seguinte foi a

realizao da anotao do corpus, de forma a otimizar o armazenamento e a recuperao das informaes contidas em cada arquivo quando fossem realizadas as anlises. Nessa etapa, a
45 46

Fisioterapia ou Revestimento Cermico. Defeito, Disfuno, Tcnica e Recurso Teraputico, Propriedade, etc.

65

anotao estrutural (nome do arquivo, domnio, subdomnio, campo semntico, etc.) e anotao lingustica do corpus (termo, definio terminolgica, gnero prximo, diferena especfica, papis qualia, relaes semnticas, etc.) foram efetuadas. O tipo de anotao utilizada foi o padro xml, acrnimo de eXtensible Markup Language, que formado por uma linguagem que permite fazer dos documentos uma estrutura hierrquica, alm de permitir a criao de qualquer tipo de etiqueta de anotao. Inicialmente, foi gerado um cabealho para cada arquivo txt. Isso foi feito por meio do Editor de Cabealho47, um programa computacional que auxilia o linguista a especificar diversas informaes sobre os textos (Alusio & Almeida, 2006, p. 174). O programa sofreu algumas pequenas adaptaes e simplificaes da verso utilizada em outro projeto do GETerm48. Segue, na Figura 11, uma tela do Editor. Note-se, acima, o menu principal, por onde possvel abrir o arquivo desejado. Nesta tela tambm se encontra um espao ( esquerda) contendo a relao de arquivos que podero ser abertos, uma rea ( direita) de visualizao e edio do texto e o acesso ao editor de cabealho, que permitir o seu preenchimento.

O Editor de Cabealho foi originariamente elaborado para o Projeto Lcio-Web (LW), coordenado pela Profa. Sandra Maria Alusio, um projeto organizado pelo NILC, em parceria com o Instituto de Matemtica e Estatstica (IME) e com a Faculdade de Filosofia, Letras e Cincias Humanas (FFLCH), todos pertencentes USP. O LW disponibiliza livremente na Web: a) vrios corpora do portugus brasileiro escrito contemporneo, representando bancos de textos adequadamente compilados, catalogados e codificados em um padro que possibilite fcil intercmbio, navegao e anlise; e b) ferramentas lingustico-computacionais, tais como contadores de freqncia, concordanciadores e etiquetadores morfossintticos. (Alusio & Almeida, 2006, p. 162). Disponvel no site: http://www.nilc.icmc.usp.br/lacioweb/ 48 O projeto em questo o NanoTerm (Terminologia em Lngua Portuguesa da Nanocincia e Nanotecnologia: Sistematizao do Repertrio Vocabular e Elaborao de Dicionrio-Piloto), financiado pelo CNPq e iniciado em 2006. O projeto uma parceria entre a UFSCar, a USP/So Carlos e a UNESP/So Jos do Rio Preto, e tem como objetivos: 1) a constituio de um corpus em lngua portuguesa da Nanocincia e Nanotecnologia (N&N); 2) uma ontologia em lngua portuguesa da rea de N&N; 3) a elaborao do primeiro dicionrio-piloto de N&N em lngua portuguesa (Almeida e Alusio, 2006, p.174).

47

66

Figura 11 - Tela inicial do Editor de Cabealho

O cabealho (header) utilizado no Editor formado pelas etiquetas que se encontram em destaque na Figura 12.

Figura 12 - Cabealho com etiquetas xml gerado pelo Editor de Cabealho

67

Em relao anotao lingustica, foram substitudas as etiquetas do projeto NanoTerm por etiquetas que se adequassem aos propsitos deste projeto, conforme se pode observar no Quadro 11.49

Etiquetas
<TE> <DT> <GP> <DE> <DE1> <DE2> <DE3> <DE4> <DE5> <DE6>

Etiquetas
<AGENTIVO> <CONSTITUTIVO> <TLICO> <CIRCUNSTNCIA> <CONSEQUNCIA> <ELABORAO> <EXEMPLO> <LOCALIZAO> <MEIO> <SEMELHANA>

Quadro 11 - Etiquetas utilizadas na anotao lingustica

Segue, em destaque na Figura 13, a anotao lingustica no corpo do texto (body).

49

Essas etiquetas sero explicadas mais frente.

68

Figura 13 - Anotao lingustica em xml gerado pelo Editor de Cabealho

4.6

Protocolo de anotao do corpus


Para a anotao do corpus, foi criado um protocolo a ser seguido quanto a cada item.

Ressalte-se que esse protocolo foi por diversas vezes alterado, conforme explorvamos o corpus. Ao final dessa etapa, ele apresentou a seguinte configurao:

I.

anotao do CABEALHO em geral: nome do arquivo, domnio geral, campo semntico, entre outros. Nessa etapa, seria necessria a ontologia de cada domnio (Fisioterapia e Revestimento), contudo, a prpria nomeao do arquivo j indicava a qual domnio (rea) e campo semntico o termo e sua respectiva DT pertenciam;

II.

anotao do TERMO (<TE>): foi anotado com essa etiqueta o termo (ou os termos) que encabea a DT;

Exemplo: <TE>Contrao isomtrica</TE>

III.

anotao da DEFINIO (<DT>) 69

Exemplo: <DT><GP>contrao</GP> <DE>muscular esttica, onde h um aumento de tenso sem mudana no comprimento muscular. realizado contra um peso que no pode ser removido como, por exemplo, uma parede. Sua finalidade de manuteno da postura e estabilizao das articulaes.</DE></DT> IV. anotao do GNERO PRXIMO (<GP>): foi considerado como GP a expresso, formada por uma ou mais palavras, que inicia a DT. Com o gnero prximo recupera-se, geralmente, o termo superordenado (hipernimo) alocado na ontologia, ou ainda um termo sinnimo. Foi considerado como GP tambm adjetivo(s) ou locuo adjetiva que acompanham a primeira unidade lexical da DT, caso do exemplo abaixo;

Exemplo: <DT><GP>articulao cartilaginosa</GP><DE>formada por hialina (cartilagem translcida, cristalina, branco-azulada) que antes da idade adulta transforma-se em osso. O exemplo mais tpico a sincondrose esfeno-occipital que pode ser visualizada na base do crnio.</DE></DT> V. anotao da DIFERENA ESPECFICA (<DE>): foi considerada como DE toda a DT com exceo do GP, haja vista que o restante do texto , na verdade, a ordenao das relaes semnticas;

Exemplo: <DT><GP>articulao cartilaginosa</GP><DE>formada por hialina (cartilagem translcida, cristalina, branco-azulada) que antes da idade adulta transforma-se em osso. O exemplo mais tpico a sincondrose esfeno-occipital que pode ser visualizada na base do crnio.</DE></DT> VI. anotao das DIFERENAS ESPECFICAS (<DE1>, <DE2>, <DE3>, <DEn>): cada uma das relaes constitui uma diferena especfica, como dito acima. Assim, foi considerada como DEn fragmentos identificados como predicao do GP. Podem variar em extenso e serem constitudos por uma ou mais oraes, e at mesmo sentenas;

Exemplo: <DT><GP>disfuno msculo-esqueltica</GP> <DE><DE1> caracterizada por uma infeco inflamatria crnica das articulaes e ligamentos da coluna vertebral; </DE1> <DE2> tem inicio nas articulaes sacroilacas</DE2><DE3>causando alteraes vertebrais lentas no sentido de baixo para cima da coluna vertebral. </DE3></DE></DT> 70

VII.

anotao das RELAES SEMNTICAS I (papis qualia): dentro das DEns, anotou-se qual papel qualia cada uma desempenha. Ressalte-se que nem todos os papis qualia iro se manifestar numa mesma DT. Os papis podem ser: Formal (o que ?): representado por <FORMAL>50 Tlico (qual a finalidade?): representado por <TLICO> Constitutivo (do que feito?): representado por <CONSTITUTIVO> Agentivo (qual a origem?): representado por <AGENTIVO>

Exemplo: <DT> <GP> disfuno neuromuscular </GP> <DE> <DE1> <CONSTITUTIVO>caracterizada pela incapacidade do indivduo em realizar aes normais na execuo da marcha</CONSTITUTIVO></DE1> <DE2> <AGENTIVO> provocada por uma leso frontal bilateral.<AGENTIVO> </DE2> </DE> </DT> VIII. anotao das RELAES SEMNTICAS II (todas as demais relaes).

Exemplo: <DT> <GP> exame </GP> <DE><DE1> <CIRCUNSTNCIA> realizado quando h suspeita de fratura </CIRCUNSTNCIA></DE1><DE2> <TLICO>e que se constitui em registrar em filme especialmente sensibilizado as estruturas internas do corpo,<TLICO> </DE2><DE3><MEIO>atravs da passagem de raios X ou gama sobre a rea examinada.</MEIO> </DE3></DE></DT>

4.6.1 Algumas regras quanto segmentao das DEns


Durante a anotao lingustica do corpus, surgiram algumas dvidas a respeito de como proceder quanto segmentao das DEs e das suas relaes semnticas, haja vista que tratamos de linguagem natural e que ela , por natureza, passvel de vrios arranjos51. Desta forma, este captulo se destina descrio de algumas regras elaboradas para essa etapa da pesquisa.

50 51

Devido ao fato de o Papel Formal ser idntico ao GP, decidimos no anot-lo. Aqui podemos referir a hiptese do inatismo de Ckomsky que, entre outras ideias fundadoras, admite a capacidade de o falante produzir infinitos enunciados com finitas estruturas (conferir a obra inaugural do autor intitulada Syntactic Structures, publicada em 1957).

71

I.

cada DEn considerada INTEGRALMENTE como uma relao. Ou seja, cada DEn corresponde a uma nica relao semntica, no havendo portanto uma DEn com duas ou mais relaes;

II.

devem constituir as DEns fragmentos que funcionam como oraes subordinadas, parfrases, parnteses, JUNTO com a orao a qual se refere, pois esses fragmentos dizem respeito orao principal e no ao GP em si. A funo desses trechos implicaria em outro estudo, que pode ser realizado mais frente. Como o caso de:

</DE2> </MEIO> realizado por meio da avaliao dimensional, na qual se mede o material antes e aps a secagem. </MEIO> </DE2>

<DE1><CONSTITUTIVO>constituda essencialmente por silicatos hidratados de alumnio, que podem vir acompanhados de outros minerais (feldspato, quartzo, carbonatos e metais pesados) (...) </CONSTITUTIVO></DE1>

<DE1><TLICO>que avalia a capacidade que a superfcie da placa cermica possui de no alterar sua aparncia quando em contato com determinados produtos qumicos. </TLICO></DE1>

<DE2><CONSTITUTIVO>Apresenta ciclo de secagem de intervalo de tempo reduzido, ou seja, mais rpido que outros secadores industriais.</CONSTITUTIVO> </DE2>

<DE1><TLICO> (...) Tem como finalidade transferir tinta ou esmalte pelos orifcios da tela (que so coincidentes com o formato do desenho) at a superfcie cermica, formando uma estampa.</TLICO></DE1>

III.

DEns seguidas, que apresentam a mesma relao semntica, so marcadas cada uma INDIVIDUALMENTE, como em:

<DE2><AGENTIVO>provocada pela destruio progressiva dos tecidos que compem as articulaes.</AGENTIVO></DE2> <DE3><AGENTIVO>Ocorre devido ao uso ou movimento excessivo (...) </AGENTIVO></DE3> 72

IV.

h casos que apresentam sequncia de oraes (coordenadas) dentro de uma mesma relao. Nessas situaes, optamos por marcar todo o conjunto com uma mesma etiqueta. Segue um exemplo:

<DE1><TLICO>realizado para identificar as fases que se encontram slidos na massa cermica, e evitar que apaream fendas na pea queimada.</TLICO></DE1>

Observamos ainda que a anotao do corpus foi realizada de acordo com os critrios listados acima, subsidiados e revisados por ferramentas computacionais e trabalho humano. Apesar disso, considera-se que a tarefa de atribuio dessas etiquetas, sobretudo a descrio do que considerar como DEn e a qual relao ela se vincula, muitas vezes subjetiva, o que significa dizer que um outro anotador pode ter uma outra interpretao sobre a mesma relao.

4.7

Programas utilizados na anlise do corpus


Aps as etapas de anotao e reviso manual do corpus, os arquivos foram submetidos a

programas computacionais que pudessem dar suporte s nossas anlises. Nos prximos subcaptulos, os 3 programas utilizados sero resumidamente descritos.

4.7.1 Wordsmith Tools

Na anlise do corpus, foi utilizado o programa computacional WordSmith Tools, verso 3, da autoria de Mike Scott, da Universidade de Liverpool. O programa composto basicamente de ferramentas (Wordlist, Keywords e Concord), e em cada uma dessas ferramentas, h uma gama de outros recursos que auxiliam na descrio lingustica. A escolha por esse programa se deu pelo fato de que ele apresenta:

73

I.

bom desempenho estatstico: por meio da ferramenta Wordlist foi possvel recuperar informaes acerca da quantidade de palavras, sentenas, ndice de riqueza vocabular do corpus de modo integral, por campo semntico ou ainda individualmente (cada DT);

II.

manipulao de vrios arquivos ao mesmo tempo: o programa permite manipular vrios arquivos simultaneamente, fornecendo assim informaes (estatsticas e lingusticas) sobre cada arquivo em especfico;

III.

leitura de etiquetas xml (tags): recurso que permite a leitura de etiquetas, e por conseguinte, a criao de buscas especficas por meio delas.

Foram utilizadas, especificamente, as ferramentas Wordlist (sobretudo a janela dos dados estatsticos referentes aos arquivos selecionados) e Concord (para realizao de buscas especficas das relaes). Observem-se, na Figura 14, duas telas do programa, uma da ferramenta Wordlist e outra do Concord, a ttulo de ilustrao.

Figura 14 - Telas Concord e WordList do programa WordSmith Tools

Alm disso, todas as buscas tiveram como filtro as etiquetas xml. Para isso, foi muito produtivo o recurso Tags (inserido em WordSmith Tools Settings), que permite 74

fundamentalmente incluir ou no as etiquetas na visualizao das ocorrncias e selecionar partes do texto a serem analisadas. Observem-se, na Figura 15, telas ilustrativas desse recurso.

Figura 15 - Telas sobre tags do programa WordSmith Tools

De modo resumido, o WordSmith Tools foi til quanto recuperao de dados estatsticos das DTs e quanto descrio das relaes presentes nas DTs. Essas informaes foram organizadas e sero demonstradas no Captulo 5 do trabalho.

4.7.2 Extrator semiautomtico de etiquetas xml


O programa escrito em Perl52 idealizado, especialmente para esta pesquisa, pelo pesquisador de Mestrado Marcelo Adriano Amancio do mbito do NILC (USP/So Carlos), tem a finalidade de extrair de modo semiautomtico fragmentos anotados com as etiquetas em xml para um arquivo que agrupe os fragmentos pertinentes a uma mesma etiqueta.

52

Acrnimo de Practical Extraction And Report Language. Para saber mais, acesse: http://www.perl.com

75

A partir de: i) um arquivo que contm todas as 500 DTs53 anotadas (chamado de Corpus.txt) e de ii) um arquivo que contm o nome das dez etiquetas que nos interessam (chamado de Etiquetas.txt), so gerados os fragmentos agrupados em seus respectivos arquivos, segundo a sua etiqueta.

Figura 16 - Extrator semiautomtico de xml

Esse programa foi utilizado porque, alm de possibilitar outra disposio dos dados (por agrupamentos de fragmentos que apresentam a mesma etiqueta semntica), foi um modo produtivo encontrado para que eles fossem visualizados e para que, a partir dos arquivos gerados, as expresses lingusticas relativas a cada etiqueta de relao semntica fossem anotados em xml tambm (com o auxlio do programa que ser demonstrado em 4.6.3).

4.7.3 Anotador semiautomtico de etiqueta xml


O anotador foi outro programa idealizado para essa pesquisa pelo mesmo pesquisador do NILC, Marcelo Adriano Amancio, a fim de realizar anotao semiautomtica em xml das expresses lingusticas selecionadas a partir dos arquivos gerados pelo programa citado anteriormente.

53

A fim de juntar os 500 arquivos em txt num nico arquivo, foi utilizado um recurso em DOS (sigla para Disk Operating System) que realiza a gerao automtica de um nico arquivo a partir de vrios outros arquivos.

76

Trata-se de um anotador na linguagem de programao python54 que trabalha do seguinte modo: a partir do: i) arquivo txt nomeado com a etiqueta xml que dever ser usada na anotao (Exemplo: Marcador_agentivo, Marcador_exemplo, Marcador_tlico, etc.), contendo no corpo do texto todas as expresses que devero ser localizadas e anotadas posteriormente e de ii) um ou mais arquivos que constam do corpus que devero ser anotados com as etiquetas, gerado arquivo anotado com as etiquetas equivalentes s expresses encontradas.

Arquivo gerado com as expresses anotadas pela etiqueta <Marcador_Agentivo>

Figura 17 Arquivos referentes ao Anotador semiautomtico de xml

Nessa etapa de anotao das expresses lingusticas, optamos por gerar dez arquivos referentes s relaes semnticas utilizadas na pesquisa (AGENTIVO, CONSTITUTIVO, TLICO, ELABORAO, MEIO e etc.), conforme a segunda tela exibida na Figura 17; alm de realizar essa anotao das expresses lingusticas no prprio corpus integral com as 500 DTs, conforme terceira tela da Figura 17.
54

http://www.python.org

77

Em suma, os dois programas elaborados para essa pesquisa nos permitiram realizar anotao das expresses lingusticas de um modo otimizado e, alm disso, possibilitaram a gerao de arquivos (ou subcorpora) que podero ser aproveitados tanto nesta pesquisa como em outras.

78

Anlise do Corpus

Aps a anotao do corpus, e por meio dos programas apresentados nos subcaptulos 4.6.1; 4.6.2 e 4.6.3, foi iniciada a anlise das DTs. Conforme j mencionado, as anlises foram realizadas por grupos de DTs de cada campo semntico, e a seleo do que era relevante constar dessa anlise foi realizada a partir das perguntas pertinentes pesquisa em si, assim como outros dados que podem ainda serem aproveitados em trabalhos futuros55. A anlise do corpus foi efetuada em diferentes nveis. Inicialmente partimos de algumas informaes gerais (item I); em seguida abordamos aspectos semnticos da DT (item II), como as combinaes de DEns mais produtivas, posio de determinadas relaes e vnculo entre a escolha de certas DEns nas DTs e o campo semntico no qual o termo a ser definido se insere. No item III, expomos a quantidade de itens lxicos por DE e por relao semntica; no item IV, so apresentadas as expresses lingusticas empregadas pertinentes em cada relao; e no item V, quanto produtividade de alguns morfemas e seus respectivos campos semnticos.

I.

Informaes gerais:

Considerando os dois domnios analisados, foram analisadas 500 DTs agrupadas em 15 campos semnticos diferentes (mdia de 33 DTs por campo semntico). Quanto quantidade de DEns analisadas, tem-se a seguinte configurao:

QTDE. DE DEns ANALISADAS DE1 DE2 DE3 DE4 DE5 TOTAL

FREQUNCIA ABSOLUTA56 500 455 221 56 9 1241

FREQUNCIA RELATIVA57 40,3% 36,7% 17,8% 4,5% 0,7% 100%

Tabela 1 - Quantidade de DEns analisadas

55

Devido quantidade de resultados obtidos, optamos por inserir neste captulo as informaes de um modo geral, ou seja, englobando as 500 DTs. No Apndice B, so apresentados os dados referentes s DTs por campo semntico. 56 Frequncia absoluta (freq.abs.) corresponde quantidade de vezes que um valor aparece como dado da mostra. 57 Frequncia relativa (freq. rel.) corresponde ao quociente entre a frequncia absoluta do valor da varivel e o nmero total de observaes.

79

Todas as DTs analisadas do corpus apresentam no mnimo

1 DE

e no mximo

5 DEs

(totalizando a frequncia de 1241 DEns), o que comprova a afirmao de Bess (1996, apud Seppl, 2004, p. 149) quanto ao aspecto estrutural de que uma definio terminogrfica no comporta mais de 5 diferenas especficas (traduo nossa). Quanto quantidade de DEns que compe as DTs, os nmeros mais expressivos correspondem a DTs formadas por 2 DEs e 3 DEs (46,8% e 33,0% das DTs, respectivamente).

QTDE. DEns POR DT DT=GP+DE(DE1) DT=GP+DE(DE1+DE2) DT=GP+DE(DE1+DE2+DE3) DT=GP+DE(DE1+DE2+DE3+DE4) DT=GP+DE(DE1+DE2+DE3+DE4+DE5) TOTAL

FREQ. ABS. 45 234 165 47 9 500

FREQ. REL. 9,0% 46,8% 33,0% 9,4% 1,8% 100%

Tabela 2 - Quantidade de DEns por DT

Do total de 1241 DEns analisadas, as 10 relaes semnticas utilizadas para anotar as DEns apresentam a seguinte frequncia:

RELAO CONSTITUTIVO TLICO ELABORAO AGENTIVO EXEMPLO MEIO CIRCUNSTNCIA CONSEQUENCIA ASSOCIAO SEMELHANA TOTAL

FREQ. ABS. 388 288 248 121 47 46 41 37 20 5 1241

FREQ. REL. 31,3% 23,2% 20,0% 9,8% 3,8% 3,7% 3,3% 3,0% 1,6% 0,4% 100,0%

Tabela 3 - Relaes semnticas no corpus de acordo com a frequncia

As relaes semnticas mais frequentes no corpus so (23,2%),


ELABORAO

CONSTITUTIVO

(31,3%),

TLICO

(20,0%) e

AGENTIVO

(9,8%). Ressalte-se que a relao

ELABORAO

no integra os papis qualia propostos por Pustejovsky (1995). Ainda assim, a alta ocorrncia das outras trs relaes confirma uma das hipteses de pesquisa deste trabalho, ou seja, os papis qualia, que aqui so considerados como relaes semnticas, so compreendidos como informaes semnticas bsicas de uma palavra. De fato, esses papis se mostraram 80

recorrentes no corpus, totalizando 64,3% das relaes utilizadas, confirmando que as relaes que integram os papis qualia de Pustejovsky (1995) coincidem com aquelas que os terminlogos apontam como as mais frequentes. No que se refere frequncia da relao ELABORAO (20,0%), entendemos que se deve ao fato de que essa relao abarca outras relaes que decidimos no anotar individualmente, como
DESCRIO, INDICAO, RECOMENDAO, DETECO,

pois constituem relaes muito

especficas de determinados domnios. Ressaltamos aqui que a nossa proposta a sistematizao de relaes mais gerais que possam ser empregadas em distintos campos do conhecimento.

II.

Informaes semnticas:

Quanto ordem na qual as relaes se apresentam nas DTs, observamos que, considerando o critrio de 2 DEns em sequncia (desprezando a posio se a relao integrava a DE1, DE2, DEn), temos as seguintes sequncias produtivas:

SEQUNCIA DE RELAES TLICO + ELABORAO CONSTITUTIVO + TLICO CONSTITUTIVO + AGENTIVO ELABORAO + ELABORAO CONSTITUTIVO + ELABORAO TLICO + CONSTITUTIVO CONSTITUTIVO + EXEMPLO CIRCUNSTNCIA + CONSTITUTIVO CONSTITUTIVO + CONSEQUNCIA CONSTITUTIVO + MEIO CONSTITUTIVO + ASSOCIAO TLICO + MEIO AGENTIVO + CONSEQUNCIA ELABORAO + TLICO AGENTIVO + CONSTITUTIVO TOTAL

FREQ. ABS. 110 98 88 54 49 44 30 25 22 21 17 15 14 13 10 610

FREQ. REL. 18,0% 16,1% 14,4% 8,9% 8,0% 7,2% 4,9% 4,1% 3,6% 3,4% 2,8% 2,5% 2,3% 2,1% 1,6% 100,0%

Tabela 4 - Sequncias produtivas das relaes semnticas

As trs sequncias mais recorrentes no corpus so de


CONSTITUTIVO + TLICO

TLICO + ELABORAO

(18,0%),

(16,1%) e

CONSTITUTIVO + AGENTIVO

(14,4%), ou seja, como j

esperado, referem-se s relaes mais produtivas do corpus. Essas combinaes podem ser teis como sugestes para o usurio do Editor de Definio. Por exemplo, na redao da DT

81

de um substantivo x, a sequncia

CONSTITUTIVO + TLICO

sugere ao redator que descreva do

que constitudo e qual a funo do termo. Tambm foram analisadas as relaes segundo o lugar (DEn) que as relaes semnticas ocupam no texto da DT. Chegamos aos seguintes resultados:

DE1 CONSTITUTIVO TLICO CIRCUNSTNCIA AGENTIVO ELABORAO MEIO EXEMPLO TOTAL

FREQ. ABS. 292 151 35 12 5 4 1 500

FREQ. REL. 58% 30% 7% 2% 1% 1% 0% 100%

Tabela 5 - Relaes semnticas na posio DE1

As relaes semnticas que mais ocorrem como DE1, ou seja, como a primeira diferena especfica a aparecer na DT, so
CONSTITUTIVO

TLICO

(58% e 30%

respectivamente), sendo que essas duas relaes somam 443 (88%) das 500 DE1s analisadas. Em paralelo, relaes como
AGENTIVO, ELABORAO, MEIO e EXEMPLO

ocorrem nesta posio e

poucas vezes, com 22 ocorrncias (4%). Relaes como


SEMELHANA no

CONSEQUNCIA, ASSOCIAO

ocorrem nenhuma vez como DE1.

J na posio DE2, todas as 10 relaes apareceram pelo menos duas vezes (Tabela 6). Ao contrrio do que ocorre com a DE1, a DE2 apresenta uma distribuio mais equilibrada quanto s relaes que ocorrem nessa posio (de 23% a 0,2%):

DE2 ELABORAO TLICO AGENTIVO CONSTITUTIVO EXEMPLO MEIO CONSEQUNCIA ASSOCIAO SEMELHANA CIRCUNSTNCIA TOTAL

FREQ. ABS. 106 89 79 78 32 30 20 16 3 2 455

FREQ. REL. 23% 20% 17% 17% 7% 7% 4% 4% 1% 0% 100%

Tabela 6 - Relaes semnticas na posio DE2

82

As relaes ASSOCIAO e SEMELHANA so as que menos aparecem no corpus (com 20 e 5 ocorrncias, conforme apresentado na Tabela 3); e quando elas ocorrem nas DTs , na maioria das vezes, na posio DE2 (com 16 e 3 ocorrncias, respectivamente, o que equivale a 80% e 60% das vezes que ocorrem no total no corpus). Esses dados so apontados na Tabela 7.

RELAO ASSOCIAO SEMELHANA

TOTAL (FREQ. ABS.) 20 5

DE2 (FREQ. ABS.) 16 3

FREQ. REL. 80% 60%

Tabela 7 - Dados sobre as relaes ASSOCIAO e SEMELHANA

Todas as 10 relaes aparecem tambm no mnimo duas vezes na DE3, e a ordem do mais frequente para o menos frequente praticamente a mesma apresentada na Tabela da DE2. A relao ELABORAO se apresenta com 47% das DE3 do corpus.

DE3 ELABORAO TLICO AGENTIVO CONSTITUTIVO EXEMPLO CONSEQUNCIA MEIO ASSOCIAO CIRCUNSTNCIA SEMELHANA TOTAL

FREQ. ABS. 104 39 25 13 12 11 8 4 3 2 221

FREQ. REL. 47% 18% 11% 6% 5% 5% 4% 2% 1% 1% 100%

Tabela 8 - Relaes semnticas na posio DE3

No grupo de relaes referentes DE4 (Tabela 9), a ELABORAO aparece em 50% das 56 DE4 do corpus, e a relao
CONSTITUTIVO

deixa de figurar entre as mais frequentes,

aparecendo com 3 ocorrncias apenas. Acreditamos que isso se deva ao fato de que a caracterizao ou constituio de um termo seja mais frequente no incio do texto definitrio (conferir Tabela 5).

83

DE4 ELABORAO TLICO CONSEQUNCIA AGENTIVO MEIO CONSTITUTIVO EXEMPLO CIRCUNSTNCIA TOTAL

FREQ. ABS. 28 8 6 4 4 3 2 1 56

FREQ. REL. 50% 14% 11% 7% 7% 5% 4% 2% 100%

Tabela 9 - Relaes semnticas na posio DE4

SEMELHANA

ASSOCIAO

no apresentaram nenhuma ocorrncia na posio DE4.

Provavelmente, essas duas relaes sejam mais pertinentes quando se inserem poucas relaes semnticas na DT, pois ao redigir semelhante x, ou est associado x, geralmente no no final de uma longa descrio, mas sim no comeo e, na maioria das vezes, numa DT que contemple menos DEns (ver Tabela 7). Seguem as Tabelas 10 e 11, contendo as sequncias produtivas que contm as relaes
SEMELHANA e ASSOCIAO.

SEQUNCIA (SEMELHANA) CONSTITUTIVO+SEMELHANA TLICO+SEMELHANA EXEMPLO+SEMELHANA TOTAL

FREQ. ABS.

2 2 1 5

FREQ. REL. 40% 40% 20% 100%

Tabela 10 - Relao x + SEMELHANA

SEQUNCIA (ASSOCIAO) CONSTITUTIVO+ASSOCIAO CONSEQUNCIA+ASSOCIAO ELABORAO+ASSOCIAO TOTAL

FREQ. ABS.

FREQ. REL. 85% 10% 5% 100%

17 2 1 20

Tabela 11 - Relao x + ASSOCIAO

E por fim apresentamos os dados referentes DE5:

84

DE5 ELABORAO CONSTITUTIVO AGENTIVO TLICO TOTAL

FREQ. ABS. 5 2 1 1 9

FREQ. REL. 56% 22% 11% 11% 100%

Tabela 12 - Relaes semnticas na posio DE5

Fazem parte da DE em posio 5 os papis qualia de Pustejovsky (1995), entretanto, a relao ELABORAO novamente se mostra como a mais produtiva. No que se refere ao campo semntico no qual o termo a ser definido se insere, agrupamos os campos dos dois domnios que apresentam caractersticas semelhantes, a fim de demonstrar: a) em que medida o campo semntico interfere na escolha das relaes semnticas das DTs; b) o quanto as relaes so produtivas, mesmo em se tratando de domnios de conhecimento distintos.

Defeito (DE) e Disfuno (DI)

REVESTIMENTO CERMICO

RELAO CONSTITUTIVO CIRCUNSTNCIA AGENTIVO CONSEQUNCIA ELABORAO EXEMPLO TOTAL

FREQ. ABS. 19 18 16 7 4 1 65

FREQ. REL. 29% 28% 25% 11% 6% 2% 100%

DE

Tabela 13 - Relaes semnticas do campo DEFEITO

85

FISIOTERAPIA

RELAO CONSTITUTIVO AGENTIVO CONSEQUNCIA

FREQ. ABS. 91 85 26 8 3 1 1 215

FREQ. REL. 42% 40% 12% 4% 1% 0% 0% 100%

DI

ELABORAO CIRCUNSTNCIA ASSOCIAO EXEMPLO TOTAL

Tabela 14 - Relaes semnticas do campo DISFUNO

Esses dois campos, um do domnio da Fisioterapia e outro do Revestimento Cermico, se caracterizam pela presena das relaes semnticas comuns:
CONSEQUNCIA, CONSTITUTIVO, AGENTIVO e

pois so dois campos semnticos semelhantes e que exigem praticamente os

mesmos predicados.

Ensaio (EN), Teste e Medida (TM) e Exame Complementar (EC)

REVESTIMENTO CERMICO

RELAO TLICO ELABORAO MEIO CONSTITUTIVO TOTAL

FREQ. ABS. 38 35 19 2 94

FREQ. REL. 40% 37% 20% 2% 100%

EN

Tabela 15 - Relaes semnticas do campo ENSAIO

FISIOTERAPIA TM

RELAO ELABORAO TLICO MEIO TOTAL

FREQ. ABS. 81 44 1 126

FREQ. REL. 64% 35% 1% 100%

Tabela 16 - Relaes semnticas do campo TESTE E MEDIDA

86

FISIOTERAPIA

RELAO ELABORAO TLICO CONSTITUTIVO CIRCUNSTNCIA TOTAL

FREQ. ABS. 10 9 4 1 24

FREQ. REL. 42% 38% 17% 4% 100%

EC

Tabela 17 - Relaes semnticas do campo EXAME COMPLEMENTAR

Nesses trs campos analisados, as relaes que se mostraram profcuas foram


ELABORAO,

TLICO e

pois se trata de termos que expressam tcnicas ou ensaios, cuja finalidade

(TLICO) precisa ser explicitada, bem como a explicao (ELABORAO) de como so realizados.

Instrumento ou Equipamento (IN) e Instrumento de medida (IM)

REVESTIMENTO CERMICO

RELAO TLICO CONSTITUTIVO ELABORAO EXEMPLO CIRCUNSTNCIA TOTAL

FREQ. ABS. 58 34 34 7 1 134

FREQ. REL. 43% 25% 25% 5% 1% 100%

IN

Tabela 18 - Relaes semnticas do campo INSTRUMENTO OU EQUIPAMENTO

FISIOTERAPIA

RELAO TLICO CONSTITUTIVO ELABORAO SEMELHANA TOTAL

FREQ. ABS. 11 6 2 1 20

FREQ. REL. 55% 30% 10% 5% 100%

IM

Tabela 19 - Relaes semnticas do campo INSTRUMENTO DE MEDIDA

Os campos semnticos apresentados nas Tabelas 18 e 19 tambm trazem como mais frequentes as relaes TLICO, CONSTITUTIVO e ELABORAO.

87

Essa descrio demonstra que apesar de serem reas do conhecimento distintas, a estrutura de organizao da DT apresenta certa prototipicidade, comprovando que essa orientao pode ser til aos usurios do Editor de Definio.

III.

Informaes quanto quantidade de itens lxicos por relao semntica e por DEn:

RELAO ELABORAO ASSOCIAO TLICO CONSTITUTIVO EXEMPLO AGENTIVO CONSEQUENCIA MEIO CIRCUNSTNCIA SEMELHANA MDIA TOTAL

ITENS LXICOS 7052 465 6012 8086 739 1861 530 572 247 27 2559

QTDE. DE VEZES QUE A RELAO APARECE 248 20 288 388 47 121 37 46 41 5 124

MDIA DE ITENS LXICOS POR RELAO 28 23 21 21 16 15 14 12 6 5 16

Tabela 20 - Dados quanto quantidade de itens lxicos por relao semntica

O corpus revelou que as relaes

ELABORAO, ASSOCIAO, TLICO e CONSTITUTIVO

apresentam uma mdia maior de itens lxicos do que as demais relaes. Em contrapartida, as relaes MEIO, CIRCUNSTNCIA e SEMELHANA apresentaram ocorrncia inferior mdia total. Acreditamos que, no caso, a relao
ELABORAO

se mostrou com uma mdia superior

s demais porque por meio dessa relao so realizadas descries que, por sua vez, abarcam geralmente mais que duas oraes e at mesmo sentenas inteiras. Segue na Tabela 21, a relao quantidade de itens lxicos por DEn.

88

DEn ITENS LXICOS DE1 DE2 DE3 DE4 DE5 MDIA TOTAL 8743 10175 5187 1191 279 5115

QTDE. DE DEns 500 455 221 56 9 248

MDIA DE ITENS LXICOS POR DEn 17 22 23 21 31 23

Tabela 21 - Dados quanto quantidade de itens lxicos por DEn

Nota-se que a mdia de itens lxicos por DEn de 23. A DE5 se caracteriza por ser mais extensa que as demais (com mdia de 31 itens lxicos), e a DE1 como a mais curta (mdia de 17). Enquanto que a DE2, DE3 e DE4 aproximam-se da mdia.

IV.

Informaes quanto s expresses lingusticas e suas respectivas relaes semnticas58:

Apresentamos, em ordem alfabtica, os quadros que contm as relaes semnticas e suas respectivas expresses lingusticas. Destacamos que as expresses descritas esto na forma como ocorreram no corpus, ou seja, no esto em sua forma lematizada e apresentam diferenas entre incio em maisculo e minsculo.

58

Ressalte-se que as expresses lingusticas referentes relao ELABORAO no foram anotadas, pois conforme mencionado, o Editor de Definio, num primeiro momento, se dedicar a apresentao de relaes mais gerais que possam ser empregadas em distintos campos do conhecimento.

89

Expresses lingustica AGENTIVO As causas mais freqentes so As principais causas ou fatores de risco so Causada pela Causada por Causado pela Causado pelo causado pelos como proveniente de origem Decorre de decorrente de desenvolvida pelo Desenvolvida por Devido a Devido devido ao causado pela ocasionada por originada pela proveniente de provocada por provocada por provocado pela e so geralmente provocadas Em consequncia em decorrncia Em decorrncia de Obtm-se por obtida pelo

Expresses lingustica AGENTIVO Obtida por Obtido a partir Ocorre devido ao Pode ocorrer devido pode ocorrer pela Pode ocorrer por pode ser causada por Pode ser causado por Pode ser de origem pode ser desencadeado por Pode ser obtido por Pode ser provocada por Pode ser resultado de Pode ter origem podem ser provocadas por provocada geralmente por provocada pela Provocada por que ocorre devido que podem ser originados que provm do realizada pelo realizado pelo resultante de So causadas por So fatores que propiciam Suas causas mais freqentes so Suas causas possveis so trazida da

Quadro 12 - Expresses lingusticas: AGENTIVO

90

Expresses lingustica ASSOCIAO depende da comprometida devido Est diretamente ligada est relacionada est relacionada ao est relacionada s est relacionado com Os fatores que interferem Pode estar associada Pode estar associado pode estar relacionada com relacionadas relacionado sofre influncia principalmente

Quadro 13 - Expresses lingusticas: ASSOCIAO

Expresses lingustica CIRCUNSTNCIA aplicado antes e depois de aplicado no Efetuado em empregada na na placa cermica na superfcie no interior no revestimento cermico ocorre no momento da Pode ocorrer Pode se desenvolver quando que atua no que ocorre aps que ocorre durante que ocorre em realizada na realizado quando Surge utilizada quando

Quadro 14 - Expresses lingusticas: CIRCUNSTNCIA

91

Expresses lingustica CONSEQUNCIA afeta significativamente causando Como consequncia compromete comprometendo leva levando a levando levando ao o que leva pode causar Pode levar podendo comprometer podendo levar podendo ocasionar provoca Provoca provocando que provoca reduzindo Tem como consequncias tendo como consequncia

Quadro 15 - Expresses lingusticas: CONSEQUNCIA

Expresses lingustica CONSTITUTIVO Apresenta Apresenta propriedades como Apresenta-se como Apresenta-se na baseada na Baseia-se fundamentalmente caracterizada pela caracterizada pelo Caracterizada por caracterizado pela caracterizado pelo Caracterizado por composto de composto essencialmente por Consiste em Consiste na Consiste num consiste numa Constituda basicamente de Constituda especialmente de

Expresses lingustica CONSTITUTIVO Constituda essencialmente de constituda essencialmente pelo Constituda essencialmente por Constitudas por Constitudo de Constitudo por cuja aparncia cujo constituinte principal baseada na composta por composto, basicamente constituda de constitudo por formado por em que h em que ocorre em que so efetuados em que se em que se realiza Engloba

Quadro 16 - Expresses lingusticas: CONSTITUTIVO

92

Expresses lingustica CONSTITUTIVO essencialmente constitudo por feito de Formada por Formado por na qual na qual as na qual um no qual no qual a no qual o no qual ocorre o no qual os por meio da qual se observa Possui forma que apresenta Que apresentam caractersticas que consiste que consiste em que consiste na que consiste num que consiste numa que descreve que envolve que inclui que indica que possui que se apresenta como que se caracteriza pela que se caracteriza pelo que se caracteriza por que se constitui em relacionada relacionada ao se baseia Seu material pode ser tem formato Tem o formato de

Quadro 17 - Expresses lingusticas: CONSTITUTIVO (continuao)

93

Expresses lingustica EXEMPLO Alguns exemplos so As formas de aplicao mais conhecidas so As formas mais conhecidas de aplicao so como por exemplo como, por exemplo H dois tipos: mais usados so O exemplo mais tpico Os exemplos mais comuns so: Os principais tipos Os principais tipos so: pode ser classificada em pode ser: podem ser classificadas em: podem ser classificados em podem-se dividir em podem-se dividir nos seguintes tipos: so classificadas em So exemplos Um caso comum Um exemplo comum Um exemplo desse tipo Um exemplo seria

Quadro 18 - Expresses lingusticas: EXEMPLO

Expresses lingustica MEIO analisada por meio do realizada tanto pelo mtodo realizado atravs do realizado em realizado por meio da realizado visualmente, na qual empregada O equipamento utilizado nesta tcnica Os aparelhos utilizados Pode ser realizado pelo Pode ser realizado por podendo ser medido podendo ser realizado por dois mtodos principais por meio da por meio de por meio do realizada por meio de tendo como parmetro Utiliza-se o mtodo

Quadro 19 - Expresses lingusticas: MEIO

94

Expresses lingustica SEMELHANA Conhecida como Contrrio a Contrrio Espcie de Ope-se ao

Quadro 20 - Expresses lingusticas: SEMELHANA

Expresses lingustica TLICO a fim de a fim de que a qual possibilita dar Alm da utilizao como Atua como atuam como com a finalidade de com o fim de com o objetivo de com o propsito de com objetivo de conferindo cuja funo cuja principal caracterstica propiciar Cumpre funo Dentre os objetivos, encontram-se destinado ao empregada empregada com o objetivo de empregada como empregado em empregado na geralmente empregada como possibilita preferencialmente usado responsvel por utilizada nas utilizada no utilizada para utilizada para utilizado em utilizado para Empregado em empregada na Empregado na

Expresses lingustica TLICO Empregado nas Empregado nos geralmente utlizada para muito utilizada como Muito utilizado como Muito utilizado na no qual se controla Normalmente se utiliza O objetivo Os objetivos so Os principais efeitos para evitar Para fins para obter pode ser empregado como pode ser utilizada na pode ser utilizada para Pode ser utilizado possibilitando a promove a Propicia propiciando prprio para provoca a que avalia que avalia a que controla que determina que fornece que identifica que permite que produz Que quantifica que registra que se dedica a

Quadro 21 - Expresses lingusticas: TLICO

95

Expresses lingustica TLICO que serve para que tem como finalidade que tem como funcionalidade que tem por finalidade que tm por objetivo que tem por objetivo que tem por objetivo atingir Que tem por objetivo aumentar Que tem por objetivo avaliar Que tem por objetivo avaliar que tem por objetivo detectar que tem por objetivo determinar Que tem por objetivo identificar Que tem por objetivo mensurar que tem por objetivo mostrar que tem por objetivo realizar que tem por objetivo verificar que visa realizado para Responsvel por So utilizadas serve como Sua aplicao favorece Sua finalidade Tal recurso objetiva Tem como finalidade Tem como objetivo Tm diversas aplicaes tem por finalidade Tem por objetivo Utilizada em utilizada na utilizada no utilizado com a finalidade de Utilizado em utilizado junto Utilizado na utilizado na utilizado no utilizado para Utilizado para Visa

Quadro 22 - Expresses lingusticas: TLICO (continuao)

96

V.

Informaes quanto aos aspectos morfolgicos:

H projetos terminogrficos que no fazem uso de ontologia do domnio que est sendo descrito. O uso desse recurso essencial na compreenso do campo semntico no qual o termo a ser definido aloca-se, assim como a ontologia auxilia o terminlogo na recuperao do seu gnero prximo ou hipernimo de modo a encabear o texto definitrio. Uma alternativa da qual o redator da definio, que no utiliza ontologia, pode valer-se observar a estrutura morfolgica dos termos do domnio em questo, pois as reas do conhecimento se caracterizam pela presena de determinados morfemas, tanto radicais quanto afixos que podem ser pistas a fim de iniciar a DT. Nos Quadros 23 a 29, so apresentados: i) na primeira coluna, alguns termos com seus respectivos sufixos em destaque (exclusivamente esse tipo de morfema foi analisado) que exemplificam a produtividade de certas estruturas no corpus de DT constitudo para a pesquisa59; ii) na segunda coluna, o nome do campo semntico que abrange o termo e; iii) na terceira, o gnero prximo utilizado no incio do texto definitrio referente ao respectivo termo60. Primeiramente so exibidos alguns sufixos produtivos no domnio da Fisioterapia.
- OSE

Esse prefixo empregado pela medicina para formar os substantivos de diversos processos patolgicos e doenas. Devido ao fato de que a Fisioterapia integra a rea de sade, so bastante recorrentes as formaes eruditas (radicais e afixos de origem grega ou latina) em sua terminologia.

59

Lembramos que devido anotao do corpus em partes que integram a DT (termo-entrada, gnero prximo, diferena especfica, etc.), a deteco dos padres analisados foram realizados por meio de buscas especficas no concordanciador do WordSmith Tools. 60 Foram consultados os dicionrios Houaiss eletrnico e o Aulete Digital na definio dos morfemas que se seguem.

97

TERMO OSTEOPOROSE ATEROSCLEROSE NECROSE ESQUIMOSE HERMATROSE ARTROSE ANQUILOSE PSEUDOARTROSE

CAMPO SEMNTICO

GNERO PRXIMO DISFUNO DISFUNO DISFUNO DISFUNO DISFUNO DISFUNO DISFUNO DISFUNO

DISFUNO

Quadro 23 Termos com sufixo -OSE

- ITE

No contexto da rea mdica, o sufixo ITE significa inflamao.

TERMO PERICARDITE TROMBOFLEBITE ARTRITE VASCULITE ESPONDILITE BRONQUITE FLEBITE DERMATITE ENCEFALITE ESPONDILITE OSTEOARTRITE ARTRITE TENOSSINOVITE MIOSITE BURSITE TENDINITE SINOVITE

CAMPO SEMNTICO

GNERO PRXIMO DISFUNO DISFUNO DISFUNO DISFUNO DISFUNO DISFUNO DISFUNO DISFUNO

DISFUNO

DISFUNO DISFUNO DISFUNO DISFUNO DISFUNO DISFUNO DISFUNO DISFUNO DISFUNO

Quadro 24 - Termos com sufixo -ITE

- METRO

Elemento de composio, de origem grega, que apresenta o sentido de medida, que mede, medidor. amplamente empregado nas terminologias de carter cientfico. 98

TERMO CAMPO SEMNTICO ERGMETRO DINAMMETRO ESTESIMETRO INSTRUMENTO DE MEDIDA ESFIGNOMANMETRO GONIMETRO OXMETRO

GNERO PRXIMO INSTRUMENTO DE MEDIDA INSTRUMENTO DE MEDIDA INSTRUMENTO DE MEDIDA INSTRUMENTO DE MEDIDA INSTRUMENTO DE MEDIDA INSTRUMENTO DE MEDIDA

Quadro 25 - Termos com sufixo -METRO

- GRAFIA

Pospositivo61, de origem grega, que significa escrita, descrio, registro geralmente em substantivos relativos a cincias e artes e tcnicas antigas ou modernas

TERMO RADIOGRAFIA ULTRASSONOGRAFIA ANGIOGRAFIA MIELOGRAFIA ELETRONEUROMIOGRAFIA

CAMPO SEMNTICO

EXAME COMPLEMENTAR

GNERO PRXIMO EXAME EXAME EXAME EXAME EXAME

Quadro 26 - Termos com sufixo -GRAFIA

Nas tabelas 27, 28 e 29, so apresentados alguns sufixos produtivos no domnio do Revestimento Cermico.

- AGEM

Sufixo formador de substantivos a partir de base nominal ou verbal, com as noes de ao ou resultado da ao.

61

Elemento que colocado em posio posterior. [Cf. sufixo.] (Aulete Digital).

99

TERMO GRETAGEM BRITAGEM COLAGEM PESAGEM MOAGEM

CAMPO SEMNTICO

ETAPA DO PROCESSO

GNERO PRXIMO PROCESSO PROCESSO PROCESSO PROCESSO PROCESSO

Quadro 27 - Termos com sufixo -AGEM

- MENTO

Sufixo que caracteriza ao ou resultado de ao; processo.

TERMO ACABAMENTO ENVELHECIMENTO POLIMENTO PENEIRAMENTO ESQUADRAMENTO ARMAZENAMENTO RESFRIAMENTO

CAMPO SEMNTICO

ETAPA DO PROCESSO

GNERO PRXIMO PROCESSO PROCESSO PROCESSO PROCESSO PROCESSO PROCESSO PROCESSO

Quadro 28 - Termos com sufixo -MENTO

- O

Sufixo que indica ato, ao, resultado ou efeito de x.


TERMO PULVERIZAO ATOMIZAO RETIFICAO DEFERRIZAO COMINUIO COMPACTAO CONFORMAO SINTERIZAO GRANULAO CAMPO SEMNTICO GNERO PRXIMO PROCESSO PROCESSO PROCESSO PROCESSO PROCESSO PROCESSO PROCESSO PROCESSO PROCESSO

ETAPA DO PROCESSO

Quadro 29 - Termos com sufixo -O

- IDADE

100

Sufixo que integra especialmente substantivos abstratos. Significa qualidade, carter ou caracterstica.
TERMO TONALIDADE COMPACIDADE LIMPABILIDADE EXPANSO POR UMIDADE PSEUDOPLASTICIDADE ORTOGONALIDADE PLASTICIDADE PLANARIDADE TRABALHABILIDADE PROPRIEDADE DA PLACA CERMICA CAMPO SEMNTICO GNERO PRXIMO CARACTERSTICA PROPRIEDADE PROPRIEDADE PROPRIEDADE PROPRIEDADE PROPRIEDADE PROPRIEDADE PROPRIEDADE PROPRIEDADE

Quadro 30 - Termos com sufixo -IDADE

Estamos de acordo com Correia & Almeida (2008, p. 32) quanto seguinte afirmao: O conhecimento morfolgico no serve apenas como um conhecimento mais ou menos abstrato de caractersticas da terminologia em anlise, mas tem tambm aplicaes prticas sobre vrias etapas do trabalho terminolgico (traduo nossa) 62. Desta forma, destacamos que essa pequena descrio se props a demonstrar que os morfemas podem contribuir com a escolha do gnero prximo (ou hipernimo) da DT e que esse conhecimento lingustico pode ser aproveitado como mais um recurso a ser implementado no Editor de Definio. No captulo 6, ser apresentada a sistematizao proposta acerca do conhecimento gerado pela pesquisa a fim de ser utilizada no e-termos.

62

Le savoir morphologique ne sert donc pas seulement une connaissance plus ou moins abstraite des caractristiques de la terminologie sous analyse, mais il a aussi dapplications pratiques sur plusieurs tches du travail terminologique. (CORREIA & ALMEIDA, 2008, p. 32)

101

Sistematizao do conhecimento obtido na pesquisa


Inicialmente, a sistematizao do conhecimento adquirido na pesquisa ir contribuir

para que o Editor de Definio seja utilizado como um ambiente de auxlio no processo da redao da DT. Alm das consideraes acerca da DT apresentadas nesse trabalho, faz-se importante manifestar alguns critrios que devem guiar o projeto da implementao dos recursos no Editor. So eles: perfil de usurio a quem se destina o Editor de Definio: o sistema e-termos63 foi criado, considerando 3 perfis de usurios, a saber:

I.

i. gerente de projeto: criador do projeto e o principal responsvel pelo controle das etapas e pela equipe de trabalho. Executa qualquer tarefa/etapa do e-termos (menos o especialista). ii. terminlogo/linguista: responsvel pelas atividades terminolgicas e lingusticas do e-termos. o principal perfil em potencial de usurio do Editor de Definio. iii. especialista do domnio: responsvel pelas tarefas de validao das etapas do ambiente (candidatos a termos, ontologia e a prpria DT).

Nesse sentido, considera-se que esses trs perfis tero acesso ao Editor de Definio e que eles podem, ainda, quanto ao estgio da escrita, ter um conhecimento nulo, bsico, intermedirio ou avanado da redao da DT.

II.

uso e tarefa que ser atribudo ao Editor de Definio: o editor se destinar a auxiliar os usurios na redao de um tipo de texto especfico, a DT, que segue padres quanto sua estrutura. O editor poder favorecer o ensino da redao da DT queles que so iniciantes na tarefa.

O sistema e-termos se diferencia do portal e-termos, o qual tem acesso pblico e irrestrito, destina-se ao pblico geral e onde se alocam os produtos terminolgicos gerados a partir do sistema e-termos. Enquanto que o sistema caracterizado pelo acesso autorizado, usurios cadastrados, criao dos produtos e local das ferramentas e etapas.
63

102

III.

A orientao fornecida pelo Editor diz respeito ao planejamento da estrutura para a redao da DT (top down).

IV.

a utilizao do Editor de Definio independe da classe morfolgica do termo que ser definido, contudo, nosso trabalho se restringiu a termos classificados como substantivo, justamente por ser a categoria mais recorrente em grande parte das terminologias, e que fosse definido de acordo com o padro de texto definitrio GPDE, reconhecido como o modelo ideal de definio. Dessa forma, o desenvolvimento das anlises assentou-se nesses dois princpios: Substantivos definidos a partir do padro GPDE;

V.

a partir da DE, pudemos fragment-la em vrias DEns de modo a observar qual nmero mnimo e mximo de DEns que normalmente constituem a DT, assim como examinar quais relaes semnticas esto implicadas em cada uma, as expresses lingusticas que as explicitam e quanto produtividade da ordem em que as relaes aparecem no texto definitrio;

VI.

e por fim, quanto ocorrncia de certos morfemas que sinalizam qual(is) gnero(s) prximo(s) podem ser empregados na DT.

A sistematizao compreende sugestes que sero agregadas ao Editor e compete ao usurio a deciso de us-las.

103

EDITOR DE DEFINIO

Figura 18 - Sistematizao proposta para o Editor de Definio do e-Termos

104

Tutorial: manual sobre princpios e convenes da DT elaborado especialmente para os que esto iniciando na redao do texto definitrio. A partir desse tutorial, cabe ao gerente do projeto eleger quais desses princpios e convenes sero adotados pela equipe, levando-se em conta o pblico-alvo e a finalidade da obra terminogrfica.

Base de exemplos de DTs: base que contemplar DTs de substantivos (anotadas conforme TE, GP, DEs, DEns), que serviro de exemplos para o usurio compor seu prprio texto definitrio. Lembramos aqui que as DTs que comporo essa base foram redigidas segundo a tipologia GPDE.

Base de relaes semnticas e suas expresses lingusticas: base que reunir as relaes semnticas propostas nesse trabalho, definio ou explicao e suas expresses lingusticas correspondentes. Sero ainda demonstradas quais as combinaes e a ordem de relaes mais produtivas na DT. Destaca-se que os redatores da DT podem inserir nova relao e expresso lingustica, caso sintam necessidade, a fim de que os membros da equipe possam se beneficiar.

Base de morfemas: base na qual sero apresentados os morfemas analisados (no item 5 da dissertao) e seus significados. Nessa base, os redatores da DT podero edit-la de modo a inserir informaes sobre os morfemas empregados na terminologia do projeto em pauta.

No captulo 7 sero apresentadas as consideraes finais da pesquisa.

105

Consideraes finais

A trajetria percorrida para a realizao deste trabalho apresentou como eixo central a Definio Terminolgica. Para tecer o fio condutor do nosso objeto de estudo, foram apresentadas: i) a fundamentao terica acerca do percurso da Terminologia at os dias de hoje; ii) a TCT, perspectiva na qual compreendemos as linguagens de especialidades; iii) a DT e os elementos que a constituem (caractersticas e relaes semnticas). No decorrer da pesquisa, observamos que era necessrio recorrer a outros autores, de linhas tericas distintas, que tivessem tratado de alguma forma de relaes semnticas, pois esse era o olhar que deveria ser dado ao nosso corpus de pesquisa. Algumas consideraes sobre as relaes semnticas foram feitas nessa etapa da investigao:

I.

a princpio, as relaes semnticas deveriam ser compreendidas por humanos; logo, elas devem ser claras e objetivas;

II.

o conjunto de relaes no necessitava ser muito extenso, a ponto de haver grandes divergncias acerca de qual relao deve ser contemplada na anotao. Por outro lado, um rol que abrangesse as relaes semnticas mais tipificadas em qualquer domnio do conhecimento j era o suficiente para o nosso propsito de pesquisa.

Ao final do levantamento das relaes utilizadas por cada pesquisador, pudemos propor o nosso rol de relaes semnticas de modo a empreg-las nas anlises das DTs. Em seguida, foi imprescindvel considerar uma metodologia de pesquisa para a manipulao do corpus. Embora o objetivo central da pesquisa fosse sistematizar o conhecimento lingustico, sobretudo quanto poro semntica do texto definitrio, houve uma certa dedicao, que demandou mais tempo que o previsto, quanto a essa etapa da pesquisa, de modo a cumprir dois papis importantes:

I.

empregar uma metodologia que pudesse cercar a DT, de modo que fosse possvel extrair vrias informaes dela de modo rpido e fivel;

II.

asseverar que os passos metodolgicos seguidos pudessem ser replicados em outras anlises de cunho lingustico-textual.

106

Chegamos, ento, a uma sequncia de etapas, as quais compreenderam: composio e armazenamento do corpus; nomeao dos arquivos e anotao do corpus (Editor de Cabealho) e utilizao de programas computacionais nas anlises (WordSmith Tools, Anotador e extrator semiautomtico de etiqueta xml). Ressalta-se que todas as decises tomadas em relao preparao do corpus tiveram que ser conforme com:

I. II.

os programas que seriam utilizados posteriormente na anlise; os dados que considerssemos relevantes constar da pesquisa.

Quanto etapa de anlise, foi possvel recuperar as informaes lingusticas e estatsticas de um modo otimizado, porm, quais e quantos desses dados deveriam, de fato, ser apresentados no trabalho de dissertao? Percebemos, ento, que a discusso acerca das informaes lingusticas to ou mais importante que a descrio do corpus. Os recursos informticos esto disposio dos linguistas, de modo que um nmero muito grande de dados possa ser manipulado simultaneamente. Contudo, a capacidade de transformar aquelas tantas informaes depende muito mais do analista do que qualquer outro fator. Sem dvida, essa uma das lies aprendidas neste trabalho de mestrado. A sistematizao das informaes adquiridas nesta pesquisa, que se tornaro posteriormente recursos disponibilizados aos usurios do Editor de Definio do ambiente computacional e-termos, est estritamente relacionada com os dados que se mostraram como mais produtivos nas anlises (quanto quantidade de DEss por DT; relaes semnticas mais recorrentes e suas expresses lingusticas, a ordem de apresentao das DEs e a observao do aspecto morfolgico da terminologia em pauta). Como projetos futuros, alm de auxiliarmos o informata na implementao do Editor de Definio, pretendemos: I. ampliar a descrio morfolgica, de maneira a enriquecer a base de morfemas e melhor atender ao usurio; II. estudar outros tipos definitrios sugeridos por Sager (1993), j citados no item 2.3, tais como: definio mediante anlise, definio mediante sinnimos, definio mediante parfrase, definio mediante sntese; III. observar quais aspectos lingusticos esto implicados quando se vai definir as seguintes classes de palavras tambm existentes em terminologias: verbo e adjetivo.

107

No que diz respeito aos aspectos terminolgicos, acreditamos ter oferecido uma contribuio, na medida em que sistematizamos o tipo definitrio mais produtivo, tornando a tarefa do terminlogo menos morosa e mais controlada. Em relao aos aspectos semnticos e lingusticos, pudemos apresentar as relaes semnticas mais frequentes nas terminologias e as expresses lingusticas que as explicitam no portugus do Brasil. E finalmente, acreditamos que nossa pesquisa poder incrementar o e-Termos, tornando o ambiente ainda mais completo para a tarefa de desenvolvimento e gesto de terminologias. A propsito deste ltimo item, cumpre ressaltar aqui a necessria e enriquecedora interdisciplinaridade entre PLN e Terminologia, uma vez que o conhecimento lingustico imprescindvel para melhorar o desempenho de ferramentas e programas computacionais, mas, em contrapartida, todo esse aparato computacional funciona como lentes para melhor enxergar e descrever a lngua. Nesse sentido, a Terminologia no s se beneficia da Computao, mas dela necessita.

108

Referncias

ALMEIDA, G.M.B. A Teoria Comunicativa da Terminologia e a sua prtica. Alfa, Araraquara, v. 50, p. 81-97, 2006. Disponvel em: <http://www.alfa.ibilce.unesp.br/download/v50-2/06-Almeida.pdf>. Acesso em: fev/2008.

ALMEIDA, G.M.B.; OLIVEIRA, L.H.M.; ALUSIO, S.M. A Terminologia na era da Informtica. Cincia e Cultura, Campinas, v. 58, n. 2, p. 42-45, 2006. Disponvel em: <http://cienciaecultura.bvs.br/scielo.php?script=sci_arttext&pid=S000967252006000200016&lng=pt&nrm=iso>. Acesso em: fev/2008.

ALMEIDA, G.M.B.; SOUZA, D.S.L.; PINO, D.H.P. A definio nos dicionrios especializados: proposta metodolgica. Debate Terminolgico, v. 3, p. 1-20, 2007. Disponvel em: <http://www.riterm.net/revista/n_3/index.htm>. Acesso em: fev/2008.

ALPZAR CASTILLO, R. Cmo hacer un diccionario cientfico tcnico? Buenos Aires: Editorial Memphis, 1997. 184p.

ALUSIO, S.M. Ferramentas para auxiliar a escrita de artigos cientficos em ingls como lngua estrangeira. 1995. 216 f. Tese (Doutorado em Fsica) Instituto de Fsica de So Carlos, Universidade de So Paulo, So Carlos, 1995.

ALUSIO, S.M.; ALMEIDA, G.M.B. O que e como se constri um corpus? Lies aprendidas na compilao de vrios corpora para pesquisa lingstica. Calidoscpio, Porto Alegre, v. 4, n. 3, p. 155-177, 2006. Disponvel em: <http://www.unisinos.br/publicacoes_cientificas/images/stories/pdfs_calidoscopio/vol4n3/art 04_Alusio.pdf>. Acesso em: fev/2008.

ARNZT, R.; PICHT, H. Introduccin a la Terminologa. Madrid: Fundacin Germn Snchez Ruiprez, 1995. 382p.

AUBERT, F. H. Introduo Metodologia da Pesquisa Terminolgica Bilnge - Cadernos de Terminologia, 2.ed. So Paulo: Humanitas Publicaes - FFLCH/ USP, 2001. 104p.

AUGER, A. Reprage des nonces dintrt definitoire dans les bases de donnes textuelles. 1997. 224f. Tese (Doutorado em Lingustica) - Facult des Lettres, Universit de Neuchtel, Genebra, 1997. 109

Disponvel em: <http://doc.rero.ch/record/473/files/these_AugerA.pdf> Acesso em: fev/2009

BARROS, L. A. Curso bsico de Terminologia. So Paulo: EdUSP, 2004. 285p.

BIDERMAN, M. T. C. Teoria Lingstica. Teoria Lexical e Lingstica Computacional. 2 ed. So Paulo: Martins Fontes, 2001. 356p.

BODSON, C. Termes et relations smantiques en corpus spcialiss : rapport entre patrons de relations smantiques (PRS) et types smantiques (TS). 2005. 298f. Tese (Doutorado em Lingustica) - Facult des tudes suprieures, Universit de Montral, Montral, 2005. Disponvel em: < http://olst.ling.umontreal.ca/pdf/bodson2005.pdf>. Acesso em: fev/2009.

BOULANGER, J.C. Une lecture socio-culturelle de la terminologie. Cahiers de linguistique sociale. Rouen, p. 13-30, 1991.

BOULANGER, J.C. Prsentation: images et parcours de la socioterminologie. Meta, Montral , v. 40, n. 2, p. 194-205, 1995. Disponvel em : <http://www.erudit.org/revue/meta/1995/v40/n2/002117ar.pdf>. Acesso em fev/2009.

BOUTIN-QUESNEL et al. Vocabulaire systmatique de la terminologie. Cahiers de lOffice de la Langue Franaise. Qubec: Publications du Qubec, 1985.

CABR, M. T. La terminologa: teora, metodologa, aplicaciones. Traduo de Carles Teb. Barcelona: Editorial Antrtida/Empries, 1993. 529p.

CABR, M. T. La terminologa: representacin y comunicacin. elementos para una teora de base comunicativa y otros artculos. Barcelona: IULA/Universitat Pompeu Fabra, 1999. 369p.

CABR, M. T. Theories of terminology: their description, prescription and explanation. Terminology, v. 9, n. 2, p. 163-200, 2003.

CIAPUSCIO, G. E. Textos especializados y Terminologa. Barcelona: IULA/ Universitat Pompeu Fabra, 2003. 115p. (Srie Monografies, 6).

110

CONDAMINES, A. Smantique et corpus spcialiss: constitution de bases de connaissances terminologiques, Carnets de grammaire, Relatrio interno da ERSS (quipe de Recherche en Syntaxe et Smantique), n. 13. Toulouse: CNRS et Universit de Toulouse-le Mirail, 2003.

CORREIA, M.; ALMEIDA, G. M. B. Le rle du savoir morphologique dans l'organisation de l'arbre conceptual d'un domaine spcialit. In: Terminologie: discours, technologie et acteurs sociaux, 2008, Brest - Bretagne - France. Actes de GLAT-BREST 2008. Brest Frana: Groupe de Linguistique Applique des Tlcommunications - GLAT, 2008. v. 1. p. 23-34.

DAHLBERG, I. Terminological definitions: characteristics and demands. In: Association internationale de terminologie et al., in: Problemes de la definition et de la synonymie en terminologie: actes du Colloque international de terminologie, Universite Laval, Quebec, 23-27 mai 1982, Girsterm, Quebec, 1983, p. 15-34.

DAVIDSON, L. et al. Semi-automatic extraction of knowledge-rich contexts from corpora. In: D. Bourigault, C. Jacquemin et M. C. LHomme (eds.), in: Proceedings of Computerm98: First Workshop on ComputationalTerminology. Montral, Universit de Montral, 1998.

DEYES, T. Discourse, Science and Scientific Discourse. The Raw Material of Comprehension in ESP. Working Paper 6, Brazilian ESP Project, PUC/SP, So Paulo, 1982

DROUIN, P. Acquisition automatique des termes: lutilisation des pivots lexicaux spcialiss. 2002. 307f. Tese (Doutorado em Lingustica) - Facult des tudes suprieures, Universit de Montral, Montral, 2002.

DUBUC, R. Manual prctico de terminologa. Traduo de Ileana Cabrera. Chile: RiL Editores, 1999. 236p.

FELIU, J. Relacions conceptuals i variaci funcional: elements per a un sistema de detecci automtica. (Trabalho de pesquisa) - UPF/IULA, Barcelona, 2000.

FELTRIM, V. D. Uma abordagem baseada em crpus e em sistemas de crtica para a construo de ambientes Web de auxlio escrita acadmica em portugus. 2004. 169f. Tese (Doutorado em Computao) Instituto de Cincia Matemtica e Computao, Universidade de So Paulo, So Carlos, 2004.

FERREIRA, A. B. H. Novo Dicionrio Eletrnico Aurlio. 3 edio. Curitiba: Editora Positivo, 2004.

111

FINATTO, M. J. B. Definio terminolgica: fundamentos terico-metodolgicos para sua descrio e explicao. 2001. 395f. Tese (Doutorado em Letras) - Instituto de Letras, Universidade Federal do Rio Grande do Sul, Porto Alegre, 2001.

FONTANA, N. et al. Computer Assisted Writing - Applications to English as a Foreign Language. CALL, v. 6, n. 2, p. 145-161, 1993.

GAMBIER, Y. Problmes tertminologiques des pluies acides: pour une socioterminologie. Meta, Montral, v.32, n. 3, p. 314-320, 1987. Disponvel em : < http://www.erudit.org/revue/meta/1987/v32/n3/002791ar.pdf> Acesso em: fev/2009

GAUDIN, F. Socioterminologie: des problmes semantiques aux pratiques institutionnelles. Rouen: Universit de Rouen, 1993. 255p. (Publications de lUniversit de Rouen, 182).

GAUDIN, F. Socioterminologie: une approche sociolinguistique de la terminologie. Bruxelles: Duculot De Boeck, 2003. 286p.

GOUADEC, D. Terminologie: constitution des donnes. Paris: AFNOR, 1990. 219p.

HOFFMAN, L. Els llenguatges d'especialitat: selecci de textos. Barcelona: IULA, 1998. 284p. (Srie Monografies)

HFLING, C. Da anlise crtica de definies de nomes concretos em dicionrios para uma proposta de definio padro. 2000. 376f. Dissertao (Mestrado em Lingustica) Faculdade de Cincias e Letras de Araraquara, UNESP, Araraquara, 2000.

ISO, Principes et methodes de la terminologie: ISO 704, Organisation Internationale de Normalisation, Genebra, 1987.

JACKENDOFF, R. Semantics and Cognition. Cambridge: MIT Press, 1983. 283p.

JORDAN, M.P. An Integrated Three-Pronged Analysis of a Fund-Raising Letter. In: W.C. Mann and S.A. Thompson (eds.), Discourse Description: Diverse Linguistic Analyses of a Fund-Raising Text, 1992. p. 171-226.

112

LARIVIRE, L. Comment formuler une dfinition terminologique. Meta, Montral, v. 41, n. 3, 405-418, 1996. Disponvel em: < http://www.erudit.org/revue/meta/1996/v41/n3/003401ar.pdf> Acesso em: fev/2009.

MARSHMAN, E. The Cause Relation in Biopharmaceutical Corpora: English and French Patterns for Knowledge Extraction. 2002. 166f. Dissertao (Mestrado em Lingustica) - University of Ottawa, Ottawa, 2002. Disponvel em: <http://www.ruor.uottawa.ca/fr/handle/10393/6385>. Acesso em: fev/2009.

MARSHMAN, E.; MORGAN, T.; MEYER, I. French patterns for expressing concept relations. Terminology, 2002, v. 8, n. 1, p. 1-29. 2002.

OLF. Le grand dictionnaire terminologique. Disponvel <http://www.granddictionnaire.com/btml/fra/r_motclef/index800_1.asp>. Acesso maro/2009.

em: em:

OLIVEIRA, L. H. M. e-Termos: um ambiente colaborativo web para a criao de produtos terminolgicos. 2006. Monografia de qualificao (Doutorado em Computao) Instituto de Cincia Matemtica e Computao. Universidade de So Paulo, So Carlos, 2006.

OTMAN, G. Terminologie et intelligence artificielle, in La Banque des mots, n special, 1989, p. 63-95.

PUSTEJOVSKY, J. The generative lexicon. Londres: Cambridge/MIT Press, 1998. 312p.

REY, A. La terminologie: noms et notions. Paris: Presses universitaires de France, 1979. 127p.

REY-DEBOVE, J. tude linguistique et smiotique des dictionnaires franais contemporains. The Hague/Paris: Mouton, 1971. 329p.

SAGER, J. C. Curso prctico sobre el procesamiento de la terminologa. Traduo de Laura C. Moya. Madrid: Fundacin Germn Snchez Ruiprez/Pirmide, 1993. 442p.

SEPPL, S. Composition et formalisation conceptuelles de la dfinition terminographique. 2004. 200f. Tese (Doutorado em Tratamento Informtico Multilingue), cole de traduction et d'interprtation, Universit de Genve, Genebra, 2004.

113

SIERRA MARTNEZ, G.; ALARCN, R. El rol de las predicaciones verbales en la extraccin automtica de conceptos. Estudios de Lingstica Aplicada, n. 38, 129-144. Distrito Federal, Mxico, 2003.

SIMMEN, F. La representation des systemes conceptuels en terminologie, Universit de Genve, cole de traduction et d'interpretation, Genve, 2002.

TEMMERMANN, R. Towards new ways of terminology description. The sociocognitive approach. Philadelphia: John Benjamins, 2000. 258p.

WSTER, E. Introduccin a la teora general de la terminologa y a la lexicografa terminolgica. Traduo de Anne-Ccile Nokerman. Barcelona: IULA/Universitat Pompeu Fabra, 1998. 227p.

ZAVAGLIA, C. Anlise da homonmia no portugus: tratamento semntico com vistas a procedimentos computacionais. 2002. 360f., v.I; 199f.; v.II Tese (Doutorado em Lingustica) - Faculdade de Cincias e Letras de Araraquara, UNESP, Araraquara, 2002.

114

Anexo I
Tipologia das relaes conceituais possveis (extrada de Seppl, 2004)

115

Anexo II
Protocolo da relao de causalidade proposta por Feliu (2004)

116

Anexo III
Tipologia das relaes semnticas propostas por Jordan (1992)
Tipo de Relao Detail Relaes Identification Classification Specification Appearance Characteristics Function Material Parts General Active Passive Agent Source Logical Assessment Basis Cause Effect Emotive Effect Purpose Means Problem Solution Modal Possibility Capability Correctness Propriety Necessity Need Completion Achievement Future Intention Mandate Authority Other Special Text manipulation Tipo de Relao Time Relaes Before After Simultaneous Inverted time Time Elaboration Summary Repetition Paraphrase Forecast Transition Collateral inversion Concession Compatibility Contrast Comparison Conditionals Document structures Hypothetical-Real Transition couplets Accompaniment Circumstance Inverted circumstance Connection Enablement Example Extent Location Inverted Location Manner True

117

Apndice A Relaes Semnticas I e II


A seguir, so apresentadas as relaes semnticas utilizadas na anotao do corpus e suas principais caractersticas.

RELAO

ETIQUETA

EXEMPLOS Propriedades

DEFINIO

EXEMPLO

EXPRESSES LINGUSTICAS possui forma; formado por; que se caracteriza por...

Constitutivo

Partes Material Aparncia

caracterizado por fissuras (....) que se estende da Relao semntica bsica do termo-entrada que apresenta do superfcie externa at a que ele feito ou constitudo. interface do esmalte com a placa cermica.

SEMANTICA I Agentivo

Causa Origem/Agente Utilizao Tlico Funo Objetivo

Relao semntica bsica do termo-entrada que apresenta sua causa ou origem.

causado pela falta de ocorre devido ao; acordo entre as expanses pode ter origem; trmicas do vidrado e causado por... suporte (...) que determina a empregado como; resistncia ao desgaste a fim de que; cuja das placas cermicas nofuno ... esmaltadas,

Relao semntica bsica do termo-entrada que apresenta sua funo ou objetivo.

118

RELAO

ETIQUETA

EXEMPLOS Efeito

DEFINIO

EXEMPLO tendo como conseqncia a perda da impermeabilidade e (...) realizado por meio da avaliao dimensional (...) que ocorre aps o assentamento. Ope-se ao estado slido ou cristalino.

EXPRESSES LINGUSTICAS provoca; o que leva ; comprometendo... por meio de; utilizase o mtodo... quando; que ocorre durante... ope-se ao; contrrio ao... um exemplo comum ; os principais tipos so...

Consequncia

Produto Resultado Instrumento

Relao semntica do termo-entrada que apresenta sua consequncia. Relao semntica do termo-entrada que apresenta o meio ou instrumento com que ele realizado. Relao semntica do termo-entrada que apresenta o espao ou tempo no qual ele se situa. Relao semntica do termo-entrada que apresenta associao positiva ou negativa dele com outro termo da ontologia de igual campo semntico, ou com qualquer outro termo/palavra devido semelhana. Relao semntica do termo-entrada que apresenta seu termo hipnimo, classificao ou exemplo.

Meio Mtodo Circunstncia Espao Tempo

Semelhana

Co-hiponmia

SEMNTICA II Exemplo

Hiponmia Classificao Descrio Indicao Elaborao Recomendao Deteco

Segundo (...), podem ser classificadas em: (...) Encontra-se tambm na maior parte das variedades de argila, em forma de quartzo ou outra forma cristalina ou amorfa de slica. A pseudoplasticidade est relacionada s caractersticas fsicas das partculas que compem o fluido (...)

Relao semntica do termo-entrada que apresenta elaborao dele, ou seja, dados ou detalhes sobre ele que no se encaixam nas outras relaes, os quais servem para deixar a DT mais rica, quase enciclopdica.

Associao

Relao semntica do termo-entrada que apresenta relao de dependncia com algum termo ou conceito de dentro ou fora da ontologia.

est diretamente ligado ; est relacionado com...

119

Apndice B Anlise das DTs por Campo Semntico

O presente Apndice constitudo das anlises realizadas com grupos de DTs de mesmo campo semntico. A partir dessa descrio, foi possvel observar algumas caractersticas pertinentes aos distintos grupos.

Como ler os dados?


Seguem, na Figura 19, explicaes acerca de como devem ser lidos os dados, sendo que, a ttulo de ilustrao, usamos o campo semntico Ao Muscular (AM) do domnio da Fisioterapia, devido sua extenso. Salientamos ainda que esses dados foram distribudos em grficos e tabelas distintas a fim de que pudssemos salientar as informaes de modo mais eficaz, assim como torn-las mais claras aos leitores, contudo esses dados esto relacionados, sendo que possvel compar-los de modo que a leitura se torne mais produtiva.

3
Figura 19 - Como ler os dados?

Os dados da Figura 19 representam:

120

Dados 1: na primeira tabela, esto elencados alguns dados estatsticos sobre a DT (GP+DE) e a DE referente a todas as DTs que compreendem o campo semntico selecionado, alm de serem exibidos os dados no total, de todos os arquivos pertencentes ao campo (em overall). Os dados so:

a) Text file: nome do arquivo; b) Tokens: quantidade de unidades lexicais presentes no arquivo; c) Types: quantidade de unidades lexicais diferentes presentes no arquivo; d) Type/Token Ratio: diviso de types por tokens64; e) Sentences: quantidade de sentenas.

Ressaltamos que esses dados estatsticos puderam nos revelar, se existe relao entre quantidade de tokens e de relaes presentes na DT, tamanho mdio de DTs e de DEs.

Dados 2: no primeiro grfico, esto elencados a quantidade de DEs (DE1, DE2, DEn) por cada DT do campo semntico selecionado e a quantidade de tokens relativa a cada DE.

Dados 3: na segunda tabela, est elencada a ordem na qual as relaes semnticas aparecem na DT. Na primeira coluna consta o nome do arquivo, e da segunda coluna em diante, exibida, abaixo de cada DE correspondente, a relao representada.

Dados 4: no segundo grfico, so exibidas as relaes e suas porcentagens, de modo que possamos visualizar as relaes mais significativas do campo semntico selecionado.

Esses dados puderam ser recuperados devido anotao do corpus e aos recursos estatsticos e de concordncia do WordSmith Tools. Primeiramente, sero apresentados os dados referentes aos campos semnticos do domnio da Fisioterapia; e em seguida, dos campos do domnio do Revestimento Cermico.

64

Conforme Biderman (2001): Na lngua inglesa os estatsticos do lxico costumam opor o token (ocorrncia no texto) ao type (lexema referido pela ocorrncia formal).

121

campo AO MUSCULAR (AM)

DT Text File Tokens Types T ype/Token Ratio Sentences OVERALL 131 32 24,43 9 F_AM_01 24 21 87,5 2 F_AM_02 34 29 85,29 2 F_AM_03 33 30 90,91 2 F_AM_04 40 36 90 3 F_AM_01 F_AM_02 F_AM_03 OVERALL 114 29 F_AM_01 22 19 F_AM_02 28 26 F_AM_03 27 26 F_AM_04 37 34 F_AM_04 DE1 <constitutivo> <constitutivo> <constitutivo> <constitutivo> DE2 <exemplo> <exemplo> <exemplo> <elaborao> <tlico> DE3

DE Text File Tokens Types

% das relaes que ocorrem


11%

CONSTITUTIVO
45% 33%

ELABORAO EXEMPLO TLICO

11%

campo ARTICULAO (AR)


DT Text File Tokens Types Type/Token Ratio Sentences DE Text File Tokens Types OVERALL F_AR_01 F_AR_02 F_AR_03 F_AR_04 F_AR_05 F_AR_06 F_AR_07 F_AR_08 235 39 18 17 34 33 25 24 15 14 41 38 36 30 32 28 34 30 OVERALL F_AR_01 F_AR_02 F_AR_03 F_AR_04 F_AR_05 F_AR_06 F_AR_07 F_AR_08 255 42 16,47 16 24 22 91,67 2 36 35 97,22 2 26 25 96,15 2 18 17 94,44 2 43 39 90,7 2 38 31 81,58 2 34 29 85,29 2 36 31 86,11 2 F_AR_01 F_AR_02 F_AR_03 F_AR_04 F_AR_05 F_AR_06 F_AR_07 F_AR_08 DE1 <constitutivo> <constitutivo> <constitutivo> <circunstncia> <constitutivo> <constitutivo> <constitutivo> <constitutivo> DE2 <exemplo> <exemplo> <exemplo> <exemplo> <exemplo> <exemplo> <exemplo> <exemplo>

campo DISFUNO (DI)


DT Text File Tokens Types Type/Token Ratio Sentences OVERALL 3.442 380 11,04 126 F_DI_01 19 16 84,21 1 F_DI_02 60 51 85 2 F_DI_03 36 27 75 1 F_DI_04 67 48 71,64 2 F_DI_05 35 32 91,43 1 F_DI_06 39 34 87,18 1 F_DI_07 37 30 81,08 2 F_DI_08 52 45 86,54 2 F_DI_09 46 39 84,78 2 F_DI_10 39 37 94,87 1 F_DI_11 41 40 97,56 2 F_DI_12 48 41 85,42 2 F_DI_13 33 32 96,97 2 F_DI_14 52 47 90,38 2 F_DI_15 22 20 90,91 1 F_DI_16 30 25 83,33 1 F_DI_17 26 23 88,46 1 F_DI_18 34 31 91,18 2

DE Text File Tokens Types OVERALL 3.223 374 F_DI_01 17 14 F_DI_02 58 49 F_DI_03 34 25 F_DI_04 65 46 F_DI_05 33 30 F_DI_06 37 32 F_DI_07 35 28 F_DI_08 50 43 F_DI_09 44 37 F_DI_10 37 35 F_DI_11 39 38 F_DI_12 45 38 F_DI_13 31 30 F_DI_14 50 45 F_DI_15 20 18 F_DI_16 28 23 F_DI_17 23 20 F_DI_18 32 29

DT Text File Tokens Types Type/Token Ratio Sentences F_DI_19 37 32 86,49 2 F_DI_20 19 18 94,74 1 F_DI_21 64 55 85,94 2 F_DI_22 54 44 81,48 2 F_DI_23 64 55 85,94 2 F_DI_24 51 43 84,31 2 F_DI_25 30 26 86,67 1 F_DI_26 35 29 82,86 1 F_DI_27 47 41 87,23 2 F_DI_28 20 18 90 0 F_DI_29 63 52 82,54 2 F_DI_30 31 24 77,42 1 F_DI_31 26 25 96,15 2 F_DI_32 33 30 90,91 2 F_DI_33 53 44 83,02 2 F_DI_34 39 34 87,18 1 F_DI_35 20 20 100 1 F_DI_36 35 31 88,57 0 F_DI_37 13 12 92,31 1

DE Text File Tokens Types F_DI_19 35 30 F_DI_20 17 16 F_DI_21 62 53 F_DI_22 52 42 F_DI_23 62 54 F_DI_24 49 41 F_DI_25 28 24 F_DI_26 33 27 F_DI_27 44 38 F_DI_28 18 16 F_DI_29 61 50 F_DI_30 29 22 F_DI_31 24 23 F_DI_32 31 28 F_DI_33 51 42 F_DI_34 37 32 F_DI_35 18 18 F_DI_36 33 29 F_DI_37 11 10

DT Text File Tokens Types Type/Token Ratio Sentences F_DI_38 34 32 94,12 2 F_DI_39 32 29 90,63 1 F_DI_40 34 30 88,24 2 F_DI_41 33 27 81,82 1 F_DI_42 49 40 81,63 1 F_DI_43 43 40 93,02 1 F_DI_44 30 28 93,33 1 F_DI_45 21 21 100 1 F_DI_46 18 17 94,44 1 F_DI_47 31 30 96,77 2 F_DI_48 32 29 90,63 2 F_DI_49 50 40 80 2 F_DI_50 29 25 86,21 1 F_DI_51 45 42 93,33 1 F_DI_52 29 26 89,66 1 F_DI_53 45 38 84,44 1 F_DI_54 23 20 86,96 1 F_DI_55 21 21 100 1 F_DI_56 14 13 92,86 1

DE Text File Tokens Types F_DI_38 32 30 F_DI_39 30 27 F_DI_40 32 28 F_DI_41 31 25 F_DI_42 47 38 F_DI_43 41 38 F_DI_44 28 26 F_DI_45 19 19 F_DI_46 16 15 F_DI_47 29 28 F_DI_48 31 28 F_DI_49 48 38 F_DI_50 27 23 F_DI_51 43 40 F_DI_52 27 24 F_DI_53 43 36 F_DI_54 20 17 F_DI_55 18 18 F_DI_56 12 11

DT Text File Tokens Types Type/Token Ratio Sentences F_DI_57 21 21 100 1 F_DI_58 24 22 91,67 1 F_DI_59 24 20 83,33 1 F_DI_60 49 41 83,67 1 F_DI_61 48 41 85,42 1 F_DI_62 23 21 91,3 1 F_DI_63 23 21 91,3 1 F_DI_64 20 19 95 1 F_DI_65 26 23 88,46 1 F_DI_66 30 30 100 2 F_DI_67 31 26 83,87 1 F_DI_68 44 39 88,64 1 F_DI_69 36 28 77,78 2 F_DI_70 44 36 81,82 2 F_DI_71 34 30 88,24 1 F_DI_72 50 42 84 2 F_DI_73 36 31 86,11 1 F_DI_74 44 38 86,36 1 F_DI_75 42 38 90,48 1

DE Text File Tokens Types F_DI_57 18 18 F_DI_58 21 19 F_DI_59 21 17 F_DI_60 46 38 F_DI_61 45 38 F_DI_62 20 18 F_DI_63 20 18 F_DI_64 17 16 F_DI_65 23 20 F_DI_66 27 27 F_DI_67 28 23 F_DI_68 41 36 F_DI_69 33 25 F_DI_70 41 33 F_DI_71 31 27 F_DI_72 47 40 F_DI_73 33 28 F_DI_74 41 35 F_DI_75 39 35

DT Text File Tokens Types Type/Token Ratio Sentences F_DI_76 32 27 84,38 1 F_DI_77 55 46 83,64 2 F_DI_78 29 27 93,1 1 F_DI_79 33 30 90,91 2 F_DI_80 72 58 80,56 2 F_DI_81 35 27 77,14 1 F_DI_82 96 73 76,04 2 F_DI_83 56 42 75 1 F_DI_84 23 18 78,26 1 F_DI_85 83 66 79,52 2 F_DI_86 44 38 86,36 2 F_DI_87 47 40 85,11 2 F_DI_88 35 28 80 2 F_DI_89 20 19 95 1 F_DI_90 41 36 87,8 1 F_DI_91 29 26 89,66 1

DE Text File Tokens Types F_DI_76 29 24 F_DI_77 52 43 F_DI_78 26 24 F_DI_79 30 27 F_DI_80 69 55 F_DI_81 32 24 F_DI_82 93 71 F_DI_83 53 40 F_DI_84 20 15 F_DI_85 80 63 F_DI_86 43 37 F_DI_87 43 38 F_DI_88 32 26 F_DI_89 17 16 F_DI_90 38 33 F_DI_91 27 24

125

F_ D

10

20

30

40

50

43% 4% 0% 0%

Quantidade de tokens por DE

% das relaes que ocorrem

12% 1% 40% EXEMPLO AGENTIVO ASSOCIAO ELABORAO CONSTITUTIVO CONSEQUNCIA CIRCUNSTNCIA

I_ 0 F_ 1 D I_ 0 F_ 4 D I_ 0 F_ 7 D I_ 1 F_ 0 D I_ 1 F_ 3 D I_ 1 F_ 6 D I_ 1 F_ 9 D I_ 2 F_ 2 D I_ 2 F_ 5 D I_ 2 F_ 8 D I_ 3 F_ 1 D I_ 3 F_ 4 D I_ 3 F_ 7 D I_ 4 F_ 0 D I_ 4 F_ 3 D I_ 4 F_ 6 D I_ 4 F_ 9 D I_ 5 F_ 2 D I_ 5 F_ 5 D I_ 5 F_ 8 D I_ 6 F_ 1 D I_ 6 F_ 4 D I_ 6 F_ 7 D I_ 7 F_ 0 D I_ 7 F_ 3 D I_ 7 F_ 6 D I_ 7 F_ 9 D I_ 8 F_ 2 D I_ 8 F_ 5 D I_ 8 F_ 8 D I_ 91

DE4

DE3

DE2

DE1

126

DE1 F_DI_01 F_DI_02 F_DI_03 F_DI_04 F_DI_05 F_DI_06 F_DI_07 F_DI_08 F_DI_09 F_DI_10 F_DI_11 F_DI_12 F_DI_13 F_DI_14 F_DI_15 F_DI_16 F_DI_17 F_DI_18 F_DI_19 F_DI_20 F_DI_21 F_DI_22 F_DI_23 F_DI_24 F_DI_25 F_DI_26 <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo>

DE2 <agentivo> <agentivo> <agentivo> <agentivo> <agentivo> <agentivo> <agentivo> <agentivo> <agentivo> <agentivo> <elaborao> <agentivo> <exemplo> <circunstncia> <agentivo> <consequncia> <consequncia> <consequncia> <agentivo> <agentivo> <agentivo> <agentivo> <agentivo> <consequncia> <agentivo> <agentivo>

DE3

DE4 F_DI_27 F_DI_28 F_DI_29 F_DI_30 F_DI_31 F_DI_32 F_DI_33

DE1 <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo>

DE2 <consequncia> <agentivo> <agentivo> <agentivo> <agentivo> <consequncia> <agentivo> <agentivo> <agentivo> <agentivo> <agentivo> <agentivo> <agentivo> <agentivo> <agentivo> <agentivo> <agentivo> <agentivo> <agentivo> <agentivo> <associao> <agentivo> <agentivo> <consequncia> <agentivo> <agentivo>

DE3 <agentivo>

DE4

<consequncia>

<agentivo> <elaborao> <consequncia>

<agentivo>

F_DI_34 F_DI_35 F_DI_36

<circunstncia> <elaborao> <elaborao> <elaborao> <consequncia>

F_DI_37 F_DI_38 F_DI_39 F_DI_40 F_DI_41 F_DI_42 F_DI_43 F_DI_44

<circunstncia>

F_DI_45 F_DI_46

<agentivo> <consequncia> <agentivo> <agentivo>

<elaborao> <agentivo>

F_DI_47 F_DI_48 F_DI_49 F_DI_50 F_DI_51 F_DI_52

<consequncia>

<agentivo>

<consequncia>

127

DE1 F_DI_53 F_DI_54 F_DI_55 F_DI_56 F_DI_57 F_DI_58 F_DI_59 F_DI_60 F_DI_61 F_DI_62 F_DI_63 F_DI_64 F_DI_65 F_DI_66 F_DI_67 F_DI_68 F_DI_69 F_DI_70 F_DI_71 F_DI_72 F_DI_73 <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo>

DE2 <agentivo> <agentivo> <agentivo>

DE3 <elaborao>

DE4 F_DI_74 F_DI_75 F_DI_76 F_DI_77

DE1 <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo>

DE2 <agentivo> <agentivo> <agentivo> <agentivo> <consequncia> <agentivo> <agentivo> <agentivo> <agentivo> <consequncia> <agentivo> <agentivo> <consequncia> <agentivo> <agentivo> <agentivo> <consequncia> <agentivo>

DE3

DE4

<consequncia> <consequncia>

<agentivo> <agentivo> <consequncia> <consequncia> <agentivo> <agentivo> <agentivo> <agentivo> <consequncia> <agentivo> <agentivo> <agentivo> <agentivo> <agentivo> <agentivo> <consequncia> <consequncia> <agentivo> <agentivo> <agentivo> <consequncia>

F_DI_78 F_DI_79 F_DI_80 F_DI_81 F_DI_82 F_DI_83 F_DI_84 F_DI_85 F_DI_86 F_DI_87 F_DI_88 F_DI_89 F_DI_90 F_DI_91

<agentivo>

<agentivo> <agentivo>

<consequncia> <agentivo>

<elaborao>

128

campo EXAME COMPLEMENTAR (EC)

DT Text File Tokens Types Type/Token Ratio Sentences OVERALL 563 74 13,14 26 F_EC_01 64 52 81,25 2 F_EC_02 F_EC_03 F_EC_04 53 42 79,25 1 65 49 75,38 2 70 56 80 4 F_EC_05 F_EC_06 47 38 80,85 3 53 44 83,02 3 F_EC_07 F_EC_08 F_EC_09 66 55 83,33 5 66 53 80,3 3 79 59 74,68 3

DE1

DE2

DE3

F_EC_01 <circunstncia> <constitutivo> <elaborao> F_EC_02 F_EC_03 F_EC_04 F_EC_05 <constitutivo> <constitutivo> <tlico> <tlico> <elaborao> <elaborao> <tlico> <tlico> <tlico> <tlico> <elaborao> <elaborao> <tlico>

<constitutivo> <elaborao> <tlico> <tlico> <elaborao> <elaborao> <elaborao> <elaborao>

DE Text File Tokens Types OVERALL 521 69 F_EC_01 63 52 F_EC_02 F_EC_03 F_EC_04 46 38 61 46 66 54 F_EC_05 F_EC_06 43 34 44 40 F_EC_07 F_EC_08 F_EC_09 61 51 62 50 75 56

F_EC_06 F_EC_07 F_EC_08 F_EC_09

129

campo INSTRUMENTOS E MEDIDAS (IM)


DT Text File Tokens Types Type/Token Ratio Sentences DE Text File Tokens Types OVERALL F_IM_01 F_IM_02 F_IM_03 F_IM_04 F_IM_05 F_IM_06 F_IM_07 F_IM_08 283 40 32 27 19 18 33 29 47 36 14 14 46 39 70 48 22 19 OVERALL F_IM_01 F_IM_02 F_IM_03 F_IM_04 F_IM_05 F_IM_06 F_IM_07 F_IM_08 307 42 13,68 22 35 29 82,86 3 22 20 90,91 3 36 31 86,11 2 50 38 76 3 17 17 100 2 49 41 83,67 3 73 50 68,49 4 25 21 84 2 F_IM_01 F_IM_02 F_IM_03 F_IM_04 F_IM_05 F_IM_06 F_IM_07 F_IM_08 DE1 <tlico> <tlico> <constitutivo> <tlico> <tlico> <tlico> <tlico> <constitutivo> DE2 <constitutivo> <semelhana> <elaborao> <constitutivo> <tlico> <constitutivo> <constitutivo> <tlico> <tlico> <elaborao> <tlico> <tlico> DE3

130

campo MOVIMENTO ARTICULAR (MA)

DT Text File Tokens Types Type/Token Ratio Sentences DE Text File Tokens Types OVERALL F_MA_01 281 63 43 31 F_MA_02 43 32 F_MA_03 23 18 F_MA_04 23 19 F_MA_05 18 17 F_MA_06 21 19 F_MA_07 14 13 F_MA_08 17 17 F_MA_09 6 6 F_MA_10 33 27 F_MA_11 7 7 F_MA_12 6 6 F_MA_13 27 25 OVERALL F_MA_01 294 63 21,43 20 44 32 72,73 2 F_MA_02 44 33 75 2 F_MA_03 24 19 79,17 2 F_MA_04 24 20 83,33 2 F_MA_05 19 18 94,74 1 F_MA_06 22 20 90,91 2 F_MA_07 15 14 93,33 1 F_MA_08 18 18 100 2 F_MA_09 7 7 100 1 F_MA_10 34 27 79,41 1 F_MA_11 8 8 100 1 F_MA_12 7 7 100 1 F_MA_13 28 25 89,29 2

DE1 F_MA_01 F_MA_02 F_MA_03 F_MA_04 F_MA_05 F_MA_06 F_MA_07 F_MA_08 F_MA_09 F_MA_10 F_MA_11 F_MA_12 F_MA_13 <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo>

DE2 <exemplo> <exemplo> <exemplo> <semelhana> <exemplo> <exemplo> <exemplo> <exemplo>

DE3

<semelhana>

<exemplo>

<elaborao>

131

132

campo TSTE E MEDIDA (TM)

DT Text File Tokens Types Type/Token Ratio Sentences OVERALL 3.193 287 8,99 161 F_TM_01 86 61 70,93 3 F_TM_02 82 66 80,49 4 F_TM_03 93 71 76,34 4 F_TM_04 147 98 66,67 6 F_TM_05 59 50 84,75 3 F_TM_06 120 76 63,33 7 F_TM_07 75 51 68 3 F_TM_08 80 57 71,25 5 F_TM_09 81 58 71,6 4 F_TM_10 54 46 85,19 3 F_TM_11 76 58 76,32 4 F_TM_12 71 53 74,65 4 F_TM_13 99 66 66,67 3 F_TM_14 110 72 65,45 4 F_TM_15 101 63 62,38 5 F_TM_16 47 38 80,85 3 F_TM_17 93 59 63,44 4 F_TM_18 42 38 90,48 3

DE Text File Tokens Types OVERALL 2.992 282 F_TM_01 81 57 F_TM_02 80 64 F_TM_03 88 67 F_TM_04 142 95 F_TM_05 54 47 F_TM_06 115 72 F_TM_07 70 46 F_TM_08 75 52 F_TM_09 76 54 F_TM_10 49 41 F_TM_11 71 54 F_TM_12 66 50 F_TM_13 94 62 F_TM_14 105 68 F_TM_15 96 60 F_TM_16 42 35 F_TM_17 88 55 F_TM_18 37 34

DT Text File Tokens Types Type/Token Ratio Sentences F_TM_19 38 33 86,84 3 F_TM_20 45 38 84,44 3 F_TM_21 67 49 73,13 3 F_TM_22 72 54 75 3 F_TM_23 67 48 71,64 2 F_TM_24 85 63 74,12 4 F_TM_25 53 45 84,91 4 F_TM_26 54 47 87,04 3 F_TM_27 62 46 74,19 3 F_TM_28 62 49 79,03 4 F_TM_29 52 44 84,62 3 F_TM_30 75 59 78,67 4 F_TM_31 63 53 84,13 3 F_TM_32 90 69 76,67 4 F_TM_33 101 73 72,28 5 F_TM_34 96 77 80,21 5 F_TM_35 81 64 79,01 3 F_TM_36 45 31 68,89 4 F_TM_37 53 44 83,02 3

DE Text File Tokens Types F_TM_19 33 29 F_TM_20 41 35 F_TM_21 62 44 F_TM_22 67 50 F_TM_23 63 45 F_TM_24 80 60 F_TM_25 49 41 F_TM_26 50 44 F_TM_27 58 43 F_TM_28 58 45 F_TM_29 47 40 F_TM_30 71 56 F_TM_31 58 50 F_TM_32 85 66 F_TM_33 96 70 F_TM_34 91 74 F_TM_35 77 62 F_TM_36 41 27 F_TM_37 48 40

DT Text File Tokens Types Type/Token Ratio Sentences F_TM_38 73 59 80,82 5 F_TM_39 58 49 84,48 3 F_TM_40 61 48 78,69 4 F_TM_41 59 46 77,97 3 F_TM_42 120 74 61,67 5 F_TM_43 45 37 82,22 3

133

DE Text File Tokens Types F_TM_38 68 55 F_TM_39 53 45 F_TM_40 57 46 F_TM_41 55 44 F_TM_42 115 70 F_TM_43 40 34

DE1 F_TM_01 F_TM_02 F_TM_03 F_TM_04 F_TM_05 F_TM_06 F_TM_07 F_TM_08 F_TM_09 F_TM_10 F_TM_11 F_TM_12 F_TM_13 F_TM_14 F_TM_15 F_TM_16 F_TM_17 F_TM_18 F_TM_19 F_TM_20 F_TM_21 F_TM_22 <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico>

DE2 <elaborao> <meio> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao>

DE3 <tlico> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao>

DE4 F_TM_23 <elaborao> F_TM_24 F_TM_25 F_TM_26 F_TM_27 F_TM_28 F_TM_29 F_TM_30 F_TM_31 F_TM_32 F_TM_33 F_TM_34 F_TM_35 F_TM_36 F_TM_37 F_TM_38 F_TM_39 F_TM_40 F_TM_41 F_TM_42 F_TM_43

DE1 <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico>

DE2 <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao>

DE3 <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao>

DE4

134

135

campo TCNICA E RECURSO TERAPUTICO (TR)

DT Text File Tokens Types Type/Token Ratio Sentences OVERALL 3.939 456 11,58 173 F_TR_01 35 30 85,71 2 F_TR_02 60 46 76,67 2 F_TR_03 81 59 72,84 2 F_TR_04 35 32 91,43 1 F_TR_05 29 25 86,21 2 F_TR_06 32 30 93,75 2 F_TR_07 17 17 100 1 F_TR_08 45 35 77,78 2 F_TR_09 20 19 95 1 F_TR_10 19 17 89,47 1 F_TR_11 30 28 93,33 2 F_TR_12 93 74 79,57 4 F_TR_13 154 110 71,43 6 F_TR_14 130 95 73,08 6 F_TR_15 184 118 64,13 7 F_TR_16 91 70 76,92 4 F_TR_17 34 29 85,29 3 F_TR_18 54 47 87,04 3

DE Text File Tokens Types OVERALL 3.742 444 F_TR_01 33 28 F_TR_02 58 44 F_TR_03 79 57 F_TR_04 33 30 F_TR_05 27 23 F_TR_06 30 28 F_TR_07 15 15 F_TR_08 43 34 F_TR_09 18 17 F_TR_10 17 15 F_TR_11 28 26 F_TR_12 88 69 F_TR_13 149 106 F_TR_14 129 95 F_TR_15 179 117 F_TR_16 89 69 F_TR_17 33 28 F_TR_18 53 47

DT Text File Tokens Types Type/Token Ratio Sentences F_TR_19 40 33 82,5 1 F_TR_20 26 25 96,15 2 F_TR_21 38 33 86,84 2 F_TR_22 49 41 83,67 3 F_TR_23 64 51 79,69 2 F_TR_24 66 57 86,36 2 F_TR_25 55 48 87,27 3 F_TR_26 24 23 95,83 1 F_TR_27 87 73 83,91 3 F_TR_28 33 29 87,88 1 F_TR_29 87 66 75,86 4 F_TR_30 66 54 81,82 4 F_TR_31 75 61 81,33 4 F_TR_32 66 54 81,82 3 F_TR_33 44 38 86,36 3 F_TR_34 72 54 75 3 F_TR_35 30 29 96,67 2 F_TR_36 36 33 91,67 1 F_TR_37 83 70 84,34 4

DE Text File Tokens Types F_TR_19 38 31 F_TR_20 24 23 F_TR_21 36 31 F_TR_22 46 39 F_TR_23 57 46 F_TR_24 64 55 F_TR_25 53 46 F_TR_26 22 21 F_TR_27 85 71 F_TR_28 29 26 F_TR_29 85 64 F_TR_30 62 51 F_TR_31 71 58 F_TR_32 64 53 F_TR_33 42 36 F_TR_34 70 52 F_TR_35 28 27 F_TR_36 34 31 F_TR_37 81 68

136

DT Text File Tokens Types Type/Token Ratio Sentences F_TR_38 41 36 87,8 2 F_TR_39 31 25 80,65 1 F_TR_40 66 52 78,79 3 F_TR_41 55 47 85,45 2 F_TR_42 43 37 86,05 2 F_TR_43 55 47 85,45 2 F_TR_44 54 47 87,04 2 F_TR_45 60 51 85 3 F_TR_46 63 55 87,3 3 F_TR_47 42 39 92,86 1 F_TR_48 18 16 88,89 1 F_TR_49 91 73 80,22 4 F_TR_50 74 58 78,38 3 F_TR_51 32 31 96,88 2 F_TR_52 43 38 88,37 2 F_TR_53 30 25 83,33 2 F_TR_54 44 38 86,36 1 F_TR_55 66 52 78,79 3 F_TR_56 89 62 69,66 3

DE Text File Tokens Types F_TR_38 38 34 F_TR_39 28 23 F_TR_40 65 51 F_TR_41 53 45 F_TR_42 41 35 F_TR_43 53 45 F_TR_44 52 45 F_TR_45 58 49 F_TR_46 61 53 F_TR_47 40 37 F_TR_48 15 14 F_TR_49 87 70 F_TR_50 70 55 F_TR_51 28 28 F_TR_52 39 35 F_TR_53 26 22 F_TR_54 40 35 F_TR_55 62 50 F_TR_56 85 60

DT Text File Tokens Types Type/Token Ratio Sentences F_TR_57 46 39 84,78 2 F_TR_58 41 36 87,8 2 F_TR_59 49 41 83,67 2 F_TR_60 29 27 93,1 1 F_TR_61 56 44 78,57 1 F_TR_62 51 39 76,47 1 F_TR_63 28 24 85,71 2 F_TR_64 29 25 86,21 2 F_TR_65 29 26 89,66 2 F_TR_66 22 21 95,45 2 F_TR_67 31 30 96,77 2 F_TR_68 39 31 79,49 2 F_TR_69 64 53 82,81 2 F_TR_70 42 32 76,19 2 F_TR_71 36 31 86,11 1 F_TR_72 76 58 76,32 4 F_TR_73 43 34 79,07 1 F_TR_74 47 38 80,85 1

DE Text File Tokens Types F_TR_57 42 36 F_TR_58 37 32 F_TR_59 45 38 F_TR_60 25 24 F_TR_61 48 39 F_TR_62 49 37 F_TR_63 26 22 F_TR_64 27 23 F_TR_65 27 24 F_TR_66 20 19 F_TR_67 29 28 F_TR_68 37 29 F_TR_69 62 51 F_TR_70 40 30 F_TR_71 34 29 F_TR_72 75 57 F_TR_73 41 32 F_TR_74 45 36

137

DE1 F_TR_01 F_TR_02 F_TR_03 F_TR_04 F_TR_05 F_TR_06 F_TR_07 F_TR_08 F_TR_09 F_TR_10 F_TR_11 F_TR_12 F_TR_13 F_TR_14 F_TR_15 F_TR_16 F_TR_17 F_TR_18 F_TR_19 F_TR_20 F_TR_21 F_TR_22 F_TR_23 F_TR_24 F_TR_25 F_TR_26 F_TR_27 <circunstncia> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <agentivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <tlico> <constitutivo> <agentivo> <tlico> <constitutivo> <constitutivo> <constitutivo> <tlico> <constitutivo> <constitutivo> <agentivo> <agentivo> <constitutivo> <circunstncia> <meio> <agentivo>

DE2 <tlico> <tlico> <tlico>

DE3

DE4

DE5 F_TR_28 F_TR_29 F_TR_30 F_TR_31

DE1 <tlico> <agentivo> <circunstncia> <circunstncia> <constitutivo> <tlico> <tlico> <circunstncia> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <circunstncia> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <tlico> <tlico> <tlico> <circunstncia> <circunstncia> <circunstncia>

DE2

DE3

DE4

DE5

<constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <elaborao> <tlico> <tlico> <elaborao> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <elaborao> <tlico> <tlico> <tlico> <elaborao> <elaborao> <constitutivo> <constitutivo> <constitutivo> <constitutivo>

<tlico> <tlico>

<elaborao>

<tlico> <elaborao> <tlico> <tlico> <agentivo> <tlico> <consequncia> <constitutivo> <elaborao> <constitutivo> <constitutivo> <constitutivo> <elaborao> <constitutivo> <meio> <tlico> <tlico> <constitutivo> <constitutivo> <tlico> <constitutivo> <agentivo> <constitutivo> <elaborao> <tlico> <elaborao> <tlico> <tlico> <elaborao> <elaborao> <tlico> <elaborao> <consequncia> <tlico> <exemplo> <tlico> <tlico> <exemplo> <elaborao> <elaborao> <elaborao> <elaborao>

F_TR_32 F_TR_33 F_TR_34 F_TR_35 F_TR_36 F_TR_37 F_TR_38 F_TR_39 F_TR_40 F_TR_41 F_TR_42 F_TR_43 F_TR_44 F_TR_45 F_TR_46 F_TR_47 F_TR_48 F_TR_49 F_TR_50 F_TR_51 F_TR_52 F_TR_53 F_TR_54

<constitutivo> <tlico>

<constitutivo>

<tlico>

<elaborao> <elaborao>

<elaborao> <elaborao>

<elaborao>

<elaborao> <elaborao> <tlico> <elaborao>

138

DE1 F_TR_55 F_TR_56 F_TR_57 F_TR_58 F_TR_59 F_TR_60 F_TR_61 F_TR_62 F_TR_63 F_TR_64 F_TR_65 F_TR_66 F_TR_67 F_TR_68 F_TR_69 F_TR_70 F_TR_71 F_TR_72 F_TR_73 F_TR_74 <circunstncia> <circunstncia> <circunstncia> <circunstncia> <circunstncia> <circunstncia> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <circunstncia> <constitutivo> <constitutivo> <tlico> <constitutivo> <circunstncia> <constitutivo> <constitutivo>

DE2 <tlico> <tlico> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <tlico> <tlico> <exemplo> <exemplo> <exemplo> <exemplo> <exemplo> <tlico> <tlico> <constitutivo> <tlico> <constitutivo> <tlico> <tlico>

DE3 <elaborao> <elaborao> <tlico> <tlico> <elaborao>

DE4

DE5

<elaborao> <exemplo>

<elaborao>

139

F_
10 20 30 40 50 60 70 80 90 0

TR TR TR TR TR TR TR TR TR TR TR TR _1 1 TR _1 2 _1 0 _0 9 _0 8 _0 7 _0 6 _0 5 _0 4 _0 3 _0 2 _0 1

F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_

TR TR TR TR TR TR TR TR TR TR TR TR TR F_ F_ F_ F_ F_ F_ F_ F_ F_ TR TR TR TR TR TR TR TR TR

_1 3 _1 4 _1 5 _1 6 _1 7 _1 8 _1 9 _2 0 _2 1 _2 2 _2 3 _2 4 _2 5 _2 6 _2 7 _2 8 _2 9 _3 0 _3 1 _3 2 _3 3 _3 4

1% 29%

4% 17% 36% MEIO TLICO EXEMPLO AGENTIVO ELABORAO CONSTITUTIVO CIRCUNSTNCIA

Quantidade de tokens por DE

% das relaes que ocorrem

4% 9%

F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_ F_

TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR

_3 5 _3 6 _3 7 _3 8 _3 9 _4 0 _4 1 _4 2 _4 3 _4 4 _4 5 _4 6 _4 7 _4 8 _4 9 _5 0 _5 1 _5 2 _5 3 _5 4 _5 5 _5 6 _5 7 _5 8 _5 9 _6 0 _6 1 _6 2 _6 3 _6 4 _6 5 _6 6 _6 7 _6 8 _6 9 _7 0 _7 1 _7 2 _7 3 _7 4

DE4 DE5

DE3

DE1 DE2

140

Campo DEFEITO (DE)


DT Text File Tokens Types Type/Token Ratio Sentences DE Text rile Tokens Types OVERALL R_DE_01 R_DE_02 R_DE_03 R_DE_04 R_DE_05 R_DE_06 R_DE_07 R_DE_08 R_DE_09 R_DE_10 R_DE_11 901 37 32 37 19 30 57 27 51 69 21 36 114 30 25 31 19 28 47 25 44 52 20 33 OVERALL R_DE_01 R_DE_02 R_DE_03 R_DE_04 R_DE_05 R_DE_06 R_DE_07 R_DE_08 R_DE_09 R_DE_10 R_DE_11 922 43 84 69 38 24 51 63 49 49 25 37 115 40 65 52 34 23 47 51 43 44 25 34 12,47 93,02 77,38 75,36 89,47 95,83 92,16 80,95 87,76 89,8 100 91,89 35 2 3 1 1 1 2 2 2 2 1 1

DT Text File Tokens Types Type/Token Ratio Sentences DE Text rile Tokens Types R_DE_12 R_DE_13 R_DE_14 R_DE_15 R_DE_16 R_DE_17 R_DE_18 R_DE_19 R_DE_20 R_DE_21 24 48 48 62 50 23 37 68 83 42 24 43 42 50 46 22 33 31 64 39 R_DE_12 R_DE_13 R_DE_14 R_DE_15 R_DE_16 R_DE_17 R_DE_18 R_DE_19 R_DE_20 R_DE_21 22 70 52 28 58 31 20 38 33 38 21 53 45 26 48 28 20 32 26 31 95,45 75,71 86,54 92,86 82,76 90,32 100 84,21 78,79 81,58 1 2 2 1 2 2 1 2 2 2

141

30 25 20 15

40 35

10 5 0 DE5 DE4 DE3 DE2 DE1

Quantidade de tokens por DE

R _D E _0 1 R _D E _0 2 R _D E _0 3 R _D E _0 4 R _D E _0 5 R _D E _0 6 R _D E _0 7 R _D E _0 8 R _D E _0 9 R _D E _1 0 R _D E _1 1 R _D E _1 2 R _D E _1 3 R _D E _1 4 R _D E _1 5 R _D E _1 6 R _D E _1 7 R _D E _1 8 R _D E _1 9 R _D E _2 0 R _D E _2 1

142

DE1 R_DE_01 R_DE_02 R_DE_03 R_DE_04 R_DE_05 R_DE_06 R_DE_07 R_DE_08 R_DE_09 R_DE_10 R_DE_11 R_DE_12 R_DE_13 R_DE_14 R_DE_15 R_DE_16 R_DE_17 R_DE_18 R_DE_19 R_DE_20 R_DE_21 <circunstncia> <circunstncia> <circunstncia> <circunstncia> <constitutivo> <constitutivo> <circunstncia> <circunstncia> <circunstncia> <circunstncia> <circunstncia> <circunstncia> <constitutivo> <circunstncia> <circunstncia> <circunstncia> <circunstncia> <circunstncia> <constitutivo> <constitutivo> <constitutivo>

DE2 <constitutivo> <constitutivo> <constitutivo> <constitutivo> <agentivo> <circunstncia> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <agentivo> <agentivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <agentivo> <associao> <associao> <consequncia>

DE3 <agentivo> <agentivo> <agentivo> <agentivo>

DE4 <consequncia> <elaborao> <consequncia> <consequncia>

DE5

<elaborao>

<agentivo> <agentivo> <consequncia> <agentivo> <agentivo> <agentivo> <circunstncia> <exemplo> <agentivo>

<elaborao> <circunstncia> <elaborao> <agentivo>

<consequncia>

<agentivo> <associao>

<consequncia>

<associao>

143

campo ENSAIO (EN)

DT Text File Tokens Types Type/Token Ratio Sentences DE Text rile Tokens Types

OVERALL R_EN_01 R_EN_02 R_EN_03 R_EN_04 R_EN_05 R_EN_06 R_EN_07 R_EN_08 R_EN_09 R_EN_10 R_EN_11 R_EN_12 2.191 43 89 86 143 130 45 74 69 78 44 50 48 259 31 65 60 75 70 35 51 49 55 36 40 35 11,82 72,09 73,03 69,77 52,45 53,85 77,78 68,92 71,01 70,51 81,82 80 72,92 104 3 3 4 8 5 2 4 3 3 3 3 3

OVERALL 2.130 257

R_EN_01 42 30

R_EN_02 88 64

R_EN_03 85 59

R_EN_04 142 75

R_EN_05 129 69

R_EN_06 44 34

R_EN_07 73 50

R_EN_08 R_EN_09 R_EN_10 R_EN_11 R_EN_12 68 77 43 49 47 48 54 35 39 34

DT Text File Tokens Types Type/Token Ratio Sentences DE Text rile Tokens Types

R_EN_13 R_EN_14 R_EN_15 R_EN_16 R_EN_17 R_EN_18 R_EN_19 R_EN_20 R_EN_21 R_EN_22 R_EN_23 R_EN_24 R_EN_25 66 96 78 54 36 41 20 39 57 62 112 38 93 47 67 55 43 28 36 19 34 38 49 76 31 65 71,21 69,79 70,51 79,63 77,78 87,8 95 87,18 66,67 79,03 67,86 81,58 69,89 3 4 3 3 2 2 1 2 3 3 5 2 4

R_EN_13 R_EN_14 R_EN_15 R_EN_16 R_EN_17 R_EN_18 R_EN_19 R_EN_20 R_EN_21 R_EN_22 R_EN_23 R_EN_24 R_EN_25 65 95 77 53 35 40 19 38 56 57 111 33 90 46 66 54 42 27 35 18 33 37 45 75 27 63

DT Text File Tokens Types Type/Token Ratio Sentences DE Text rile Tokens Types

R_EN_26 R_EN_27 R_EN_28 R_EN_29 R_EN_30 R_EN_31 R_EN_32 R_EN_33 R_EN_34 R_EN_35 R_EN_36 33 78 51 30 72 26 17 55 31 52 55 25 54 40 26 51 24 16 43 27 40 43 75,76 69,23 78,43 86,67 70,83 92,31 94,12 78,18 87,1 76,92 78,18 2 3 3 2 3 1 1 2 2 2 2

R_EN_26 R_EN_27 R_EN_28 R_EN_29 R_EN_30 R_EN_31 R_EN_32 R_EN_33 R_EN_34 R_EN_35 R_EN_36 32 77 50 29 71 20 11 54 27 49 54 24 53 39 25 51 18 11 43 24 39 43

144

100

120

140

20

40

60

80

0 R_EN_01 R_EN_02 R_EN_03 R_EN_04 R_EN_05 R_EN_06 R_EN_07 R_EN_08 R_EN_09 R_EN_10 R_EN_11 R_EN_12 R_EN_13
41%

R_EN_14 R_EN_15 R_EN_16 R_EN_17 R_EN_18


2%

Quantidade de tokens por DE

% das relaes que ocorrem

20% 37%

R_EN_19 R_EN_20 R_EN_21 R_EN_22 R_EN_23 R_EN_24 R_EN_25

TLICO

R_EN_26 R_EN_27 R_EN_28 R_EN_29 R_EN_30 R_EN_31 R_EN_32 R_EN_33 R_EN_34 R_EN_35 R_EN_36 DE4 DE3 DE2 DE1

ELABORAO MEIO

CONSTITUTIVO

145

DE1 R_EN_01 R_EN_02 R_EN_03 R_EN_04 R_EN_05 R_EN_06 R_EN_07 R_EN_08 R_EN_09 R_EN_10 R_EN_11 R_EN_12 R_EN_13 R_DE_14 R_EN_15 R_EN_16 R_EN_17 R_EN_18 R_EN_19 R_EN_20 <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico>

DE2 <elaborao> <meio> <meio> <meio> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <meio> <elaborao> <meio> <meio> <elaborao>

DE3

DE4

R_EN_21 R_EN_22

<tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico>

<elaborao> <meio> <elaborao> <elaborao> <elaborao> <meio> <meio> <meio> <elaborao> <elaborao>

<elaborao> <meio> <elaborao> <elaborao>

<elaborao> <elaborao> <elaborao>

<elaborao>

R_EN_23 R_EN_24

<elaborao>

R_EN_25 R_EN_26 R_EN_27

<constitutivo> <tlico> <elaborao> <elaborao>

<elaborao>

<meio> <elaborao> <meio>

R_EN_28 R_EN_29 R_EN_30 R_EN_31

<elaborao>

<tlico>

<meio> <meio> <meio>

R_EN_32 R_EN_33 R_EN_34 R_EN_35 R_EN_36

<constitutivo> <meio> <elaborao> <meio>

<meio>

<elaborao>

146

campo ETAPA OU MTODO DE FABRICAO (EP)

DT Text File Tokens Types Type/Token Ratio Sentences

OVERALL 1.369 172 12,56 56

R_EP_01 33 30 90,91 1

R_EP_02 20 18 90 1

R_EP_03 20 19 95 1

R_EP_04 22 21 95,45 1

R_EP_05 20 18 90 1

R_EP_06 27 24 88,89 1

R_EP_07 25 24 96 1

R_EP_08 0 0 84 0

R_EP_09 50 42 100 2

R_EP_10 19 19 79,1 1

R_EP_11 67 53 77,36 2

R_EP_12 53 41 78,57 2

R_EP_13 56 44 77,59 2

R_EP_14 58 45 75,61 2

R_EP_15 41 31 73,21 1

R_EP_16 56 41 72,13 2

R_EP_17 61 44 78,26 3

DE Text rile Tokens Types

OVERALL 1.250 169

R_EP_01 29 26

R_EP_02 14 13

R_EP_03 19 18

R_EP_04 21 20

R_EP_05 14 13

R_EP_06 19 17

R_EP_07 23 23

R_EP_08 21 19

R_EP_09 47 40

R_EP_10 16 16

R_EP_11 66 52

R_EP_12 47 38

R_EP_13 50 40

R_EP_14 57 44

R_EP_15 37 27

R_EP_16 52 37

R_EP_17 57 40

DT Text File Tokens Types Type/Token Ratio Sentences

R_EP_18 46 36 81,25 2

R_EP_19 32 26 67,11 2

R_EP_20 76 51 76,74 4

R_EP_21 43 33 84,62 2

R_EP_22 39 33 79,63 2

R_EP_23 54 43 83,64 3

R_EP_24 55 46 78,13 2

R_EP_25 64 50 67,57 3

R_EP_26 37 25 73,21 1

R_EP_27 56 41 70,59 2

R_EP_28 34 24 74,29 1

R_EP_29 35 26 85,37 0

R_EP_30 41 35 89,36 2

R_EP_31 47 42 82,14 2

R_EP_32 28 23 100 1

R_EP_33 14 14 85 1

R_EP_34 20 17 90 1

R_EP_35 20 18 1

DE Text rile Tokens Types

R_EP_18 42 32

R_EP_19 25 22

R_EP_20 72 49

R_EP_21 34 27

R_EP_22 32 28

R_EP_23 47 39

R_EP_24 46 40

R_EP_25 60 47

R_EP_26 36 24

R_EP_27 52 37

R_EP_28 33 23

R_EP_29 34 25

R_EP_30 37 32

R_EP_31 43 39

R_EP_32 24 19

R_EP_33 10 10

R_EP_34 17 15

R_EP_35 17 16

147

40 35 30 25

20 15 10 5 0 DE4 DE3 DE2 DE1

Quantidade de tokens por DE

R_ EP R_ _0 EP 1 R_ _0 EP 2 R_ _0 EP 3 R_ _0 EP 4 R_ _0 EP 5 R_ _0 EP 6 R_ _0 EP 7 R_ _0 EP 8 R_ _0 EP 9 R_ _1 EP 0 R_ _1 EP 1 R_ _1 EP 2 R_ _1 EP 3 R_ _1 EP 4 R_ _1 EP 5 R_ _1 EP 6 R_ _1 EP 7 R_ _1 EP 8 R_ _1 EP 9 R_ _2 EP 0 R_ _2 EP 1 R_ _2 EP 2 R_ _2 EP 3 R_ _2 EP 4 R_ _2 EP 5 R_ _2 EP 6 R_ _2 EP 7 R_ _2 EP 8 R_ _2 EP 9 R_ _3 EP 0 R_ _3 EP 1 R_ _3 EP 2 R_ _3 EP 3 R_ _3 EP 4 _3 5

148

DE1 R_EP_01 R_EP_02 R_EP_03 R_EP_04 R_EP_05 R_EP_06 R_EP_07 R_EP_08 R_EP_09 R_EP_10 R_EP_11 R_EP_12 R_DE_13 R_DE_14 R_EP_15 R_EP_16 R_EP_17 R_EP_18 <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <meio> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo>

DE2 <tlico>

DE3

DE4

R_EP_19 R_EP_20 R_EP_21 R_EP_22

<constitutivo> <constitutivo> <constitutivo> <meio> <meio> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo>

<meio> <meio> <elaborao> <constitutivo> <constitutivo> <elaborao> <meio> <tlico> <meio> <meio> <meio> <meio> <tlico> <tlico> <constitutivo> <constitutivo> <meio> <meio> <tlico> <exemplo> <constitutivo> <meio> <elaborao>

<meio>

R_EP_23 R_EP_24 R_EP_25

<meio>

<tlico>

R_EP_26 R_EP_27

<elaborao>

R_EP_28 R_EP_29

<meio> <constitutivo> <meio> <meio> <tlico> <meio> <meio> <meio>

<tlico> <meio> <tlico> <tlico>

<elaborao> <tlico> <meio> <elaborao>

R_EP_30 R_EP_31 R_EP_32 R_EP_33 R_EP_34 R_EP_35

<meio>

<elaborao> <elaborao> <elaborao>

149

campo INSTRUMENTO OU EQUIPAMENTO (IN)

DT Text File Tokens Types Type/Token Ratio Sentences DE Text File Tokens Types

OVERALL 2.866 318 11,1 116

R_IN_01 65 52 80 3

R_IN_02 44 36 81,82 2

R_IN_03 R_IN_04 R_IN_05 R_IN_06 R_IN_07 142 30 50 25 90 83 27 44 23 62 58,45 90 88 92 68,89 4 1 2 2 3

R_IN_08 R_IN_09 R_IN_10 R_IN_11 R_IN_12 R_IN_13 R_IN_14 R_IN_15 R_IN_16 49 41 85 35 42 42 86 36 44 36 37 58 31 35 35 62 28 38 73,47 90,24 68,24 88,57 83,33 83,33 72,09 77,78 86,36 2 1 3 1 1 2 3 2 1

R_IN_17 75 58 77,33 3

OVERALL 2.781 310

R_IN_01 64 51

R_IN_02 41 35

R_IN_03 R_IN_04 141 29 83 26

R_IN_05 49 43

R_IN_06 24 22

R_IN_07 89 61

R_IN_08 R_IN_09 48 40 35 36

R_IN_10 R_IN_11 R_IN_12 R_IN_13 R_IN_14 84 34 41 41 85 57 30 34 34 62

R_IN_15 R_IN_16 35 43 27 37

R_IN_17 74 58

DT Text File Tokens Types Type/Token Ratio Sentences DE Text File Tokens Types

R_IN_18 74 55 74,32 3

R_IN_19 75 59 78,67 2

R_IN_20 75 56 74,67 3

R_IN_21 R_IN_22 R_IN_23 R_IN_24 R_IN_25 80 61 57 99 110 60 45 43 75 69 75 73,77 75,44 75,76 62,73 3 2 3 6 3

R_IN_26 R_IN_27 R_IN_28 R_IN_29 R_IN_30 R_IN_31 R_IN_32 R_IN_33 R_IN_34 52 55 54 66 33 39 44 55 67 41 40 41 47 29 32 35 41 53 78,85 72,73 75,93 71,21 87,88 82,05 79,55 74,55 79,1 2 2 2 2 2 2 3 2 3

R_IN_35 85 62 72,94 4

R_IN_18 73 54

R_IN_19 74 58

R_IN_20 73 54

R_IN_21 R_IN_22 79 60 59 45

R_IN_23 56 42

R_IN_24 98 74

R_IN_25 109 68

R_IN_26 R_IN_27 47 54 38 39

R_IN_28 R_IN_29 R_IN_30 R_IN_31 R_IN_32 51 65 32 38 40 38 46 28 31 31

R_IN_33 R_IN_34 54 59 40 48

R_IN_35 82 60

DT Text File Tokens Types Type/Token Ratio Sentences DE Text File Tokens Types

R_IN_36 78 59 75,64 4

R_IN_37 77 61 79,22 4

R_IN_38 98 70 71,43 3

R_IN_39 R_IN_40 R_IN_41 R_IN_42 R_IN_43 22 35 47 57 33 21 31 43 45 26 95,45 88,57 91,49 78,95 78,79 2 1 2 2 1

R_IN_44 R_IN_45 R_IN_46 R_IN_47 R_IN_48 R_IN_49 R_IN_50 R_IN_51 18 61 16 49 40 20 27 26 17 52 14 40 35 18 24 24 94,44 85,25 87,5 81,63 87,5 90 88,89 92,31 1 3 1 2 2 1 1 1

R_IN_36 75 56

R_IN_37 75 60

R_IN_38 91 64

R_IN_39 R_IN_40 21 34 20 30

R_IN_41 46 42

R_IN_42 56 44

R_IN_43 32 25

R_IN_44 R_IN_45 17 59 16 50

R_IN_46 R_IN_47 R_IN_48 R_IN_49 R_IN_50 15 48 39 19 26 13 40 35 17 23

R_IN_51 22 20

150

20 10

40 30

50

70 60

80

44%

% das relaes que ocorrem

5% 1% 25% 25%

Quantidade de tokens por DE

TLICO

EXEMPLO

ELABORAO

CONSTITUTIVO

CIRCUNSTNCIA

R_ IN R_ _01 IN R_ _02 IN R_ _03 IN R_ _04 IN R_ _05 IN R_ _06 IN R_ _07 IN R_ _08 IN R_ _09 IN R_ _10 IN R_ _11 IN R_ _12 IN R_ _13 IN R_ _14 IN R_ _15 IN R_ _16 IN R_ _17 IN R_ _18 IN R_ _19 IN R_ _20 IN R_ _21 IN R_ _22 IN R_ _23 IN R_ _24 IN R_ _25 IN R_ _26 IN R_ _27 IN R_ _28 IN R_ _29 IN R_ _30 IN R_ _31 IN R_ _32 IN R_ _33 IN R_ _34 IN R_ _35 IN R_ _36 IN R_ _37 IN R_ _38 IN R_ _39 IN R_ _40 IN R_ _41 IN R_ _42 IN R_ _43 IN R_ _44 IN R_ _45 IN R_ _46 IN R_ _47 IN R_ _48 IN R_ _49 IN R_ _50 IN _5 1

DE5

DE4

DE3

DE2

DE1

151

DE1 R_IN_01 R_IN_02 IN_03 R_IN_04 R_IN_05 R_IN_06 R_IN_07 R_IN_08 R_IN_09 R_IN_10 R_IN_11 R_IN_12 R_IN_13 R_IN_14 R_IN_15 R_IN_16 R_IN_17 R_IN_18 R_IN_19 R_IN_20 R_IN_21 R_IN_22 R_IN_23 R_IN_24 R_IN_25 R_IN_26 R_IN_27 <constitutivo> <constitutivo> <constitutivo> <tlico> <constitutivo> <constitutivo> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <constitutivo> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico>

DE2 <tlico> <tlico> <tlico>

DE3 <elaborao>

DE4

DE5

R_IN_28 R_IN_29 R_IN_30

<tlico> <tlico> <constitutivo> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <constitutivo> <tlico> <tlico> <tlico> <constitutivo> <tlico> <tlico> <tlico> <tlico> <circunstncia> <tlico> <constitutivo>

<elaborao> <elaborao> <tlico> <exemplo> <elaborao> <elaborao> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <tlico> <constitutivo> <elaborao> <exemplo> <exemplo> <elaborao> <elaborao> <elaborao> <elaborao> <elaborao> <exemplo> <tlico> <elaborao> <elaborao>

<elaborao>

R_IN_31 R_IN_32

<tlico> <tlico> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <tlico> <elaborao> <constitutivo> <constitutivo> <constitutivo> <tlico> <elaborao> <elaborao> <exemplo> <elaborao> <constitutivo> <elaborao> <elaborao> <elaborao> <constitutivo> <elaborao> <elaborao> <elaborao> <exemplo> <elaborao> <elaborao> <exemplo> <elaborao> <tlico> <elaborao> <tlico> <elaborao> <tlico> <tlico> <elaborao> <tlico> <elaborao> <elaborao> <elaborao>

R_IN_33 R_IN_34 R_IN_35 R_IN_36 R_IN_37 R_IN_38 R_IN_39 R_IN_40 R_IN_41 R_IN_42 R_IN_43 R_IN_44 R_IN_45 R_IN_46 R_IN_47 R_IN_48 R_IN_49 R_IN_50 R_IN_51

<tlico> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <tlico> <elaborao>

<tlico>

152

campo MATRIA-PRIMA (MP)


DT Text File Tokens Types Type/Token Ratio Sentences DE Text File Tokens Types OVERALL 5.242 599 11,43 286 R_MP_01 15 15 100 1 R_MP_02 38 35 92,11 2 R_MP_03 153 103 67,32 7 R_MP_04 79 64 81,01 4 R_MP_05 93 72 77,42 6 R_MP_06 44 27 61,36 2 R_MP_07 44 39 88,64 2 R_MP_08 59 45 76,27 3 R_MP_09 68 59 86,76 2 R_MP_10 61 51 83,61 3 R_MP_11 22 19 86,36 2 R_MP_12 21 19 90,48 2 R_MP_13 80 68 85 4 R_MP_14 72 55 76,39 4 R_MP_15 105 75 71,43 4 R_MP_16 22 22 100 3 R_MP_17 40 34 85 3

OVERALL 5.075 589

R_MP_01 13 13

R_MP_02 36 33

R_MP_03 150 102

R_MP_04 77 62

R_MP_05 92 71

R_MP_06 41 25

R_MP_07 43 38

R_MP_08 56 42

R_MP_09 65 57

R_MP_10 60 50

R_MP_11 20 17

R_MP_12 20 18

R_MP_13 76 64

R_MP_14 70 53

R_MP_15 101 72

R_MP_16 21 21

R_MP_17 39 33

DT Text File Tokens Types Type/Token Ratio Sentences DE Text File Tokens Types

R_MP_18 65 57 87,69 3

R_MP_19 65 50 76,92 4

R_MP_20 104 77 74,04 4

R_MP_21 64 50 78,13 4

R_MP_22 42 38 90,48 4

R_MP_23 102 68 66,67 7

R_MP_24 75 61 81,33 6

R_MP_25 169 111 65,68 8

R_MP_26 258 165 63,95 14

R_MP_27 23 21 91,3 2

R_MP_28 123 83 67,48 7

R_MP_29 121 78 64,46 3

R_MP_30 123 89 72,36 5

R_MP_31 308 197 63,96 18

R_MP_32 333 196 58,86 17

R_MP_33 103 78 75,73 7

R_MP_34 154 106 68,83 9

R_MP_35 99 76 76,77 7

R_MP_18 64 56

R_MP_19 64 49

R_MP_20 94 70

R_MP_21 62 48

R_MP_22 41 37

R_MP_23 101 67

R_MP_24 71 58

R_MP_25 166 110

R_MP_26 257 165

R_MP_27 20 19

R_MP_28 120 81

R_MP_29 120 78

R_MP_30 120 86

R_MP_31 304 194

R_MP_32 330 195

R_MP_33 98 74

R_MP_34 152 104

R_MP_35 97 75

DT Text File Tokens Types Type/Token Ratio Sentences DE Text File Tokens Types

R_MP_36 50 41 82 4

R_MP_37 15 14 93,33 1

R_MP_38 86 65 75,58 5

R_MP_39 97 68 70,1 3

R_MP_40 49 36 73,47 2

R_MP_41 140 100 71,43 10

R_MP_42 313 180 57,51 13

R_MP_43 62 48 77,42 5

R_MP_44 19 18 94,74 1

R_MP_45 109 79 72,48 3

R_MP_46 85 68 80 5

R_MP_47 91 73 80,22 4

R_MP_48 75 60 80 5

R_MP_49 92 63 68,48 5

R_MP_50 77 63 81,82 4

R_MP_51 39 33 84,62 2

R_MP_52 63 51 80,95 5

R_MP_53 45 40 88,89 3

R_MP_36 49 41

R_MP_37 13 12

R_MP_38 82 61

R_MP_39 96 67

R_MP_40 45 34

R_MP_41 134 97

R_MP_42 310 178

R_MP_43 59 46

R_MP_44 18 17

R_MP_45 103 75

R_MP_46 83 66

R_MP_47 85 68

R_MP_48 73 58

R_MP_49 88 62

R_MP_50 75 61

R_MP_51 36 30

R_MP_52 57 45

R_MP_53 41 36

153

100

150

200

250

300

50

DE Text File Tokens Types

DT Text File Tokens Types Type/Token Ratio Sentences

R_MP_54 62 54 R_MP_55 106 78 R_MP_56 69 53 R_MP_57 59 45 R_MP_58 29 28 R_MP_59 10 10 R_MP_60 32 26

R_MP_54 66 56 84,85 4 R_MP_55 110 80 72,73 9 R_MP_56 70 54 77,14 3 R_MP_57 60 46 76,67 3 R_MP_58 30 29 96,67 1 R_MP_59 18 17 94,44 1 R_MP_60 34 28 82,35 2

Quantidade de tokens por DE

R _M P R _01 _M P R _02 _M P R _0 _M 3 P R _04 _M P R _0 _M 5 P R _06 _M P R _07 _M P R _0 _M 8 P R _09 _M P R _1 _M 0 P R _11 _M P R _12 _M P R _1 _M 3 P R _14 _M P R _1 _M 5 P R _16 _M P R _17 _M P R _1 _M 8 P R _19 _M P R _2 _M 0 P R _21 _M P R _22 _M P R _2 _M 3 P R _24 _M P R _2 _M 5 P R _26 _M P R _27 _M P R _2 _M 8 P R _29 _M P R _3 _M 0 P R _31 _M P R _32 _M P R _3 _M 3 P R _34 _M P R _3 _M 5 P R _36 _M P R _37 _M P R _3 _M 8 P R _39 _M P R _4 _M 0 P R _41 _M P R _42 _M P R _4 _M 3 P R _44 _M P R _4 _M 5 P R _46 _M P R _47 _M P R _4 _M 8 P R _49 _M P R _5 _M 0 P R _51 _M P R _52 _M P R _5 _M 3 P R _54 _M P R _5 _M 5 P R _56 _M P R _57 _M P R _5 _M 8 P R _59 _M P _6 0

DE5

DE4

DE3

DE2

DE1

154

DE1 R_MP_01 R_MP_02 R_MP_03 R_MP_04 R_MP_05 R_MP_06 R_MP_07 R_MP_08 R_MP_09 R_MP_10 R_MP_11 R_MP_12 R_MP_13 R_MP_14 R_MP_15 R_MP_16 R_MP_17 R_MP_18 R_MP_19 R_MP_20 R_MP_21 R_MP_22 R_MP_23 R_MP_24 R_MP_25 R_MP_26 R_MP_27 <tlico> <tlico> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <elaborao> <constitutivo> <constitutivo> <elaborao> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <agentivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <elaborao> <constitutivo>

DE2

DE3

DE4

DE5

R_MP_28 R_MP_29 R_MP_30

<constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <agentivo> <constitutivo> <constitutivo> <tlico> <agentivo> <constitutivo> <constitutivo> <constitutivo> <tlico> <constitutivo> <tlico> <tlico> <tlico> <constitutivo> <constitutivo> <constitutivo> <agentivo> <constitutivo> <constitutivo> <tlico> <constitutivo> <constitutivo>

<tlico> <tlico> <tlico> <tlico> <tlico> <tlico> <constitutivo>

<elaborao>

<agentivo> <tlico> <tlico> <exemplo>

<exemplo>

<constitutivo>

<tlico>

R_MP_31 R_MP_32

<exemplo>

R_MP_33 R_MP_34 R_MP_35

<tlico>

<tlico>

<exemplo>

R_MP_36 R_MP_37

<tlico>

<semelhana>

<tlico> <tlico>

R_MP_38 R_MP_39 R_MP_40

<tlico> <tlico> <elaborao> <tlico> <exemplo> <elaborao>

<elaborao>

<tlico>

<exemplo> <exemplo> <tlico> <constitutivo>

<elaborao> <tlico> <elaborao> <tlico>

<tlico>

R_MP_41 R_MP_42

<tlico>

<constitutivo> <constitutivo>

R_MP_43 R_MP_44 R_MP_45

<tlico> <tlico> <tlico> <constitutivo> <tlico>

R_MP_46 R_MP_47 R_MP_48 R_MP_49 R_MP_50 R_MP_51

<constitutivo> <tlico> <tlico> <tlico> <elaborao> <tlico> <tlico>

<elaborao> <constitutivo> <elaborao>

<tlico>

<tlico> <elaborao> <constitutivo> <tlico> <tlico> <elaborao>

R_MP_52 R_MP_53 R_MP_54 R_MP_55

<tlico>

155

DE1 R_MP_56 R_MP_57 R_MP_58 <tlico> <tlico> <constitutivo>

DE2 <elaborao> <elaborao>

DE3

DE4

DE5

R_MP_59 R_MP_60

<TLICO> <CONSTITUTIVO> <EXEMPLO>

156

campo PRODUTO ACABADO (PA)

DT Text File Tokens Types Type/Token Ratio Sentences

OVERALL R_PA_01 R_PA_02 R_PA_03 R_PA_04 R_PA_05 R_PA_06 R_PA_07 R_PA_08 R_PA_09 R_PA_10 R_PA_11 R_PA_12 R_PA_13 837 80 71 89 73 127 25 28 67 34 65 47 75 56 109 60 56 65 56 90 19 23 44 20 46 33 63 43 13,02 75 78,87 73,03 76,71 70,87 76 82,14 65,67 58,82 70,77 70,21 84 76,79 36 2 3 3 3 4 2 2 2 1 4 3 5 2

DE Text File Tokens Types

OVERALL R_PA_01 R_PA_02 R_PA_03 R_PA_04 R_PA_05 R_PA_06 R_PA_07 R_PA_08 R_PA_09 R_PA_10 R_PA_11 R_PA_12 R_PA_13 782 78 60 86 71 125 23 26 57 31 61 42 73 49 101 58 49 62 55 88 17 21 39 17 42 29 63 40

157

% das relaes que ocorrem

15% 28%

AGENTIVO CONSTITUTIVO ELABORAO EXEMPLO


4% 42% 11%

TLICO

R_PA_01 R_PA_02 R_PA_03 R_PA_04 R_PA_05 R_PA_06 R_PA_07 R_PA_08 R_PA_09 R_PA_10 R_PA_11 R_PA_12 R_PA_13

DE1 <constitutivo> <constitutivo> <constitutivo> <constitutivo> <exemplo> <tlico> <constitutivo> <agentivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <agentivo>

DE2 <tlico> <constitutivo> <tlico> <tlico> <tlico> <constitutivo> <tlico> <tlico> <tlico> <agentivo> <agentivo> <tlico> <constitutivo>

DE3 <elaborao> <exemplo> <constitutivo> <elaborao> <constitutivo>

DE4 <tlico> <agentivo> <tlico> <agentivo>

DE5

<constitutivo> <constitutivo> <constitutivo> <agentivo> <elaborao> <tlico> <tlico> <elaborao> <constitutivo> <constitutivo> <elaborao>

158

campo PROPRIEDADE (PR)

DT Text File Tokens Types Type/Token Ratio Sentences

OVERALL 1.365 168 12,31 63

R_PR_01 38 29 76,32 2

R_PR_02 44 36 81,82 3

R_PR_03 28 22 78,57 2

R_PR_04 31 26 83,87 2

R_PR_05 26 26 100 1

R_PR_06 31 28 90,32 2

R_PR_07 25 23 92 1

R_PR_08 19 19 100 1

R_PR_09 17 16 94,12 1

R_PR_10 62 45 72,58 2

R_PR_11 76 59 77,63 2

R_PR_12 40 37 92,5 1

R_PR_13 27 25 92,59 2

R_PR_14 25 22 88 1

R_PR_15 27 26 96,3 1

R_PR_16 32 31 96,88 2

R_PR_17 66 45 68,18 2

DE Text File Tokens Types

OVERALL 1.284 161

R_PR_01 36 28

R_PR_02 42 34

R_PR_03 26 20

R_PR_04 26 24

R_PR_05 24 24

R_PR_06 30 27

R_PR_07 23 21

R_PR_08 17 17

R_PR_09 15 14

R_PR_10 60 44

R_PR_11 74 57

R_PR_12 38 35

R_PR_13 25 24

R_PR_14 19 17

R_PR_15 20 19

R_PR_16 30 29

R_PR_17 64 43

DT Text File Tokens Types Type/Token Ratio Sentences

R_PR_18 43 36 83,72 2

R_PR_19 52 40 76,92 2

R_PR_20 38 36 94,74 2

R_PR_21 45 34 75,56 3

R_PR_22 52 40 76,92 3

R_PR_23 68 55 80,88 2

R_PR_24 68 51 75 2

R_PR_25 142 96 67,61 3

R_PR_26 31 27 87,1 2

R_PR_27 35 32 91,43 2

R_PR_28 37 27 72,97 2

R_PR_29 22 20 90,91 2

R_PR_30 19 18 94,74 1

R_PR_31 23 18 78,26 2

R_PR_32 25 25 100 2

R_PR_33 34 29 85,29 2

R_PR_34 17 14 82,35 1

DE Text File Tokens Types

R_PR_18 41 34

R_PR_19 51 39

R_PR_20 35 33

R_PR_21 42 33

R_PR_22 46 37

R_PR_23 67 54

R_PR_24 67 50

R_PR_25 138 94

R_PR_26 30 26

R_PR_27 34 31

R_PR_28 36 27

R_PR_29 19 18

R_PR_30 18 17

R_PR_31 21 16

R_PR_32 23 23

R_PR_33 32 27

R_PR_34 15 12

159

10

20

30

40

50

60

17%

Quantidade de tokens por DE

% das relaes que ocorrem

54% 2% 24% 3%
ASSOCIAO ELABORAO SEMELHANA CONSEQUNCIA CONSTITUTIVO

_P R _ _P 0 1 R R _0 _P 2 R R _0 _P 3 R R _0 _P 4 R R _0 _P 5 R R _0 _P 6 R R _0 _P 7 R R _0 _P 8 R R _0 _P 9 R R _1 _P 0 R R _1 _P 1 R R _1 _P 2 R R _1 _P 3 R R _1 _P 4 R R _1 _P 5 R R _1 _P 6 R R _1 _P 7 R R _1 _P 8 R R _1 _P 9 R R _2 _P 0 R R _2 _P 1 R R _2 _P 2 R R _2 _P 3 R R _2 _P 4 R R _2 _P 5 R R _2 _P 6 R R _2 _P 7 R R _2 _P 8 R R _2 _P 9 R R _3 _P 0 R R _3 _P 1 R R _3 _P 2 R R _3 _P 3 R _3 4

DE3

DE2

DE1

160

DE1 R_PR_01 R_PR_02 R_PR_03 R_PR_04 R_PR_05 R_PR_06 R_PR_07 R_PR_08 R_PR_09 R_PR_10 R_PR_11 R_PR_12 R_PR_13 R_PR_14 R_PR_15 R_PR_16 R_PR_17 R_PR_18 R_PR_19 R_PR_20 R_PR_21 R_PR_22 R_PR_23 R_PR_24 R_PR_25 R_PR_26 R_PR_27 R_PR_28 R_PR_29 R_PR_30 R_PR_31 R_PR_32 R_PR_33 R_PR_34 <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo> <constitutivo>

DE2 <elaborao> <associao> <associao> <associao> <associao>

DE3

<associao> <associao> <elaborao> <elaborao> <elaborao>

<elaborao> <associao> <associao> <associao> <elaborao> <consequncia> <consequncia> <associao> <associao> <elaborao> <associao> <elaborao> <associao> <semelhana> <elaborao> <elaborao> <elaborao> <associao> <associao>

161