Você está na página 1de 52

UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE ARTES E COMUNICAO DEPARTAMENTO DE CINCIA DA INFORMAO CURSO DE BIBLIOTECONOMIA

MRCIA IVO BRAZ

VOCABULRIO CONTROLADO PARA INDEXAO DE TESES E DISSERTAES DO PROGRAMA DE PS-GRADUAO EM DIREITO DA UFPE

RECIFE 2010

UNIVERSIDADE FEDERAL DE PERNAMBUCO


CENTRO DE ARTES E COMUNICAO DEPARTAMENTO DE CINCIA DA INFORMAO CURSO DE BIBLIOTECONOMIA

MRCIA IVO BRAZ

VOCABULRIO CONTROLADO PARA INDEXAO DE TESES E DISSERTAES DO PROGRAMA DE PS-GRADUAO EM DIREITO DA UFPE

RECIFE 2010

MRCIA IVO BRAZ

VOCABULRIO CONTROLADO PARA INDEXAO DE TESES E DISSERTAES DO PROGRAMA DE PS-GRADUAO EM DIREITO DA UFPE

Trabalho de Concluso de Curso (TCC) apresentado ao Curso de Biblioteconomia do Departamento de Cincia da Informao da Universidade Federal de Pernambuco, como requisito parcial para obteno do grau de Bacharel em Biblioteconomia. Orientador: Prof. Dr. Renato Fernandes Corra

RECIFE 2010

B827v

Braz, Mrcia Ivo. Vocabulrio controlado para indexao de teses e dissertaes do Programa de Ps-Graduao em Direito da UFPE/Mrcia Ivo Braz. - Recife, 2010. 51f. Trabalho de Concluso de Curso (Bacharelado em Biblioteconomia) Universidade Federal de Pernambuco. 1. Vocabulrio controlado 2. Linguagens documentrias 3.Biblioteca Digital de Teses e Dissertaes 4. Informao jurdica I. Ttulo. CDU - 025.43 CDD - 025.49 i

Dedico a Deus e minha famlia.


ii

AGRADECIMENTOS
Agradeo a Deus, por permitir que conclusse mais essa etapa, (privilgio que muitos gostariam de ter alcanado) pelas bnos, pela famlia que me deu, por me presentear com alguns bons amigos e por aqueles me do fora e que acreditam em mim. Agradeo a minha me, pelo esforo de ter me guiado durante todo esse tempo, pelos sacrifcios que fez pelo simples motivo de me amar, deixando muitas vezes seus sonhos de lado para que eu realizasse os meus, e pela confiana sem medidas, mesmo que no possa me acompanhar no dia-a-dia como gostaria. Ao meu pai, pois sei que tambm se alegra com as minhas conquistas. A Marcones e Marissol, meus irmos, por estarem ligados a mim no apenas por laos de sangue, mas de afeto perptuo. A Srgio, pela pacincia e por estar sempre ao meu lado. A ngela, por me inspirar na escolha daquilo que concluo agora. A minha tia Terezinha, pela acolhida em sua casa, e ao meu primo Joo Batista, pelas idas dirias para a faculdade, minimizando algumas dificuldades. A Priscila, por ser amiga-irm. Jamais saberia que poderia encontrar algum que dividisse alegrias, anseios como se j fizesse parte da famlia que Deus permitiu que encontrasse. Ao professor Renato, pela gentileza de me orientar, pela pacincia e dedicao. Ao professor Lourival, pela acolhida nesse ano inteiro como monitora, e a professora Dora pela minha primeira monitoria. Aos alunos das monitorias em Linguagens Documentrias, Representao Descritiva 1 e Representao Temtica 2, que me permitiram um crescimento enorme como pessoa e como profissional. Aos meus ex-alunos, pelos bons momentos que jamais esquecerei. As bibliotecrias do Tribunal Regional Federal da 5 Regio Isis e Erotides pelos dois anos de intenso aprendizado e amizade. As bibliotecrias da Procuradoria da Repblica em Pernambuco Gracilene e Irade pela acolhida, apesar do pouco tempo que ficarei em sua companhia. A Julyane, Yale, Ialy, Jarleide, Tatiana e Kassandra, que em situaes diferentes me ensinaram o significado da amizade. iii

s pessoas da turma de Biblioteconomia 2007.1 pela alegria de t-los desde ento em meu corao. Agradeo, enfim, a todos que fazem parte da minha histria; cada um contribuiu para que me tornasse a pessoa que sou hoje.

iv

O valor de todo o conhecimento est no seu vnculo com as nossas necessidades, aspiraes e aes; de outra forma, o conhecimento torna-se um simples lastro de memria, capaz apenas - como um navio que navega com demasiado peso - de diminuir a oscilao da vida cotidiana." V. O. Kliutchevski v

RESUMO
Aborda a construo de um vocabulrio controlado para a indexao de teses e dissertaes do Programa de Ps-Graduao em Direito da UFPE. Utiliza como base para a elaborao das entradas no vocabulrio as palavras-chave extradas das prprias publicaes, aps a devida anlise e normalizao, atravs da comparao com tesauros j existentes da rea jurdica. Apresenta os conceitos relacionados Biblioteca Digital de Teses e Dissertaes e informao jurdica, ao passo que prope e discute metodologias para construo e avaliao de vocabulrios controlados. O vocabulrio controlado construdo consiste em uma lista de cabealhos de assunto com 145 termos, dos quais 122 entradas principais e mais 23 remissivas, e obteve bons ndices de revocao e preciso.

Palavras-chave: Vocabulrio controlado; Linguagens documentrias; Biblioteca Digital de Teses e Dissertaes; Informao jurdica.

vi

ABSTRACT
This work coverages the build of a controlled vocabulary for indexing theses and dissertations from the Post-Graduate Program at UFPE. Use the keywords extracted from the publications as input in the construction process of entries in the vocabulary, analyzing and standardization, through comparison with existing thesauri in the juridical field. It introduces the concepts related to Digital Library of Theses and Dissertations and juridical information, proposes and discusses methodologies for construction and evaluation of controlled vocabulary. The controlled vocabulary consists of a list of subject headings with 145 terms, with 122 main entries and 23 remissives, and obtained good levels of recall and precision.

KEYWORDS: Controlled vocabulary; Documentary languages; Digital Library of Theses and Dissertations; Juridical information.

vii

SUMRIO

1 INTRODUO ............................................................................................................................ 1 2 FUNDAMENTAO TERICA ............................................................................................... 4 2.1 A BDTD ................................................................................................................................ 4 2.1.1 Histrico ......................................................................................................................... 4 2.1.2 A BDTD nas universidades brasileiras ........................................................................... 7 2.2 O CONTROLE DE VOCABULRIO ................................................................................. 8 2.2.1 Definio ........................................................................................................................ 9 2.2.2 Metodologia para construo e avaliao de um vocabulrio controlado .................... 11 2.3 INFORMAO JURDICA ............................................................................................... 15 3 METODOLOGIA....................................................................................................................... 18 3.1 Coleta dos dados .................................................................................................................. 18 3.2 Anlise dos dados ................................................................................................................ 19 3.3 Construo do vocabulrio controlado ................................................................................ 20 3.4 Avaliao do vocabulrio controlado .................................................................................. 21 4 RESULTADOS .......................................................................................................................... 22 4.1 Descrio do Programa de Ps-Graduao em Direito ....................................................... 22 4.2 Anlise das palavras-chave das teses e dissertaes em Direito ......................................... 22 4.3 Vocabulrio controlado para indexao das teses e dissertaes sobre Direito .................. 27 4.3 Avaliao do vocabulrio controlado .................................................................................. 32 5 CONCLUSO ............................................................................................................................ 36 6 REFERNCIAS ......................................................................................................................... 39

viii

1 INTRODUO Com o advento das tecnologias de informao, principalmente a Internet, um volume crescente de documentos se encontra acessvel, o que tem resultado numa demanda por instrumentos que facilitem a recuperao dessas informaes. Neste sentido, podemos observar tambm a multiplicao do nmero de produes no campo cientfico, impulsionadas pela facilidade na comunicao de informaes e a dinamizao do processo de transformao do conhecimento. Porm, no contexto brasileiro, faltava uma iniciativa que tornasse mais visveis as produes oriundas das unidades de pesquisa, muitas vezes destinadas ao esteretipo de literatura cinzenta. Partindo desta premissa, o IBICT Instituto Brasileiro de Cincia e Tecnologia desenvolveu e aplicou o projeto de um repositrio eletrnico onde seriam depositadas as teses e dissertaes produzidas nas universidades e instituies brasileiras de pesquisa, privilegiando tambm aquelas desenvolvidas por pesquisadores brasileiros no exterior. Assim, a Biblioteca Digital de Teses e Dissertaes - BDTD foi implantada nestas instituies, que por sua vez alimentam a BDTD Nacional, ao passo que esta disponibiliza os dados em nvel internacional por meio da Network Digital Library of Thesis and Dissertation NDLTD. Por outro lado, a disponibilizao online esbarra em algumas dificuldades, como a resistncia dos autores que receiam plgio de suas obras, ou ainda por escassez de recursos financeiros e tecnolgicos para a implantao das BDTDs nas instituies. Alm do mais, existe outro problema, desta vez referente recuperao das informaes em alguns destes sistemas, como por exemplo, no caso da Universidade Federal de Pernambuco, onde no existem instrumentos para o controle terminolgico, ou seja, os termos utilizados para indexao ficam a critrio dos prprios autores, que muitas vezes no a fazem de modo satisfatrio no tocante a consistncia nos termos utilizados, comprometendo, portanto, as buscas que so feitas. Muitas vezes, o fato de disponibilizar documentos na Internet faz a considervel parte das pessoas pensarem que dispensvel a indexao. Geralmente isso acontece pelo fato de alguns programas disporem de indexadores automticos, apesar de que alguns extraem, em vez do texto completo, apenas URL (...) ou palavras contidas no ttulo, por exemplo, (CENDN, 2001, p. 42) ou ainda as palavras-chave atribudas pelos prprios autores, na maioria dos casos, sem nenhum 1

critrio adequado para escolha dos termos. Neste sentido, Packer, Antonio e Beraquet (1998, p. 111) comentam que certo que a publicao eletrnica, especialmente a disponvel na Internet, possui maior grau de exposio e acessibilidade do que a publicao em papel, mas no a ponto de dispensar os servios de indexao. Assim, o sistema adotado no contexto da BDTD da UFPE muitas vezes compromete a recuperao das informaes, visto que so os prprios autores que atribuem as palavras-chave utilizadas na indexao, conforme o formulrio que deve ser preenchido no ato da entrega da documentao seo responsvel pela BDTD. Logo, se no h critrios para atribuio dos termos de maneira uniforme, como por exemplo, uma lista de assuntos ou vocabulrio controlado, a busca resultar em rudos, que podem omitir resultados que seriam essenciais. Ento fica evidente que os critrios utilizados para indexao influenciam os resultados das buscas, quando na verdade se pressupe que os autores utilizaro criteriosamente estes [instrumentos], o que pode no ocorrer. (CENDN, 2001, p. 45) Para Gusmo (1985) e Lancaster (2004), essencial o controle terminolgico, a fim e assegurar-se a coincidncia entre o assunto pesquisado, sob o qual o documento foi indexado, e aquilo que foi recuperado, sendo evidente, portanto, que a utilizao de ferramentas que garantam a uniformidade das informaes, bem como proporcionar maior quantidade de termos para indexao so pontos extremamente valiosos. Os termos atribudos pelo indexador so os pontos de acesso s informaes, que garantem sua recuperao. Desta forma, em ambientes de busca (virtuais ou no), uma indexao feita sem critrios padronizados compromete o resultado da pesquisa, omitindo resultados que muitas vezes so essenciais para o usurio. Assim, de acordo com Lancaster (2004), evidente que a utilizao de ferramentas que garantam a uniformidade das informaes, bem como proporcionem maior quantidade de termos para indexao so extremamente valiosos A justificativa deste trabalho se enquadra na necessidade da uniformizao das informaes representadas em sistemas de busca. Este enfoque se embasa em um dos princpios de Gusmo (1985), que retrata o quanto importante o controle terminolgico, a fim de que seja assegurada a coincidncia entre o assunto pesquisado e os documentos recuperados, ou seja, que se obtenham as repostas pelas quais procura. Dessa forma, podemos perceber o quanto necessrio que se faa a uniformizao dos termos utilizados para descrever as teses e dissertaes, a fim de assegurar maior qualidade nas 2

respostas obtidas nas buscas no sistema TEDE (Sistema de Publicao Eletrnica de Teses e Dissertaes) utilizado na UFPE. Portanto, uma iniciativa que privilegie a construo e desenvolvimento de ferramentas para controle terminolgico ser uma boa contribuio para o melhor aproveitamento do servio de busca da BDTD da UFPE e tambm para a prpria Cincia da Informao, quando aborda e discute pontos importantes no que se refere s linguagens documentrias. Partindo dessas premissas, pode-se destacar os problemas que sero base deste trabalho: a indexao das teses e dissertaes do Programa de Ps Graduao em Direito eficaz para a recuperao de informaes no sistema TEDE da BDTD/UFPE? Existe/ vivel implantar, na UFPE, vocabulrio controlado para indexao das teses e dissertaes em direito depositadas na BDTD? Quais as metodologias necessrias para a construo de um vocabulrio controlado no mbito da UFPE? Visando as respostas para estas questes, o principal objetivo deste trabalho propor uma metodologia e construir um vocabulrio controlado para indexao das teses e dissertaes do Programa de Ps Graduao em Direito depositadas na BDTD/UFPE, a partir da anlise das palavras-chave utilizadas. Para tanto, sero seguidas algumas etapas, alcanadas medida que o trabalho se desenvolve, como a verificao da relevncia das palavras-chave utilizadas para indexar as teses e dissertaes em direito para a recuperao das informaes no sistema TEDE, anlise das palavras-chave j utilizadas nas teses e dissertaes j depositadas, a fim de que sirvam como base para o vocabulrio controlado que ser construdo, proposta de uma metodologia para construo e avaliao de vocabulrio controlado que possa se adequar s diversas reas que oferecem cursos de ps graduao na UFPE, e por fim a construo do vocabulrio controlado propriamente dito. Dessa forma, o tema Vocabulrio controlado para a indexao das teses e dissertaes do Programa de Ps Graduao da Universidade Federal de Pernambuco. se justifica medida que visa trazer contribuies para estes universos: ao passo que abordar consideraes acerca das metodologias para construo de vocabulrios controlados, segundo normas e padres internacionais, a BDTD nos nveis nacional e local, e concomitantemente, discusso de pontos referentes importncia da indexao para a recuperao da informao neste contexto.

2 FUNDAMENTAO TERICA A partir de reviso de literatura, sero apresentados e discutidos alguns pontos necessrios ao entendimento deste trabalho. Compreender o objeto de estudo a BDTD, suas finalidades e seu contexto, abordando tambm as linguagens documentrias, suas definies, objetivos e sua necessria aplicao para garantir indexao e recuperao de informaes de forma mais consistente e satisfatria, alm de abordar a informao jurdica, sua definio e seus tipos, para que seja esclarecida mais detalhadamente a rea temtica do vocabulrio controlado que ser construdo. 2.1 A BDTD Nesta seo sero apresentados pontos relevantes sobre a BDTD, sua histria, origens, o contexto em que se insere nas instituies de pesquisa e a importncia para a divulgao da informao cientfica produzida por pesquisadores brasileiros. 2.1.1 Histrico Sob a coordenao do IBCT, o projeto da BDTD integra o programa Biblioteca Digital Brasileira (BDB), que em parceria com instituies nacionais de ensino e pesquisa, visa integrar os sistemas de informao de teses e dissertaes existentes no pas. Foi desenvolvida com participao da Financiadora de Estudos e Pesquisas (Finep), contando com um Comit Tcnico Cientfico (CTC), composto por representantes do IBICT, CNPQ e MEC, alm das trs universidades que deram incio ao programa, com a implementao do projeto-piloto: Universidade de So Paulo, Pontifcia Universidade Catlica do Rio de Janeiro e Universidade Federal de Santa Catarina. De acordo com Packer, Antonio e Beraquet (1998, p. 111), extremamente importante que pases em desenvolvimento, como o Brasil, criem mecanismos alternativos e complementares s bases de dados internacionais para promover o aumento da visibilidade nacional e internacional de suas publicaes, visto que o repositrio proposto pelo IBICT privilegia no apenas as produes em mbito local, mas tambm aquelas produzidas por pesquisadores brasileiros no exterior.

Neste sentido, surgem alguns produtos, como indicadores de uso e produo de teses e dissertaes (eletrnicas ou no) alm de mecanismos e avaliao da utilizao, da sua qualidade e de seu impacto. (PACKER; ANTONIO; BERAQUET, 1998, p. 108). Em 1995, o IBICT implantou um sistema integrado, que reunia, em uma nica base, referncias bibliogrficas de produo cientfica de dezessete instituies de ensino superior, o que totalizava cerca de 121 mil registros. Mesmo que fosse uma iniciativa importante, tinha sua abrangncia restrita, uma vez que cobria to-somente a descrio bibliogrfica das teses. Entretanto, a BDTD comea sua trajetria efetivamente em janeiro de 2001, quando especialistas de organismos nacionais discutiram e avaliaram a implantao de um repositrio de teses e dissertaes nacional. Um ano mais tarde, foi implantado o Consrcio Brasileiro de Teses e Dissertaes, bem como a definio do modelo da BDTD (os protocolos, estrutura da rede, etc). No final de 2002, o lanamento oficial foi realizado pelo ento Ministro da Cincia e Tecnologia, Ronaldo Sandenberg, e em seguida, comeou a implantao do projeto-piloto nas universidades participantes. Este processo no foi interrompido, e a transferncia de tecnologia e treinamento de pessoal para seu uso em diversas instituies ocorre desde ento por meio de workshops realizados tanto em Braslia, como tambm nos estados onde estas se localizam. Kuramoto (2006, p. 1), comenta a respeito do cenrio atual que parece fcil a construo de uma biblioteca ou repositrio digital de teses e dissertaes, tendo em vista hoje a facilidade que se publicam, na Internet, documentos eletrnicos. Entretanto, sabe-se que iniciativas semelhantes esbarram em alguns problemas, como por exemplo, a cultura institucional, que muitas vezes no contribui, demonstrando falta de interesse ou ainda receio em disponibilizar a produo via web por conta de direitos autorais, ou ainda outros fatores, como a escassez de recursos financeiros e tecnolgicos para a viabilizao deste projeto, alm de ser necessria a garantia da interoperabilidade entre o sistema adotado pelo IBICT e os que porventura existam em algumas instituies, ou seja, que exista a possibilidade de os dados serem migrados, se necessrio, ou mesmo acessados por qualquer um destes, sem prejuzo na qualidade das informaes, sem comprometimento na integridade dos dados. Neste sentido, o IBICT constituiu kits para serem doados aquelas IES desprovidas de uma infra-estrutura tecnolgica para implantar a BDTD em suas universidades. (KURAMOTO, 2006, p. 1). Estes kits so constitudos por um servidor (microcomputador Intel), pacote de software bsico e o pacote TEDE. Em contrapartida, as IES assumem o compromisso de 5

implantar, em at trs meses, as BDTDs em seus campi disponibilizando pelo menos quarenta teses e dissertaes. Desta forma, as instituies assumem o papel de provedoras de dados, ao passo que o IBICT assume a posio de provedor de servios, uma vez que so utilizadas tecnologias de coleta automtica de metadados nacionais para alimentar uma base centralizada, sendo esta objeto de coleta por sistemas internacionais (IBICT, 2010). Assim, as produes oriundas do pas tambm so disponibilizadas em nvel internacional, especialmente pela Network Digital Library of Thesis and Dissertation (NDLTD). Para que a interoperabilidade entre os sistemas seja garantida, alguns padres e protocolos devem ser adotados, embora no seja necessrio que sejam utilizados sistemas especficos para desenvolver as bibliotecas digitais em nvel local. Porm, a adoo do MTD-BR (padro de metadados brasileiro para teses e dissertaes desenvolvido pelo IBICT), compatvel com os padres Dublin Core e ETD-MS da NDLTD, implantando tambm uma camada do protocolo OAI-PMH, para que seja permitida no apenas a comunicao entre os sistemas, mas a exposio dos dados para coleta pelos provedores de servio. O IBICT prev a operao da BDTD em dois nveis de integrao:

IES que possuem a prpria biblioteca digital de teses e dissertaes implantada, lanando mo de tecnologia desenvolvida em nvel local; Instituies que no possuem BTD.

No primeiro caso, a integrao BDTD nacional se d pela implantao da camada correspondente ao protocolo OAI-PMH no contexto local, para que dessa maneira os dados sejam expostos no padro MTD-BR. Assim, o apoio instituio ser tcnico, para que os registros j integrados ao sistema prprio tornem-se passveis de ser expostos e conseqentemente coletados, permitindo a interoperabilidade com os provedores de servio. No segundo caso, em que a instituio no dispe de recursos ou de uma biblioteca digital j em operao, foi desenvolvido o TEDE (Sistema de Publicao Eletrnica de Teses e Dissertaes), a fim de possibilitar a implementao e integrao com a BDTD nacional. Este sistema gera bibliotecas digitais, e distribudo gratuitamente atravs dos kits disponibilizados pelo IBICT, contendo tambm a metodologia para estabelecimento do sistema, os manuais de 6

operao, alm da documentao e do treinamento das pessoas que sero responsveis pela sua utilizao. O TEDE est disponvel nas aplicaes Modular e Simplificado. O primeiro depende da existncia de um sistema estruturado que compreenda a integrao entre o curso de psgraduao, o autor da tese ou dissertao e finalmente a biblioteca local, atores envolvidos no processo de publicao, e neste caso, o TEDE dispe de uma funo especfica para cada fase que compreende a trajetria do documento. J na aplicao simplificada, no so utilizadas as ferramentas da aplicao modular, e a disponibilizao feita diretamente pela biblioteca, a partir do depsito e autorizao do autor. Existe tambm a preocupao de tornar os dados disponveis na BDTD compatveis com o catlogo automatizado das bibliotecas da instituio sem a necessidade de que sejam novamente inseridas, e para tanto, foi implementado no prprio TEDE, nas duas modalidades um conversor de MTD-BR para MARC 21, permitindo a exportao dos dados diretamente para o OPAC. De acordo com Triska e Caf (2001), a utilizao de metodologias baseadas em arquivos abertos resulta ainda em um ambiente para submisso, busca e recuperao de documentos em meio digital de forma mais eficaz.

2.1.2 A BDTD nas universidades brasileiras Para a implantao da BDTD no contexto brasileiro, o IBICT deveria contar com agncias que provessem os dados, a fim de promover a alimentao da base. Neste sentido, a participao das universidades e instituies de pesquisa foi e continua sendo imprescindvel para o crescimento e manuteno da biblioteca digital. Atualmente, noventa e duas instituies fazem parte da BDTD nacional, onde um total de 135.173 documentos esto depositados, dos quais 36.365 teses de doutorado e 98.808 dissertaes de mestrado (IBICT, 2010). Para que as instituies pudessem participar dessa iniciativa, foi necessrio um processo de implantao, o que em cada realidade se deu de maneira diferente. Isto acontece porque em cada uma dessas unidades h uma cultura e polticas peculiares; assim, puderam ser encontradas tanto facilidades como tambm diversas dificuldades para que a BDTD pudesse se tornar uma realidade, com vantagens claras.

A disponibilizao de publicaes em um ambiente aberto suscita algumas questes, que podem se tornar empecilhos para o desenvolvimento da biblioteca digital. Packer, Antonio e Beraquet (1998, p. 111) relatam que
alguns aspectos que emergem dessas propostas so altamente polmicos, permanecendo em debate, como a diminuio do papel das editoras (...) a redefinio do direito do autor, (...) e a eliminao da prpria identidade dos peridicos cientficos em benefcio das bases de dados.

Assim, uma densa campanha de sensibilizao, que privilegiasse vrios nveis e envolvessem diversas linhas de atuao necessrias para a conscientizao global das pessoas que compe as instituies foi necessria em muitas situaes, sem mencionar aquelas que no conseguem desenvolver suas BDTDs por estes mesmos motivos. Logo, podemos notar que em muitas situaes (...) se conseguiu o mais difcil, que era a interoperabilidade tecnolgica, e esbarra-se na interoperabilidade humana, que fazer com que vrios atores envolvidos conversem e compartilhem seus interesses. (KURAMOTO, 2006, p. 1) Por outro lado, existe uma crescente procura pela iniciativa, e instituies tm mostrado grande interesse em participar da BDTD, pois representa uma oportunidade de se tornar visvel a nvel local, nacional e internacional (SOUTHWICH, 2006, p. 109). Alm do mais, a implantao do projeto traz diversas vantagens para seus participantes, como registro e disseminao da produo cientfica em diversos contextos, com ampla divulgao as instituies em funo da alta operabilidade da BDTD, uniformidade nos dados, uma vez que se trabalha de acordo com protocolos comuns, boa descrio das publicaes, o que permite a gerao de relatrios e indicadores necessrios para avaliar os programas de psgraduao alm do baixo custo do tocante ao investimento em infra-estrutura. Outras vantagens so o melhoramento no fluxo de informao cientfica e tecnolgica, alm de incrementar o ciclo de gerao de novos conhecimentos (TRISKA; CAF, 2001, p. 92), graas facilidade de troca de informaes, o que agiliza sensivelmente o surgimento e transformao do conhecimento. 2.2 O CONTROLE DE VOCABULRIO Nesta seo sero contempladas a definio, tipos, funes e a importncia das linguagens documentrias. Sero tambm discutidas metodologias necessrias para a construo e avaliao de vocabulrios controlados. 8

2.2.1 Definio Desde o princpio da humanidade que os seres humanos detm habilidades que possibilitam a transformao do meio ambiente. Com o passar do tempo, veio tona a necessidade de registrar seus feitos, sua histria, a fim de perpetuar o conhecimento, transmitindo-o para outras geraes. Essa necessidade evoluiu durante milhares de anos, e desse modo, com a modernizao dos processos que registravam as informaes, que foram das pinturas rupestres, passaram pelos papiros e pergaminhos, pela imprensa de Gutemberg e finalmente no sculo 20, com a exploso documental da dcada de 1940, resultante do processo de especializao do saber e com a Internet, resultou em um entrave: em meio a tanta informao, como fazer para organiz-la? E mais ainda: como recuperar o que se deseja? A quantidade crescente de informaes, que esto dispostas em quantidades cada vez maiores aos indivduos tem sido a grande dificuldade para identificar aquelas que lhes interessa, alm de se tornar mais difcil ainda filtrar a grande quantidade de resultados e acess-los. No so raros os casos em que um usurio tem grandes problemas para encontrar algo do seu interesse, e se v com um impasse, tendo nas mos imensa quantidade de documentos sem saber quais so realmente adequados. Nesse sentido, surge a necessidade de dispor tambm de guias, que apontem para determinados critrios acerca dos documentos, como por exemplo, os assuntos de que tratam. Dessa forma, o tratamento temtico se configura como uma maneira eficaz de expressar o contedo de documentos, sob formas destinadas a facilitar a recuperao da informao. (DIAS; NAVES, 2007, p. 11) Ou seja, o tratamento temtico e o estabelecimento de pontos de acesso s informaes contidas nos documentos deve ser uma constante, pois o objetivo de recuperar da maneira mais eficaz as informaes j justificativa suficiente para preocupar-se com o controle do vocabulrio. (SMIT; KOBASHI, 2003, p. 13) Lancaster (2004, p. 19) define vocabulrio controlado como
essencialmente uma lista de termos autorizados. Em geral, o indexador somente pode atribuir a um documento termos que constem na lista adotada pela instituio na qual trabalha. Comumente, no entanto, o vocabulrio controlado mais que uma lista. Inclui, em geral, uma forma de estrutura semntica.

Os vocabulrios controlados obedecem critrios que primam pela padronizao e consistncia, como por exemplo, o controle de sinnimos, incluindo, para tanto, remissivas, a 9

diferenciao de homgrafos, e a reunio de termos que apresentem entre si relaes de hierarquia. Lancaster tambm classifica em trs tipos as linguagens documentrias, a saber: os esquemas de classificao bibliogrfica, como a Classificao Decimal de Dewey, as listas de cabealhos de assuntos e os tesauros. Estes ltimos so similares, uma vez que utilizam uma base alfabtica, porm, os tesauros possuem uma estrutura hierrquica e associativa, que se incorpora lista, ao passo que os cabealhos de assunto no tratam minuciosamente das relaes hierrquicas e associativas como fazem os tesauros. Nessa perspectiva, Dodebei (2002) destaca algumas funes pertinentes s linguagens documentrias: Organizar os conceitos em detrimento da representao documental, estabelecendo um patamar entre a linguagem controlada em questo e o perfil do usurio a que se destina, sem perder a relao com a literatura representada, ou seja, que no haja disparidade entre os conceitos apresentados nos documentos seja por simplificar demais, ou elevar demais o nvel dos termos eleitos para representar os documentos. Ser utilizado para a organizao fsica dos documentos, sendo uma funo das classificaes bibliogrficas, que por sua vez agrupam os assuntos de acordo com as reas do conhecimento. Essas classificaes atendem satisfatoriamente a organizao lgica e fsica, mas por outro lado, como privilegiam apenas as reas do conhecimento e no conceitos, acabam sendo deficientes em situaes em que o acervo representado por apenas uma classe. Uniformizar o vocabulrio, inclusive aspectos lingsticos e lxicos, controlando possveis desvios que estes fatores possam acarretar para a recuperao das informaes. Assim, visam, portanto, obter (...) um mximo de informaes relevantes ou pertinentes, (...) alm de economizar smbolos, eliminar redundncias e condensar informaes (DODEBEI, 2002, p. 58)

Com o aumento da quantidade de documentos armazenados e disponibilizados nas instituies e tambm em sistemas on-line, bem como na prpria Internet, sua recuperao rpida se torna tambm igualmente necessria, levando consequentemente necessidade de adoo de estratgias que tornem essa massa documental passvel de retornar requisies com respostas 10

precisas quando solicitadas. Smit e Kobashi (2003, p. 14) afirmam que O controle de vocabulrio um recurso para organizar e recuperar documentos e informaes com consistncia, mas enfatizam, por outro lado, que a organizao fsica deve ser tratada com seriedade e rigor. Todavia, isso apenas no condio suficiente para garantir que as informaes sejam recuperadas nas mais diversas situaes. O caos instala-se com relativa facilidade, e raramente o vilo corretamente encontrado: o controle do vocabulrio ou o seu descontrole. (SMIT; KOBASHI, 2003, p. 14) Assim, pode-se perceber a importncia no apenas da correta descrio fsica, classificao e arrumao/disponibilizao dos exemplares caso estes no possam ser recuperados. Uma das garantias de recuperao a correta indexao, com a atribuio de quantos pontos de acesso forem necessrios, entretanto, preciso que se faa com consistncia e uniformidade, a fim de eliminar possveis falhas decorrentes de fatores como a ambiguidade e redundncias. Para tanto, pode-se lanar mo de instrumentos de controle de vocabulrio, como os tesauros, que consistem em uma lista estruturada de conceitos, destinados a representar de maneira unvoca o contedo dos documentos e das consultas dentro de um sistema documental determinado (...) (SLYPE, 1991, p. 23). Pretende-se deixar claro que este trabalho tratar de vocabulrio controlado no sentido de lista de cabealhos de assunto uma vez que os tesauros geralmente exigem um grau maior de familiaridade com sistemas de indexao por sua estrutura mais elaborada com relaes de hierarquia e associao, enquanto os cabealhos de assunto consistem em uma lista de palavras sem estrutura hierrquica definida, mas que privilegiam relaes de termos preferidos, proibidos e relacionados, expressas apenas com o uso de remissivas (ver e ver tambm) (AQUINO, 2009, p. 13). Por essa estrutura simplificada, indicado para o contexto da BDTD, j que os autores so responsveis pela escolha dos termos de indexao de seus trabalhos. 2.2.2 Metodologia para construo e avaliao de um vocabulrio controlado A construo de vocabulrios controlados se pauta em alguns princpios e etapas que disciplinam desde a necessidade de conceber este tipo de instrumento at a sua elaborao e avaliao. As normas, manuais e outros trabalhos que tratam da construo de vocabulrios controlados se fundamentam, em sua grande maioria, na norma 2788 - Guidelines for the 11

Establishment and Development of Monolingual Thesauri, da International Standartization Organization (ISO). Por esta razo, os pontos e princpios abordados por esta norma podem ser adotados em vrios contextos sociais e culturais, visto que trata de diretrizes internacionais. Outra norma, neste sentido, acerca dos procedimentos a serem adotados para finalidades afins, a Z39.19 - Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies, da ANSI/NISO, (...) prope linhas gerais para a construo, formato e gesto de vocabulrios controlados monolngues, de um modo geral, abrangendo os tesauros e tambm estruturas menos complexas como listas, redes de sinnimos, etc. (CERVANTES, 2009, p. 74) Neste sentido, o IBICT produziu, em 1984, Diretrizes para elaborao de tesauros monolnges, que se basearam na ISO 2788 e na Z39.19, dispondo, para tanto, oito etapas necessrias para a orientao da construo de linguagens controladas : 1. Mtodos de compilao: Antes mesmo de eleger os termos que faro parte do vocabulrio, necessrio escolher a forma que ser adotada, ou seja, a sistematizao: se em forma de tesauro, lista de termos, etc.; 2. Coleta e registro dos termos: Apontamento dos termos que podem ser utilizados, registrando tambm, se possvel, as definies, as fontes em onde podem ser encontrados, como literatura especfica, outras listas de termos, bem como as relaes que podem estabelecer com outros termos tambm eleitos; 3. Verificao do termo: Consultar fontes onde se possa encontrar os termos com preciso, a fim de validar uma forma correta para estabelecer as entradas. Uma boa opo uma reviso de literatura, ou consulta a dicionrios especializados, ou ainda a profissionais da rea; 4. Especificidade: Empregar terminologias especficas ao cerne do assunto, ou seja, garantir a preciso em detrimento rea que o vocabulrio abranger; 5. Admisso e excluso de termos: Essa etapa compreende a deciso de adotar um padro mais especfico ou mais prximo da linguagem do usurio, ou seja, se necessrio, uma modificao nos descritores j eleitos. Nesse momento recomendada a validao dos termos por meio de consultas profissionais, ou ainda, se possvel, testado por um grupo de usurios para que dem sua opinio,

12

ou ainda por profissionais que lidam com indexao, para que seja testado e validado como til; 6. Uso de equipamento automtico de processamento de dados: tido como uma opo para a obteno de dados importantes, como a extrao, listagem e verificao da freqncia com que os termos candidatos a descritores aparecem. Geralmente utilizado um software apropriado; 7. Forma e contedo do vocabulrio: Estabelecimento de elementos que iro compor o vocabulrio, tais como a prpria diagramao, o sumrio, a apresentao das listas, as datas de coleta e de encerramento da edio do documento, alm de informar, de maneira clara, alguns pontos como a rea de abrangncia, o significado dos termos e as regras adotadas para a adoo dos termos; 8. Questes editoriais: Trata de formalidades, como divulgar em algum meio acadmico/cientfico a inteno de produzir um vocabulrio controlado, definio da abrangncia: se apenas uma rea do conhecimento ou mais, e por fim, consulta a outros instrumentos para checar se j existe publicao semelhante, a fim de no duplicar esforos. No sentido da coleta de termos e da determinao do universo conceitual, Dodebei ressalta que estes pontos podem ser obtidos a partir de conhecimentos prvios ou ainda por (...) observao do campo conceitual (2002, p. 70), alm de considerar para a metodologia a induo e deduo como importantes processos de escolha para a composio do universo. No processo dedutivo, a identificao dos termos provveis ser feita por um grupo de peritos, especialistas ou a partir da formao de comits para levantar os assuntos, uma vez que a fonte para a definio dos termos partir dos prprios produtores da informao. Neste sentido, Lancaster afirma que esta abordagem no de todo eficaz, uma vez que (...) pode no conduzir classificao mais adequada s necessidades dos usurios (1987, p. 20). Por outro lado, no processo denominado indutivo por Dodebei (2002) e emprico por Lancaster (1987), a identificao dos termos feita atravs de anlise da literatura, considerando a freqncia com que aparecem. Nesse processo h uma vantagem, pois os termos provveis so identificados ao passo que a anlise literria pode contribuir para sua conceituao. Ainda de acordo com Lancaster, essa a maneira mais eficiente de coletar a terminologia de um assunto.

13

Na abordagem indutiva, ou emprica, pode-se identificar dois princpios que regem a escolha dos termos: a garantia literria e a garantia do uso, tambm definido por Dodebei como endosso do usurio. Na garantia literria, a escolha de um termo se justifica apenas quando existe literatura sobre o assunto, ou seja, neste princpio um termo s far parte do vocabulrio controlado quando for identificado na literatura pertinente rea (SOUZA, 2004, p. 39). Por outro lado, o endosso do usurio ou garantia do uso igualmente necessrio que os termos eleitos traduzam tambm as necessidades dos usurios. Muitos termos sero escolhidos a partir da literatura, porm preciso ficar atento para que no sejam to tcnicos que fujam da realidade onde o vocabulrio ser aplicado, pois os usurios podem precisar de menos especificidade do que a rea sugere para certos tipos de textos (LANCASTER, 1987, p. 22) Para que o trabalho seja feito com coerncia, preciso que haja uma juno dos das duas garantias. Os responsveis por elaborar um vocabulrio controlado (...) fariam muito bem em identificar os termos que traduzem os interesses temticos dos usurios, ao mesmo tempo em que os coleta da literatura. Estas abordagens so muito mais complementares que alternativas. (LANCASTER, 1987, p. 22)
A unio dos princpios da garantia literria e do endosso do usurio um forte indicador de que a linguagem documentria a ser construda para a indexao e recuperao da informao ser eficiente na traduo da linguagem natural, tanto do universo de documentos que entram no sistema de informao, quanto do universo de possveis perguntas que sero formuladas acerca da existncia de documentos registrados no acervo. (DODEBEI, 2002, p. 74)

Neste sentido, a figura a seguir uma adaptao da representao apresentada por Dodebei (2002) a respeito da juno ideal entre as garantias literria e de uso.

Figura 1: Vocabulrio controlado frente s garantias literria e de uso

14

No sentido da necessidade de avaliar os vocabulrios controlados, a fim de garantir seus objetivos no contexto em que ser aplicado, Cervantes evidencia que esses instrumentos podem e necessitam ser avaliados no sentido de se ter um controle sobre a qualidade da recuperao de informao. (2009, p.71) A respeito dos mtodos para que seja feita a avaliao, a norma ANSI/NISO Z39.19 (2005, p. 94) dispe trs mtodos para que se mea a qualidade e/ou a eficcia de um vocabulrio controlado: Avaliao heurstica: Um especialista ou um grupo de peritos convidado a avaliar o vocabulrio controlado. Essa avaliao pode ser informal e qualitativa (por exemplo, cada um dos peritos pode partilhar as suas reaes e opinies) ou formal e quantitativa (por exemplo, todos os especialistas atribuindo pontuao de acordo com uma lista de critrios partilhados), ou seja, nesse mtodo a avaliao ser feita levando em considerao um grupo de especialistas na rea de abrangncia do vocabulrio; Modelagem por afinidade: Uma amostra representativa dos usurios solicitada a classificar um conjunto de documentos, considerando os termos do vocabulrio controlado. Os resultados so em seguida confrontados com a indexao feita por profissional utilizando o mesmo vocabulrio. Os usurios tambm podem ser convidados para marcar termos equivalentes e os relacionados de acordo com o nvel de similaridade; Teste de usabilidade: Deve-se simular a aplicao desse instrumento considerando o contexto ao qual o vocabulrio se destina. Nesse ponto existe uma concepo holstica, em que no se pode considerar o vocabulrio como um ponto isolado, mas a soma de todos os processos desde a identificao de sua necessria construo at a sua aplicao de fato. 2.3 INFORMAO JURDICA A informao tornou-se, ao longo do tempo, sinnimo de transformao do homem, e de acordo com Miranda (2004, p. 137) se expressa em diferentes mbitos, perpasando suas relaes sociais, culturais e econmicas, adquirindo importncia decisiva para sua integrao como cidado e contribuindo para o alcance de seus objetivos, adquirindo assim substancial papel para sua adaptao na sociedade em que vive.

15

Alm de imprescindvel para a vida social, a informao, com o advento das tecnologias, na era das patentes um poderoso instrumento de poder, quando utilizada de maneira estratgica, contribui para formao da concincia crtica, podendo resultar em um grande crescimento inelectual, entretanto, quando ocorre o contrrio, os indivduos esto destinados estagnao. Assim, podemos perceber que tanto o conhecimento quanto a informao esto profundamente arraigados, e so processos dinmicos, ou seja, informao gera novas informaes, tornando-se uma constante. Miranda (2004, p. 137) aponta ainda para o conceito de informao de Le Coadic, que a define como sendo um conhecimento gravado (ou registrado) sob a forma escrita, oral ou audiovisual. Assim, a informao pode adquirir vrios formatos, tipos e facetas, e um desses tipos a informao jurdica. Para tanto, a fim de definir melhor esse nicho, podemos citar a definio de informao jurdica expressa por Passos (1994, p. 363) como sendo
toda a unidade de conhecimento humano que tem a finalidade de embasar manifestaes de pensamento de jurisconsultos, tratadistas, escritores jurdicos, advogados, legisladores, desembargadores, juzes e todos aqueles que lidam com a matria jurdica, quando procuram estudar (do ponto de vista legal) ou regulamentar situaes, relaes e comportamentos humanos, ou ainda quando interpretam e aplicam dispositivos legais.

A informao jurdica, assim como qualquer aspecto que a informao venha asumir, pode perfeitamente gerada, transformada, registrada e tambm recuperada basicamente em trs formas distintas: descritiva (por meio da doutrina); normativa (pela legislao) e interpretativa (com o emprego da jurisprudncia). (PASSOS, 1994, p. 363-364) A respeito destes formatos que a informao jurdica pode assumir, podemos abord-los a partir das definies de Guimares (1993, p. 42): Doutrina: Teorizao do conhecimento jurdico, ou seja, as interpretaes feitas por especialistas da rea e expostas em publicaes como livros, peridicos e demais meios que possibilitem sua publicao. Em resumo, a doutrina se ocupa da face cientfica da informao jurdica quando rene conceitos, definies e princpios do direito pela tica particular, ou seja, atravs das percepes dos autores. Legislao: So os atos e dispositivos normativos de provenientes de autoridades competentes. Nesse universo podemos considerar as constituies, emendas

constitucionais, leis, decretos-lei, resolues, portarias e ordens de servios.

16

Jurisprudncia: Consiste em deliberaes de juzes e tribunais sobre determinada matria jurdica, orientando-se pelos mesmos critrios e concluindo de maneiras semelhantes. (BARROS, 2004, p. 203) Uma caracterstica peculiar da informao jurdica a longevidade: ao passo que em algumas reas as informaes tm sua vida til relativamente curta ou bastante prolongada. No direito, esses dois fenmenos andam juntos: enquanto alguns dispositivos sofrem alteraes, revogaes que mudam parcialmente ou totalmente a qualquer momento, alguns mesmo que j ultrapassados continuam como fontes importantes, a ttulo de consulta.
A informao jurdica tem uma validade quase permanente, interessando ao jurista no apenas a ltima que foi publicada, a que foi legislada, mas tambm a anterior, ainda que a revogao de uma norma legal deixe sem efeito essas disposies, seus preceitos sero aplicveis queles atos jurdicos que tenham nascido sob a sua vigncia, e portanto a eficcia perdura alm da prpria revogao. Da que no se pode prescindir de documentos jurdicos sob o pretexto da antigidade. (LPEZ-MUIZ apud PASSOS, 1994, p. 364)

Outro ponto interessante acerca da informao jurdica a quantidade de documentos produzidos. A grande proporo de publicaes se deve ao fato de a pesquisa ser um dos principais instrumentos dos advogados, juristas, magistrados e de todos que lidam com a matria jurdica, e o resultado disso se reflete em livros, artigos, peridicos, congressos etc, e (...) toda essa massa documental de informao jurdica seria apenas o "caos documental jurdico", se no existissem mecanismos para controlar e recuperar a informao contida nos documentos. (PASSOS, 1994, p. 364), portanto, no mbito jurdico, da mesma forma que qualquer outro, o controle de vocabulrio aparece como um importante aliado para o controle e consequentemente para o acesso e recuperao das informaes.

17

3 METODOLOGIA Os objetos de pesquisa constitui-se das palavras-chave utilizadas para indexao das teses e dissertaes do Programa de Ps-Graduao em Direito da UFPE e o vocabulrio controlado a ser construdo. O trabalho baseado nos metadados das teses e dissertaes do PPG em Direito das quais sero extrados e analisados os termos necessrios para a construo do vocabulrio controlado. Este projeto se configura como uma pesquisa exploratria, uma vez que busca reunir e discutir materiais sobre o tema abordado, porm aplicado a um contexto especfico, se configurando tambm como estudo de caso. Para tanto, utiliza-se mtodos bibliogrficos, uma vez que busca apoio e subsdios na literatura pr-existente sobre o assunto. Os mtodos de pesquisa adotados delimitam alguns procedimentos, que de acordo com Gil (2002) so intrnsecos de sua natureza: Bibliogrfico- foi levantada uma gama de literatura acerca do tema, como livros, peridicos, textos disponibilizados pelo IBICT e acesso s BDTDs de algumas universidades. Estudo de caso - Anlise detalhada do contexto em questo, a fim de descrever e esclarecer a situao e a realidade da qual a temtica oriunda, bem como o estudo das palavras-chave utilizadas pelos autores nas teses e dissertaes, da terminologia empregada para sua indexao, considerando as linhas de pesquisa adotadas pelo Programa de PsGraduao em Direito.

3.1 Coleta dos dados Os metadados das teses e dissertaes foram extrados pelo projeto Mapeador de Teses e Dissertaes na UFPE da BDTD-UFPE e cedidos no formato BIBTEX, podendo ser visualizados atravs do software JabRef. As teses e dissertaes so caracterizadas pelos seguintes campos de metadados: autor, ttulo, ano, palavras-chave, URL, resumo e o BIBTEXKEY. Este ltimo campo consiste de um nmero nico que identifica cada tese ou dissertao na BDTD-UFPE. Essas informaes tambm podem ser visualizadas pelos usurios no site da BDTD1, quando realizada a busca e selecionado o documento, tambm sero apresentados seus
1

http://www.ufpe.br/propesq

18

metadados. Porm, para que se obtenham os dados de todas as teses e dissertaes de um Programa de Ps-Graduao, seria necessrio acess-las uma por uma e cadastr-las em um arquivo BIBTEX. Com o JabRef fica mais fcil a visualizao e o manejo das informaes. O software oferece recursos para pesquisa avanada e permite diferentes tipos de visualizao, alm de ser possvel estabelecer entradas com termos que possibilitam a recuperao dos documentos sob alguns critrios, como por exemplo, determinar que um termo especfico aponte os documentos que o contm nas palavras-chave ou no ttulo, por exemplo. Atravs do site da Propesq (Pr-Reitoria para Assuntos de Pesquisa e Ps- Graduao) 1, foi feito o levantamento sobre o PPG em Direito. Informaes como um breve histrico, a rea de concentrao, as linhas de pesquisa e o conceito CAPES atribudo ao programa esto disponveis no site. 3.2 Anlise dos dados Aps a coleta de dados, foram escolhidos os termos utilizados para indexao que ocorressem a partir de duas vezes. Esse critrio resultou em 154 palavras-chave, que posteriormente foram analisadas quanto a presena em quatro tesauros da rea jurdica para que fossem validados ou corrigidos, a saber: Tesauro Jurdico da Justia Federal (Conselho da Justia Federal), Tesauro Jurdico do Supremo Tribunal de Justia, Tesauro da Justia Eleitoral e Tesauro do Supremo Tribunal Federal, acessados no perodo compreendido entre os meses de outubro e dezembro de 2010. A respeito destes tesauros, podemos observar o seguinte quadro: Tesauro Descrio Responsvel URL

Tesauro Jurdico Contempla a terminologia do da Justia Federal Direito nas reas de competncia da Justia Federal usualmente empregada pelos magistrados, selecionada dos acrdos includos nas bases de dados de jurisprudncia dos TRFs. Tesauro Jurdico Corresponde s classificaes e do Supremo divises dos textos legais Tribunal de existentes no Direito brasileiro, Justia com a adoo da terminologia

Centro de Estudos http://www.cjf.jus.br/ Judicirios do biblioteca/ Conselho da Justia Federal

Comisso Tcnica de http://www.stj.jus.br/ Jurisprudncia SCON/thesaurus/

19

usualmente empregada pelos ministros, selecionada dos acrdos includos na base de dados da jurisprudncia do STJ. Tesauro da Padroniza a linguagem de Justia Eleitoral representao temtica dos documentos constitutivos das bases de informao mantidas pelos Tribunais Regionais Eleitorais e pelo Tribunal Superior Eleitoral, contemplando a terminologia prpria das atividades na Justia Eleitoral. Tesauro do Desenvolvido para padronizar Supremo Tribunal as informaes tratadas nos Federal diversos bancos de dados do STF, a partir do levantamento de termos que fogem terminologia jurdica.

Secretaria de Gesto da Informao Comisso Permanente de Gerenciamento do Tesauro

http://www.tse.gov.br /internet/CatalogoPub licacoes/pdf/tesauro/T esauro_web_v2.pdf

Coordenadoria Anlise Jurispruncia

de http://www.stf.jus.br/ de portal/jurisprudencia/

pesquisarVocabulario Juridico.asp

O levantamento sobre o PPG em Direito da UFPE, sua rea de concentrao, linhas de pesquisa e a consulta aos tesauros, foram cruciais na validao dos termos, escolha e normalizao das terminologias quanto ao uso do singular/plural, siglas e expresses. 3.3 Construo do vocabulrio controlado

Aps a coleta, anlise, normalizao e uniformizao das palavras-chave, estas foram includas no software JabRef, constituindo a lista de cabealhos de assunto, resultado deste trabalho. Ao utilizar o JabRef para incluir os termos, o prprio software verifica quais e quantos documentos contm cada uma das palavras-chave, e ao considerar cada documento, so apontados os termos utilizados na indexao que aparecem na lista de assuntos. Podemos destacar as etapas que constituram o trabalho desde os estudos preliminares at a construo do vocabulrio controlado: 1. Levantamento de literatura referente definio do universo de pesquisa - A partir da consulta dos registros da BDTD, foi escolhido o Programa de Ps-Graduao em Direito como amostra, por se tratar de um curso cujo quantitativo de dissertaes bastante significativo, alm de ser um dos pioneiros a depositar seus trabalhos. 20

2. Reviso de literatura Levantamento de bibliografia especfica para embasamento terico e melhor definio da abordagem e conseqentemente da anlise e propostas para a resoluo do problema em evidncia neste trabalho. 3. Coleta dos metadados das TEDs Utilizando o software Jab Ref, foram extrados os metadados do Programa de Ps Graduao em Direito, com as informaes sobre as teses e dissertaes, como autor, ttulo, resumo e palavras-chave. 4. Anlise das palavras-chave Validao dos termos e normalizao dos termos, utilizando outros tesauros e vocabulrios controlados da rea jurdica. 5. Construo e avaliao do tesauro Aps escolha, validao e normalizao, foi feita a insero das palavras-chave no software JabRef.

3.4 Avaliao do vocabulrio controlado De acordo com a norma ANSI/NISO Z39.19 (2005, p. 94) que dispe de trs mtodos para que se mea a qualidade e/ou a eficcia de um vocabulrio controlado, a saber: Avaliao heurstica: Quando um especialista ou um grupo de peritos convidado a avaliar o vocabulrio controlado; Modelagem por afinidade: Uma amostra representativa dos usurios solicitada a classificar um conjunto de documentos, de acordo com os termos do vocabulrio controlado; Teste de usabilidade: Simulao da aplicao do vocabulrio, considerando o contexto ao qual o vocabulrio se destina. Desta forma, para a avaliao, buscou-se o mtodo que melhor se encaixasse no caso do vocabulrio controlado para as teses e dissertaes modelagem por afinidade. Para avaliar a eficcia do vocabulrio controlado, foi observado, aps a construo deste, alguns critrios, como quantos termos foram contemplados em detrimento ao nmero total de palavras-chave, quantas teses foram representadas pelos termos escolhidos e quantos termos do vocabulrio aparecem em cada documento.

21

4 RESULTADOS Nesta seo, sero contemplados os resultados das etapas que compreendem a coleta de dados, a anlise das palavras-chave, a construo do vocabulrio controlado e sua avaliao. 4.1 Descrio do Programa de Ps-Graduao em Direito O PPG em Direito da UFPE contempla os nveis de mestrado e doutorado, e rea de concentrao diz respeito teoria e dogmtica do direito. O nvel de mestrado teve incio em 1972, e o de doutorado em 1996. Detm conceito Capes com avaliao nota 5 (cinco) divulgada pela CAPES, em 2007, sendo considerado o quarto melhor programa de ps-graduao em Direito do Brasil, para as duas modalidades. As linhas de pesquisa so respectivamente: Linha de Pesquisa 1: Estado, Constitucionalizao e Direitos Humanos. 1.1Jurisdio e processos constitucionais; 1.2 Estado, Regulao e Tributao Indutora; 1.3 Direitos humanos, sociedade e democracia. Linha de Pesquisa 2: Transformaes nas Relaes Jurdicas Privadas e Sociais. 2.1 Constitucionalizao do direito privado; 2.2 Relaes contratuais privadas supranacionais. Linha de Pesquisa 3: Linguagem e Direito 3.1 Retrica e pragmatismo no Direito; 3.2 Teoria da Antijuridicidade e Retrica da Proteo Penal dos Bens Jurdicos. Para que sejam concedidos os ttulos de mestre ou doutor pelos cursos de ps-graduao, condio necessria para o aluno depositar duas vias impressas e uma digital da tese ou dissertao em sua verso definitiva. Alm desses documentos, o autor deve apresentar um formulrio de depsito legal, contendo autorizao para a publicao online do documento devidamente assinado, destacando o grau de acesso: ser disponibilizado apenas ttulo e resumo, se apenas partes ou captulos ou se integralmente. 4.2 Anlise das palavras-chave das teses e dissertaes em Direito A anlise das palavras-chave se deu atravs da visualizao dos metadados por meio do software JabRef. Foram analisadas 295 teses e dissertaes nicas (foram identificadas 10 22

duplicidades), sendo considerados como termos as palavras-chaves que apresentaram a partir de duas ocorrncias. Assim, foram obtidos 154 termos, que foram apreciados em cada um dos quatro tesauros utilizados; essa comparao permitiu a normalizao, uniformizao dos termos e modificaes em alguns termos, visto que se tratava de indexao livre, sendo bastante comum encontrar vrias grafias, que no entanto se referiam ao mesmo objeto. Um exemplo para essa situao o termo CONSTITUICAO FEDERAL, escolhido como descritor do vocabulrio controlado aps consulta e confirmao que essa grafia aparece em pelo menos dois tesauros. Porm, com o mesmo sentido, encontram-se nas teses e dissertaes as grafias: CONSTITUICAO; CONSTITUICAO DE 1988; CONSTITUICAO, 1988; BRASIL CONSTITUICAO 1988. O critrio para validao dos descritores depois da verificao nos tesauros que seja consenso em pelo menos dois dos quatro tesauros, ou que caso no aprea em apenas um ou nenhum, fosse feita a verificao considerando as linhas de pesquisa do PPG em Direito. o caso dos termos Hermenutica e Filosofia. O primeiro no aparece em nenhum dos tesauros, e o segundo apenas em um, porm, foram incorporados ao vocabulrio por serem tradicionalmente terminologias que constam em dicionrios jurdicos e tambm por serem reas privilegiadas pelas linhas de pesquisa do PPG. As terminologias com mais de duas ocorrncias foram organizadas em uma tabela onde podem ser visualizadas as ocorrncias em cada um dos quatro tesauros utilizados:

ASSUNTO ACESSO A JUSTICA ADMINISTRACAO PUBLICA ADMINISTRATIVO AFETIVIDADE AGENCIAS REGULADORAS AMPLA DEFESA ANATEL ARBITRAGEM ARGUMENTACAO AUTONOMIA DA VONTADE BANCOS DE DADOS BIOETICA BRASIL CIDADANIA CONFISCO CONSTITUICAO

CJF no sim** sim** no sim* sim sim sim no sim sim* sim sim sim sim no

STJ no sim no no sim* sim sim sim no sim** sim* no sim sim sim sim**

STF sim sim sim** no sim* sim** sim sim sim no sim sim sim sim sim sim**

STE no sim no no no sim no sim sim no sim no sim sim sim sim

23

CONSTITUICAO DE 1988 CONSTITUICAO FEDERAL CONSTITUICAO, 1988 CONTRATO DE GESTAO CONTRATOS CONTROLE CONTROLE DE CONSTITUCIONALIDADE CONTROLE JUDICIAL CONTROLE JURISDICIONAL CREDITO CRIMES CRIMES AMBIENTAIS CRIMINALIZACAO E DESCRIMINALIZACAO CULPABILIDADE DECISAO JUDICIAL DEMOCRACIA DESCONSIDERACAO DEVIDO PROCESSO LEGAL DIGNIDADE DA PESSOA HUMANA DIGNIDADE HUMANA DIREITO DIREITO ADMINISTRATIVO DIREITO AMBIENTAL DIREITO BRASILEIRO DIREITO CIVIL DIREITO CONSTITUCIONAL DIREITO CONSTITUCIONAL - BRASIL DIREITO DE FAMILIA DIREITO DO CONSUMIDOR DIREITO DO TRABALHO DIREITO FUNDAMENTAL DIREITO INTERNACIONAL DIREITO INTERNACIONAL PRIVADO DIREITO PENAL DIREITO PRIVADO DIREITO PROCESSUAL CIVIL DIREITO PUBLICO DIREITO TRIBUTARIO DIREITOS FUNDAMENTAIS DIREITOS FUNDAMENTAIS SOCIAIS DIREITOS HUMANOS DISCRICIONARIO DNA EFETIVIDADE EFICIENCIA ENTIDADES FAMILIARES ESTADO ESTADO BRASILEIRO ESTADO-NACAO

no sim no no sim* no no sim no sim sim* no sim sim sim sim sim sim sim*** no sim sim sim no sim sim no no sim sim sim sim sim sim sim sim sim sim sim* no sim sim** sim** no sim** no sim no no

no sim no no sim* no no sim sim** sim sim* sim no sim sim sim sim sim sim** sim** sim sim sim no sim sim no sim sim sim sim sim sim sim sim sim sim sim sim** no sim sim** sim** sim sim** sim* sim no no

no sim no sim sim no sim sim sim** sim sim* sim* no sim sim sim sim sim sim** sim** sim sim sim no sim sim sim no sim sim sim sim sim sim sim sim sim sim sim* no sim sim** sim sim sim sim* sim sim no

no sim no no sim sim sim sim no sim sim no no sim sim sim sim sim** sim** sim** sim sim sim no sim sim sim*** sim sim sim sim* sim** sim sim sim sim sim sim no no sim sim** no sim sim no sim no sim***

24

ESTATUTO DA CRIANCA E DO ADOLESCENTE ETICA EXISTENCIA FAMILIA FEDERALISMO FILIACAO FILOSOFIA FILOSOFIA DO DIREITO FUNCAO REGULADORA GLOBALIZACAO HABEAS DATA HERMENEUTICA IGUALDADE IMPROBIDADE ADMINISTRATIVA INCONSTITUCIONALIDADE INDEPENDENCIA NORMATIVA INFORMACAO INIMPUTABILIDADE PENAL INTERNET INTERVENCAO DE TERCEIROS INTIMIDADE ISONOMIA JUIZADOS ESPECIAIS CIVEIS JURISDICAO JURISPRUDENCIA JUSTICA JUSTICA SOCIAL LEGITIMA DEFESA LEGITIMIDADE LIMITACAO TRIBUTARIA LIMITES E POSSIBILIDADES DO LEGISLADOR E DO JUIZ LIMITES LEGAIS MANDAMENTOS CONSTITUCIONAIS CRIMINALIZADORES MEIO AMBIENTE MERCOSUL METODO MINIMO EXISTENCIAL MINISTERIO PUBLICO MORAL NEOCONSTITUCIONALISMO NORMA JURIDICA ORGANIZACOES SOCIAIS PARCERIA PATERNIDADE PENA PERSONALIDADE PODER JUDICIARIO POLITICAS PUBLICAS

sim no no sim no sim no no no no sim no sim sim sim no no sim*** sim sim sim** sim sim* sim sim no sim sim sim sim** no sim no sim sim sim** no sim sim no no no kwoc sim sim sim** sim no

sim sim** sim sim no sim no no no sim sim no sim sim sim no sim sim*** sim sim sim** sim sim* sim sim no sim sim sim no no sim* no sim sim sim** no sim sim no sim sim* no sim sim sim** sim no

sim sim sim sim sim sim sim no no no sim sim sim sim sim no sim sim*** sim sim sim** sim sim sim sim no no sim sim no no no no sim sim sim sim sim sim no sim sim* sim** sim sim sim** sim sim

sim sim sim sim no sim no no no no sim no sim sim sim no sim sim*** sim no sim sim** sim*** sim sim sim sim sim sim no no no no sim no sim no sim sim** no sim no sim sim sim sim** sim no

25

PRAGMATISMO PRECEITO FUNDAMENTAL PRESERVACAO AMBIENTAL PRINCIPIO PRINCIPIO DA DIGNIDADE DA PESSOA HUMANA PRINCIPIOS CONSTITUCIONAIS PENAIS PRIVACIDADE PROCESSO PROCESSO CIVIL PROCESSO DE CONHECIMENTO PROCESSO DE EXECUCAO PROCESSO DO TRABALHO PROCESSO PENAL PROPORCIONALIDADE PUBLICIZACAO RACIONALIDADE REFORMA DO ESTADO REGULACAO REPERSONALIZACAO RESPONSABILIDADE RESPONSABILIDADE ACIDENTARIA RESPONSABILIDADE CIVIL RESPONSABILIDADE DO ESTADO RESPONSABILIDADE LIMITADA RESPONSABILIDADE PENAL DA PESSOA JURIDICA RETORICA ANALITICA SEMIOTICA SERVICOS PUBLICOS SOBERANIA SOCIEDADE DE RISCO SUPREMO TRIBUNAL FEDERAL TEORIA TERCEIRO SETOR TORTURA TRANSACAO PENAL TRIBUTACAO TUTELA ANTECIPADA ULTRA VIRES UNIAO EUROPEIA

no no no sim no sim*** sim** sim sim sim sim sim* sim sim** no no sim** no no sim no sim sim** sim no no no sim** sim** no sim sim sim sim sim sim sim no no

no no no sim sim sim*** sim** sim** sim sim sim sim* sim sim no no sim** no no sim no sim sim** sim no no no sim sim** no sim* sim no sim sim sim sim no no

no sim sim sim sim no sim sim sim sim sim sim sim sim sim no sim sim sim sim sim sim sim sim sim sim sim sim sim** sim sim sim sim sim sim sim no sim sim

no no no sim sim no sim sim sim sim sim no sim sim no no no no no sim no sim no no sim*** no no sim* sim no sim sim no no sim sim sim no no sim**

no VALORES sim** sim** Legenda: sim* - termos presentes nos tesauros, e que no entanto foram normalizados. sim** - termos presentes nos tesauros como keyword on context. sim*** - termos presentes nos tesauros, porm apresentados em forma reduzida.

A partir da anlise dos dados representados pela tabela, pudemos chegar s seguintes consideraes acerca da totalidade dos termos: Apareceram em pelo menos um tesauro na forma original: 118 26

Apareceram em pelo menos dois tesauros na forma original: 86 No apareceram em nenhum tesauro: 13 Keyword on context em pelo menos um tesauro: 27 Aparecem em formato reduzido (expresso com alguma modificao): 7 Normalizados (mudanas na grafia, uso do singular/plural): 13 4.3 Vocabulrio controlado para indexao das teses e dissertaes sobre Direito Aps a coleta, anlise, normalizao e uniformizao das palavras-chave, estas foram includas no software JabRef, constituindo a lista de cabealhos de assunto, resultado deste trabalho. A vantagem de utilizar o JabRef para incluir os termos o prprio software verifica quais e quantos documentos contm cada uma das palavras-chave, e ao considerar cada documento, so apontados os termos utilizados na indexao que aparecem na lista de assuntos. Depois da reunio de literatura especializada na temtica deste trabalho, do estudo acerca da construo e das etapas que compreenderam desde a escolha at a validao das palavraschave, foi obtida a seguinte lista de cabealhos de assunto:

ACESSO A JUSTICA ADMINISTRACAO PUBLICA AGENCIA REGULADORA AMPLA DEFESA ANATEL ARBITRAGEM ARGUMENTACAO ATO DISCRICIONARIO AUTONOMIA DA VONTADE BANCO DE DADOS BIOETICA BRASIL CIDADANIA CODIGO DE ETICA USE ETICA

27

CONFISCO CONSIDERACAO CONSTITUICAO BRASIL USE CONSTITUICAO FEDERAL CONSTITUICAO DE 1988 USE CONSTITUICAO FEDERAL CONSTITUICAO FEDERAL CONSTITUICAO USE CONSTITUICAO FEDERAL CONSTITUICAO, 1988 USE CONSTITUICAO FEDERAL CONTRATO DE GESTO CONTROLE DE CONSTITUCIONALIDADE CONTROLE JUDICIAL CONTROLE JUDICIAL CONTROLE JURISDICIONAL USE CONTROLE JUDICIAL CREDITO CRIME CRIME AMBIENTAL CRIMINALIZACAO CULPABILIDADE DECISAO JUDICIAL DEMOCRACIA DESCONSIDERACAO DESCRIMINALIZACAO DEVIDO PROCESSO LEGAL DIGNIDADE HUMANA USE PRINCIPIO DA DIGNIDADE DA PESSOA HUMANA DIREITO DIREITO A INTIMIDADE DIREITO A PRIVACIDADE DIREITO ADMINISTRATIVO DIREITO AMBIENTAL DIREITO CIVIL DIREITO CONSTITUCIONAL DIREITO CONSTITUCIONAL BRASIL USE DIREITO CONSTITUCIONAL 28

DIREITO DE FAMILIA DIREITO DO CONSUMIDOR DIREITO DO TRABALHO DIREITO FUNDAMENTAL DIREITO INTERNACIONAL DIREITO INTERNACIONAL PRIVADO USE DIREITO INTERNACIONAL DIREITO INTERNACIONAL PUBLICO USE DIREITO INTERNACIONAL DIREITO PENAL DIREITO PRIVADO DIREITO PROCESSUAL CIVIL DIREITO PUBLICO DIREITO TRIBUTARIO DIREITOS FUNDAMENTAIS SOCIAIS USE DIREITO FUNDAMENTAL DIREITOS HUMANOS DNA USE EXAME DE DNA EFETIVIDADE EFICIENCIA USE PRINCIPIO DA EFICIENCIA ENTIDADE FAMILIAR ESTATUTO DA CRIANCA E DO ADOLESCENTE ETICA EXAME DE DNA EXISTENCIA FAMILIA FEDERALISMO FILIACAO FILOSOFIA DO DIREITO FILOSOFIA USE FILOSOFIA DO DIREITO FUNCAO REGULADORA USE AGENCIA REGULADORA GLOBALIZACAO HABEAS DATA HERMENEUTICA 29

IGUALDADE IMPROBIDADE ADMINISTRATIVA IMPUTABILIDADE INCONSTITUCIONALIDADE INFORMACAO INTERNET ISONOMIA JUIZADO ESPECIAL CIVEL JURISDICAO JURISPRUDENCIA JUSTICA SOCIAL LEGITIMA DEFESA LEGITIMIDADE LIMITACAO DO PODER DE TRIBUTAR LIMITACAO TRIBUTARIA USE LIMITACAO DO PODER DE TRIBUTAR LIMITES LEGAIS MEIO AMBIENTE MERCOSUL MINIMO EXISTENCIAL MINISTERIO PUBLICO MORAL NEOCONSTITUCIONALISMO NORMA JURIDICA ORGANIZACAO SOCIAL PATERNIDADE PENA PERSONALIDADE JURIDICA PERSONALIZACAO PODER JUDICIARIO POLITICAS PUBLICAS PRESERVACAO AMBIENTAL 30

PRINCIPIO DA DIGNIDADE DA PESSOA HUMANA PRINCIPIO DA EFICIENCIA PRINCIPIO JURIDICO PRINCIPIO USE PRINCIPIO JURIDICO PRINCIPIOS CONSTITUCIONAIS PRINCIPIOS CONSTITUCIONAIS PENAIS USE PRINCIPIOS CONSTITUCIONAIS PROCESSO PROCESSO CIVIL PROCESSO DE CONHECIMENTO PROCESSO DE EXECUCAO PROCESSO DO TRABALHO USE PROCESSO TRABALHISTA PROCESSO PENAL PROCESSO TRABALHISTA PROPORCIONALIDADE PUBLICIZACAO RACIONALIDADE JURIDICA REFORMA DO ESTADO REGULACAO REPERSONALIZACAO USE PERSONALIZACAO RESPONSABILIDADE ACIDENTARIA RESPONSABILIDADE CIVIL RESPONSABILIDADE CIVIL DO ESTADO RESPONSABILIDADE DO ESTADO USE RESPONSABILIDADE CIVIL DO ESTADO RESPONSABILIDADE LIMITADA RESPONSABILIDADE PENAL RESPONSABILIDADE PENAL DA PESSOA JURIDICA USE RESPONSABILIDADE PENAL RETORICA ANALITICA SEMIOTICA SERVICO PUBLICO SOBREANIA NACIONAL 31

SOCIEDADE DE RISCO SUPREMO TRIBUNAL FEDERAL TERCEIRO SETOR TORTURA TRANSACAO PENAL TRIBUTACAO TUTELA ANTECIPADA UNIAO EUROPEIA A lista de cabealhos de assunto composta por 145 termos, dos quais 122 entradas principais e mais 23 entradas remissivas. 4.3 Avaliao do vocabulrio controlado De acordo com a norma ANSI/NISO Z39.19 (2005, p. 94) dispe de mtodos para que se mea a qualidade e/ou a eficcia de um vocabulrio controlado, consideramos que o mais adequado para avaliao deste vocabulrio controlado a modelagem por afinidade, onde uma amostra representativa dos usurios solicitada a classificar um conjunto de documentos, utilizando o vocabulrio controlado. Os resultados so confrontados com os termos que aparecem em tesauros jurdicos, a fim de que fossem validados e normalizados de acordo com as perspectivas j consagradas por profissionais da indexao de documentos jurdicos. Entretanto, este mtodo ainda no se enquadra bem, pois exigem a aplicao de entrevistas a um grupo de usurios, o que requer muito tempo para planejamento, coleta e tratamento dos dados, alm da dificuldade de reunir usurios dispostos a participarem. Propemse ento, uma maneira de realizar a modelagem por afinidade de forma indireta, fazendo uso da recuperao automatizada da informao das entradas do vocabulrio nos campos ttulos e palavras-chaves. Logo este trabalho, no tocante avaliao, se encaixa melhor na modelagem por afinidade, uma vez que a lista de cabealhos de assunto foi originada atravs da anlise da indexao das teses e dissertaes feita pelos seus autores. Dessa forma, a avaliao considerada eficaz, pois parte do ponto de vista de cada autor, passando pelo crivo na adaptao, normalizao e uniformizao para que contemple a realidade do PPG em Direito, sem deixar de lado os parmetros para que a recuperao das informaes 32

acontea de forma consistente e satisfatria, facilitando a escolha das palavras que garantiro a recuperao e visibilidade de seu trabalho. A partir desses critrios, utilizando os metadados do PPG em Direito e da lista de cabealhos de assuntos, chegamos s seguintes estatsticas referentes usabilidade do vocabulrio: Quantidade de palavras-chave atribudas a cada documento:

Do total de palavras-chave em cada documento, coincidem com os termos do vocabulrio controlado:

33

So recuperadas pelo vocabulrio controlado a partir de outros critrios (aparecem no ttulo ou coincidem apenas com parte de uma expresso regular nas palavras-chave)

De acordo com as estatsticas visualizadas acima, no que diz respeito s ocorrncias, podemos observar que a maioria das teses e dissertaes (79%) so representadas por cerca de quatro a seis palavras-chave, das quais um percentual que varia entre duas a quatro coincidem exatamente com os termos do vocabulrio controlado (72%). Por outro lado, as teses e dissertaes tambm so recuperadas no apenas pelas palavras-chave; os descritores tambm podem aparecer no ttulo, ou ainda coincidirem com partes das expresses utilizadas no vocabulrio controlado (80%), como por exemplo, o termo PRINCIPIO JURIDICO, onde os documentos indexados apenas com PRINCIPIO apontaro imediatamente para o primeiro, sem que no entanto seja o termo realmente exato; apenas parte de uma expresso. A partir dos dados estatsticos apresentados, podemos apontar algumas consideraes acerca da revocao e da preciso do vocabulrio controlado, que so algumas das caractersticas essenciais ao bom desempenho das linguagens de indexao. A revocao se refere ao nmero de palavras-chave que so contempladas no vocabulrio controlado em detrimento do nmero de palavras-chave que aparecem no documento. J a preciso (ou relevncia) refere-se qualidade dos documentos recuperados pelo sistema em detrimento dos termos contemplados pelo vocabulrio controlado. Neste caso, para se obter o ndice de preciso, foi calculada a proporo entre a quantidade de termos que de fato so

34

palavras-chave utilizadas nos documentos e aquelas que so apontadas, mesmo que no sejam descritores. Assim, o ndice de revocao do vocabulrio construdo de 48%, ou seja, quase metade das palavras-chave que aparecem nas teses e dissertaes so contempladas pelo vocabulrio controlado. Neste sentido, o desvio padro de 20%, podendo em 65% dos casos o ndice de revocao variar entre 28 e 68%. J o ndice de preciso de 73%, com o desvio padro de 24%, podendo variar em 65% dos casos entre 49 e 97%.

35

5 CONCLUSO

A partir dos temas abordados, da investigao, anlise dos dados coletados e das etapas que configuraram este trabalho, acredita-se que o objetivo principal, que foi propor uma metodologia e construir um vocabulrio controlado para indexao das teses e dissertaes do Programa de Ps Graduao em Direito depositadas na BDTD/UFPE, a partir da anlise das palavras-chave utilizadas foi alcanado. Procurou-se responder s questes levantadas, que visavam ao esclarecimento de questionamentos sobre a eficcia da indexao para recuperao de informaes no sistema TEDE da BDTD/UFPE, as metodologias necessrias para construo de um vocabulrio controlado nesse contexto, alm de demonstrar a importncia e possibilidade de implantao desse instrumento como auxiliar das atividades desenvolvidas pela BDTD, potencializando a eficcia do sistema de recuperao e servindo de guia aos autores que necessitam atribuir palavras-chave s suas teses e dissertaes. De acordo com o que foi exposto durante o trabalho, buscou-se uma abordagem que privilegia o esclarecimento de alguns pontos importantes para a construo de vocabulrios controlados. O primeiro passo foi a identificao da necessidade de sua construo. Dessa forma, a partir da premissa que as informaes referentes s teses e dissertaes do PPG em Direito estavam sendo recuperadas de forma insatisfatria, no tocante indexao, constatou-se o problema central do trabalho: a ausncia de instrumentos de normalizao terminolgica que visem uniformizao das palavras-chave especificamente para utilizao dos autores de teses e dissertaes da UFPE, isto porque a indexao elaborada sem guiar-se por algum critrio comum para todos os autores que depositaram documentos no sistema

36

pode acabar gerando o que McGarry chamou de rudos nas pesquisas feitas pelos usurios, ou seja, desvios nas respostas solicitao que o usurio fez ao sistema. Outro ponto importante para a configurao deste trabalho foi a escolha do Programa de Ps-Graduao em Direito para compor o universo de pesquisa, j que se trata de um dos programas pioneiros na Universidade Federal de Pernambuco, tendo, portanto, uma quantidade significativa de produes acadmicas. No decorrer da pesquisa, foi feito uma descrio da Biblioteca Digital de Teses e Dissertaes, sua definio, objetivos, atuao, enfim, a reunio de uma srie de consideraes acerca do repositrio acadmico das produes acadmicas das psgraduaes. A etapa seguinte foi a caracterizao do controle de vocabulrio, sua importncia, e apontamentos a respeito das metodologias necessrias para a construo de instrumentos de normalizao terminolgica de forma que possa ser adaptada em outras realidades ou mesmo em outros programas de ps-graduao. Neste sentido, um passo importante foi delimitar e conhecer a informao jurdica e suas formas, objeto de estudo deste trabalho. Nessa perspectiva, a partir da anlise das palavras-chave extradas das teses e dissertaes em detrimento a tesauros j consagrados na rea, pretende-se deixar claro a necessidade de construo de um vocabulrio controlado prprio, e no a adoo de um j existente, visto que durante a etapa de anlise dos dados, os tesauros consultados, mesmo que tendo uma gama variada de termos em quantidade e abordagens, no contm todos os termos utilizados pelos autores das teses e dissertaes, embora seja necessrio que alguns deles sejam privilegiados, como o caso da Filosofia do direito e da Hermenutica, termos que fazem parte da caracterizao das linhas de pesquisa do PPG em Direito.

37

Alm do mais, acredita-se que a metodologia para sua construo poder ser utilizada por outros programas de ps-graduao que estejam interessados em uniformizar o vocabulrio para indexao de suas publicaes acadmicas, trazendo, desta maneira, as mesmas vantagens para estes programas, minimizando problemas semelhantes no tocante indexao e recuperao das informaes. Portanto, espera-se que as consideraes apresentadas neste estudo se tornem valiosa contribuio tanto para os autores das futuras teses e dissertaes, quanto para a realidade dos usurios da BDTD, e para os profissionais da Biblioteconomia que procuram elucidaes acerca dos problemas que tangem a recuperao da informao e as linguagens documentrias.

38

6 REFERNCIAS AQUINO, Magali. Indexao: teoria e prtica. Rio Grande do Sul: FURG, 2009. Disponvel em: http://atbibliofurg2011.files.wordpress.com/2009/05/indexacao-aula-3.pdf Acesso: em 05 nov. 2010.

AMERICAN

NATIONAL

STANDARDS

INSTITUTE;

NATIONAL

INFORMATION

STANDARDS ORGANIZATION. ANSI/NISO Z39.19-2005: guidelines for the construction, format, and management of monolingual controlled vocabularies. Bethesda: NISO Press, 2005. Disponvel em: http://www.niso.org/standards/resources/Z39-19-2005.pdf Acesso em: 08 out. 2010. BARROS, Lucivaldo. Fontes de informao jurdica. In: PASSOS, Edilenice Jovelina Lima (org.). Informao jurdica: teoria e prtica. Braslia: Thesaurus, 2004. p. 201-225.

CENDN, Beatriz. Ferramentas de busca na web. Cincia da Informao, Braslia, v. 30, n. 1, p. 39-49, jan./abr. 2001.

CERVANTES, Brgida Maria Nogueira. A construo de tesauros e a integrao de procedimentos terminogrficos. 2009. Tese (Doutorado em Cincia da Informao) Faculdade de Filosofia e Cincias, Universidade Estadual Paulista, Marlia, 2009.

DIAS, Eduardo Wense; NAVES, Madalena Martins Lopes. Anlise de assunto: teoria e prtica. Braslia: Thesaurus, 2007. (Estudos Avanados em Cincia da Informao, v. 3)

DODEBEI, Vera Lcia Doyle Louzada. Tesauro: linguagem de representao da memria documentria. Niteri: Intertexto; Rio de Janeiro: Intercincia, 2002.

GIL, Antnio Carlos. Como elaborar projetos de pesquisa. 4.ed. So Paulo: Atlas, 2002.

39

GUIMARES, Jos augusto Chaves. Formas da informao jurdica: uma contribuio para sua abordagem temtica. Revista Brasileira de Biblioteconomia e Documentao, So Paulo, v. 26, n. 1/2, p. 41-54, jan./jun. 1993.

GUSMO, Heloisa Rios. Tesauros: anlise e utilizao. Niteri: UFF, 1985.

INSTITIUTO BRASILEIRO DE INFORMAO EM CINCIA E TECNOLOGIA. O que a BDTD. Disponvel em: http://bdtd.ibict.br/pt/a-bdtd.html Acesso em 20 abr. 2010.

______. Diretrizes para a elaborao de tesauros monolnges. Braslia, 1984. 70 p.

______. Indicador: resumo geral. Disponvel em: http://bdtd.ibict.br/pt/indicador-resumogeral.html Acesso em 25 abr. 2010.

KURAMOTO, Hlio. BDTD: uma questo de interoperabilidade humana? Disponvel em: <http://kuramoto.blog.br/2006/04/14/bdtd-uma-questao-de-interoperabilidade-humana/> Acesso em: 27 abr. 2010.

Lancaster F. Wilfrid. Indexao e resumos: teoria e prtica. 2. ed. Braslia: Briquet de Lemos, 2004.

______. Construo e uso de tesauros: curso condensado. Braslia: IBICT, 1987.

MIRANDA, Ana Cludia Carvalho de. A poltica de desenvolvimento de colees no mbito da informao jurdica. In: PASSOS, Edilenice Jovelina Lima (org.). Informao jurdica: teoria e prtica. Braslia: Thesaurus, 2004. p. 137-152.

PACKER, Abel; ANTONIO, Irati; BERAQUET, Vera Slvia. Rumo publicao eletrnica. Cincia da Informao, Braslia, v. 27, n. 2, p. 107-108, maio/ago. 1998.

40

______. Scielo: uma metodologia para publicao eletrnica. Cincia da Informao, Braslia, v. 27, n. 2, p. 109-121, maio/ago. 1998.

PASSOS, Edilenice Jovelina Lima. O controle da informao jurdica no Brasil: a contribuio do Senado Federal. Cincia da Informao, Braslia, v. 23, n. 3, p. 363-368, set./dez. 1994.

SLYPE, Georges Van. Los languages de indizacin: concepcin, construccin y utilizacin em los sitemas documentales. Madrid: Pirmide, 1991.

SMIT, Johanna Wilhelmina; KOBASHI, Nair Yumiko. Como elaborar vocabulrio controlado para aplicao em arquivos. So Paulo: Arquivo do Estado, Imprensa Oficial do Estado de So Paulo, 2003.

SOUZA, Cristiane Ferreira de. Vocabulrio controlado em direito do trabalho: o caso da base de dados REV. 2004. Trabalho de Concluso de Curso (Ps-Graduao em Organizao do Conhecimento para a Recuperao da Informao) - Universidade Federal do Estado do Rio de Janeiro, Rio de Janeiro, 2004.

SOUTHWICK, Slvia Barcellos. The Brazilian electronic theses and dissertations digital library: providing open access for scholarly information. Cincia da Informao. Braslia, v.35, n.2, p. 103-110, maio/ago. 2006.

TRISKA, Ricardo; CAF, Lgia. Arquivos abertos: subprojeto da Biblioteca Digital Brasileira. Cincia da Informao, Braslia, v. 30, n. 3, p. 92-96, set./dez. 2001.

41