Você está na página 1de 16

Linguagens de indexao em contextos cinematogrficos: a experincia de elaborao do tesauro eletrnico do cinema brasileiro

Maria Aparecida Moura


Professora Adjunta da Escola de Cincia da Informao da UFMG

Luiz Nazrio
Professor da Escola de Belas Artes da UFMG.

Daniela Cristina da Silva Rodrigues; Elisabete Quatrini Vieira; Iris da Silva; Lcia Mara Barbosa de Oliveira Paoliello.
Bibliotecrias formadas pela Escola de Cincia da Informao da UFMG.

Relata a experincia de elaborao do Tesauro Eletrnico do Cinema Brasileiro, estruturado para auxiliar a organizao e a recuperao de informaes produzidas em contextos cinematogrficos. Sua realizao partiu da constatao da ausncia de instrumentos especializados no tratamento temtico dos acervos cinematogrficos brasileiros e das crescentes demandas por linguagem especializada realizadas por centros de memria e referncia audiovisual consolidados no pas. Objetivou desenvolver um instrumento de indexao capaz de representar tematicamente os acervos cinematogrficos especficos bem como o conhecimento produzido sobre o cinema brasileiro. Foram estabelecidas aes para mapear tematicamente a rea com o objetivo de identificar os conceitos principais vinculados ao domnio e sua rede de relaes e realizados estudos fundamentados na literatura da rea, seguido de cotejamento conceitual baseado no acervo flmico e nas publicaes mantidas pela Ophicina Digital do Departamento de Fotografia, Teatro e Cinema da Escola de Belas Artes - UFMG. Prope a estrutura facetada do instrumento com base na literatura e no conhecimento do especialista em cinema brasileiro integrante da equipe. Tais medidas visaram assegurar que os princpios fundamentais de garantia literria e de uso norteassem a elaborao do tesauro. Foram realizados pr-testes de indexao para assegurar a especificidade do instrumento e avaliar sua performance em contextos especficos. O tesauro resultante composto por 1040 termos organizados em 34 facetas especficas. Palavras-chave: Tesauro eletrnico; Linguagem de indexao-elaborao; Cinema brasileiro Recebido em 24.09.2004 Aceito em 28.04.2005

54
Perspect. cinc. inf., Belo Horizonte, v.10 n.1, p. 54-69, jan./jun. 2005

Maria Aparecida Moura; Luiz Nazrio; Daniela Cristina da Silva Rodrigues; Elisabete Quatrini Vieira; Iris da Silva; Lcia Mara Barbosa de Oliveira Paoliello

Introduo
A ampliao dos domnios e a intensa disponibilizao de contedos diversificados e integrais na WEB aumentaram significativamente a demanda por instrumentos de organizao e tratamento da informao. Em funo dessa oferta, os motores de busca, associados ao contexto digital, tiveram reconhecido destaque exatamente por proverem o acesso aos contedos informacionais disponveis na rede, atravs da organizao de estratgias de estruturao e traduo das necessidades de informao dos usurios em linguagem verbal. Contudo, a insuficincia das solues dadas por esses instrumentos, em termos do fornecimento de respostas precisas s demandas informacionais enunciadas pelos usurios em interao com a rede, tornou crescente o interesse de pesquisa relativo aos processos de elaborao de linguagens de indexao. Paralelamente, o campo audiovisual tambm vivenciou nos ltimos anos uma considervel alterao de seus processos de criao e disseminao de produtos. Nesse sentido, ampliaram-se as demandas por instrumentos de organizao e tratamento da informao que pudessem apoiar, em termos de acesso informao, as diversas etapas dos processos da produo cinematogrfica. Este artigo objetiva descrever a experincia de criao do Tesauro Eletrnico do Cinema Brasileiro1, elaborado para auxiliar a organizao e a busca de informaes produzidas em contextos cinematogrficos. A atividade foi uma realizao conjunta do Departamento de Organizao e Tratamento da Informao da Escola de Cincia da Informao - ECI/UFMG e da Ophicina Digital do Departamento de Fotografia, Teatro e Cinema da Escola de Belas Artes FTC/EBA/UFMG.

Linguagens de Indexao: aspectos histricos e perspectivas


A linguagem tornou-se, ao longo dos ltimos anos, um tema de interesse central no mbito da cincia da informao. Essa intensificao do interesse passou a incorporar a necessidade da efetiva articulao de uma perspectiva mais ampla desse conceito, exigindo a aproximao da CI com as demais reas de conhecimento que se dedicam ao estudo do fenmeno da linguagem na atualidade. Destaca-se, nesse contexto, a filosofia da linguagem, a anlise do discurso, a teoria da terminologia, a teoria do conceito, a semntica, dentre outras. A linguagem compreendida, no mbito desse artigo, como um conjunto organizado e compartilhado de signos que permitem a expresso do pensamento. Nesse sentido, o acesso ao signo sempre exigir a mediao e a interposio de mltiplas linguagens. Em Plato encontram-se os argumentos para compreender a linguagem como instrumento atravs das teses da naturalidade e da convencionalidade. Para o filsofo, apenas o uso e, por conseguinte, a conveno pode prover de significado as palavras. Entretanto, o uso a escolha repetida ou convalidada que levou a forjar determinado instrumento lingstico e, assim como todos os outros instrumentos, os lingsticos tambm podem resultar mais ou menos perfeitos e adequados finalidade. (ABBAGNANO, 2000, p. 622).

http://www.eci.ufmg.br/tesaurodecinema

55

Perspect. cinc. inf., Belo Horizonte, v.10 n.1, p. 54-69, jan./jun. 2005

Linguagens de indexao em contextos cinematogrficos: a experincia de elaborao do tesauro eletrnico do cinema brasileiro

http://www.inep.gov.br/pesquisa/ thesaurus/ 3 http://www.museudofolclore.com.br/ tesauro/Index.htm 4 http://www.ulcc.ac.uk/unesco/ 5 http://europa.eu.int/celex/eurovoc/

56

A exploso informacional, experimentada nos ltimos anos devido s inovaes tecnolgicas, tornou evidente a utilidade das linguagens de indexao em contextos mais amplos, embora o controle de vocabulrio seja uma preocupao e uma prtica consolidada na rea da cincia da informao h dcadas. Nesse sentido, a rea lidera os estudos tericos e os experimentos relativos anlise dos processos de produo da informao com vistas criao de instrumentos de organizao e recuperao da informao cada vez mais adequados s realidades dos grupos que deles fazem uso. Parece consensual que um dos aspectos que mais carece de estudos especficos refere-se elaborao de linguagens de indexao mais adequadas ao provimento e traduo das necessidades dos usurios em interao com sistemas de informao tradicionais ou eletrnicos. No processo de gerao automtica de tesauros Kimoto & Iwadera (1990) salientam que o processamento automtico da linguagem natural apresenta dificuldades em relao anlise sinttica e semntica. Gomes e Campos (2004, p.1-2) afirmam que os mtodos automticos, ao se basearem na freqncia de ocorrncia de termos, tornam os instrumentos de indexao ineficazes quanto natureza semntica dos termos. Nesse sentido, os estudos relacionados aos fundamentos tericos das linguagens de indexao (CAMPOS, 2001; CAMPOS & GOMES, 2003, 2004; RIVIER, 1992; SVENONIUS, 1986, 2000) realizados no Brasil e no exterior tm contribudo para dar maior consistncia conceitual aos experimentos computacionais relativos criao de tesauros. Em virtude desse fato, buscou-se assegurar que os princpios fundamentais de garantia literria e de uso pudessem nortear a elaborao do tesauro. Cabe destacar ainda que a base terminolgica utilizada na elaborao desse instrumento originou-se de um profundo estudo realizado no domnio. A garantia literria um conceito introduzido por Wyndam Hulme em 1911. Segundo esse princpio os termos que compem uma linguagem de indexao devem ser empiricamente derivados da literatura da rea que se pretende descrever tematicamente. A garantia de uso visa privilegiar a abordagem temtica adotada pelos usurios reais em situao de recuperao da informao. No processo de elaborao do tesauro, alm dos princpios de garantia literria e uso, foram consideradas algumas experincias nacionais e internacionais de implementao de tesauros eletrnicos. Dentre eles, destacam-se os projetos nacionais: o Tesauro Brasileiro de Educao - BRASED2 mantido pelo INEP , o Tesauro de Folclore e Cultura Popular Brasileira3 mantido pelo Centro Nacional de Folclore e Cultura Popular CNFCP- do IPHAN e o Tesauro Eletrnico do Mundo do Trabalho mantido pela Rede Unitrabalho. Dentre as experincias internacionais destacam-se: o Tesauro da Unesco4e o tesauro multlingue Eurovoc5 mantido pela Unio Europia em 16 idiomas. As linguagens de indexao so instrumentos elaborados intencionalmente para proceder mediao entre os processos de organizao e recuperao da informao e resultam do trabalho coletivo desenvolvido entre os profissionais da informao e os especialistas das reas a que se destinam. Para fazer isso, as linguagens de indexao adotam o postulado da monoreferencialidade a partir do qual restringe-se a significao de um dado termo. Assim, o termo deve representar um conceito relativo determinada rea de conhecimento e com ele guardar uma relao unvoca.

Perspect. cinc. inf., Belo Horizonte, v.10 n.1, p. 54-69, jan./jun. 2005

Maria Aparecida Moura; Luiz Nazrio; Daniela Cristina da Silva Rodrigues; Elisabete Quatrini Vieira; Iris da Silva; Lcia Mara Barbosa de Oliveira Paoliello

De acordo com Svenonius (2000) existem atualmente inmeras linguagens de indexao que exibem um varivel grau de refinamento. Essas linguagens quando utilizadas nos sistemas de recuperao da informao podem prov-lo de qualidade adicional de modo que por seu intermdio possamos transformar informao em conhecimento. Segundo a autora, quando isso acontece a linguagem de indexao torna-se anloga ao prprio conhecimento. Nesse sentido, as linguagens de indexao como representao do conhecimento so fundamentais no apenas na recuperao da informao, mas tambm em outros contextos que referenciam o conhecimento estruturado tais como, o processamento automtico da linguagem e a engenharia de conhecimento. Dessa forma, as linguagens de indexao em geral e os tesauros em particular mapeiam conceitualmente os termos e buscam efetivar e tornar evidentes as relaes existentes entre eles. A partir de um diagrama de relacionamento entre termos, revelam-se os aspectos conceituais envolvidos. Dentre essas relaes destacam-se as relaes de hierarquia (todo/parte, gnero/espcie), de oposio, de funcionalidade, de associao e de equivalncia. As linguagens de indexao atuam nos sistemas de informao para orientar o indexador sobre quais os melhores termos para a representao do assunto de um documento e para guiar os pesquisadores sobre o modo de escolher os termos indexados que representam no sistema o assunto procurado. Possuem vocabulrio e sintaxe prprios. Tm ainda como funo recuperar documentos com contedo semelhante, recuperar documentos relevantes sobre um assunto especfico, recuperar documentos por grandes reas de assunto, possibilitar a converso dos termos de indexao entre diferentes linguagens, auxiliar na escolha do termo adequado para a estratgia de busca, representar o assunto de maneira consistente permitindo a compatibilidade e o dilogo entre a linguagem do autor, do indexador e a do pesquisador. Hoje, tem sido cada vez mais complexo o desenvolvimento de tais linguagens, visto que elas objetivam, em ltima instncia, proceder mediao entre o usurio e sua necessidade de informao. Dada a dinamicidade dos processos de produo de conhecimento, torna-se cada vez mais difcil prover os sistemas de representaes que de fato reflitam esse conhecimento. Ao analisar os aspectos comuns existentes entre a teoria do conceito, a terminologia e a classificao facetada, Campos (2001, p.117) enfatiza a importncia dessas para a construo de linguagens e o movimento contraditrio que esse esforo de construo exige. Segundo a autora, as abordagens onomasiolgica e semasiolgica, presentes no contexto de elaborao de linguagens, atuam no sentido de orientar a concepo da linguagem de indexao no que concerne dinamicidade prpria da linguagem, tendo em vista conferir maior representatividade ao termo nela incorporado. Nos tesauros, h a preocupao com a preciso dos termos, dando nfase ao termo preferencial. Por estarem em um ambiente de recuperao de informao, os termos devem ser submetidos a controles terminolgicos rgidos. (CAMPOS, 2001, p. 129). No estudo desenvolvido, objetivou-se elaborar um tipo de linguagem de indexao - o tesauro. O tesauro um instrumento de indexao pscoordenado no qual os conceitos podem ser identificados atravs da mxima diga-me com quem tu andas e eu te direi quem s. Nesse sentido, os tesauros
Perspect. cinc. inf., Belo Horizonte, v.10 n.1, p. 54-69, jan./jun. 2005

57

Linguagens de indexao em contextos cinematogrficos: a experincia de elaborao do tesauro eletrnico do cinema brasileiro

permitem compreender conceitualmente um dado campo de conhecimento atravs de uma estrutura relacional de termos dispostos esquematicamente. Trata-se de uma metalinguagem composta por um sistema de smbolos que utiliza a linguagem natural como um esquema de codificao da informao. Derivam desse esquema parte da complexidade do gerenciamento dos sistemas de recuperao da informao com o uso de linguagem verbal. Na medida em que a lngua um organismo vivo, torna-se complexo elaborar um instrumento de representao da informao com base na linguagem natural. Tal complexidade pode ser atribuda permanente mutao scio-histrica que tem na linguagem uma de suas principais manifestaes.

A linguagem cinematogrfica
O mundo do cinema possui uma linguagem prpria com um vocabulrio altamente especializado, que se formou durante os ltimos cem anos, assimilando as mais diversas conquistas tecnolgicas, desde os primitivos equipamentos de captao e projeo de imagens at os modernos softwares de produo grfica para efeitos especiais. Essa lngua, falada e escrita pelos habitantes do planeta cinema, tem diversas dices, diferentes dialetos - os quais provm, contudo, de dois idiomas bsicos: o francs e o ingls. Os cinfilos de todo o mundo assimilaram o idioma francs porque foram os irmos Lumire os inventores do cinematgrafo, o primeiro aparelho de projeo de imagens para uma platia, substituindo os aparelhos de projeo individual - invento devidamente patenteado em 1895; e tambm porque foram franceses os primeiros tericos a sistematizar o vocabulrio da nova arte. Os cinfilos assimilaram igualmente o idioma ingls porque, a partir da Primeira Guerra Mundial (1914-1918), que arrasou a Europa, os USA tomaram a dianteira na produo cinematogrfica, importando talentos, desenvolvendo tecnologias, fazendo do cinema uma grande indstria que no cessar de renovar a linguagem da cmara acrescentando-lhe, a cada ano, novos termos tcnicos especializados. diferena da literatura e da pintura, o cinema no feito de palavras escritas ou de imagens pintadas por um nico instrumento caneta, mquina de escrever ou computador; pincel, spray ou aergrafo e sim de imagens silenciosas ou sonoras compostas por uma multiplicidade de equipamentos convergentes em constante evoluo e refinamento: cmara, grua, stead cam; moviola, ilha de edio, estao grfica; mono, stereo, surround; 16mm, 35mm, cinerama; preto e branco, colorido, tecnicolor; trucagem, efeito especial, efeito digital. Mesmo o mais primitivo dos instrumentos de produo, como a claquete, feita com dois tabletes de madeira, hoje se sofisticou a ponto de incorporar um contador digital a claquete eletrnica. O cinema cria e renova sua linguagem atravs da criao e da renovao do conjunto dos seus instrumentos de produo. Cada novo equipamento cria novas possibilidades expressivas que produzem novas expresses cinematogrficas carentes de nomenclatura, tarefa assumida pelos tcnicos que fazem uso desses instrumentos: da natureza da linguagem cinematogrfica incorporar termos esdrxulos que nascem mais da prtica que da teoria cinematogrfica.

58
Perspect. cinc. inf., Belo Horizonte, v.10 n.1, p. 54-69, jan./jun. 2005

Maria Aparecida Moura; Luiz Nazrio; Daniela Cristina da Silva Rodrigues; Elisabete Quatrini Vieira; Iris da Silva; Lcia Mara Barbosa de Oliveira Paoliello

Exemplo disso o verbo renderizar, do substantivo renderizao palavras derivadas do ingls render. Ou o curioso termo bilnge contra-plonge, derivado do francs contre-plonge, palavra composta que manteve o segundo termo no original e traduziu apenas o primeiro para o portugus. Da mesma forma, a expresso decupagem deriva de dcoupage. A palavra cmera, usada de preferncia palavra portuguesa cmara, o aportuguesamento da palavra inglesa cmera, provando o gosto dos brasileiros pelos americanismos (basta dizer que em Portugal o mouse do computador chamado de rato). Portanto, o vocabulrio cinematogrfico todo feito de estrangeirismos e neologismos, um cdigo tcnico em constante mutao. Cada cinematografia possui as suas idiossincrasias e termos prprios para descrev-las. No existe uma traduo consagrada em portugus para o termo heritage film, que no se refere a patrimnio cinematogrfico (film heritage), mas a um gnero de filme tipicamente ingls. O filme de patrimnio - termo que nos soa to estranho - refere-se a filmes ingleses que celebram o passado, o patrimnio, a tradio, filmes de costumes com nfase na identidade nacional. Da mesma forma no h um termo em portugus que traduza adequadamente a expresso alem Heimatfilm , que designa filmes exclusivamente produzidos na Alemanha (eventualmente na ustria) associados s tradies locais. Uma traduo aproximada do termo resultaria no esdrxulo filme de torro natal. Nesses casos, prefervel, a uma traduo literal, manter o termo original com uma nota de rodap explicando o sentido do termo e o tipo de filme que o encarna. O mesmo ocorre com o Kulturfilm alemo, que se poderia traduzir como filme cultural, mas que implicou, durante o Terceiro Reich, em propaganda poltica do regime nazista. Os nativos do planeta cinema falam em plonge e raccord, close-up e flashback com a nonchalance de experts que tiveram o privilgio de nascerem bilnges. Comunicam-se atravs de um idioma de base franco-americano enriquecido com termos prprios da lngua nacional. Os cinfilos nascidos no Brasil, que falam oficialmente o portugus, quando encontram um concidado de sua ptria de adoo entende-se com ele atravs de frases onde predominam termos como fade in, make-up, travelling, glamour, star system, noir, happy end, making of e fade out. Cinfilos do mundo falam um esperanto tcnicocinematogrfico que contm alguns termos j popularizados pelos programas de TV sobre cinema e outros que ainda guardam sua aura de mistrio para os no iniciados. O terico e o historiador de cinema sempre se basearam em livros datados e, sobretudo, na prpria memria (freqentemente traidora e afetada por emoes e circunstncias do momento) para escrever sobre os filmes. Mas os bancos de dados eletrnicos esto revolucionando a pesquisa no campo cinematogrfico. Hoje, o site http://www.imdb.com/ substitui as memrias individuais por uma gigantesca memria coletiva do cinema, realimentada diariamente por milhes de usurios em todo o mundo, numa reviso e atualizao constante dos dados. O resultado que uma elite de crticos est sendo substituda por uma massa de cinfilos. A facilitao da pesquisa e seu aprimoramento atravs do instrumento eletrnico tm sua contrapartida: a banalizao da linguagem cinematogrfica. O que era antes um sacerdcio, um culto mais ou menos secreto, foi profanado pelo amadorismo. Muito do prazer proporcionado pelo mistrio cinematogrfico foi diludo pelos meios tcnicos de difuso. A sacralidade do cinema foi substituda pela desmistificao em massa. Assim, no centenrio de Alfred Hitchcock
Perspect. cinc. inf., Belo Horizonte, v.10 n.1, p. 54-69, jan./jun. 2005

59

Linguagens de indexao em contextos cinematogrficos: a experincia de elaborao do tesauro eletrnico do cinema brasileiro

60

o mercado livreiro lanou uma infinidade de ttulos sobre o cineasta biografias, anlises, filmografias, dirios, roteiros, at notas de produo. Apesar de tudo isso, o melhor livro sobre Hitchcock continuou sendo Hitchcock/Truffaut Entrevistas (1983), ou seja, nem sempre a quantidade de informao em que se mergulha hoje representa ganho qualitativo de conhecimento. Alguns termos da linguagem cinematogrfica de significado aparentemente semelhante, como diretor e cineasta, possuem uma distino sutil: o diretor um profissional; o cineasta um artista. Essa distino associase teoria do cinema de autor, que os crticos da revista francesa Cahiers du Cinma lanaram nos anos 1960. Nessa poca, as discusses sobre a linguagem do cinema eram to intensas que, mesmo no interior desse grupo, surgiram duas correntes opostas que receberam curiosas designaes: os Hitchcockohawksiens e os Mac Mahoniens. Os primeiros, que predominavam, defendiam a causa de Alfred Hitchcock e Howard Hawks, enquanto os segundos, que freqentavam a sala de arte Mac Mahon, privilegiavam Fritz Lang, Joseph Losey, Otto Preminger e Raul Walsh (Journot, 2002). Hoje, essas discusses parecem bizantinas, uma vez que esses cineastas foram igualmente consagrados pela histria do cinema. Da mesma forma, os debates tericos do cinema russo dos anos 1920 e 1930, com Serguei Eisenstein opondo o seu cine-punho ao cine-olho de Dziga Vertov, foram superados pela reconciliao das duas tendncias na perspectiva histrica que os valoriza na mesma medida. s vezes, o objeto cinematogrfico ganha diferentes termos conforme a poca: a obra chamada de fita, pelcula e filme segundo as geraes. Contudo, na atualidade ocorre uma confuso generalizada entre os termos filme e vdeo, porque o pblico no consegue mais distinguir, pela textura das imagens, o que uma projeo de pelcula e uma exibio em vdeo. Muitas instituies culturais anunciam mostras de filmes e apresentam vdeos; h cineclubes que s programam filmes em DVD; e mesmo os cinemas iniciam suas sesses com propagandas em vdeo, de modo que o pblico passa a falar de vdeo como se tratasse de filme. Vi um filme ontem na TV: na verdade, se entendermos a imagem como um conjunto de informaes envolvendo luz, textura, foco, pontos, definio de cor, formato de tela, ritmo, som etc, o que se v no monitor apenas uma transmisso empobrecida das informaes contidas no filme. Um filme s pode ser visto numa sala de cinema por meio de um projetor de pelculas. DVD, vdeo transmitem apenas gravaes da informao contida na pelcula obtida por processos conhecidos como telecinagem (vdeo) ou autorao (DVD). O primeiro a captao da imagem impressa na pelcula em um suporte magntico; o segundo a gravao dos arquivos digitais num disco verstil digital. Em ambos os processos h uma inevitvel perda de informao. Os processos inversos transferncia de dados magnticos e de dados digitais para a pelcula foram batizados com nomes ainda mais estranhos: respectivamente, kinescopagem e datacinagem. Enfim, diante da complexidade dos significados e significantes da linguagem cinematogrfica, a criao do Tesauro eletrnico do cinema brasileiro pretende dar um primeiro passo na direo da sistematizao de termos usados muitas vezes de forma incorreta, imprpria e at contraditria. A implementao desse Tesauro nas bibliotecas e instituies culturais ser de grande utilidade para cineastas, atores e tcnicos; jornalistas e agentes culturais; estudantes e professores de cinema.
Perspect. cinc. inf., Belo Horizonte, v.10 n.1, p. 54-69, jan./jun. 2005

Maria Aparecida Moura; Luiz Nazrio; Daniela Cristina da Silva Rodrigues; Elisabete Quatrini Vieira; Iris da Silva; Lcia Mara Barbosa de Oliveira Paoliello

O Tesauro eletrnico do cinema brasileiro


A construo de um vocabulrio controlado surgiu a partir de um tpico da disciplina Elaborao de Linguagens de Indexao 6, do Curso de Biblioteconomia da UFMG. A rea de cinema foi escolhida e recortada em cinema brasileiro. Como produto dessa disciplina foi elaborado um tesauro experimental monolinge com 344 termos (283 descritores e 61 nodescritores). Em etapa posterior, foi elaborado um projeto de ampliao do instrumento construdo na fase anterior. Nesse projeto, conforme j salientado, evidenciou-se o pblico-alvo, os objetivos do instrumento e os princpios metodolgicos adotados. Em virtude dessas aes o instrumento proposto, denominado Tesauro do cinema brasileiro, tornou-se mais exaustivo e contou com a co-orientao de um profissional da rea pertinente7 para possibilitar a garantia de uso. Esse tesauro possui 1.040 termos (983 descritores e 57 no-descritores). A fase inicial de elaborao desse vocabulrio controlado foi o levantamento da literatura relevante na rea. Com a ajuda de um historiador especialista em cinema, vrias obras foram selecionadas para estudo. A leitura dessas obras possibilitou o contato com importantes aspectos do cinema brasileiro, o que proporcionou uma viso panormica de elementos tcnicos, histricos e estticos. Com o aumento do volume de leituras ficou explcita a necessidade de experincia e de conhecimento tcnico na rea. O grau de complexidade do assunto confirmou a necessidade do trabalho interdisciplinar. A construo dessa linguagem documentria envolveu tambm pesquisas em outros instrumentos de indexao da mesma natureza. Foram observados dados como reas temticas cobertas, objetivos, fontes de informao pesquisadas, renovao/atualizao dos instrumentos, idiomas disponveis, simbologia adotada, e principais facetas. Em etapa posterior, a equipe de trabalho escolheu conjuntamente os termos que melhor definiam os conceitos veiculados na literatura, conforme a importncia desses para seus usurios. Os critrios para escolha dos termos foram definidos em funo de sua relevncia na rea, assim como sua especificidade. A metodologia adotada, a partir de ento, fundamentou-se na concepo do relacionamento entre conceitos atravs da anlise de assunto processo por meio do qual o classificador, indexador ou catalogador identifica e determina de que assuntos trata um documento e quais desses assuntos devem ser representados [...]. (NAVES, 2001, p. 206). Os relacionamentos ocorrem no campo das idias (conceitualmente), no qual os conceitos so comparados e representados por relaes hierrquicas e associativas. No campo semntico, (comparao entre palavras) so representados pela relao de equivalncia. Estudos da rea (NAVES, 2001; FUGITA, 1999) ressaltam que a anlise de assunto uma das etapas mais complexas num sistema de recuperao da informao, pois o indexador sofre influncia de fatores como a subjetividade, o conhecimento anterior, a preparao profissional e as vivncias que influenciam na qualidade de crtica, de associao e de interpretao. A etapa seguinte consistiu em organizar os termos que comporiam as facetas. O agrupamento desses elementos possibilitou a constituio do conceito, definindo-o como a compilao de enunciados verdadeiros a respeito de determinado objeto, fixada por smbolo lingstico. (DAHLBERG,1978).

Ministrada pela professora Maria Aparecida Moura, Departamento de Organizao e Tratamento da Informao da Escola de Cincia da Informao da UFMG. Professor Luiz Nazario, coordenador da Ophicina Digital do Departamento de Fotografia, Teatro e Cinema da Escola de Belas-Artes da UFMG.

61

Perspect. cinc. inf., Belo Horizonte, v.10 n.1, p. 54-69, jan./jun. 2005

Linguagens de indexao em contextos cinematogrficos: a experincia de elaborao do tesauro eletrnico do cinema brasileiro

A utilizao do glossrio foi fundamental para o estabelecimento das similaridades de cada termo, o que possibilitou a insero do mesmo na faceta mais apropriada. As facetas so em nmero de 34 e convencionou-se que seriam denominadas da seguinte maneira: Gneros/Tipos de filmes; ciclos/ movimentos do cinema; cinema de animao; antropologia; semitica/linguagem do cinema; movimentos artsticos/culturais/filosficos; documentao do filme; legislao do cinema; organizaes profissionais/culturais relacionadas ao cinema; fontes de informao em cinema; preservao de filmes; atividades cinematogrficas; profisses relacionadas ao cinema; eventos de cinema; ensino; produtoras de filmes; companhias cinematogrficas; estdios de cinema; salas de exibio; produo cinematogrfica; local de filmagem; processos de edio; sonorizao; tecnologia do cinema; sistema de cor; movimentos de cmera; movimentos de cena; enquadramentos de cena; cinematografia; origem/ evoluo do cinema; equipamentos e suportes utilizados em filmagem; tempo de projeo; processos de produo e exibio cinematogrfica. A escolha das facetas levou em considerao a compreenso que os especialistas possuem da rea. Para garantir a longevidade do tesauro, considerou-se fundamental o desmembramento dos nomes das instituies e dos eventos em tabelas de autoridade, permitindo assim, em qualquer momento, a atualizao do tesauro atravs da incluso de novos descritores sem afetar a estrutura do mesmo. As facetas desmembradas so as seguintes: organizaes profissionais / culturais relacionadas ao cinema (agncias reguladoras de cinema, associaes relacionadas ao cinema, rgos governamentais relacionados ao cinema e sindicatos relacionados ao cinema), eventos de cinema, produtoras de filmes, escolas/instituies de ensino em cinema, legislao referente ao cinema brasileiro, cineastas/diretores brasileiros e atores/atrizes brasileiros. Aps essa etapa foi realizado um pr-teste, atravs de alguns documentos, para mensurar a efetiva utilizao desse instrumento no tratamento da informao para a rea. Cabe destacar que, na realizao do projeto do Tesauro eletrnico do cinema brasileiro, considerou-se fundamental a realizao das etapas apresentadas na FIG.1, visto que elas no ocorrem de forma isolada, mas interagem mutuamente. Alm disso, salienta-se que as atividades de monitoramento e avaliao so etapas fundamentais para garantir a consistncia, representatividade e longevidade da linguagem elaborada.
Pesquisa em fontes de informao gerais e especializadas Descrio semntica

Definio e caracterizao da rea temtica Pesquisa em instrumentos de organizao e tratamento da informao

Elaborao da lista inicial

Anlise conceitual

Definio das facetas, termos e relacionamentos

Pr-teste

Lanamento das facetas, termos e relacionamentos no software

Avaliao / Monitoramento

62

FIGURA 1- Representao grfica das etapas de elaborao do tesauro.


Perspect. cinc. inf., Belo Horizonte, v.10 n.1, p. 54-69, jan./jun. 2005

Maria Aparecida Moura; Luiz Nazrio; Daniela Cristina da Silva Rodrigues; Elisabete Quatrini Vieira; Iris da Silva; Lcia Mara Barbosa de Oliveira Paoliello

As atribuies da equipe na elaborao do instrumento


A elaborao do Tesauro eletrnico de cinema brasileiro permitiu a concretizao de uma atividade de cooperao acadmica da mxima relevncia. Trata-se de uma contribuio fundamental organizao dos acervos cinematogrficos brasileiros gerada a partir da conjugao de esforos e conhecimentos das artes e da cincia da informao. O processo de elaborao do instrumento contou com inmeras ocasies em que os conhecimentos das duas reas envolvidas convergiram no sentido de consolidar um projeto de natureza interdisciplinar. Conforme j salientado anteriormente, esse trabalho tomou por base os princpios da garantia literria e de uso. Entretanto, esses princpios no so facilmente apreensveis no domnio proposto. De modo semelhante, a dinmica de operacionalizao conceitual de um instrumento de indexao no se apresenta de maneira evidente entre os profissionais sem uma formao especfica. Nesse sentido, foi necessria a realizao de diversas reunies com o intuito de promover e sedimentar o entendimento da equipe acerca das variveis que estavam implicadas na efetivao do projeto. O especialista em cinema brasileiro e sua equipe de pesquisadores foram fundamentais no sentido de promoverem discusses conceituais especficas em que as particularidades da linguagem cinematogrfica foram evidenciadas.Tal dinmica permitiu a ampliao do entendimento da equipe acerca do domnio de conhecimento perscrutado e a gerao de uma proposta mais corrente com os usos e as particularidades da linguagem verificadas no campo. Esforo semelhante foi realizado pela especialista em cincia da informao e sua equipe de pesquisadores no sentido de evidenciar o papel da linguagem de indexao nos processos de organizao e recuperao da informao. Alm disso, foram ressaltados os princpios tericos e metodolgicos adotados na efetivao de um instrumento dessa natureza. As aes de seleo e descrio semntica dos termos bem como a proposio da estrutura facetada foram definidas com base nas ponderaes apresentadas pelas duas equipes envolvidas de modo que fosse possvel gerar um instrumento robusto o suficiente para representar as informaes geradas em contextos cinematogrficos.

Instrues de uso do tesauro


A finalidade do Tesauro eletrnico do cinema brasileiro proporcionar tratamento formal para a rea em questo, minimizando ambigidades e facilitando a comunicao entre os profissionais envolvidos. Tambm atendem aos conhecedores dessa rea e ao indexador que no tenha necessariamente uma formao especfica. Foram adotados os significados das convenes e abreviaturas utilizados no software Thesaurus Webchoir Educational - TCS-8: BT (Broader Term): Termo genrico. O termo introduzido aps este smbolo representa um conceito de conotao mais ampla. NT (Narrower Term): Termo especfico. O termo introduzido por esse smbolo representa um conceito de conotao mais especfica. SN (Scope note): Nota de aplicao. Explicao concisa sobre o modo de emprego de um descritor. Tambm chamada de nota explicativa ou nota de escopo.
Perspect. cinc. inf., Belo Horizonte, v.10 n.1, p. 54-69, jan./jun. 2005

63

Linguagens de indexao em contextos cinematogrficos: a experincia de elaborao do tesauro eletrnico do cinema brasileiro

64

UF (Used for): Usado por. O termo introduzido aps este smbolo um no-descritor ou termo no preferido. USE (Use): O termo introduzido aps este smbolo o descritor, ou termo preferido. RT (Related Term): Termo relacionado. O termo introduzido por esse smbolo representa um conceito que possui algum tipo de relao com aquele sob o qual est submetido. RTO (Related Term Opposite): Termo Relacionado Oposto. O termo introduzido por esse smbolo representa um conceito contrrio, contraditrio ou oposto. A novidade, em termos de relacionamentos, foi a presena do termo relacionado oposto que permitiu a oposio entre termos. O tesauro possui trs classes gerais fundamentais de relacionamento: relacionamentos semnticos ou de equivalncia, relacionamentos lgicohierrquicos, relacionamentos associativos. O Tesauro possui uma apresentao sistemtica com um ndice alfabtico apresentado em duas partes. A primeira das categorias ou hierarquias de termos ordenados de acordo com seus significados e relacionamentos lgicos. Contm o relacionamento genrico/especfico indicado pela posio dos termos dentro de sua hierarquia e pelas diferentes margens. Inclui tambm notas de explicao e referncias recprocas a termos equivalentes e associativos. A segunda o ndice alfabtico que leva o usurio ao ponto apropriado da seo sistemtica. Contm tambm as notas de explicao e as referncias recprocas entre sinnimos e demais relacionamentos que no o genrico/especfico. O nmero total de termos (descritores e nodescritores) constituintes do tesauro de 1.040 sendo que so 983 descritores e 57 no-descritores. A disposio dos termos segue ordem alfabtica palavra por palavra, como no exemplo: ATIVIDADES CINEMATOGRFICAS Assistncia de produo Cenografia Cinematografia (filme)* Consultoria tcnica Crtica de cinema Direo Distribuio cinematogrfica Dublagem Edio A escolha da forma singular prevaleceu para os termos. Utilizou-se o smbolo * (asterisco) para representar os termos com grafias iguais em mais de uma faceta, mas que correspondem a contextos diferentes. Ex. Cinesdistri (estdio)* Cinesdistri (companhia cinematogrfica)* Aos conceitos diferentes, que foram expressos pela mesma forma lingstica, acrescentou-se um qualificador a cada forma. Exemplo: Girafa (equipamento) Como princpio geral, as siglas foram usadas como descritores. Uma das razes que muitas siglas so mais reconhecidas na rea do cinema do que a expresso completa. A forma por sigla figurou como descritor, com uma remissiva da grafia completa.
Perspect. cinc. inf., Belo Horizonte, v.10 n.1, p. 54-69, jan./jun. 2005

Maria Aparecida Moura; Luiz Nazrio; Daniela Cristina da Silva Rodrigues; Elisabete Quatrini Vieira; Iris da Silva; Lcia Mara Barbosa de Oliveira Paoliello

Software utilizado na elaborao do tesauro


Atualmente existem vrios softwares com caractersticas de registro e de consulta dos termos, ou seja, de ferramenta de construo de tesauros. Para o gerenciamento do Tesauro eletrnico de cinema brasileiro foi utilizado o software Thesaurus Webchoir Educational, TCS-8, verso 1.161 que permite: Gerenciar com facilidade a estrutura do Tesauro com criao, edio ou remoo de termos e relacionamentos (FIG. 2). Recuperar os termos, atravs do sistema de busca (FIG. 3).

FIGURA 2 - Estrutura do Tesauro eletrnico do cinema brasileiro.

FIGURA 3 - Recuperao dos termos no Tesauro eletrnico do cinema brasileiro

Disponvel em: <http:// www.webchoir.com/TCS-8.html>. Acesso em 30/08/2003.

65

Perspect. cinc. inf., Belo Horizonte, v.10 n.1, p. 54-69, jan./jun. 2005

Linguagens de indexao em contextos cinematogrficos: a experincia de elaborao do tesauro eletrnico do cinema brasileiro

Esse programa gera produtos, como home page, arquivos XML e possibilita a emisso de relatrios, dentre os principais: a) Relatrio alfabtico: representa uma lista geral de todos os termos em ordem alfabtica, incluindo os seus respectivos relacionamentos, notas de explicao, datas de criao e modificao, dentre outros. (FIG. 4). b) Relatrio hierrquico: representa uma lista de todas as categorias/ facetas com os respectivos termos em ordem alfabtica (FIG. 5).

FIGURA 4 - Visualizao do relatrio alfabtico.

FIGURA 5 - Visualizao do relatrio hierrquico.

66
Perspect. cinc. inf., Belo Horizonte, v.10 n.1, p. 54-69, jan./jun. 2005

Maria Aparecida Moura; Luiz Nazrio; Daniela Cristina da Silva Rodrigues; Elisabete Quatrini Vieira; Iris da Silva; Lcia Mara Barbosa de Oliveira Paoliello

c) ndice rotado: representa uma rotao dos termos ordenados alfabeticamente, o que possibilita, atravs do conhecimento de uma palavra, a recuperao do termo (FIG. 6).

FIGURA 6 Visualizao do ndice rotado O tesauro eletrnico uma ferramenta em permanente construo, o que garante sua longevidade. Ele reflete a rea de conhecimento e representa sua dinmica de produo. Dessa forma, pode-se afirmar que a originalidade do tesauro eletrnico no reside tanto no fato de ser eletrnico, mas em ser dinmico, numa rea do conhecimento em que a expanso e a consecutiva transformao da informao so relativamente freqentes.

Consideraes finais
A extrema especializao do conhecimento na atualidade tem exigido respostas geis em termos de organizao e recuperao da informao. Os usurios interagem de forma mais direta com os sistemas de recuperao da informao, razo pela qual, a linguagem que prov o acesso informao, deve possuir uma sintaxe prpria, mas, ao mesmo tempo, refletir as demandas informacionais produzidas nesses ambientes. O campo audiovisual certamente um dos domnios que mais sofreu alteraes de carter tecnolgico e conceitual ao longo dos ltimos anos. Em virtude desse fato, realizar pesquisas ou organizar informaes especializadas em cinema se reveste em tarefa extremamente delicada. O cinema representa um domnio cuja traduo intersemitica ocorre de maneira intensa, ou seja, os signos verbais so interpretados atravs dos signos no verbais e vice-versa. Em funo disso, prover um instrumento verbal de representao da informao nesse domnio revestiu-se num grande desafio. O principal desafio do projeto foi a criao das condies de possibilidade para o compartilhamento dos conhecimentos necessrios ao desenvolvimento da proposta. Foi preciso construir uma base comum de conhecimentos entre
Perspect. cinc. inf., Belo Horizonte, v.10 n.1, p. 54-69, jan./jun. 2005

67

Linguagens de indexao em contextos cinematogrficos: a experincia de elaborao do tesauro eletrnico do cinema brasileiro

68

os integrantes do projeto que permitisse alguma equivalncia em termos da estrutura conceitual concebida. Para tanto, a equipe envolvida no processo de elaborao do Tesauro teve como objetivo principal fornecer uma sistematizao inicial da linguagem cinematogrfica adotada no Brasil. Atravs do acompanhamento e sistematizao dos termos usados no campo, foi possvel estruturar um lxico articulado por uma rede de relacionamentos que, do ponto de vista da linguagem, pudesse prover um uso mais articulado e em consonncia com o vocabulrio adotado pelos tericos do cinema, os profissionais e artistas. Ateno especial foi dada tambm aos usurios de publicaes e registros cinematogrficos brasileiros. Dessa forma, o Tesauro foi gerado a partir de uma padronizao da linguagem utilizada pelos produtores e usurios da informao. No caso, a garantia de uso foi assegurada por um especialista em cinema e sua equipe de pesquisadores. Atravs do seu ponto de vista, da experincia, da compreenso conceitual dos termos e das inter-relaes existentes entre esses termos foi possvel privilegiar uma estrutura mais conexa s lgicas de utilizao da informao no domnio. Como resultado obteve-se um vocabulrio controlado que representa a dinmica informacional existente no campo. Avalia-se que, se no processo de elaborao do Tesauro no houvesse a garantia de uso, talvez o instrumento pudesse tornar-se ineficaz em sua finalidade de proporcionar o tratamento formal para a rea. Verifica-se ento que o instrumento concebido pode evitar as ambigidades e tornar mais interativa a comunicao entre os profissionais que fazem uso das informaes nesse campo. Outro aspecto a ser destacado refere-se ao fato de que a construo de uma linguagem de indexao, independente da rea, requer sempre um trabalho interdisciplinar. Estudos das vrias obras selecionadas foram feitos por profissionais da informao, mas as peculiaridades da rea foram esclarecidas por especialistas em cinema, uma vez que o instrumento tinha como pressuposto atender as demandas informacionais desse segmento. Nesse sentido, foi fundamental para o xito do trabalho a existncia de um projeto no qual estavam explcitos o pblico alvo, os objetivos e os princpios metodolgicos. Devido a esse fato, cada etapa do projeto foi executada com transparncia, mtodo e rigor conceitual. Alm disso, a escolha de um bom instrumento para o gerenciamento do tesauro foi imprescindvel. Nesse aspecto, identificou-se um software que pudesse prover a atualizao e o gerenciamento do tesauro e que, ao mesmo tempo, proporcionasse a organizao e a recuperao especializada da informao. Cabe ressaltar, entretanto que o software no foi o elemento principal no desenvolvimento do tesauro, mas contribuiu de maneira significativa na gesto da base terminolgica elaborada. Finalmente, a experincia de elaborao do Tesauro eletrnico do cinema brasileiro revelou a necessidade de investir em iniciativas locais para o provimento de solues informacionais que adotem, como princpio, as necessidades concretas de um dado campo de conhecimento e que a atividade de elaborao de linguagens indexao seja considerada uma tarefa fundamentalmente interdisciplinar. No caso especfico do Tesauro a oportunidade de compor uma equipe interdisciplinar tornou evidente que preciso estabelecer, cada vez mais, a aproximao de campos disciplinares diferentes para a soluo de problemas especficos e que seja possvel nesse movimento o compartilhamento de metodologias de trabalho (DOMINGUES, 2005, p. 24). Acredita-se, pois que so iniciativas como essas que tornam possvel a gerao novos conhecimentos.
Perspect. cinc. inf., Belo Horizonte, v.10 n.1, p. 54-69, jan./jun. 2005

Maria Aparecida Moura; Luiz Nazrio; Daniela Cristina da Silva Rodrigues; Elisabete Quatrini Vieira; Iris da Silva; Lcia Mara Barbosa de Oliveira Paoliello

Indexing languages in cinematographic contexts: the experience of creating an Electronic Thesaurus of Brazilian Cinema
The article describes the experience of creating an Electronic Thesaurus of Brazilian Cinema, which was developed to support the organization and the search of information generated in cinematographic contexts. The point of departure for this work is the realization of the fact that there are no specialized instruments available for the thematic organization of Brazilian cinematographic collections, as well as the increasing demand for specialized language on the part of renowned centers of memory and audiovisual reference in Brazil. The objective is to provide an indexation tool capable of representing not only the specific cinematographic collections thematically, but also the knowledge produced about Brazilian movies. For this, we determined procedures towards mapping the area thematically with the purpose of identifying the main concepts related to the area and its net of relationships. Studies were conducted based on the specific literature of the area, followed by a conceptual comparison based on the collection of films and publications housed by Ophicina Digital of the Department of Photography, Theater and Cinema of the School of Fine Arts - UFMG. With the help of available literature and the expertise of a Brazilian Cinema specialist who was part of the team of researchers, the article introduces the indexation tool. Fundamental principles of use and of literary warranty were used to verify the application of the tool to specific contexts. Pre-testing indexation testified to the specificity of the tool and evaluated its applicationin specific contexts. The result was the compilation of a thesaurus of 1040 terms organized in 34 specific facets. Key-words: Electronic thesaurus; Indexing languages - elaboration; Brazilian Cinema

Referncias
ABBAGNANO, Nicola. Dicionrio de filosofia. So Paulo: Martins Fontes, 2000. CAMPOS, M. L. de A. Linguagem documentria: teorias que fundamentam sua elaborao. 5. ed. Rio de Janeiro: Ed. UFF, 2001. 133 p. CAMPOS, M. L. de A., GOMES, H. E. Tesauro e normalizao terminolgica: o termo como base para o intercmbio de informaes. Datagramazero, v. 5, n. 6, dez. 2004. Disponvel em http://www.dgzero.org/, dez.2004. ___________. Organizao de domnios de conhecimento e os princpios ranganathianos. Perspectiva em Cincia da Informao, Belo Horizonte, v. 8, n. 2, p. 150-163, jul./dez. 2003. DAHLBERG, I. Teoria do conceito. Cincia da Informao, Braslia, v. 7, n. 2, p. 101-107, 1978. DOMINGUES, I. Em busca do mtodo. In: . (Org.). Conhecimento e transdisciplinaridade II: aspectos metodolgicos. Belo Horizonte: Ed. UFMG, 2005. p.1740. FUGITA, M. S. L. A leitura do indexador: estudo de observao. Perspectivas em Cincia da Informao, Belo Horizonte, v. 4, n. 1, p. 101-116, jan./jun. 1999. JOURNOT, M.-T. Le Vocabulaire du Cinma. Paris: Nathan / VOUEF, 2002. NAVES, M. M. L. Estudo de fatores interferentes no processo de anlise de assunto. Perspectivas em Cincia da Informao, Belo Horizonte, v. 6, n. 2, p. 189203, jul./dez. 2001. KIMOTO, H.; IWADERA, T. Construction of dynamic thesaurus and its use for associated information retrieval. [sl]: ACM, 1990. p.227-240. LARA, M. L. G. de. A representao documentria: em jogo a significao. So Paulo: ECA/USP, 1993. 133p. _______. Algumas contribuies da semiologia e da semitica para a anlise das linguagens documentrias. Cincia da Informao, Braslia, v. 22, n. 3, p. 223-226, set./dez. 1993. _______.Linguagens documentrias, instrumentos de mediao e comunicao. Rev. Bras. Bibliotecon. e Doc., So Paulo, v. 26, n.1/2, p. 72-80, jan./ jun. 1993. RIVER, A. Construo de linguagens de indexao: aspectos tericos. Revista da Escola de Biblioteconomia da UFMG, Belo Horizonte, v. 21, n. 1, p. 56-99, jan./jun. 1992. SVENONIOUS, E. Unanswered questions in the design of controlled vocabularies. Journal of American Society for information Science, v. 37, n. 5, p.331-340, 1986. _______. The intellectual foundation of information organization. Cambridge: MIT Press, 2000. Perspect. cinc. inf., Belo Horizonte, v.10 n.1, p. 54-69, jan./jun. 2005

69

Você também pode gostar