Você está na página 1de 453

GT 2

Organizao e Representao do Conhecimento O GT 2 aborda Teorias, metodologias e prticas relacionadas organizao e preservao de documentos e da informao, enquanto conhecimento registrado e socializado, em ambincias informacionais tais como: arquivos, museus, bibliotecas e congneres. Compreende, tambm, os estudos relacionados aos processos, produtos e instrumentos de representao do conhecimento (aqui incluindo o uso das tecnologias da informao) e as relaes inter e transdisciplinares neles verificadas, alm de aspectos relacionados s polticas de organizao e preservao da memria institucional.

SUMRIO
A BIBLIOTECA DIGITAL PAULO FREIRE COMO DISPOSITIVO DE ACESSO E USO DO CONTEDO FREIREANO Izabel Frana Lima, Mirian de Albuquerque Aquino.......................................................................317 MAPA CONCEITUAL E TERMINOLGICO PARA A CINCIA DA INFORMAO: UM ESTUDO EXPLORATRIO PARA SUA ELABORAO Vnia Mara Alves Lima....................................................................................................................333 A PRECISO NAS LINGUAGENS DE INDEXAO: UM ESTUDO COM A TEMTICA DA HOMOSSEXUALIDADE MASCULINA Fabio Assis Pinho, Jos Augusto Chaves Guimares.......................................................................352 O BLOOD PROJECT: UMA INICIATIVA PARA ORGANIZAO DA INFORMAO EM BIOMEDICINA Almeida, M.B.; Coelho, K.C.; Andrade, A.Q.; Carneiro, L.E.S.; Oliveira, J. A.; Mendona, B.M.; Souza, R.R..........................................................................................................371 INDICADORES DE QUALIDADE DA INFORMAO EM SISTEMAS BASEADOS EM FOLKSONOMIA: UMA ABORDAGEM SEMITICA Juliana de Assis e Maria Aparecida Moura.....................................................................................389 A IMPORTNCIA DOS PRESSUPOSTOS ONTOLGICOS COMO BASE PARA O USO ARTICULADO DE ONTOLOGIAS NO CONTEXTO DA WEB SEMNTICA Linair Maria Campos, Maria Luiza Almeida Campos, Maria Luiza Machado Campos e Miguel Gabriel Prazeres de Carvalho..............................................................................................406 O VOCABULRIO CONTROLADO COMO INSTRUMENTO DE ORGANIZAO E REPRESENTAO DA INFORMAO NA FINEP Tatiana Almeida Rosali Fernandes Souza.......................................................................................424 TRATAMENTO TCNICO DA DOCUMENTAO AUDIOVISUAL NA TV DA UNIVERSIDADE FEDERAL DE GOIS Maria Leticia Costa Miranda, Maria de Ftima Garbelini.............................................................439 A LINGUSTICA DOCUMENTRIA E A ANLISE DE DOMNIO NA ORGANIZAO DA INFORMAO Julietti de Andrade, Marilda Lopes Ginez de Lara..........................................................................452 A ORGANIZAO DA INFORMAO EM SITES DE RECURSOS HUMANOS Brigida Maria Nogueira Cervantes, Antonio Bezerra de Lima Filho..............................................468 RELAES CONCEITUAIS E CATEGORIAS FILOSFICAS: APORTES DAS ONTOLOGIAS E DA TERMINOLOGIA PARA A REPRESENTAO DO CONHECIMENTO Walter Moreira, Marilda Lopes Ginez de Lara................................................................................485

GT2 314

INDEXAO AUTOMTICA E VISUALIZAO DE INFORMAES: UM ESTUDO BASEADO EM LGICA PARACONSISTENTE Carlos Alberto Correa,Nair Yumiko Kobashi...................................................................................502 A TEORIA CLSSICA DE CATEGORIZAO E OS PRINCPIOS CATEGORIAIS DE RANGANATHAN: UMA ANLISE TERICA Alessandra Rodrigues da Silva e Gercina Angela Borem Oliveira Lima.........................................523 A APLICAO DA TEORIA DA CLASSIFICAO FACETADA EM BANCO DE DADOS, ATRAVS DA MODELAGEM CONCEITUAL Mrcio Bezerra da Silva, Dulce Amlia de Brito Neves...................................................................540 IDENTIFICAO ARQUIVSTICA: SUBSDIOS PARA A CONSTRUO TERICA DA METODOLOGIA NA PERSPECTIVA DA TRADIO BRASILEIRA Ana Celia Rodrigues.........................................................................................................................558 MTODO DE COMPATIBILIZAO DE LINGUAGENS APLICADO A IMAGENS FOTOGRFICAS: UMA PROPOSTA DE AVALIAO Joice Cleide Cardoso Ennes de Souza..............................................................................................572 ORGANIZAO DOS CONTEDOS DE CONHECIMENTO PARA SITES: REPRESENTAO DAS ATIVIDADES DE PESQUISA EM LABORATRIO CIENTFICO DE BIOLOGIA MOLECULAR Laura de Lira e Oliveira, Maria Luiza de Almeida Campos, Hagar Espanha Gomes (CNPq)...........585 O CORDEL E AS LINGUAGENS DOCUMENTRIAS Maria Elizabeth Baltar Carneiro de Albuquerque...........................................................................597 BIASES NA REPRESENTAO DO CONHECIMENTO: UMA ANLISE DA QUESTO FEMININA EM LINGUAGENS DOCUMENTAIS BRASILEIRAS Suellen Oliveira Milani, Jos Augusto Chaves Guimares..............................................................616 SEMIOSE E ANLISE DE ASSUNTO EM CONES COMEMORATIVOS DA GOOGLE: IMPLICAES DA EXPERINCIA COLATERAL NA REPRESENTAO DA INFORMAO ICONOGRFICA EM AMBIENTES DIGITAIS Maria Aparecida Moura...................................................................................................................631 PROTTIPO DE UM SISTEMA DE SUBMISSO DE ARTIGO CIENTFICO PARA PERIDICO ELETRNICO SEMNTICO EM CINCIAS BIOMDICAS Leonardo Cruz da Costa...................................................................................................................645 A LEITURA DE IMAGENS FOTOGRFICAS: PRELIMINARES DA ANLISE DOCUMENTRIA DE FOTOGRAFIAS Miriam Paula Manini.......................................................................................................................663 ORGANIZAO CONCEITUAL DO DOMNIO DE INSTRUMENTOS MUSICAIS COM BASE NA TEORIA DO CONCEITO Adriana Olinto Ballest....................................................................................................................679 GT2 315

TAXONOMIA FACETADA NAVEGACIONAL: AGREGANDO VALOR S INFORMAES DISPONIBILIZADAS EM BIBLIOTECAS DIGITAIS DE TESES E DISSERTAES Benildes Coura Moreira dos Santos Maculan, Gercina Angela Borm de Oliveira Lima...............696 TESAUROS CONCEITUAIS E ONTOLOGIAS DE FUNDAMENTAO: ANLISE COMPARATIVA ENTRE AS BASES TERICO-METODOLGICAS UTILIZADAS EM SEUS MODELOS DE REPRESENTAO DE DOMNIOS Jackson da Silva Medeiros, Maria Luiza de Almeida Campos.........................................................715 REPRESENTAO DA INFORMAO MUSICAL: SUBSDIOS PARA RECUPERAO DA INFORMAO EM REGISTROS SONOROS E PARTITURAS NO CONTEXTO EDUCACIONAL E DE PESQUISA Camila Monteiro de Barros, Lgia Maria Arruda Caf....................................................................731 PRESERVAO DIGITAL DE DOCUMENTOS DE ARQUIVO LONGO PRAZO: ESTRATGIAS E INICIATIVAS O DOCUMENTO AUDIOVISUAL INSERIDO EM AMBIENTE DE ARQUIVO Luiz Antonio Santana da Silva, Telma Campanha Carvalho Madio................................................746 IDENTIFICAO DE CATEGORIAS INFORMACIONAIS PARA REPRESENTAO DE IMAGENS FOTOGRFICAS FIXAS EM BANCOS DE IMAGENS COMERCIAIS Joice Cleide Cardoso Ennes de Souza, Rosali Fernandez de Souza................................................754 COMUNICAO CIENTFICA E REPRESENTAO DA INFORMAO: ESTUDO PRELIMINAR SOBRE A INDEXAO COM PALAVRAS-CHAVE NO ENANCIB Marilucy da Silva Ferreira, Fbio Mascarenhas Silva....................................................................760

GT2 316

COMUNICAO ORAL

A BIBLIOTECA DIGITAL PAULO FREIRE COMO DISPOSITIVO DE ACESSO E USO DO CONTEDO FREIREANO
Izabel Frana Lima, Mirian de Albuquerque Aquino Resumo: Reflete sobre as bibliotecas digitais como um dispositivo de acesso e uso da informao e sua contribuio para a educao, viabilizada pelo uso das tecnologias da informao e comunicao no cotidiano escolar. Objetiva proceder a uma anlise da Biblioteca Digital Paulo Freire (BDPF) no que diz respeito ao acesso e ao uso do contedo freireano por professores de uma escola pblica municipal de Joo Pessoa, Paraba. A construo da Biblioteca Digital Paulo Freire na Universidade Federal da Paraba (UFPB) teve como finalidade democratizar o conhecimento, descentralizando o pensamento de Paulo Freire da cultura escrita (impressa) para recoloc-la na cultura digital, com a finalidade a fim de disseminar sua produo intelectual desse educador e a de seus intrpretes e de crticos, por meio de tecnologia digital. Palavras-chave: acesso e uso de informao, biblioteca digital, educao, incluso digital, Biblioteca Digital Paulo Freire. 1 INTRODUO Os efeitos da globalizao e as exigncias da sociedade da informao e do conhecimento instigam-nos a pensar a educao mediada pelas tecnologias da informao e comunicao como uma temtica articulada a um contexto sociocultural anteriormente inimaginvel, em que os indivduos vislumbram possibilidades de mudanas na forma de pensar, aprender, conhecer, ensinar e agir sobre o mundo. Por tecnologias entendemos, com Castells (1999), um conjunto de tecnologias em microeletrnica, computao (software e hardware), telecomunicao, radiodifuso, optoeletrnica e engenharia gentica cuja dinmica penetra em quase todos os campos do conhecimento, construindo redes de informao que interligam organizaes, empresas, editoras, bancos, arquivos, bibliotecas, museus, centros de informao, Ongs, instituies de ensino etc. So formas novas de interagir, com diferentes suportes, que exigem a parceria da educao na formao de competncias para se acessar e usar adequadamente a informao e transform-la em conhecimento e, assim, se adaptar s mudanas e desenvolver atividades cada vez mais complexas no mundo do trabalho e/ou na vida cotidiana. Sem dvida, as TICs vm provocando inmeras mutaes nos hbitos humanos, nas atividades profissionais e nos projetos educacionais, convertendo a oralidade, a escrita e o digital em um mesmo sistema de comunicao. Elas tm sido vistas como ferramentas importantes para a educao, contribuindo para novas relaes no processo ensino e aprendizagem. Com o advento da sociedade da informao e do conhecimento, essas tecnologias ganham GT2 317

destaque no mundo globalizado, onde os pases interligam-se pela rede mundial de computadores Internet - com seus produtos e servios, a partir dos quais possvel reconhecer as bibliotecas digitais como um ambiente virtual de aprendizagem e dispositivo de incluso digital/social na educao, cujos efeitos podem levar a escola a repensar e redefinir as suas teorias e metodologias de ensino, as relaes com o conhecimento armazenado em diferentes suportes, independentemente de tempo e de espao. Essa desconstruo espao-temporal nos ajuda a considerar que a condio fsica dos livros no est mais num nico lugar. No caso especfico das bibliotecas tradicionais, o armazenamento de milhares de acervos nas estantes de salas com paredes, como comumente visto ali, foram desafiados pelo contexto da virtualidade, com o surgimento das bibliotecas digitais, onde se depositam apenas referncias (hyperlinks) de arquivos espalhados por diversos servidores em qualquer lugar, onde os indivduos podem acessar os textos criando seus prprios meios, interagindo com objetos de aprendizagem ou objetos multimdia (AQUINO, 2004), com um potencial de recuperao da informao, anteriormente desconhecida em formato digital, oferecendo a possibilidade de recuperao do texto, independente de sua localizao original, para alm do lugar em que ele se encontre (PARENTE, 1999, p. 68). A biblioteca digital desconstruiu os muros milenares das bibliotecas tradicionais, antes conhecidas como repositrio da memria da humanidade, apresentando-se com um novo formato, deslocando a noo de lugar e de memria do conhecimento. evidente que os conceitos de descentralizao e de delimitao sofrem mutaes perceptveis para dar lugar interface da tela (computador) que passa a existir enquanto distncia, profundidade de campo de uma representao nova, de uma visibilidade que apaga o antigo modelo. A descentralizao vista na perspectiva de espao geogrfico em oposio centralizao e delimitao como espao fsico definido, assinalando o fim da unidade de lugar (VIRILIO, 1993, p. 99). Esses conceitos constituram o ponto de partida da criao das bibliotecas digitais, nos mais distantes campos do conhecimento e, como uma organizao social, constitudas por servios e produtos diferenciados (na funo de selecionar, organizar, disponibilizar, disseminar e democratizar a informao), so concebidas como um espao que reduz as barreiras fsico-geogrficas que sempre limitaram o acesso e ao uso das bibliotecas fsicas. Nessa era da informao e do conhecimento, as bibliotecas digitais para utilizao pela educao constituem um potencial ambiente de aprendizagem, pois por meio delas que os (as) professores(as) acessam e usam a informao com a qual interagem. Empregamos, neste estudo, a noo de aprendente para nos referir aos (s) professores (as) como sujeitos que esto em constante estado de aprendizagem das TICs. Essa transposio de termos tem como base o argumento de Assmann (2000, p. 10), quando diz que necessria a substituio dos termos tradicionais pelo cenrio epistemolgico das novas linguagens, pois o que h de novo e indito com as [TICs] a parceria cognitiva que comeam a exercer na relao que o aprendente estabelece com elas. Os termos como usurio j no expressam bem essa relao cooperativa entre ser humano e as mquinas inteligentes.

GT2 318

2 ACESSO E USO DAS TICs NA EDUCAO O advento da Internet trouxe possibilidades, at ento, inusitadas para a criatividade humana que conta hoje com o acesso e uso da informao e da comunicao global. O acesso pblico inclui o acesso tecnologia (computador, conexo, banda larga etc.) e a todo o contedo armazenado na maior rede mundial de computadores (a Internet). Dentre esses dois elementos, o segundo hierarquicamente superior ao primeiro, uma vez que a tecnologia se subordina ao contedo (conhecimento) que pode comportar. Assim sendo, como podemos ver as TICs so postas no centro da cena, como um dispositivo de incluso digital/social na educao. No que concerne insero das TICs no ambiente escolar, Lvy (1993, p. 160), refletindo sobre a interao homem, tcnica e razo, diz que a escola tem o dever de realizar uma fuso entre objetos e sujeitos, permitindo o exerccio da racionalidade. Para este autor, a racionalidade equivale ao uso de certo nmero de tecnologias intelectuais, que recorrem a dispositivos exteriores ao sistema cognitivo humano. Trata-se de investir numa educao mediada pelas TICs, como um processo que deve se inserir nas atividades escolares, as quais, para Castells (1999), no constituem ferramentas a serem aplicadas, mas processos a serem desenvolvidos. A partir da viso do autor, parece-nos que uma nova educao precisar ser construda, como as redes sociais, com responsabilidade individual e coletiva. Talvez, a educao possa vir a ser um espao de reflexo para pensar a construo do conhecimento com o uso dessas tecnologias. Essa possibilidade de um novo fazer educativo exige dos (as) pesquisadores (as), que atuam no campo da educao, a tarefa de examinar criticamente os discursos e as prticas de incluso digital/social que, possivelmente, esto sendo desenvolvidas em contextos escolares, deixando de perceber o papel das bibliotecas digitais como dispositivo de comunicao e incluso digital/social e, consequentemente, da incluso informacional. verdade que insistir nas prticas convencionais de ensino obscurece a viso de que as tecnologias atuais figuram na sociedade atual como um motor impulsionador das transformaes educacionais. Porm, tudo se manifesta pelas inovaes, e no, simplesmente pelas TICs, interferindo nas maneiras de ensinar e aprender. Por outro lado, afirma Brunner (2004, p. 74), para se conseguir uma mudana
[...] em grande escala na prtica do ensino, necessrio que um nmero muito maior de docentes modifique seu enfoque pedaggico e que se operem mudanas substanciais na administrao escolar, na estrutura institucional e nas relaes com a comunidade.

Ento, o diferencial estaria em reconhecer, tambm, que o uso dessas tecnologias desloca os conceitos de tempo, espao, ambiente educacional e a relao professor-aluno, tentando romper com o ensino formal, reprodutivo, que prioriza a transmisso de informaes descontextualizadas para memorizao. Sem dvida, os novos paradigmas educacionais revelam uma ruptura com as prticas pedaggicas tradicionais, buscando a interdisciplinaridade que envolva o aluno no seu potencial cognitivo e contemplando tambm os fatores afetivos e sociais (SANTOS; RADTKE, 2005, p. 328). O Programa da Sociedade da Informao Para o Brasil - Livro Verde, Takahashi (2000, p. 7) GT2 319

ressalta que a educao o elemento-chave para a construo de uma sociedade da informao e condio essencial para que pessoas e organizaes estejam aptas a lidar com o novo, a criar e, assim, garantir seu espao de liberdade e autonomia, devendo permanecer ao longo da vida para que o indivduo tenha condies de acompanhar as mutaes tecnolgicas. Embora esse autor considere que a educao bsica, no Brasil, ainda apresente deficincias marcantes nos segmentos sociais de baixa renda e em regies menos favorecidas, o analfabetismo permanece como realidade nacional. No atual contexto, a educao assume um papel relevante na sociedade que prioriza o domnio de certas habilidades (FLECHA; TORTAJADA, 2000). Os indivduos desprovidos de competncias para processar, ressignificar e atribuir sentido informao, para transform-la em conhecimento necessitam ser reconhecidos e valorizados, pois ao contrrio podem ser excludos. Novos espaos de aprendizagem e de produo do conhecimento possibilitados pelas TICs foram tambm um das preocupaes do educador Paulo Freire ao alicerar o ensino-aprendizagem em ambientes interativos com o uso do vdeo, da televiso e da informtica (FREIRE; GUIMARES, 2003), mas sempre buscando utilizar essas tecnologias de forma crtica (AQUINO, 2004). 2 A CONSTRUO E A IMPLEMENTAO DA BIBLIOTECA DIGITAL PAULO FREIRE A compreenso de que o conhecimento na sociedade contempornea no est mais centrado apenas nas pginas de livros catalogados ou nas bibliotecas dos grandes centros de disseminao de conhecimentos (universidades e outras instituies educativas), bem como o entendimento de que o conhecimento navega instantaneamente para todo o mundo a qualquer hora e lugar, fundamentaram a construo e a implementao da Biblioteca Digital Paulo Freire (BDPF) (http://www.paulofreire.ufpb.br) cuja consolidao encontra-se nas aes do projeto de pesquisa Implementao e Desenvolvimento da Biblioteca Digital Paulo Freire, desenvolvido na Universidade Federal da Paraba (UFPB) em parceria com a Universidade Federal de Pernambuco (UFPE) e o Centro Paulo Freire: Estudos e Pesquisa. Esse empreendimento digital recebeu apoio da Coordenao Institucional de Educao a Distncia (CEAD) e da Coordenao de Informtica da UFPB e contou com recursos financeiros do Conselho Nacional de Desenvolvimento em Cincia e Tecnologia (CNPq). O projeto coadunou-se com as estratgias do Programa Sociedade da Informao/MCT e do Plano Plurianual 2000 2004 que inclui projetos de educao distncia, criao e difuso cultural, criao de bibliotecas digitais no sentido de colocar o mundo virtual como habilitador de competncias e de participao social (Brenannd et al., 2000). Em seu processo de criao foram consideradas as orientaes do Programa de Informao para a Pesquisa (Prossiga), que investia na criao de novos servios de informao para a pesquisa, ou seja, a criao de bibliotecas virtuais na internet e a relevncia concedida educao por parte das instituies governamentais, contemplando os objetivos de ampliao da ao educativa nos projetos educativos Vivendo e Aprendendo e Pedagogia da Pergunta, do Programa Ao Cultural, desenvolvidos pela UFPB e pela UFPE, fortalecendo, assim, a ampliao dos espaos de difuso de informaes para atender expanso da incluso digital/social. GT2 320

Na UFPB, essa construo da Biblioteca Digital Paulo Freire (BDPF) teve como finalidade democratizar o conhecimento com o intuito de disponibiliz-lo para diferentes grupos sociais, descentralizando o pensamento de Paulo Freire da cultura escrita (impressa) para recoloc-lo na cultura digital, com a finalidade de disseminar a produo intelectual desse educador, de intrpretes e de crticos, por meio de tecnologia digital. Essa Biblioteca foi concebida como um dispositivo de incluso digital/social, que se props buscar, recuperar, armazenar, organizar, indexar e disponibilizar digitalmente a informao para transform-la em conhecimento, com o propsito de democratizar os pressupostos filosficos, sociolgicos e pedaggicos do pensamento freireano, a fim de dar suporte a aes educativas democrticas e coletivas que tenham como vetor o desenvolvimento de competncias de participao social, facilitando a insero dos sujeitos educacionais na sociedade da informao e do conhecimento (BRENNAND et al., 2000). Seus idealizadores a definem como uma fonte de conhecimento de fcil acesso, sobre Paulo Freire e seus crticos, no apenas para uma comunidade, mas para todos que desejarem conhecer mais sobre esse pensador, um dos mais importantes pedagogos da histria, no apenas pelo conhecimento que gerou para a humanidade, ou melhor, para a histria da educao, mas tambm por sua postura contra as desigualdades que assolam o nosso pas (ARAGO JNIOR; BRENNAND, 2004). Tiveram como propsito tambm fazer com que todas as pessoas que estiverem conectadas aos computadores tenham acesso, sem nus, ao conhecimento disponibilizado atravs de um amplo acervo de materiais diversificados, incluindo livros, artigos, udios e vdeos etc., referentes vida e obra de Paulo Freire, espalhados pelo Brasil e pelo mundo (AQUINO et al., 2001; BRENNAND et al., 2000). A BDPF contribui para a educao ao consolidar e disponibilizar a vida, a obra e as ideias de Paulo Freire, difundidas no mundo inteiro, tornando-se um instrumentos de pesquisa e recurso didtico, pressupondo que novos subprodutos de informao sobre a vida e a obra de Paulo Freire (CD-ROOM, catlogos, folders eletrnicos, eventos) possam trazer a possibilidade de uma nova reorganizao dos modos de registro e produo do conhecimento, modificando, de forma permanente, a maneira de se lidar com a informao na sociedade (BRENANND et al.,2000). No Brasil, o acesso e o uso da informao so definidos pelo poder aquisitivo, evidenciado no alto custo dos livros e na escassez de bibliotecas pblicas (CUNHA, 2000), que se assume como parceira na dinmica da formao de cidados/s, numa sociedade aberta e global, estritamente contraditria, em que uma grande parte da populao ainda no tem pleno acesso ao ensino tradicional (alfabetizao funcional) e, menos ainda, ao ensino tecnolgico (alfabetizao digital), projetando aos nossos olhos um quadro cada vez mais assustador. 3 A BDPF COMO UM DISPOSITIVO DE INCLUSO DIGITAL/SOCIAL NA EDUCAO Deleuze (2005) prope o conceito de dispositivo inspirando-nos a entender as bibliotecas digitais como ferramentas criadas e produzidas a partir das condies dadas, e que operam no mbito mesmo dessas condies. O conceito de dispositivo oferecido por Deleuze comunga com o conceito sugerido por Peraya (2002, p. 29) que o entende como a organizao estruturada de meios materiais, tecnolgicos, simblicos e relacionais, naturais e artificiais, que tipificam, a partir de suas GT2 321

caractersticas prprias, os comportamentos e as condutas sociais, cognitivas e afetivas dos sujeitos. Os dispositivos formam um conjunto de interaes promovidas por toda mdia, toda mquina, todas as TICs, entre os universos tcnico, semitico e, ainda, social ou relacional, sendo as TICs a fronteira desses trs universos (PERAYA, 2002). Desse modo, os dispositivos de comunicao midiatizada, as mdias, das mais antigas, a exemplo da escrita, s mais contemporneas, como a Web, a internet, o ciberespao, as bibliotecas digitais podem se constituir em dispositivos de incluso digital/social. Nesta perspectiva, as bibliotecas digitais podem ser entendidas como dispositivos de incluso digital/social que possibilitam aos aprendentes (docentes e discentes) o rpido acesso e uso da informao confivel, ampliando as possibilidades de aprendizagem e configurando as experincias de uso. Essas bibliotecas digitais, consideradas aqui como dispositivos de incluso digital/social, supem as novidades e as possibilidades de criatividade que rompem com o poder que impede o saber, permitindo que as linhas de subjetivao sejam capazes de traar caminhos de criao e aprendizagem (DELEUZE, 2005, p.92) por meio do computador e da internet como suportes no processo de produo do conhecimento. A internet e as bibliotecas digitais podem executar importante papel na garantia da ampliao do acesso informao: [...] as bibliotecas digitais constituem o nico canal que tem o potencial de disponibilizar contedo cultural de bom nvel (CUNHA; MCCARTHY, 2006, p. 51). Elas constituem fontes de registros histricos de rpido acesso, recuperao, disseminao e democratizao da informao, permitindo a existncia da relao entre o conhecimento e as necessidades educacionais e informacionais, dando nfase importncia da informao e do conhecimento e ao fortalecimento dos processos educativos, enfatizando a importncia da informao e do conhecimento para atender a essas necessidades. Para desempenhar a funo educacional, a biblioteca deve prover a educao continuada, criando e apoiando os interesses da comunidade, dando suporte atividade intelectual independente e liberdade de expresso. 4 INFOVIAS METODOLGICAS A abordagem quanti-quali, adotada nesta pesquisa, fundamenta-se nas contribuies tericometodolgicas que proporcionam a percepo de estruturas, da ao dos sujeitos, de indicadores e das relaes entre micro e macro realidades (DEMO,1995), articuladas com a anlise de contedo (BARDIN, 2010) para focar os eventos ocorridos no Laboratrio da escola pesquisada, no momento da exposio verbal dos sujeitos sobre a BDPF e na aplicao do teste de usabilidade. Para tanto, procuramos levar em conta mltiplos fatores que poderiam afetar o desempenho das professorasaprendentes no acesso e uso das TICs. A escolha dos sujeitos da pesquisa recaiu sobre um nico grupo voluntrios: os professoresaprendentes da Rede Pblica Municipal de Ensino, selecionados mediante o atendimento a critrios mnimos estabelecidos em relao sua interao com as TICs e a Internet. Essa seleo contou com o envolvimento da Direo da Escola, que se utilizou de uma prtica convencional de convocao dos (as) professores (as) para participarem das reunies pedaggicas mensais, servindo tal prtica apenas GT2 322

como pano de fundo para uma primeira aproximao entre pesquisadora e futuros participantes da pesquisa. Esse momento tornou-se crucial para aproxim-los ou afast-los, no momento das aes da pesquisadora concernentes aplicao do teste de usabilidade da BDPF. Aps a interao inicial com o grupo, visando coleta de dados, a pesquisadora fez uma explanao sobre a concepo contempornea de biblioteca frente s digresses tericas da sociedade da informao e do conhecimento com o propsito de levar o grupo compreenso do novo sentido adquirido pela biblioteca no contexto digital e suas possibilidades de incluso digital/social. Essa interveno abrangeu as peculiaridades da interface da biblioteca que contou com recursos (Data Show e slides), sendo os slides dotados de um efeito significativo em qualquer apresentao, especialmente naquelas em que no h muitas variedades de mdia, e servem a um plano de contingncia, principalmente quando os professores desconhecem as bibliotecas digitais. A pesquisa de campo foi desenvolvida durante dois meses, seguindo-se os passos metodolgicos que no se desenvolveram de forma estanque, e sero discorridos nos itens seguintes, considerando as intrnsecas relaes envolvendo o papel da pesquisadora, que se inicia com a descoberta do ambiente de estudo, passando pela aplicao do teste de usabilidade e suas consequentes anlise e interpretao. Foram utilizados questionrios, observao, anotaes em caderno de campo e teste de usabilidade, com base na triangulao de instrumentos de coleta de dados visando descrio, anlise e interpretao dos dados. Os questionrios utilizados, com perguntas fechadas e abertas, abrangeram duas partes: uma serviu para caracterizar os dados pessoais relacionados ao sexo, idade, formao e ao tempo de servio e a outra, para a categorizao dos conhecimentos e habilidades dos sujeitos da pesquisa, a sua relao com a tecnologia e conhecimento sobre Internet. Esse questionrio determinou a realizao da amostra, pois, a partir de sua aplicao, verificamos que apenas onze dos (as) professores (as) presentes na reunio tinham conhecimento mnimo necessrio para participar do teste de usabilidade. O segundo questionrio (ps-teste), com questes abertas e fechadas, abrangeu duas partes: uma constou de trs questes fechadas por meio das quais avaliamos a realizao das atividades executadas pelos professores-aprendentes durante o teste de usabilidade, visando atender s categorias relativas facilidade de uso da BDPF. A segunda parte pretendeu conhecer a opinio dos participantes sobre a BDPF, e caracterizou-se por questes abertas, quando os professores-aprendentes puderam expressar, livremente, os pontos positivos e negativos detectados no uso da Biblioteca. A observao serviu para detectar os problemas de usabilidade da BDPF vivenciados pelos professores-aprendentes, durante a realizao do teste, no momento em que tiveram contato com os computadores para a realizao das atividades selecionadas e baseadas em propostas de teste de usabilidade, que visava perceber se a BDPF de fcil acesso e uso. Sobre o texto Bohmerwald (2005, p. 96) ressalta que [...] o processo pelo qual as caractersticas de interao homem-computador de um sistema so medidas, e as fraquezas so identificadas para correo, ou seja, os testes ajudam a determinar a facilidade de uso da BDPF pelo professor-aprendente que, ao ser confrontado com novas informaes, ele modifica suas representaes e reconstri as diferentes situaes-problema que encontra (SILVINO; ABRAHO, 2003, p. 5). A aplicao do teste de usabilidade teve incio com a apresentao da BDPF aos professoresGT2 323

aprendentes por meio do Data Show e sua participao, posteriormente, no Laboratrio. A lista de atividades a serem realizadas pelos professores-aprendentes durante o teste de usabilidade foi elaborada para verificar se existiam dificuldades no uso e na localizao das informaes na biblioteca. Sobre essa questo, Ferreira (2002, p. 17) explicita que as tarefas [atividades] so apresentadas aos participantes, provendo detalhes realistas e habilitando-os a execut-las com o mnimo de interveno do observador. No momento da aplicao do teste, esclarecemos aos professores-aprendentes que o nosso objetivo no era o de avali-los, mas analisar a BDPF como um dispositivo de incluso digital/ social (BOHMERWALD, 2005; DIAS, 2003). Durante o teste de usabilidade, os (as) professores (as) tiveram contato com o computador, enquanto eram observados (as) pela pesquisadora. O teste de busca e uso visa conhecer a facilidade de uso de um site ou software para desempenhar atividades prescritas. O ps-teste foi aplicado imediatamente aps a execuo das atividades, atendendo recomendao de Bohmerwald (2005, p. 100), que ressalta a importncia de [...] aplicar o questionrio logo aps os usurios terem experimentado o site, pois nesse momento eles ainda se lembram de como eram as pginas e esto mais vontade para avaliar [...]. Para analisarmos a interao dos professores-aprendentes com a BDPF e a perspectiva de este ambiente se tornar um dispositivo de incluso digital/social na educao, adaptamos os parmetros sugeridos por Bohmerwald (2005, p. 100), como categorias de nossa pesquisa: a) Se aprende rpido a usar a BDPF; b) Se as instalaes disponveis na BDPF so suficientes para seu uso; c) Se a terminologia usada pela BDPF compreendida no momento do uso; d) Se o menu suficiente para orientar o uso da BCPF. O material recolhido na pesquisa de campo, por meio dos questionrios e do teste de usabilidade, foi submetido anlise de carter interpretativo baseada em proposies que apontam os testes como sendo uma tima forma de se entender o que os usurios querem e o de que precisam para facilitar a realizao de suas tarefas [atividades], conforme sublinham Veldof, Prasse e Mills (1999, p.116), citados por Bohmerwald (2005, p. 95). O teste de usabilidade o responsvel por revelar como se estabelece a interao entre professores-aprendentes e biblioteca digital, de acordo com as categorias previamente propostas. 4.1 A interao Professores-Aprendentes com as TICs: uma anlise A nossa pretenso inicial foi a de compreender, por meio das falas registradas no teste de usabilidade e nos questionrios ps-teste, o modo como os professores-aprendentes - sujeitos da pesquisa - acessam e usam a BDPF na execuo das seguintes atividades: os recursos empregados (rapidez na aprendizagem de uso; as instrues disponveis so suficientes para seu uso; a terminologia compreendida para uso; o menu suficiente para orientar o uso) e a obteno de indcios da satisfao ou insatisfao que ela possa trazer ao usurio. Em seguida, passamos a caracterizar os professores-aprendentes e suas possibilidades de acesso e uso da BDPF. Constatamos que os sujeitos da pesquisa so do sexo feminino. A maioria GT2 324

situa-se na faixa etria entre 35 e 45 anos, sendo que apenas uma professora tem entre 20 e 25 anos. No que tange formao, dezesseis dessas professoras-aprendentes so graduadas, sendo que dez tem ps-graduao (Especializao). Percebemos, ainda, que essas professoras-aprendentes com mais de vinte anos de dedicao sala de aula e, mesmo tendo feito cursos de capacitao para o uso das TICs e da Internet, ainda no se sentem suficientemente habilitadas para incorporar essas ferramentas sua prtica. No que tange questo conhecimento e habilidade, quatro professoras-aprendentes ao responderem questo Tem facilidade em interagir com PC? confirmaram ter facilidade na interao com o computador, enquanto as demais admitiram ter dificuldade. Essa dificuldade ou resistncia apresentada pela maioria das professoras-aprendentes em incorporar o computador na sua prtica educativa e enfrentar os novos desafios da educao, remete-nos a Demo (1995), ao posicionar-se no sentido de ser necessrio incorporar as tecnologias ao fazer educativo, assegurando que: o professor no pode fugir do entendimento das tendncias tpicas das sociedades atuais e futuras, em particular, sua marca cientfica e tecnolgica (DEMO, 1995, p. 20). Prosseguindo a anlise, constatamos que cinco dessas professoras-aprendentes informaram no usar o computador na sua prtica educativa. Essas dificuldades corroboraram para ficarem fora da amostra da pesquisa, j que deixaram de atender aos requisitos bsicos estabelecidos para sua participao. Essa pouca familiaridade com as tecnologias nos leva a Silva (2000, p. 70), quando diz que a escola no se encontra em sintonia com a emergncia da interatividade [...] alheia ao esprito do tempo, mantm-se fechada em si mesma, em seus rituais de transmisso. Por outro lado, acrescenta o autor, os/as professores/as ainda no sabem raciocinar seno na transmisso linear e separando emisso e recepo, e esquecem que aprender com as TICs o mais recente desafio do/a professor/a e sua incluso digital/social faz-se necessria na educao da sociedade da informao e do conhecimento. questo Recursos da Internet mais utilizados nas suas interaes com as tecnologias da informao e comunicao, as professoras-aprendentes indicaram o correio eletrnico, seguido dos sites de busca, como os recursos mais usados. Apenas duas professoras-aprendentes mencionaram o uso das bibliotecas digitais, demonstrando, a nosso ver, certo desconhecimento desse ambiente de aprendizagem para a busca e a recuperao de informao na preparao de suas aulas. Chamou-nos a ateno o fato das professoras-aprendentes desconhecerem a BDPF, pois, quando pesquisamos sobre o pedagogo Paulo Freire, nos buscadores (Google, Yahoo) citados por elas como um dos recursos mais utilizados da internet, o link da BDPF aparece na primeira pgina (www.paulofreire.ufpb.br/paulofreire). Este no acesso pode ser um indcio de que essas professoras-aprendentes parecem no ter conhecimento das possibilidades de ensino, aprendizagem e conhecimento do contedo freireano, digitalmente, ou no conseguem se apropriar de sua riqueza para reinventarem a sua prtica pedaggica, principalmente quando se trabalha numa escola localizada numa comunidade que vive em condies sociais vulnerveis. Tendo verificado o conhecimento e a habilidade das professoras-aprendentes com as TICs, selecionamos onze para participar do teste de usabilidade, atendendo ao critrio de ter conhecimento bsico em informtica. Demonstraremos o seu desempenho diante das atividades em que utilizamos o GT2 325

questionrio de avaliao da BDPF no quadro a seguir. Nas atividades de 1 a 8, procuramos verificar se as professoras tinham facilidade para usar a BDPF, com o intuito de avaliar a categoria se o aprendizado quanto ao uso rpido. Quadro 1 Apresentao dos dados das atividades do teste de usabilidade Atividades 1 2 3 4 5 6 7 8 Muito fcil 3 3 3 Fcil 2 2 3 Mdio 3 3 1 Difcil 1 1 2 Muito difcil 2 2 0 No conseguiu 0 0 2

7 consegui visualizar normalmente; 2 no consegui achar o endereo para acess-lo 2 o arquivo no abriu no computador; 3 3 3 2 3 3 3 1 1 1 2 2 2 2 0 0 2

Fonte: dados da pesquisa, 2007

Os dados obtidos com as respostas do questionrio para a avaliao das atividades demonstram que oito professoras-aprendentes consideram de mdio a fcil a realizao das atividades, e apenas trs tiveram dificuldades para realiz-las, mas nenhuma delas deixou de fazer. A partir desse posicionamento, podemos afirmar que a BDPF de fcil uso. Porm, precisamos, ainda, considerar que elas no conheciam a BDPF e ainda no haviam acessado o site. Assim, por ser o primeiro contato, e todas as informaes solicitadas nas atividades serem encontradas pelas professoras-aprendentes, podemos inferir que a BDPF um espao virtual que possibilita um rpido e fcil aprendizado. A questo da facilidade de uso em bibliotecas digitais determinada pelo modelo de interface adotada e, neste sentido, Ferreira e Souto (2006, p. 188) afirmam que a facilidade de uso identifica a percepo de que inexiste esforo por parte do usurio para manusear o sistema. Quanto mais fcil for a interao do usurio com o sistema, mais ele sentir a utilidade do mesmo e crescer sua inteno de adot-lo. As observaes feitas durante a realizao do teste de usabilidade corroboram com os dados, pois no registramos qualquer demanda de ajuda por parte das professoras-aprendentes. Isso ratifica o pensamento dos idealizadores da BDPF, quando a definem como uma fonte de conhecimento de fcil acesso, sobre Paulo Freire e seus crticos (BRENNAND et al., 2000). A aplicao da atividade 3 buscou compreender se as instrues disponveis na BDPF so suficientes para habilitar o professor-aprendente para uso. Para atender essa categoria, foi dada a instruo 3: Acessar o link Guia do Usurio, que mostra dicas e informaes sobre a Biblioteca Digital Paulo Freire. As respostas das professoras-aprendentes demonstram que as informaes contidas no guia de usurio so suficientes para orient-las quanto ao uso e localizao das informaes. Assim sendo, observamos que sete professoras-aprendentes localizaram os links com relativa facilidade; GT2 326

duas consideraram difcil e duas no conseguiram realizar a tarefa. Em nossa avaliao, constatamos que as dificuldades relatadas referem-se localizao dos links nacionais, e no, do guia de usurio. As atividades 2, 4 e 7 foram elaboradas com a finalidade de percebermos se a terminologia usada pela BDPF compreendida no momento da busca pela informao ao utilizar essa Biblioteca. Para atender essa categoria, foram dadas as seguintes instrues: Instruo 2 - Achar e visualizar o mesmo artigo do item 1, agora utilizando o sistema de busca da Biblioteca Digital Paulo Freire; Instruo 4 - Visualizar, em tamanho mximo, a imagem (que est relacionada com a obra de Paulo Freire) com o seguinte ttulo (observao: utilize o sistema de busca para tal): Paulo Freire e Henry Giroux; Instruo 7 - Achar e visualizar a seguinte resenha (observao: utilizar o sistema de busca para tal): Pedagogia da indignao: cartas pedaggicas e outros escritos. Ao solicitar o uso do sistema de busca disponvel no site, intencionvamos perceber se a indexao (terminologia, cabealhos de assunto ou termos de busca) adotada adequada, pois, conforme Bohmerwald (2005, p. 100), importante a utilizao de terminologia que seja conhecida e, conseqentemente, compreendida pelo usurio, em vez de termos comuns aos profissionais da informao ou da biblioteconomia. No uso do sistema de busca da BDPF, oito professoras-aprendentes consideram o nvel de dificuldade de fcil a mdio, na localizao da informao solicitada e trs assinalaram ter dificuldades em realizar a tarefa. O resultado demonstrou que a terminologia adotada facilita a busca da informao, principalmente por disponibilizar a relao dos termos adotados na indexao do contedo disponibilizado. As atividades 5 e 8 foram aplicadas com a finalidade de evidenciar se o menu suficiente para orientar o uso da BDPF e a localizao das informaes solicitadas. Para atender essa categoria, foram dadas as seguintes instrues: Instruo 5 - Visualizar o vdeo (que est relacionado com a crtica a Paulo Freire) com o seguinte ttulo (observao: no utilizar o sistema de busca para tal, mas sim, outra seo do menu superior): depoimento de Jos Genono; Instruo 8 - Acessar o seguinte link nacional, a partir da pgina da Biblioteca Digital Paulo Freire: Revista Nova Escola On-Line. No teste de usabilidade, quando a tarefa solicitava no usar a ferramenta de busca, tnhamos a inteno de perceber se seria fcil localizar a informao usando apenas o menu disponvel nas barras de ferramenta, tanto superior como inferior. Nessa questo, as professoras-aprendentes expressaram facilidade na localizao, mas, na tarefa 8, duas delas no conseguiram localizar a informao porque, no equipamento em que elas acessaram, no havia o programa Adobe Acrobat ou um programa que ajudasse a visualizar um arquivo em PDF. Nesse momento da pesquisa, queramos saber se a interface da BDPF possibilitava uma explorao fcil dos contedos, recorrendo, principalmente, aos menus. Em relao categoria 1, se aprende rpido ao usar a BDPF, as questes 4 e 5 indicam a percepo das professores-aprendentes a respeito da visualizao das imagens, uma vez que, para isso, teriam que acessar outros recursos multimdia, como imagem e som. As professoras-aprendentes consideraram que as imagens na BDPF so de fcil localizao e visualizao. Sete conseguiram realizar as atividades. A avaliao mostrou que as duas professoras-aprendentes que no conseguiram visualizar o vdeo enfrentaram a dificuldade de o software necessrio no estar instalado na mquina. Nas questes do ps-teste, as professoras-aprendentes P4, P8 e P11, mesmo tendo realizado as atividades, no responderam as questes do ps-teste. P4 e P8 consideraram como muito fcil GT2 327

encontrar as informaes, mas, ao terem que visualizar as imagens, tarefa que requer um pouco mais familiaridade com as TICs, elas no conseguiram executar, justificando no ter respondido as questes do ps-teste, como vemos na fala de P4: no tenho muita experincia com computador, preciso me aperfeioar melhor. Em relao facilidade de uso dessa Biblioteca apresentada pelas professoras-aprendentes nas questes sobre os pontos positivos e negativos, fica evidente que elas perceberam mais pontos positivos do que negativos. A maioria das respostas evidencia que a BDPF um ambiente de aprendizagem interativo, com facilidade de acesso aos usurios para pesquisa e novos conhecimentos, como mostram as falas seguintes: P1 a praticidade; P2 facilidade de acesso para pesquisa e informaes corretas; P3 a facilidade de acesso a informao; P5 oportunidade a novos conhecimentos; P6 facilita o acesso para a pesquisa; P7 facilitar o acesso pesquisa; P9 de fcil acesso; P10 fcil acesso; menu claro e explicativo. Em relao aos pontos negativos da BDPF, apenas P1 se pronunciou: o manuseio do computador ainda difcil. Tambm assumindo uma posio, P10 declarou: no vejo pontos negativos, j que a facilidade permite o acesso de pessoas sem um conhecimento aprofundado de computao. Na avaliao geral que as professoras-aprendentes fazem da BDPF, opinam sobre o sistema de busca, o contedo e a aparncia da BDPF, que foram investigados nas questes em relao ao sistema de busca, algumas pistas revelam a interao das professoras-aprendentes com a BDPF: excelente; timo, faclimo; muito prtico; interessante; proveitoso; muito boa; muito bom. Complementando essas pistas de interao, P5 considerou o sistema de busca interessante... nos ajuda a ampliar nossos conhecimentos. P6 tambm opinou que o sistema de busca bastante proveitoso para pesquisa, e o contedo disponibilizado muito positivo. P10 ponderou: bom o sistema de busca da BDPF, mas acrescenta: no obtive sucesso na busca avanada. Quanto disposio do contedo, as professoras-aprendentes registraram: muito bom; tima; satisfatria; muito positivo; excelente; importante. P6 opinou que o contedo disponibilizado muito positivo. Em relao disposio do contedo no menu, P10 expressou: importante, pois centraliza os temas que abordam Paulo Freire. Essa fala nos leva a intuir que o fato de atuar na rea da pedagogia faz com que P10 considere importante o uso do contedo freireano para a construo do material didtico e a reflexo de sua prtica educativa. Esse momento de reflexo importante porque se baseia na conscincia da capacidade de pensamento, que caracteriza o ser humano como criativo e no como mero reprodutor de ideias e prticas que lhes so impostas. importante lembrar que esse o primeiro contato das professoras-aprendentes com a BDPF. Quando no temos familiaridade como o uso de um site, sempre apresentamos dificuldades de interao. Entretanto, a resposta de P5 no a impediu de se satisfazer com o contedo disponvel. Neste ponto, Ferreira e Souto (2006) explicitam que a interface de uma biblioteca digital, antes de gerar qualquer frustrao ao usurio, deve satisfaz-lo. Isso significa que a interface no deve retardar a resposta, mas permitir que o usurio obtenha ajuda na interao. Em termos de interao, a BDPF apresenta, em sua interface, informaes em mltiplos formatos, tais como: imagens, hipertextos, grficos, vdeos e diferentes formas de visualizao do seu contedo, disponibilizando os softwares para download. Alm do mais, promove uma visualizao GT2 328

geral do seu contedo, possibilitado pelo menu em cascata, que vai abrindo ao deslizar do mouse, e o usurio percebe como est organizado o contedo nela disponibilizado, iniciando com apresentao dos contedos relativos obra do educador e, depois, vem a crtica, que contm obras de outros autores sobre o pensamento freiriano, os objetos multimdia disponveis na biblioteca e os instrumentos de busca, com a opo de busca simples ou avanada. Em relao questo da aparncia da BDPF ou design grfico, as respostas das professorasaprendentes pontuaram: gostei muito; muito boa; tima; excelente; boa; simples e elegante. Neste contexto, das falas, P5 declarou: Ainda no tenho uma opinio formada a esse respeito. Analisando a fala da professora, percebemos pouca familiaridade com o uso da internet, demonstrando certo desconhecimento sobre a interface da biblioteca. Entretanto, ela realizou todas as atividades e considerou o grau de dificuldade em localizar a informao como fcil. Fazendo uma observao mais completa, P10 fez uma revelao sobre o visual da BDPF, caracterizando-o como Simples, completo e elegante, em especial, a pgina principal, que ela considerou excelente. H, nesse posicionamento de P10, a presena de uma srie de caractersticas desejveis em uma interface para uma biblioteca digital. De forma geral, as professoras-aprendentes demonstraram uma avaliao positiva da BDPF, como foi possvel constatar nas falas de P2, e P6, que consideram a BDPF nota dez, e P7, que a classificou como excelente. A opinio de P3 tambm foi positiva em relao BDPF: facilita no racionamento do tempo do professor que trabalha em mais de uma escola. Nesta direo, P9 afirma: muito bom e de muita utilidade para ns educadores. J P5 considera a BDPF como positiva, visto que nos mantm bem informados acerca no s de Paulo Freire, como tambm de outros autores, o que demonstra interesse em conhecer e usar o contedo freireano. P10, por sua vez, refere: s posso avaliar positivamente, pois o acesso foi sem dificuldades. Entretanto, P1 assim se expressou: no fcil, porque ainda no entendo bem os comandos do computador. Os posicionamentos das professoras-aprendentes permitem-nos avaliar a BDPF como dispositivo adaptvel, que promove a visualizao global do contedo freireano em mltiplos formatos e oferece mecanismos de recuperao desse contedo de modo consistente. Ento, podemos afirmar que a BDPF no tem problemas? importante salientar que as professoras-aprendentes admitem no ter prtica no uso de bibliotecas digitais, sendo essa a sua primeira experincia. Elas conseguiram, com certa facilidade, realizar todas as atividades solicitadas, tais como visualizar os hipertextos, vdeos e sons e, por se sentirem satisfeitas com o uso do dispositivo, atriburam-lhe a nota mxima, considerando-o excelente. 5 CONSIDERAES FINAIS As TICs constituem um importante meio para dar voz aos excludos do mundo digital e, assim, incrementar a incluso de todas as pessoas na educao mediada pelas tecnologias, independente de cor, idade, gerao, orientao sexual, deficincia etc. Todavia, para que a relao educacional se caracterize como um dilogo de ideias importante que cada sujeito do processo educativo possa revelar e tornar explcita a maneira como faz as coisas e, por conseguinte, o conhecimento de que GT2 329

dispe e como est pensando esse conhecimento. Assim sendo, ao trazermos essa discusso para o campo onde realizamos a pesquisa, foi possvel perceber que, na escola pesquisada, os computadores so usados para navegar na internet, mas no como forma de expandir a cognio dos/as alunos/as. Apenas acessar a internet no realiza a incluso digital/social. Assim, caberia aos educadores/as a tarefa de examinar criticamente os discursos e as prticas de incluso digital/social desenvolvidas em contextos escolares. Nesta linha de discusso, as bibliotecas digitais podem ser compreendidas como dispositivos de incluso digital/social que possibilitam aos professores (as) /alunos (as) o rpido acesso informao, e seu uso, ampliando as possibilidades de aprendizagem. Isso possvel pelas novas formas de acesso e uso e de aplicao das TICs, que tm ocasionado mudanas substantivas nas formas de aprendizagem dos sujeitos, alterando significativamente a autonomia da mente humana e os sistemas culturais. Nessa insero crtica dos indivduos no seu processo histrico, a BDPF pode ser mobilizada como um dispositivo de incluso digital/social, capaz de propiciar condies para os/as professores/as da escola pblica se apropriarem dos contedos disponveis e construam novos contedos. As professoras-aprendentes apresentam um perfil positivo, pois tm formao acadmica adequada e experincia de sala de aula. importante destacar que a maioria delas no conhecia e nunca havia acessado a BDPF, demonstrando desconhec-la. A pouca facilidade para lidar com o computador, no causou dificuldades para as onze participantes do teste de usabilidade da BDPF. Considerando ter sido o primeiro contato das professoras-aprendentes com a BDPF podemos inferir que ela um espao virtual rpido e fcil. Constatamos, ainda, que as informaes contidas no guia de usurio so suficientes para orientar quanto ao uso e localizao das informaes e atribumos a isso a facilidade de uso. Assim sendo, possvel considerar, a partir do ponto de vista das professoras-aprendentes, que a BDPF um solo frtil para as estratgias de ensino-aprendizagem no s por conter informaes indexadas, organizadas e disponibilizadas digitalmente e que podem e devem ser utilizadas para propiciar reestruturao do conhecimento, mas tambm oferecer possibilidades para a construo do prprio caminho do usurio na busca da informao relevante para compor o material didtico a ser utilizado em sala de aula. Do mesmo modo que acontece com as demais bibliotecas digitais, a BDPF ainda pouco usada pelos (as) professores (as) da rede pblica como fonte de informao para a construo do material didtico. Por fim, consideramos que as bibliotecas digitais so cada vez mais necessrias para o acesso ao conhecimento, por disponibilizarem uma informao sistematizada, organizada, de fcil acesso e com boa navegabilidade. Percebemos, portanto, a necessidade de que seja mais usada e divulgada entre os (as) professores (as) que precisam ter acesso informao indispensvel construo dos contedos pedaggicos a serem trabalhos em sala de aula. Como estratgia, podemos pensar que as duas reas do conhecimento - Cincia da Informao e Educao - podem trabalhar conjuntamente para minimizar as questes da escola e compreender que as bibliotecas digitais esto disponibilizadas na internet para serem usadas tambm com fins pedaggicos.

GT2 330

ABSTRACT: It reflects on digital libraries as a device for information access and use and its contribution to education, by means of information and communication technologies use in the school routine. It aims at analyzing Paulo Freire Digital Library (BDPF) with regard to the access and use of Freires content by teachers of a municipal public school of Joo Pessoa, Paraba. Paulo Freire Digital Librarys design, at the Federal University of Paraba (UFPB), had the purpose of democratizing knowledge, by decentralizing Paulo Freires thought from the written culture (printed format) so as to replace it into the digital one, with the goal of disseminating such an educators intellectual production as well as his interpreters and critics one through digital technology. Keywords: information access and use, digital library, education, digital inclusion, Paulo Freire Digital Library. REFERNCIAS AQUINO, M. A. et al. Recuperao do contedo freireano para construo da Biblioteca Digital Paulo Freire. (Projeto de Iniciao Pesquisa). Joo Pessoa: PIBIC/CNPq/UFPB, 2001. AQUINO, M. A. Metamorfoses da cultura: do impresso ao digital, criando novos formatos e papis em ambientes de informao. Cincia da Informao, Braslia, DF, v. 33, n. 2, 7-14, maio/ago. 2004. ARAGO JNIOR, M. L.; BRENANND, E. G. G. Relatrio Tcnico-Cientfico da Pesquisa Concepo e Implementao da Biblioteca Digital Paulo Freire. (Relatrio Projeto de Iniciao Pesquisa). Joo Pessoa: PIBIC/CNPq/UFPB, 2004. ASSMANN, H. A Metamorfose do aprender na sociedade da informao. Cincia da Informao, 29 (2), 7-15, maio/ago. 2000. BARDIN, Laurence. Anlise de Contedo: Lisboa: Edies 70, 2010. BOHMERWALD, P. Uma proposta metodolgica para avaliao de bibliotecas digitais: usabilidade e comportamento de busca por informao na biblioteca digital da PUC - Minas. Cincia da Informao, Braslia, DF, v. 34, n. 1, p. 95-105, jan./abr. 2005. BRENANND, E. G. G. et al. Concepo e Implementao da Biblioteca Digital Paulo Freire. (Projeto de Iniciao Pesquisa). Joo Pessoa: PIBIC/CNPq/UFPB, 2000. BRENNAND, E. G. G.; BEZERRA, E. P. Construindo redes comunicacionais: a Biblioteca Digital Paulo Freire. In: Comunicao Cientfica, 25 Congresso Brasileiro de Cincias da Comunicao. [CD-ROM]. Salvador: Sociedade Brasileira de Estudos Interdisciplinares da Comunicao2002 BRUNNER, J. J. Educao no encontro com as novas tecnologias. In: TEDESCO, J. C. (Org.) Educao e novas tecnologias: esperana ou incerteza? Braslia, DF: UNESCO, 2004. CASTELLS, M. A sociedade em rede. So Paulo: Paz e Terra, 1999. CUNHA, M. B. Construindo o futuro: a biblioteca universitria brasileira em 2010. Cincia da Informao, Braslia, DF, v. 29, n. 1, p. 71-89, jan./abr. 2000.

GT2 331

CUNHA, M. B.; McCARTHY, C. Estado atual das bibliotecas digitais no Brasil. In: MARCONDES, C. H. et al. (Org.) Bibliotecas digitais: saberes e prticas. 2. ed. Braslia, DF: IBICT, 2006. p. 25-54. DELEUZE, G. O que dispositivo? In: ______. O mistrio de Ariana. 2. ed. Lisboa: Passagens, 2005. p. 83-96. DEMO, P. Desafios modernos da educao. 3. ed. Petroplis, RJ: Vozes, 1995. DIAS, C. Usabilidade na Web: criando portais mais acessveis. Rio de Janeiro: Alta Books, 2003. FERREIRA, K. G. Teste de Usabilidade. 60f. Trabalho de concluso de Curso (Especializao em Informtica) - Curso de Especializao em Informtica, Universidade Federal de Minas Gerais, Belo Horizonte, 2002. FERREIRA, S. M. S. P.; SOUTO, P. C. N. (2206). A Interface do usurio e as bibliotecas digitais. In: MARCONDES, C. H. et al. (Org.) Bibliotecas digitais: saberes e prticas. 2. ed. Braslia, DF: IBICT, 2006. p. 187-204. FLECHA, R.; TORTAJADA, I. Desafios e sadas educativas na entrada do sculo. In: IMBERNON, F (Org.) A educao no sculo XXI: os desafios imediatos. Porto Alegre: Artmed, 2000. FREIRE, P.; GUIMARES, S. Sobre educao. 3. ed. Rio de janeiro: Paz e Terra, 2003. LVY, P. As tecnologias da inteligncia: o futuro do pensamento na era da informtica. Rio de Janeiro: Editora 34, 1993. (Coleo TRANS). PARENTE, A. O virtual e o hipertextual. Rio de Janeiro: Pajulin, 1999. PERAYA, D. O Ciberespao: um dispositivo de comunicao e de formao midiatizada. In: ALAVA, S. (Org.) Ciberespao e formaes abertas: rumo a novas prticas educacionais? Porto Alegre: Artmed, 2002. SANTOS, B. S.; RADTKE, M. L. Incluso digital: reflexes sobre a formao docente. In: N. PELLANDA, M. C; SCHLNZEN, E. T. M.; SCHLNZEN JNIOR, K. (Org.) Incluso digital: tecendo redes afetivas / cognitivas. Rio de Janeiro: DP&A, 2005. p.327-343. SILVA, M. Sala de aula interativa. Rio de Janeiro: Quartet, 2000. SILVINO, A. M. D.; ABRAHO, J. I. Navegabilidade e incluso digital: usabilidade e competncia. RAE-eletrnica, v. 2, n. 2, jul./dez. 2003. Disponvel em: <http://www16.fgv.br/rae/ eletronica/index.cfm?FuseAction=Artigo&ID=1808&Secao=CI%C3%8ANCIA&Volume=2&Num ero=2&Ano=2003>. Acesso em: 20 mar. 2011. TAKAHASHI, T. Sociedade da Informao no Brasil: o livro verde. Braslia, DF: Ministrio da Cincia e Tecnologia, 2000. VIRILIO, P. O espao crtico: e as perspectivas do tempo real. Rio de Janeiro: Edio 34, 1993.

GT2 332

COMUNICAO ORAL

MAPA CONCEITUAL E TERMINOLGICO PARA A CINCIA DA INFORMAO: UM ESTUDO EXPLORATRIO PARA SUA ELABORAO
Vnia Mara Alves Lima Resumo: Apresenta um estudo exploratrio para coleta de conceitos/termos no domnio da Cincia da Informao de forma a elaborar um mapa conceitual e terminolgico da rea. O referencial para elaborao desse instrumento passa pelos referenciais tericos da terminologia, assim como pelos princpios e critrios para a elaborao de mapas conceituais e ontologias. O corpus, para coleta dos conceitos/termos consiste nos artigos publicados entre 2008 e 2010 nas revistas cientficas do domnio relacionadas no Qualis. Como referncia para categorizao desses conceitos/termos utilizam-se os grupos de trabalho do ENACIB que representam o estado da arte das pesquisas no pas. Palavras-chave: Mapa conceitual. Cincia da Informao. 1 INTRODUO Neste trabalho realiza-se um estudo exploratrio de coleta dos conceitos/termos no domnio da Cincia da Informao para a elaborao de um mapa conceitual e terminolgico da rea. A necessidade de se elaborar um mapa conceitual e terminolgico da Cincia da Informao se deve em primeiro lugar ao fato de que a rea considerada ainda um campo cientfico em constituio, interdisciplinar, cujos conceitos so tomados de emprstimo de outras disciplinas como a Lgica, a Lingustica, as Cincias da Computao, etc. e muitas vezes os termos utilizados no refletem conceitos, mas remetem a procedimentos prticos e ou instrumentos que regulamentam suas aplicaes (SMIT; TLAMO; KOBASHI, 2004). Em segundo lugar, a que essa interdisciplinaridade demanda novas perspectivas educacionais de forma a contribuir para o desenvolvimento dos diferentes segmentos sociais, tanto do ponto de vista cultural quanto econmico; alm de preparar as novas geraes no apenas para absorver, mas, sobretudo, para produzir e novos conhecimentos. Como a produo de novos conhecimentos, em qualquer rea, est diretamente ligada apropriao, por parte de seus futuros profissionais e/ou pesquisadores, dos conceitos que a constituem, torna-se imprescindvel buscar alternativas didtico-pedaggicas, para a formao desses quadros, assim como elaborar instrumentos que permitam determinar a estrutura conceitual dos domnios no ensino, na pesquisa e na atuao profissional. A elaborao de um mapa conceitual e terminolgico, alm dos referenciais tericos e metodolgicos da terminologia (CABR, 1987; 1995; FELBER, 1987, ISO, 1990, 2000; BARROS, GT2 333

2004) deve considerar tambm os critrios, princpios e normas para a elaborao de topic maps e ontologias (ROVIRA, 2005; MOREIRO, 2004; FEITOSA, 2006, THELLEFSEN, 2004). O termo mapa conceitual tem origem nos trabalhos de psicologia da aprendizagem de Joseph D. Novak, nos anos 60,onde seria um instrumento para tornar visvel, na forma de um grfico, a aprendizagem das crianas. Ao ordenar um grupo de proposies sobre um determinado assunto em forma de rvore, onde os conceitos seriam os ns e a ligao entre os ns demonstrariam os relacionamentos entre os conceitos conectados seria possvel representar o conhecimento sobre esse assunto e assim, prover aprendizagem (ROVIRA, 2005). Os mapas conceituais representam graficamente o conhecimento, j que os conceitos aparecem interligados em redes cognitivas formadas por ns (conceitos) e laos (relaes entre conceitos) e podem ser construdos com vrios objetivos: gerar ideias, desenhar estruturas complexas (sites da web, hipermdia); para comunicar ideias complexas; para auxiliar na aprendizagem e integrar o conhecimento novo ao antigo (MOREIRO, 2004). Do ponto de vista do ensino e aprendizagem os mapas conceituais so definidos como instrumentos que buscam dar uma viso geral de um assunto ou rea possibilitando o planejamento de aes, atravs do fornecimento de grande quantidade de dados e estimulando a soluo de problemas, permitindo uma percepo de novos caminhos criativos dentro de um conjunto (BUZAN, 2005 apud FENDRICH e PEREIRA, 2006). Segundo Moreiro (2004) o processo para a construo de um mapa conceitual segue as seguintes etapas: seleo dos conceitos que sero representados no mapa, lista desses conceitos, agrupamento dos conceitos relacionados (categorizao), ordenao dos conceitos em forma bidimensional ou tridimensional; estabelecimento de relaes entre cada par de conceitos mediante etiquetas (modo preposicional ou proposicional). J o termo topic map, surge a partir da elaborao de uma norma internacional, a ISO/ IEC 13250, no incio dos anos 90 pelos editores de livros eletrnicos, conhecido como Grupo de Davenport, cujo objetivo armazenar e processar a informao a partir de um formato padronizado. Rovira (2005) distingue mapa conceitual de topic map, pois considera que o mapa conceitual tem como preocupao a aprendizagem a partir da representao do conhecimento e os topic maps se preocupam com a representao do conhecimento para seu armazenamento e recuperao. Ao relacionar as diferenas e semelhanas entre mapa conceitual e topic map, observa que possvel modelar um mapa conceitual a partir da norma para os topic maps, pois os dois objetivos so complementares visto que a aprendizagem, ou aquisio do conhecimento, depende tanto da sua representao quanto da possibilidade do seu armazenamento, recuperao e disseminao. Assim, a norma ISO/IEC 13250 ao estabelecer regras para a representao da informao desde a definio dos conceitos at as relaes existentes entre eles torna-se parmetro para a elaborao de um mapa conceitual que funcione tambm como um topic map nos sistemas de recuperao de informao. Moreiro (2004) observa tambm que devido estruturao semntica que oferece e dos laos GT2 334

que estabelece, a norma denominada o GPS do universo da informao, pois tem se mostrado uma soluo para navegar e organizar os crescentes recursos de informao, publicaes de todos os tipos, especialmente os sites da web, alm de estabelecer uma ponte entre os campos do conhecimento e a gesto da informao. O termo ontologia surge na Filosofia, definido como o estudo do ser e de suas propriedades fundamentais. De acordo com a etimologia da palavra, ontos (ser) e logos (saber) entende-se ontologia no seu aspecto existencial: um saber sobre aquilo que fundamental, comum a todos os entes singulares; e no seu aspecto essencial: busca determinar as leis, estruturas ou causas do ser em si (FEITOSA, p.70, 2006). A pergunta que a ontologia pretende responder : quais tipos de coisas existem ou podem existir no mundo, e quais so as relaes que essas coisas podem ter umas com as outras. A teoria ontolgica pretende representar o conhecimento humano de maneira estruturada, onde parte da essncia de cada fenmeno ou objeto e estabelece suas relaes com outras essncias, isto , investiga quais so as propriedades e ou caractersticas essenciais de maneira a representar objetos, conceitos ou outras entidades existentes em uma rea de interesse, bem como as relaes entre tais objetos, conceitos e entidades; estruturando o conhecimento atravs de categorias. Ao se preocupar com as relaes entre conceitos e com a sua estruturao para representar um domnio do conhecimento, a ontologia aproxima-se da terminologia e dos mapas conceituais e pode colaborar na construo do mapa conceitual e terminolgico pretendido, pois especifica as categorias fundamentais da existncia, isto , classifica os conceitos e examina as distines que sustentam cada fenmeno no mundo. Segundo Gomez-Prez (1999 apud FEITOSA, p.75, 2006) alguns princpios bsicos devem ser seguidos para a estruturao de ontologias, os quais so vlidos tambm para a elaborao de um mapa conceitual e terminolgico: - clareza e objetividade: uma ontologia deve fornecer o significado dos termos definidos, fornecendo definies objetivas e tambm documentao em linguagem natural; - completeza: uma definio expressa por condies necessrias e suficientes prefervel a uma definio parcial; - coerncia: para permitir inferncias que sejam consistentes com as definies; - maximizao da extenso: novos termos gerais ou especializados devem ser includos na ontologia de modo que no seja necessrio realizar a reviso das definies j existentes; - comprometimento ontolgico mnimo: fazer a menor quantidade possvel de declaraes sobre o mundo que est sendo modelado, isto , especificar, em um contexto to pequeno quanto possvel, os significados de seus termos; - princpio da distino ontolgica: as classes de uma ontologia devem ser desmembradas, o critrio para isolar a propriedade invariante para uma classe o critrio da identidade; - diversificao de hierarquias: usar tantos critrios de classificao quanto possvel, o que permite GT2 335

herdar propriedades a partir de diferentes pontos de vista; - modularidade: reduo da distncia semntica entre conceitos similares, os quais so agrupados e representados como subclasses de uma classe e devem ser definidos utilizando-se as mesmas propriedades, enquanto conceitos menos similares so representados mais apartados na hierarquia; - padronizao: os nomes devem ser padronizados quando possvel. Feitosa (p. 77, 2006) resume da seguinte maneira os vrios conceitos e aplicaes de uma teoria ontolgica: uma ontologia define vrios conceitos de um domnio do conhecimento, por meio de um vocabulrio; uma aplicao faz uso dos objetos, por meio de axiomas e de regras lgicas; tais regras dizem como utilizar os conceitos referenciados, com vistas soluo de problemas em particular; h sempre uma estrutura que melhor representa o domnio do conhecimento, mas tal estrutura depende dos objetivos do sistema e, por isso, deve obedecer a certos princpios; existem nveis de formalismo a serem estabelecidos, os quais tero inferncia determinante na efetividade do sistema; mas tambm se conformam aos objetivos do sistema. Portanto, somando-se os procedimentos ontolgicos aos terminolgicos na construo de um mapa conceitual e terminolgico podemos elaborar um instrumento capaz de representar o conhecimento de um domnio, aumentar a capacidade de recuperao da informao relevante diante da interdisciplinaridade das reas e da diversidade do uso profissional, alm de contribuir para a apropriao do conhecimento atravs dos processos de cognio e deciso embasados nas relaes de significao identificadas pelo sujeito que o utiliza. Segundo Thellefsen (2004) ele inicia-se a partir do estabelecimento de um perfil de conhecimento do domnio que se quer mapear. Para criar o perfil de conhecimento de um domnio deve-se em primeiro lugar considerar o conceito mais geral que tem influncia nesse domnio. Esse conceito mais geral tambm denominado de signo fundamental a ideia central de um domnio de conhecimento. A terminologia do domnio centrada no signo fundamental. O signo fundamental consiste na soma dos termos de um domnio e cada termo do domnio s pode ser entendido em relao ao signo fundamental. O signo fundamental uma entidade abstrata a qual contem um potencial a ser desenvolvido. Ao elaborar um perfil do conhecimento mantm-se o projeto na trilha terminolgica. Assim, necessrio conhecer a base epistemolgica do domnio, ou seja, a maneira como se desenvolvem seus conceitos e teorias, seus objetos de pesquisa e os domnios correlatos, a partir de um signo fundamental, alm de estabelecer as categorias, isto , conceitos elementares, princpios que permitem identificar um conceito como pertencente a um domnio do conhecimento. Neste trabalho, considera-se que o conceito mais geral, ou signo fundamental da Cincia da Informao a informao, pois cabe a Cincia da Informao, estabelecer os princpios e prticas da criao, organizao e distribuio da informao, bem como investigar as propriedades e o comportamento da informao em todas as suas formas e suportes; estudar as foras que governam os fluxos de informao, os meios utilizados para o seu processamento, sua disseminao, alm de procurar garantir sua acessibilidade e usabilidade a qualquer usurio (SMIT e BARRETO, 2002, p. GT2 336

17-18 apud LOUREIRO, 2006; CUNHA; CAVALCANTI, 2008, p.81). A operacionalizao desse mapa conceitual e terminolgico inicia-se com a definio primeiramente, do pblico a que ele quer atingir e em segundo lugar, com a delimitao de um corpus para coleta desses conceitos, o que, tratando-se de uma cincia to interdisciplinar como a Cincia da Informao e que agrega em seu escopo reas como a Biblioteconomia, a Documentao, a Arquivologia e a Museologia, s possvel a partir de instrumentos de procuram representar e disseminar a convergncia das pesquisas realizadas, o que o caso das revistas cientficas e dos eventos da rea. Por esse motivo, considera-se como pblico de um mapa conceitual e terminolgico do domnio da Cincia da Informao os seus pesquisadores, por princpio, usurios e criadores dos conceitos pertencentes ao domnio e como corpus para a coleta de conceitos, nesse estudo exploratrio, as palavras-chave, atribudas pelos pesquisadores, aos 487 artigos publicados nas revistas cientficas da rea, referenciadas no QUALIS, entre 2008 e 2010 e os termos propostos para a indexao, atribudos aos mesmos artigos, pelo Sistema de Indizacon Semi-Automtica SISA. A incluso de termos a partir em um processo de indexao semi-automtico deve-se ao fato de o software utilizado permitir a anlise do texto completo dos artigos e o seu cotejamento com um instrumento de controle terminolgico interdisciplinar, no caso o Vocabulrio Controlado do Sistema Integrado de Bibliotecas da Universidade de So Paulo - VOCAUSP. Da mesma maneira, definem-se como norteadores das categorias desse mapa conceitual e terminolgico, os Grupos de Trabalho do ENANCIB - Encontro Nacional de Pesquisa em Cincia da Informao, evento da Associao Nacional de Pesquisa e Ps-graduao em Cincia da Informao, que rene os pesquisadores da rea por temas e representam o estado da arte das pesquisas no pas. 2 METODOLOGIA Devido ao grande escopo terico-metodolgico proposto, isto delinear o mapa conceitual e terminolgico do domnio da Cincia da Informao, nesse estudo exploratrio, de coleta e categorizao dos conceitos desse domnio, definimos como corpus terminolgico de pesquisa os 487 artigos publicados nas principais revistas da rea da Cincia da Informao no Brasil relacionadas no Sistema Qualis no perodo 2008-2010 que pudessem ser exportados do formato pdf para o formato txt. O Sistema Qualis da Coordenadoria para Aperfeioamento de Pessoal de Nvel Superior CAPES um conjunto de indicadores para a avaliao de peridicos cientficos brasileiros e as revistas selecionadas foram: Cincia da Informao; Transinformao; Datagramazero, Encontros Bibli, Informao & Sociedade, Revista Digital de Biblioteconomia e Cincia da Informao, Revista Brasileira de Biblioteconomia e Documentao e Ponto de Acesso. Os conceitos foram coletados, a partir das palavras-chave atribudas pelos autores em seus artigos, e a partir da indexao automtica utilizando-se o software SISA (Sistema de Indizacin Semi GT2 337

Automtica). A utilizao desse instrumento permitiu coletar os conceitos pertencentes ao domnio da Cincia da Informao relevantes no texto e que no foram indicados como palavras chave pelos autores, ampliando-se assim o escopo do mapa conceitual. Ao software SISA foi incorporado, como base terminolgica, o Vocabulrio Controlado do Sistema Integrado de Bibliotecas da Universidade de So Paulo (VOCAUSP), por ser o nico em lngua portuguesa a abranger as reas das Cincias Humanas, Exatas e Biolgicas. Na coleta das palavras-chaves no foram considerados os nomes prprios e de instituies, por serem entidades cujas formas de representao so normalizadas no mbito da representao descritiva e no da representao temtica. Da mesma maneira no foram considerados os nomes geogrficos. J o SISA segue os seguintes critrios para a coleta de termos (Gil Leiva, 1999, p.123): se um termo autorizado aparece no ttulo e no resumo, ele se apresenta como um termo de indexao; se um termo autorizado aparece no ttulo e no corpo do texto, ele se apresenta como um termo de indexao; se um termo autorizado aparece no resumo e no corpo do texto, ele se apresenta como um termo de indexao; se uma palavra semivazia, palavra no encontrada no vocabulrio controlado de referncia, aparece no ttulo, no resumo e no corpo do texto, ela se apresenta como um termo candidato indexao; se uma palavra semivazia aparece no corpo do texto dez vezes ou mais e, alm disso, em oitos pargrafos diferentes ou mais, e no est includa no vocabulrio controlado, ela se apresenta como termo candidato indexao. Os dois primeiros critrios, segundo Gil Leiva (1999), se devem importncia dos ttulos e dos resumos na indexao dos documentos. O terceiro critrio utilizado para atribuir valor aos termos que apaream no corpo do texto. Os dois ltimos critrios possibilitam que um novo termo, no includo no vocabulrio controlado, possa ser convertido em termo de indexao. A partir da anlise dos resultados foram selecionados como conceitos a serem inicialmente incorporados ao mapa conceitual e terminolgico, tanto as palavras chave quanto os termos propostos pelo SISA que obtiveram 5 ocorrncias ou mais. Esses conceitos foram agrupados em categorias de acordo com as ementas dos GTs do ENANCIB. Ao mesmo tempo, procurando-se identificar quais as reas tem sido objeto do maior nmero de produo cientfica, agrupamos os artigos como um todo tambm de acordo com os GTs do ENANCIB. Por ltimo realizamos algumas consideraes sobre os resultados e indicamos as prximas etapas da pesquisa. 3 RESULTADOS 3.1 Resultados referentes s Palavras-chave Foram coletadas 1193 palavras-chave totalizando com 2099 ocorrncias em 487 artigos publicados entre 2008-2010 nas revistas: Cincia da Informao; Transinformao; Datagramazero, Encontros Bibli, Informao & Sociedade, Revista Digital de Biblioteconomia e Cincia da Informao, Revista Brasileira de Biblioteconomia e Documentao e Ponto de GT2 338

Acesso. Foram retiradas palavras-chave referentes a nomes prprios, eventos, instituies, ttulos de obras publicadas e locais geogrficos restando 1121 palavras chave com 2048 ocorrncias. A seguir o quadro 1 indica a relao entre o nmero de palavras chave e o nmero de ocorrncias. Nmero de Ocorrncias 5 ou mais ocorrncias 4 ocorrncias 3 ocorrncias 2 ocorrncias Apenas 1 ocorrncia Total Nmero de palavras chave 72 20 46 142 841 1121 % 6 2 4 13% 75% 100%

Quadro 1 Resultado das palavras-chave em relao ao nmero de ocorrncias Observa-se que a maioria das palavras-chave atribudas aos artigos, aproximadamente 75%, aparece apenas uma vez no universo da amostra, indicando uma alta especificidade na indexao por parte dos autores. Por outro lado, apenas 72 palavras chave, 6%, aparecem 5 vezes ou mais, indicando conceitos mais gerais que so sempre utilizados pelos autores na representao de seus trabalhos. O quadro 2 relaciona essas 72 palavras chave e o nmero de ocorrncias de cada uma para anlise. Nmero de Ocorrncias* 66 36 26 21 20 19 18 17 16 15

Palavras-Chave CINCIA DA INFORMAO INFORMAO GESTO DO CONHECIMENTO GESTO DA INFORMAO SOCIEDADE DA INFORMAO BIBLIOTECRIOS TECNOLOGIAS DE INFORMAO E COMUNICAO - TICS COMPETNCIA EM INFORMAO BIBLIOTECAS UNIVERSITRIAS BIBLIOTECAS; PROFISSIONAIS DA INFORMAO GT2 339

BIBLIOMETRIA; INCLUSO DIGITAL CIENTOMETRIA; SISTEMAS DE INFORMAO CONHECIMENTO; ESTUDO DE USURIOS BIBLIOTECAS DIGITAIS; ONTOLOGIAS; ORGANIZAO DO CONHECIMENTO; PRODUO CIENTFICA COMUNICAO CIENTIFICA; EDUCAO A DISTNCIA; TECNOLOGIA DA INFORMAO ORGANIZAO DA INFORMAO RECUPERAO DE INFORMAO BIBLIOTECA ESCOLAR; BIBLIOTECONOMIA; DISCURSO; FLUXOS DE INFORMAO; INTERDISCIPLINARIDADE; MEMRIA; NECESSIDADES DE INFORMAO; REDES SOCIAIS; USOS DE INFORMAO; WEB SEMNTICA ANLISE DE CITAES; BUSCA E USO DE INFORMAO; COMUNICAO; FONTES DE INFORMAO; INDICADORES; INFORMETRA; INTELIGNCIA COMPETITIVA; INTERNET; LEITURA; LIVROS; MEDIAO; METADADOS; PESQUISA EM CINCIA DA INFORMAO; TECNOLOGIA; USABILIDADE; USURIOS; USURIOS DA INFORMAO ACESSIBILIDADE; ACESSO LIVRE; ARQUITETURA DA INFORMAO; BASES DE DADOS; COMPARTILHAMENTO DE CONHECIMENTO; COMPETNCIAS; EDUCAO; TICA; TICA INFORMACIONAL; INDEXAO; INFORMAO E TECNOLOGIA; INOVAO; LINGUAGENS DOCUMENTRIAS; PERIDICOS ELETRNICOS; PS-GRADUAO; PRODUTIVIDADE DOS AUTORES; REPOSITRIOS DIGITAIS; SOFTWARE LIVRE; WEB 2 0

14 13 12 11 10 9 8

Quadro 2 Relao das palavras-chave com 5 ou mais ocorrncias na amostra coletada * para cada uma das palavras-chave relacionadas na coluna anterior. Verifica-se que o conceito com o maior nmero de ocorrncias indica o prprio domnio Cincia da Informao, e que em segundo lugar aparece o conceito considerado como signo fundamental do domnio, ou seja, Informao. De acordo com a representao realizada pelos prprios autores poderamos inferir que os temas mais presentes na produo cientfica publicada nos dois ltimos anos seriam por demais genricos.

3.2 Resultados dos Termos propostos Indexao Automtica GT2 340

Dentre os 656 termos propostos pela indexao automtica que totalizaram 3824 ocorrncias foram considerados em um primeiro momento apenas aqueles reconhecidos como pertencentes rea da Cincia da informao, cerca de 210 termos que totalizam 1821 ocorrncias. O quadro 3 indica a relao entre o nmero de termos propostos e o nmero de ocorrncias Nmero de ocorrncias 5 ocorrncias ou mais 4 ocorrncias 3 ocorrncias 2 ocorrncias Apenas 1 ocorrncias Total Nmero de termos propostos pelo SISA 71 9 22 33 75 210 % 34 4 10 16 36 100

Quadro 3 Resultado dos termos propostos em relao ao nmero de ocorrncias Observa-se um maior equilbrio entre os termos propostos com maior nmero de ocorrncias, aproximadamente 34% e os termos propostos com apenas uma ocorrncia, aproximadamente 36%, quando da utilizao de um software de indexao com base terminolgica. A seguir relacionamos no Quadro 4 os 71 termos propostos pelo software SISA com 5 ocorrncias ou mais para anlise. Termos Propostos CONHECIMENTO PESQUISA CINCIA SOCIEDADE INFORMAO BIBLIOTECAS TECNOLOGIA BIBLIOTECONOMIA PERIDICOS DOCUMENTOS PAPEL Nmero de Ocorrncias* 166 156 150 75 64 62 53 42 40 37 33

GT2 341

ENSINO; INTRANET TEORIA DOS NS LEITURA FONTES DE INFORMAO CULTURA COMPORTAMENTO DISCURSO; MEMRIA LINGUAGEM ACERVO; COMUNIDADES DOMNIO; TICA; PBLICO ARQUIVSTICA ESTRUTURAS; SEMNTICA; SISTEMAS NUMRICOS ARQUIVOS; AUTORIA; LIVROS; METADADOS; PARADIGMA; SUJEITO BASES DE DADOS; CINCIA DA INFORMAO; REVISTAS PERIDICOS CIENTFICOS; SIGNIFICADO ARTIGOS DE PERIDICOS; BIBLIOMETRIA; DIAGNSTICO; SENTIDOS; TERMINOLOGIA COLETA DE DADOS; ESCRITA; FILOSOFIA; MERCADO DE TRABALHO; REDES SOCIAIS; SOFTWARES ANLISE DE CONTEDO; ATITUDES; BIBLIOTECA UNIVERSITRIA; COMPETNCIA INFORMACIONAL; COMPUTADORES; ONTOLOGIA; POLTICAS PBLICAS; PRODUTIVIDADE ANLISE DO DISCURSO; BIBLIOTECA DIGITAL; CINCIA DA COMPUTAO; EPISTEMOLOGIA; LEI DE LOTKA; LGICA; LGICA MODAL; PESQUISA CIENTFICA; RESPONSABILIDADE SOCIAL; RESUMOS; SOCIEDADE DO CONHECIMENTO
Quadro 4 Relao dos termos propostos na indexao automtica com 5 ou mais ocorrncias. * para cada um dos termos propostos relacionados na coluna anterior.

32 30 29 23 20 19 18 17 16 15 14 13 12 11 10 9 8

GT2 342

Observa-se que os termos propostos com maior nmero de ocorrncias tambm so por demais genricos como: Conhecimento, Pesquisa, Cincia, Sociedade, Informao, Biblioteca, Tecnologia, etc. 3.3 Resultados palavras-chave x termos propostos O quadro a seguir relaciona os conceitos com 5 ocorrncias ou mais que aparecem tanto como palavras-chave quanto como os termos propostos e seu respectivo nmero de ocorrncias nas duas situaes.
Nmero de Ocorrncias Palavra-chave 5 14 15 11 16 7 66 17 12 7 5 6 36 6 6 7 6 11 5 7 6 Nmero de Ocorrncias Termos propostos 11 9 11 6 7 42 11 7 166 18 15 23 64 29 12 18 12 7 7 8 53

Conceitos coincidentes BASES DE DADOS BIBLIOMETRIA BIBLIOTECAS BIBLIOTECAS DIGITAIS BIBLIOTECAS UNIVERSITRIAS BIBLIOTECONOMIA CINCIA DA INFORMAO COMPETNCIA EM INFORMAO CONHECIMENTO DISCURSO TICA FONTES DE INFORMAO INFORMAO LEITURA LIVROS MEMRIA METADADOS ONTOLOGIAS PRODUTIVIDADE DOS AUTORES REDES SOCIAIS TECNOLOGIA

GT2 343

Quadro 5- Relao de conceitos coincidentes nas palavras-chave e nos termos propostos Observa-se que os 21 conceitos indicados tanto como palavras-chave quanto como termos propostos indicam 30% de coincidncia entre a indexao dos autores e a indexao automtica dos artigos. Dentre esses conceitos, destaca-se o conceito Cincia da Informao com maior nmero de ocorrncias enquanto palavra-chave, isto , atribudo pelos autores, constituindo-se como um conceito indispensvel em aproximadamente 35% do conjunto de 487 os artigos. Observa-se tambm, que os demais conceitos relacionados identificam o domnio da Cincia da Informao com o seu subdomnio mais tradicional, a Biblioteconomia, ao relacionar conceitos como Bibliotecas, Livros, Bibliometria, Fontes de informao, indicando poucos novos conceitos como Metadados, Ontologias e Redes sociais. 3.4 Resultados palavras-chave e termos propostos categorizados de acordo com os GTs do

ENANCIB A seguir, os 143 conceitos, com 5 ocorrncias ou mais, seja como palavras-chave ou como termos propostos, so categorizados de acordo com as ementas dos grupos de trabalho do ENANCIB, na tentativa de se identificar os conceitos elementares do mapa conceitual e terminolgico da Cincia da Informao. O ENANCIB Encontro Nacional de Pesquisa em Cincia da Informao um frum de debates e reflexes, promovido pela ANCIB Associao Nacional de Pesquisa em Cincia da Informao e organizado por um programa de ps-graduao na rea, o qual tem por objetivo reunir os pesquisadores da Cincia da Informao organizados em Grupos de Trabalho (GTs) por temas de interesse para a pesquisa, conforme relacionados no site da entidade: GT 1: Estudos Histricos e Epistemolgicos da Cincia da Informao: Estudos Histricos e Epistemolgicos da Cincia da Informao. Constituio do campo cientfico e questes epistemolgicas e histricas da Cincia da informao e seu objeto de estudo - a informao. Reflexes e discusses sobre a disciplinaridade, interdisciplinaridade e transdisciplinaridade, assim como a construo do conhecimento na rea. GT 2: Organizao e Representao do Conhecimento: Teorias, metodologias e prticas relacionadas organizao e preservao de documentos e da informao, enquanto conhecimento registrado e socializado, em ambincias informacionais tais como: arquivos, museus, bibliotecas e congneres. Compreende, tambm, os estudos relacionados aos processos, produtos e instrumentos de representao do conhecimento (aqui incluindo o uso das tecnologias da informao) e as relaes inter e transdisciplinares neles verificadas, alm de aspectos relacionados s polticas de organizao e preservao da memria institucional. GT 3: Mediao, Circulao e Apropriao da Informao: Estudo dos processos e das relaes entre mediao, circulao e apropriao de informaes, em diferentes contextos e tempos histricos, considerados em sua complexidade, dinamismo e abrangncia, bem como relacionados GT2 344

construo e ao avano do campo cientfico da Cincia da Informao, compreendido em dimenses inter e transdisciplinares, envolvendo mltiplos saberes e temticas, bem com contribuies tericometodolgicas diversificadas em sua constituio. GT 4: Gesto da Informao e do Conhecimento nas Organizaes: Gesto da informao, de sistemas, de unidades, de servios, de produtos e de recursos informacionais. Estudos de fluxos, processos e uso da informao na perspectiva da gesto. Metodologias de estudos de usurios. Monitoramento ambiental e inteligncia competitiva no contexto da Cincia da Informao. Redes organizacionais: estudo, anlise e avaliao para a gesto. Gesto do conhecimento e aprendizagem organizacional no contexto da Cincia da Informao. Tecnologias de Informao e comunicao aplicadas gesto. GT 5: Poltica e Economia da Informao: Polticas de informao e suas expresses em diferentes campos. Sociedade da informao. Informao, Estado e governo. Propriedade intelectual. Acesso informao. Economia poltica da informao e da comunicao; produo colaborativa. Informao, conhecimento e inovao. Incluso informacional e incluso digital. GT 6: Informao, Educao e Trabalho: Campo de trabalho informacional: atores, cenrios, competncias e habilidades requeridas. Organizao, processos e relaes de trabalho em unidades de informao. Sociedade do Conhecimento, tecnologia e trabalho. Sade, mercado de trabalho e tica nas profisses da informao. Perfis de educao no campo informacional. Formao profissional: limites, campos disciplinares envolvidos, paradigmas educacionais predominantes e estudo comparado de modelos curriculares. O trabalho informacional como campo de pesquisas: abordagens e metodologias. GT 7: Produo e Comunicao da Informao em CT&I: Medio, mapeamento, diagnstico e avaliao da informao nos processos de produo, armazenamento, comunicao e uso, em cincia, tecnologia e inovao. Inclui anlises e desenvolvimento de mtodos e tcnicas tais como bibliometria, cientometria, informetria, webometria, anlise de rede e outros, assim como indicadores em CT&I. GT 8: Informao e Tecnologia: Estudos e pesquisas terico-prticos sobre e para o desenvolvimento de tecnologias de informao e comunicao que envolvam os processos de gerao, representao, armazenamento, recuperao, disseminao, uso, gesto, segurana e preservao da informao em ambientes digitais. GT 9: Museu, Patrimnio e Informao: Anlise das relaes entre o Museu (fenmeno cultural), o Patrimnio (valor simblico) e a Informao (processo), sob mltiplas perspectivas tericas e prticas de anlise.Museu, patrimnio e informao: interaes e representaes.Patrimnio musealizado: aspectos informacionais e comunicacionais. GT10: Informao e Memria: Estudos sobre a relao entre os campos de conhecimento da Cincia da Informao e da Memria Social. Pesquisas transdisciplinares que envolvem conceitos, teorias e prticas do binmio informao e memria. Memria coletiva, colees e colecionismo, GT2 345

discurso e memria. Representaes sociais e conhecimento. Articulao entre arte, cultura, tecnologia, informao e memria, atravs de seus referenciais, na contemporaneidade. Preservao e virtualizao da memria social. O Quadro 6 relaciona os conceitos indicados tanto como palavras-chave quanto como termos propostos pelo SISA com os GTs do ENANCIB a partir de suas ementas . Conceitos Cincia, Cincia da informao; Biblioteconomia, Conhecimento, Compartilhamento de Conhecimento; Gesto do conhecimento; Interdisciplinaridade; Epistemologia; tica; tica informacional; Filosofia Anlise de contedo; Anlise do discurso; Discurso; Domnio; Escrita; Estruturas; Indexao; Linguagem; Linguagens documentrias; Lgica; Lgica modal; Metadados; Ontologias; Organizao da informao; Organizao do conhecimento; Paradigma; Recuperao de informao; Resumos; Semntica; Sentidos; Significado; Terminologia Comunidades; Cultura; Leitura; Livros; Mediao; Necessidades de informao; Pblico; Sociedade; Sociedade da informao ; Sociedade do Conhecimento; Sujeito; Usos de informao Atitudes; Biblioteca escolar; Biblioteca universitria; Bibliotecas; Competncia em informao; Competncias; Comportamento; Estudo de usurios; Fluxos de informao; Fontes de informao; Gesto da informao; Inteligncia Competitiva; Usurios Acessibilidade; Acesso livre ; Biblioteca digital; Busca e uso de informao; Incluso digital; Polticas pblicas; Repositrios digitais; Responsabilidade social; Redes sociais; Teoria dos ns Bibliotecrios; Profissionais da informao; Educao; Educao a distncia; Ensino; Ps-graduao Anlise de citaes; Artigos de peridicos; Autoria; Bibliometria; Cientometria; Coleta de dados; Comunicao cientifica; Diagnstico; Indicadores; Informetra; Lei de Lotka; Comunicao; Comunicao cientifica; Peridicos; Peridicos cientficos; Peridicos eletrnicos; Pesquisa; Pesquisa cientfica; Pesquisa em Cincia da Informao; Produo cientfica; Produtividade; Revistas Bases de dados; Computadores; Informao e Tecnologia;Inovao; Internet ;Intranet; Sistemas de informao; Sistemas numricos; Software livre; Softwares; Tecnologia; Tecnologia da informao ;Usabilidade; Web 2 0; Web semntica Acervo; Arquivstica; Arquivos; Documentos; Memria; Papel GTs GT 1

GT 2

GT 3

GT 4

GT 5

GT 6 GT 7

GT 8

GT 10

Quadro 6 - Palavras-chave e termos propostos categorizados pelos GTs do ENANCIB GT2 346

Observa-se que a maioria dos conceitos relacionados podem ser categorizados como pertencentes aos GTs 7, 2, 8, 4 e 3, os quais representam o ciclo informacional e documentrio, ou seja, produo, organizao atravs do desenvolvimento de tecnologias de informao para mediao e circulao da informao; conceitos elementares da Biblioteconomia e da Documentao. J os conceitos relacionados as questes epistemolgicas, polticas e histricas, tratadas nos GTs 1,5 e 6 so em menor nmero. Destaca-se ainda que os conceitos relacionados s questes da Arquivologia so incipientes e que no h conceitos identificados s questes relativas ao patrimnio e aos museus objeto do GT 9. Aqui, podese chegar a trs concluses, uma de que no h trabalhos sobre essas questes, outra, que o instrumento terminolgico adotado no contempla esses conceitos, ou ainda, os autores, ao generalizarem a sua indexao acabam por dificultar a recuperao de seus trabalhos. Por esse motivo, tomou-se a deciso de categorizar os artigos, como um todo, a partir dos dois processos de indexao. 3.5 Resultados dos artigos categorizados de acordo com os GTs do ENANCIB O Quadro 7 apresenta a seguir a categorizao dos artigos como um todo, a partir da anlise comparativa: das palavras-chave atribudas pelos autores, dos termos propostos, atribudos pela indexao automtica realizada pelo SISA, assim como de seus ttulos e resumos, com as ementas dos GTs do ENANCIB: Nmero de artigos 27 75 31 127 41 42 68 57 4 15

Grupo de Trabalho GT 1: Estudos Histricos e Epistemolgicos da Cincia da Informao GT 2: Organizao e Representao do Conhecimento GT 3: Mediao, Circulao e Apropriao da Informao GT 4: Gesto da Informao e do Conhecimento nas Organizaes GT 5: Poltica e Economia da Informao GT 6: Informao, Educao e Trabalho GT 7: Produo e Comunicao da Informao em CT&I GT 8: Informao e Tecnologia GT 9: Museu, Patrimnio e Informao GT10: Informao e Memria

% 6 15 6 26 8 9 14 12 1 3

GT2 347

Total

487

100

Quadro 6 Categorizao dos artigos como um todo de acordo com as ementas dos GTs do ENANCIB Observa-se que a maioria, 26% dos artigos publicados, foi includa no GT4 Gesto da Informao e do Conhecimento nas Organizaes. Em segundo lugar, com 15% dos artigos publicados surge o GT 2 Organizao e Representao do Conhecimento, em terceiro lugar encontra-se o GT 7 Produo e Comunicao da Informao em CT&I com 13%, seguido do GT 8 Informao e Tecnologia com 12%. Abaixo dos 10% dos artigos publicados esto o GT 6 Informao, Educao e Trabalho com 9%; o GT 5 Poltica e Economia da Informao com 8%; o GT 3 Mediao, Circulao e Apropriao da Informao com 7% ; o GT 1 Estudos Histricos e Epistemolgicos da Cincia da Informao com 6%; o GT 10 Informao e Memria com 3% e por fim o GT 9 Museu, Patrimnio e Informao com apenas 1% dos artigos publicados. Observa-se que atualmente mais da metade das pesquisas, 54%, no domnio da Cincia da Informao, tem se concentrado nos subdomnios da gesto, organizao e produo da informao. Por outro lado as pesquisas relacionadas s questes sociais, histricas e interdisciplinares da rea como poltica, educao, trabalho, memria e patrimnio somam 34% e os trabalhos voltados para a interface com a tecnologia completam a amostra com 12%. Assim, poderamos esboar o incio de um mapa conceitual e terminolgico da Cincia da Informao, a partir do seu signo fundamental, a informao, com o seguinte esboo de suas principais categorias e suas relaes com alguns termos coletados como exemplo:

GT2 348

Quadro 7: Esboo de Mapa conceitual da CI 4 CONSIDERAES FINAIS A Cincia da Informao nasce sob o signo da interdisciplinaridade e o seu desenvolvimento tem oscilado entre o humano e o tecnolgico e apesar da exigncia de resoluo de seus aspectos tcnicos, os assuntos principais da rea esto relacionados esfera do social ao politico; ao social e ao cultural (SARACEVIC apud PINHEIRO; LOUREIRO, 1995, p.51). Ao contrrio, os resultados obtidos nesta etapa da pesquisa demonstram que a produo cientfica publicada nas revistas da rea continua voltada para as questes da organizao e da gesto da informao sendo poucos os trabalhos com vis social e poltico. Da mesma maneira, os resultados demostram que apesar do domnio da Cincia da Informao envolver as reas da Biblioteconomia e Documentao, Arquivologia e Museologia os conceitos elementares obtidos a partir da amostra considerada, e reunidos de acordo com as ementas que regem os grupos de pesquisa da rea, referem-se em sua maioria as questes da Biblioteconomia com foco mais especfico na organizao e gesto da informao e do conhecimento nas organizaes. Os resultados demonstram tambm que as questes sociais tem sido objeto de um nmero menor de trabalhos, assim como as questes interdisciplinares que levem em considerao no s as tradicionais unidades de informao como as bibliotecas, mas tambm os museus e os arquivos. Os resultados reforam a concepo da informao como signo fundamental do domnio da Cincia da Informao, cujos processos tericos e metodolgicos para sua organizao, representao, GT2 349

recuperao e disseminao constituem o objeto de estudo. Por outro lado, no pode se deixar de considerar a funo social e poltica da informao como fator de incluso e de acesso ao conhecimento dentro da sociedade. Assim, infere-se que o mapa conceitual e terminolgico do domnio da Cincia da Informao deve abranger no s as questes pragmticas de organizao e gesto da informao, mas deve incluir os conceitos relacionados aos processos de mediao, memria e apropriao da informao enquanto instrumento de transformao de uma sociedade. Como prxima etapa da pesquisa, a ser desenvolvida, alm da categorizao dos demais conceitos indicados com menor nmero de ocorrncias, considera-se essencial um levantamento nas estruturas curriculares dos cursos de Biblioteconomia, Arquivologia e Museologia para se identificar quais conceitos que esto sendo trabalhados na formao dos novos profissionais. imprescindvel verificar se os conceitos ministrados em sala de aula refletem tambm apenas essa viso pragmtica e organizacional da rea. Assim, espera-se obter um mapa conceitual e terminolgico da Cincia da Informao que no s apresente o estado atual da rea, mas tambm indique suas lacunas, de maneira que possa orientar o ensino e pesquisa. Abstract : Presents an exploratory study to collect concepts / terms in the field of information science in order to produce a terminological and conceptual map of the area. The framework for the elaboration of this instrument includes the theoretical terminology, as well as the principles and criteria for the preparation of a conceptual map and ontologies. The core collection of concepts / terms consists of articles published between 2008 and 2010 in journals listed in the domain Qualis. As a reference for categorization of these concepts / terms are used to working groups ENACIB representing the state of the art research in the country. Keywords: 1. Conceptual map 2. Information Science REFERNCIAS BARROS, L. A. Curso bsico de terminologia. So Paulo: EDUSP, 2004. BIOLCHINI, J.C de A Semntica na representao do conhecimento: do vocabulrio controlado ontologia. In: ENCONTRO NACIONAL DE PESQUISA EM CINCIA DA INFORMAO, V, 2003, Belo Horizonte. Informao, conhecimento e transdisciplinaridade: Anais. Belo Horizonte: Escola de Cincia da Informao da UFMG, 2003. 21 p CABR, M. T. La terminologia hoy: concepciones, tendncias y aplicaciones. Cincia da Informao, Braslia, v.24, n.3, p.289-298, set./dez. 1995. CABR, M. T. La terminologia: teoria, metodologia e aplicaciones. Barcelona: Antrtida/ Empries, 1993 CUNHA, M. B. da; CAVALCANTI, C. R. de O. Dicionrio de biblioteconomia e arquivologia. Braslia: Briquet de Lemos, Livros, 2008. FELBER, H. Manuel de terminologie. Paris: UNESCO, 1987. GT2 350

FENDRICH, L J; PEREIRA, L. 2006. Ensinar e Aprender no Ensino Superior Atravs de Mapas Conceituais In: XIII SIMPEP - Bauru, SP, Brasil, 6 a 8 de Novembro. FEITOSA, A. Organizao da informao na web: das tags web semntica. Braslia: Thesaurus, 2006 GIL LEIVA, I. La automatizacon de la indizacin de documentos. Gijn (Asturias): Ediciones Trea, 1999. ISO. Terminologie - vocabulaire: ISO 1087. Geneve: ISO, 1990 ISO. Terminology work principles and methods: ISO 704, Geneve: ISO, 2000. LOUREIRO, M. Organizao da informao no ambiente virtual por meio de mapas conceituais: A importncia da terminologia. Biblios. v.28, p.2-10, abr./jun., 2007. MOREIRO GONZALEZ, J. De los tesauros a los topic maps: nuevo estandar para la representacin y la organizacin de la informacin. Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n.18, 2 sem. 2004. PINHEIRO, L. V.R.; LOUREIRO, J.M.M. Traados e limites da Cincia da Informao, Cincia da Informao, Braslia, v.24, n.1, p.42-53, jan./abr., 1995. ROVIRA, C. DigiDocMap conceptual maps editor and Topic Maps norms [en linea]. Hipertext.net, n. 3, 2005. Disponvel em: http://www.hipertext.net Acesso em 31/01/2011. SMIT, J.W.; TLAMO, M de F. G. M; KOBASHI, N. Y. A determinao do campo cientfico da Cincia da Informao: uma abordagem terminolgica. Datagramazero Revista de Cincia da informao, v.5, n.1, fev. 2004. Disponvel em: www.datagramazero.com.br Acessado em 15/04/2011. THELLEFSEN, T. Knowledge profile: the basis for knowledge organization. Library Trends, v.52, n.3, p. 507-514, winter, 2004

GT2 351

COMUNICAO ORAL

A PRECISO NAS LINGUAGENS DE INDEXAO: UM ESTUDO COM A TEMTICA DA HOMOSSEXUALIDADE MASCULINA


Fabio Assis Pinho, Jos Augusto Chaves Guimares Resumo: Os estudos sobre a tica na Organizao e Representao do Conhecimento, especialmente no Tratamento Temtico da Informao, tm colaborado para sedimentar os referenciais tericos e metodolgicos da Cincia da Informao, que se justificam pelo pressuposto da incluso social que, enquanto um metavalor, se situa entre o preconceito social e o proselitismo, formando um cenrio em que trs universos axiolgicos convivem: o do documento ou informao, o do usurio e o do bibliotecrio. Por isso, a indexao est ligada a uma dimenso tica porque deve preocupar-se com sua confiabilidade e utilidade em relao a determinadas comunidades discursivas ou domnios especficos. Nesse sentido, prope-se, por meio de uma pesquisa exploratria e documental, com caractersticas qualitativas e indutivas, identificar a mxima especificidade terminolgica que linguagens de indexao brasileiras permitem para termos relativos homossexualidade masculina, analisando como corpus investigativo os termos atribudos aos artigos cientficos de Journal of Homosexuality, Sexualities e Journal of Gay & Lesbian Mental Health, entre os anos de 2005 a 2009. Do cotejo e anlise dos termos e das linguagens de indexao brasileiras verifica-se uma aproximao de significados no contexto brasileiro, impreciso terminolgica, com indcios de preconceitos disseminados atravs do politicamente correto, representao inadequada da temtica e a presena de figuras de linguagem. Palavras-chave: tica informacional. Representao do conhecimento. Figuras de linguagem. 1 INTRODUO A Representao do Conhecimento, no mbito da Organizao e Representao do Conhecimento (ORC), especificamente na sua vertente do Tratamento Temtico da Informao (TTI), vai muito alm de um fazer tcnico e as preocupaes, cada vez mais, voltam-se para a dimenso social da rea, seus impactos para os usurios e, como decorrncia, o papel desempenhado pelo profissional1. Nesse contexto, especial importncia assume o papel do profissional da informao em relao a uma atuao tica no que tange concepo de um bem fazer e de um bem atuar, visto que as competncias especficas para os profissionais que trabalham com o tratamento temtico no se esgotam no como fazer, mas encontram terreno frtil de indagao no porque fazer e no para que fazer, principalmente porque necessrio levar em conta que tanto o produto quanto o processo
1 Lpez-Huertas (2008), na condio de ex-presidente e atual vice-presidente da ISKO, delineia um cenrio de tendncias de pesquisa na rea de Organizao do Conhecimento, dando especial destaque s questes sociais.

GT2 352

de representao devem estar imbudos da preocupao com a sua utilidade e sua adequao para determinada comunidade ou grupo-alvo2. com esse cenrio que se estabelece o tema deste trabalho, ou seja, os aspectos ticos na representao do conhecimento, particularmente, no que tange preciso. Sabe-se que o processo, o instrumento e os produtos da representao do conhecimento no so neutros, uma vez que seus idealizadores impem uma viso de mundo particular, refletindo posies ideolgicas e polticas. Por isso, a possibilidade de ocorrer bias na representao do conhecimento factvel, e por esse motivo a necessidade de identificao de valores envolvidos, uma vez que eles so norteadores das atividades dos profissionais que trabalham na ORC. Entretanto, o que so essas biases? Na literatura de Lngua Inglesa o termo bias , por vezes, utilizado para designar alguma ocorrncia de preconceito e o seu significado. De acordo com Hornby (1995, p. 104, traduo nossa), uma opinio ou sentimento que favorece fortemente um dos lados em um argumento ou uma coisa em um grupo, s vezes injustamente; um preconceito. Ou seja, o entendimento do termo bias na Lngua Inglesa versa sobre uma influncia geralmente tendenciosa sobre algo ou algum. Na Lngua Portuguesa, bias traduzido como tendncia, inclinao, preconceito e, tambm, vis. Poder-se-ia destacar, ainda, os sentidos de desvio, que, segundo Houaiss (2001, p. 1021-1022) so vrios como, por exemplo: mudana do caminho, da direo ou da posio normal, [...] afastamento dos padres, [...] qualquer fuga aos padres normais [...]. Nesse sentido, desvios so considerados afastamentos ou mudanas em relao quilo que considerado normal e, em relao a esse trabalho acrescenta-se, pela sociedade em relao aos seus valores e at comportamento. Dessa maneira, o entendimento de bias enquanto desvio versa sobre o sentido de que, no mbito da representao do conhecimento, quando atividades ou produtos so constitudos tendo uma tendncia ou viso preponderante, isto , um sentimento que venha a se sobrepor (e tambm a prejudicar) outros, subentende-se que est ocorrendo uma mudana, um afastamento ao tratamento igualitrio que essa atividade ou produto deve representar. Esse entendimento baseia-se na explicao que Hjrland (2008, p. 256, traduo nossa) faz de bias, no que tange ORC, como normalmente entendida como uma palavra com carga negativa, como algo a ser evitado ou minimizado [...], ou seja, algo que deva ser afastado, mudado e, portanto, portador de desvios. Em vista do exposto, a problemtica da pesquisa reside na incipincia de estudos verticalizados sobre os aspectos ticos na indexao, particularmente em relao preciso terminolgica, uma vez que encontra respaldo enquanto uma etapa do processo de Anlise Documental (se adotada a corrente terica francesa), da Indexao (corrente inglesa) ou da Catalogao de Assunto (corrente norteamericana) (GUIMARES, 2008). Em um recorte para mais claramente identificar tal questo, tem-se o universo temtico da homossexualidade masculina, cuja produo literria ainda padece de representao documental
2 Destaca-se aqui a fora semntica do termo suitability (em ingls), valendo-se da metfora da vestimenta, evidenciando o aspecto da adequao.

GT2 353

adequada, devido ausncia de um vocabulrio controlado que seja voltado para esse domnio; tampouco existe, no momento, uma normalizao vocabular que propicie uma satisfatria indexao de documentos relativos ao tema. Nesse caso, o uso de uma linguagem normalizada facilita a busca realizada pelo usurio e tambm permite uma maior preciso. O profissional bibliotecrio ao indexar no intuito de buscar substitutos para o conhecimento estabelece rtulos, o mais das vezes permeado por certa subjetividade. Sem dvida, tal fazer est baseado em um contexto cultural e ideolgico e, por isso, est sujeito que as crenas pessoais do profissional interfiram na representao do conhecimento que est em anlise naquele momento. Dessa maneira, se estabelece o recorte deste trabalho, ou seja, os aspectos ticos na representao do conhecimento de temticas relativas homossexualidade masculina. A questo da homossexualidade masculina constitui um domnio do conhecimento que se materializa por meio de uma terminologia cientfica. Esse recorte leva em considerao a anlise de domnio proposta por Hjrland e Albrechtsen (1995) e Hjrland (2002) que versa sobre o entendimento do objeto de estudo da Cincia da Informao a informao registrada e socializada por meio da anlise dos domnios do conhecimento como um todo ou de comunidades discursivas, sendo como uma das abordagens os estudos terminolgicos. Tambm leva em considerao a Teoria Comunicativa da Terminologia (TCT) de Cabr (2005), uma vez que a Terminologia se dedica observao do comportamento dos termos e sua relao com o conhecimento cientfico e, dessa maneira, aponta elementos tericos e princpios prticos capazes de nortear a busca, a seleo e a ordenao de termos daquele domnio do conhecimento. Alm disso, o recorte especfico em relao homossexualidade masculina se deve ao fato de que abranger outros assuntos relacionados resultaria em um excessivo alongamento de domnio e, por conseqncia, traria um prejuzo na anlise, pela falta de especificidade. Dessa forma, foram excludos termos relativos a categorias como, por exemplo, lesbianismo, deixando-os quando necessrio apenas a ttulo de explicao. De acordo com a situao comunicacional em que a terminologia utilizada, ela pode ativar ou no um valor especializado. Esses valores mantm um relacionamento polissmico uns com os outros. Dessa forma, a anlise deste trabalho deteve-se em termos oriundos de uma comunidade discursiva especfica, isto , homossexuais masculinos, e da materializao de seu discurso3 na produo cientfica, atravs de palavras-chave atribudas a artigos cientficos. E o que dizer da produo de conhecimento sobre a homossexualidade? O termo homossexual foi publicado no Brasil pela primeira vez, em 1906, na obra Homossexualismo: a libertinagem no Rio de Janeiro de Jos Ricardo Pires de Almeida. Mas foram necessrias mais oito dcadas para que, em 1986, se tivesse uma obra de carter antropolgico sobre a homossexualidade masculina no Brasil, com o ttulo Devassos no Paraso de Joo Silvrio Trevisan. Atualmente, possvel encontrar muitas obras sobre a homossexualidade masculina, inclusive como foco de produo e de revistas cientficas.
3 Discurso a interatividade da lngua. Para Bakhtin (1998, p. 225) o Discurso no reflete uma situao, ele uma situao. Ele uma enunciao que torna possvel considerar a performance da voz que o anuncia e o contexto social em que anunciado.

GT2 354

Esse fator importante porque a Cincia da Informao, e mais notadamente a ORC, foca seus processos, instrumentos e produtos naquilo que Buckland (1991) denomina informao-comocoisa, ou seja, o documento e prioritariamente a documentao cientfica (LE COADIC, 2004). Fazse importante tambm ressaltar o fato de que as linguagens de indexao so elaboradas a partir da produo cientfica, como bem destaca o princpio da garantia literria enunciado por Hulme (1911, 1912) e da comunidade discursiva. Para isso, leva-se em considerao o endosso do usurio, o princpio de uso (j preconizado por Cutter no sculo XIX) e o princpio da garantia do conhecimento (em ingls, knowledge warrant principle), ou seja, para que esse campo de domnio homossexualidade masculina possa ser organizado, necessria uma produo intelectual, j que a partir dessa realidade que os termos so identificados e disseminados por meio da terminologia estabelecida pela rea. Atualmente, os estudos relativos homossexualidade tm considerada visibilidade, o que roga ainda mais pela garantia de uso e pelo endosso do usurio porque, caso contrrio, a indexao dessa produo documental cairia em um vazio, o que significa que a maioria desses documentos seria indexada sob o conceito de homossexualidade, reduzindo a preservao especfica do seu contedo por dificuldades na recuperao, visto que a produo desse conhecimento no se limita a esse conceito. Nesse cenrio, a questo de pesquisa que se apresenta em relao problemtica diagnosticada aborda a necessidade de identificar se as linguagens de indexao brasileiras representam, com preciso, os contedos especficos relativos homossexualidade masculina, visto que, essas linguagens tm por objetivo representar o contedo de documentos cientficos por meio de uma terminologia de especialidade e, dessa maneira, possveis desvios podem interferir na preciso, decorrendo de preconceitos e figuras de linguagens como as metforas, eufemismos e disfemismos, por exemplo. As figuras de linguagem so recursos lingsticos sofisticados empregados como estratgia com intuito de se conseguir um determinado efeito seja em um texto ou em um dilogo, isto , no sentido comunicativo envolvendo emissor-receptor. A reviso de literatura realizada auxiliou na explicao das figuras de linguagem no mbito da representao do conhecimento, recorrendo-se aos estudos de Cabr (1995, 2005), bem como nos trabalhos de Hjrland e Albrechtsen (1995) e Hjrland (2002) sobre anlise de domnio. Alm disso, investigaram-se trabalhos sobre a homossexualidade, atravs do olhar da Cincia da Informao, como em Holder (2002) e Louro (2004), integrando-se questo tica na representao do conhecimento. Portanto, o objetivo geral deste trabalho foi identificar a mxima especificidade terminolgica que as linguagens de indexao brasileiras permitem para a representao de termos relativos homossexualidade masculina. 2 REPRESENTAO DO CONHECIMENTO E A HOMOSSEXUALIDADE MASCULINA A recuperao da informao no pode ser dissociada de duas etapas que a precede: o armazenamento e a indexao. Na etapa do armazenamento so tratados os aspectos fsicos da armazenagem como, por exemplo, mdias, servidores que possam abrigar as informaes. Na etapa da indexao so previstas questes de como sero realizadas a insero e combinao de palavras, bem GT2 355

como o destaque de assuntos principais e perifricos. Consequentemente, na recuperao so previstas as formas como ela acontecer, ou seja, qual(is) o(s) modelo(s) que far(o) parte: booleano, probabilstico, vetorial. Um sistema de recuperao da informao agrega um conjunto de procedimentos que, atravs de um software gerenciador, permite a armazenagem, indexao e recuperao, disponibilizando para isso um ndice de assuntos. A atividade de indexao deve ser realizada com o mximo de preciso possvel, levando-se em considerao o contexto e o contedo informacional. Sob esse aspecto, Foskett (1973, p. 377) lana a seguinte questo: ser possvel especificar todos os atributos de um dado conceito?. Nesse sentido, entende-se que o substrato da preciso a especificidade, ou seja, quanto mais especfico o assunto4, mais precisa necessita ser a representao e, ainda, quanto menos especfica a linguagem de indexao for, maior a dificuldade de usurios e indexadores no momento da indexao ou recuperao. E essa especificidade na representao ser tanto maior quanto mais especfico for o campo representado. No universo ora estudado, tem-se que as questes terminolgicas em temticas ligadas homossexualidade masculina passam por questes culturais, sobretudo pelo discurso, em que o grupo busca solidificar sua identidade. Entretanto, como ficam as figuras de linguagem interpostas em uma subcultura que, por vezes, modifica os sentidos dos conceitos em seus discursos? O uso das figuras de linguagem, no mbito da homossexualidade masculina, parte do princpio de que a identificao de uma terminologia est vinculada ao reconhecimento da natureza e dos propsitos daqueles que a utilizam em uma dada rea, nesse caso, uma subcultura; ou seja, essas figuras so apropriadas no sentido de revestirse de proteo contra um ambiente hostil e, por isso, tornam-se parte na esfera discursiva da construo de sua identidade. Os estudos sobre terminologia, enquanto um objeto de estudo, ou seja, o conjunto de termos de uma comunidade discursiva, encontram respaldo nos estudos de Cabr (1995; 2005). Nesse sentido, ao profissional da informao pertinente entender as questes terminolgicas nas quais suas atividades esto inseridas, particularmente, na representao do conhecimento, justamente porque isso se deve ao fato de que essa compreenso na maioria das vezes resultar em trabalhos de terminografia, em outras palavras, na prtica de elaborao de vocabulrios especializados (BARROS, 2004, p. 22). As pesquisas terminolgicas e terminogrficas resultam no conhecimento e na compreenso de uma rea do conhecimento vinculando-se ao domnio de sua linguagem, ou seja, no seu ncleo especfico, que seu vocabulrio que organizado e normalizado de forma lgica e semntica resulta na terminologia da rea (KOBASHI; SMIT; TLAMO, 2001). Com base no entendimento de que a comunidade homossexual reconhecida como uma comunidade discursiva e, portanto, objeto da anlise de domnio, como justificar o seu estudo no mbito da representao do conhecimento? Para Hjrland e Albrechtsen (1995, p. 400), o paradigma da anlise
4 Em que pese o distanciamento acerca da discusso sobre o conceito de assunto, ser adotada nesta tese a concepo de Hjrland (2003, p. 98) que definiu o assunto como as potencialidades epistemolgicas ou informativas do documento, sendo o trabalho dos indexadores identific-las.

GT2 356

de assunto social, trabalhando com vertentes da psicologia social, da Sociolingstica, da sociologia do conhecimento e est concatenada com a Cincia da Informao, inclusive porque essa ltima faz parte das Cincias Sociais. Alm disso, o autor observa que a anlise de domnio possui dois aspectos: o funcionalista e o realstico-filosfico, sendo o primeiro para entender as funes implcitas e explcitas da informao e comunicao; e o segundo, para entender os fatores que so externos s percepes subjetivas e individuais dos usurios. Um exemplo da figura de linguagem est materializado na palavra francesa phoque que significa, literalmente, foca em portugus, mas seu significado eufemstico/disfemstico diferente nas duas lnguas, ou seja, em francs homossexual masculino e em portugus jornalista iniciante ou recm-formado5. J em espanhol seu significado eufemstico/disfemstico de pessoa obesa. As mudanas semnticas no intuito de ajustar um significado esto presentes em alguns exemplos como o da palavra inglesa queer. O seu significado pode ser traduzido por estranho, ridculo, excntrico, raro e extraordinrio, contudo sinnimo de homossexual podendo designar um comportamento excntrico ou desviante. O significado dessa palavra possui duas matrizes, em que a primeira refere-se a uma srie de expresses consolidadas no senso comum homofbico, portanto, pejorativa; e a segunda refere-se ao contexto anglo-saxo cujo significado tem a ver com algo esquisito, inslito, raro, estranho. Holder (2002, p. 324) identificou, no contexto norte-americano, quatro significados para queer, a saber: pessoa bbada ou alcoolizada, uma pessoa alienada mental (implicando uma condio inofensiva e suave), um homossexual masculino (tanto no substantivo como no adjetivo) e, por fim, notas de dinheiro falsas. O autor salienta que o primeiro significado a ela atribudo, o de uma pessoa alcoolizada, est obsoleto. Com os estudos envolvendo a teoria queer, Louro (2004), por usa vez, afirma que queer refere-se ao indivduo marginalizado devido sua orientao sexual por uma que seja predominante. Dessa maneira, o significado da palavra tornou-se positivo, uma vez que era pejorativo. De disfemstica ela tornou-se eufemstica, mas esconde uma carga de preconceito haja vista seus demais significados. Outro exemplo trata-se da palavra inglesa gay. Literalmente, podemos traduzi-la como alegre ou feliz. Holder (2002, p. 160) informa que, no sculo XIX, uma prostituta poderia ser chamada de uma moa ou senhora alegre ou feliz e que, at a dcada de 1960, gay era sinnimo de alegre com uma ligeira indicao de embriaguez ou intoxicao, porm, atualmente seu significado remete a uma pessoa de orientao homossexual. Em que pese o contexto norte-americano6, existem diversos eufemismos para designar o homossexual masculino com caractersticas femininas, como por exemplo, butterfly (termo que faz aluso ao inseto diurno borboleta), sissy ou cissy (termos provavelmente originrios de uma corrupo de sister via sissy ou sis - irm), campy (afrescalhado, entretanto, sua origem obscura, esse termo revela uma responsabilidade natural das quais se podem reprovar), cupcake (apesar de no muito
5 Interessante notar que o equivalente eufemstico em ingls para jornalista iniciante ou recm formado cub cujo significado filhote ou escoteiro novato, conhecidos como lobinhos. 6 Baseado, principalmente, em Holder (2002, passim).

GT2 357

clara, a explicao para esse termo vem da caracterstica inofensiva, ou seja, um macho inofensivo, ineficaz), degenerate (significa deixar de ser capaz de funcionar como antes, dessa maneira, levando em considerao que o sexo funciona como a propagao da espcie, pode haver uma ligao com os homossexuais, entretanto, possui uma imagem de degradao e degenerao), divergence (aquele que se afasta da regra), effeminate (que possui caractersticas de mulher), fag (provavelmente por considerar os fumantes como afeminados), faggot (originrio de fag, como verbo significa copular e, como substantivo, prostituta), freak (um evento irracional ou monstruoso), entre outros. Esses exemplos demonstram a carga negativa que as expresses ou a palavras carregam, dessa forma, em muitos casos impossvel separar o eufemismo do disfemismo, pois no h uma diviso ntida, caracterizada principalmente pelas mudanas de contexto lingstico, dessa forma, o que um eufemismo hoje pode ser um disfemismo amanh. Acontece que muitas palavras, afastadas de seu significado original, so utilizadas com significados totalmente novos. Gay nos Estados Unidos preferido ao invs de Homosexual, porque esse ltimo remete a uma terminologia mdica que designava o indivduo como portador de uma patologia. Entretanto, homossexual preferido no Brasil ao invs de gay, sendo este ltimo utilizado muitas vezes com conotao pejorativa. Dessa maneira, gay ser usado em um contexto mais politizado ao contrrio de homosexual. Entende-se, ento, que a terminologia parte de uma linguagem real, com dados oriundos da documentao, para dar conta da denominao especializada; por isso, baseia-se nas palavras daquela especialidade, materializadas atravs do registro funcional da base temtica (CABR, 1995, p. 7). No que se refere aplicao da terminologia, Cabr (1995, p. 12) explica que ela serve representao e transferncia. Na funo de representao, a terminologia serve a algumas reas como a documentao, a engenharia lingstica e, nesse sentido, seus objetivos versam sobre a organizao do processo terminogrfico. Em relao documentao, a terminologia um elemento-chave para representar o contedo dos documentos e para acess-los. Na funo de transferncia, a terminologia serve fundamentalmente comunicao direta, mediao comunicativa e planificao lingstica. Entende-se, dessa forma, que o estudo das figuras de linguagem existentes no universo da homossexualidade masculina com vistas representao do conhecimento passa pela identificao de seu sistema lingstico, do seu universo lxico, o que resulta em conjuntos terminolgicos, visto que sero termos utilizados por aquele comunidade/subcultura, ou seja, um conjunto vocabular-cultural. Por isso, esse conjunto vocabular-cultural ou base lxica foi investigado no mbito da produo cientfica. 3 MATERIAL E MTODO O presente trabalho possui natureza exploratria e documental e, dessa forma, apresenta em sua dimenso aplicada, caractersticas qualitativas e indutivas, na medida em que desenvolve sua anlise a partir de um corpus composto de palavras-chave extradas de peridicos especializados em homossexualidade masculina (Journal of Homosexuality, Sexualities e Journal of Gay & Lesbian Mental Health), entre 2005 e 2009, situando-as em um universo especfico, qual seja, de trs abrangentes GT2 358

linguagens de indexao brasileiras (Vocabulrio Controlado Bsico do Senado Federal, o Vocabulrio Controlado da USP (Universidade de So Paulo) e a Terminologia de Assuntos da Fundao Biblioteca Nacional). 3.1 Corpus da Pesquisa Journal of Homosexuality dedica-se pesquisa acadmica sobre a homossexualidade, incluindo os subtemas como prticas sexuais e papis de gnero e sua diversidade cultural, histrica, interpessoal e contextos sociais modernos. Alm disso, os artigos publicados procuram explorar as implicaes polticas, sociais e morais da pesquisa sobre a sexualidade humana. Essa parte do corpus da pesquisa versou sobre os artigos publicados entre os anos de 2005 a 2009, o que corresponde aos volumes de nmero 48 a 56, em um total de 279 artigos, resultando em 544 palavras-chave.Sexualities de alcance internacional e se estabeleceu como uma fonte de pesquisa e de publicao de artigos no mbito dos estudos sobre a sexualidade humana. Nesse sentido, o escopo da revista, atravs de uma perspectiva interdisciplinar, cobre as reas de Cincias Sociais, Histria Cultural, Antropologia Cultural, bem como, os estudos de gnero, feminismo e os estudos sobre gays e lsbicas. Essa segunda parte do corpus da pesquisa versou sobre os artigos publicados entre os anos de 2005 a 2009, o que corresponde aos volumes de nmero 8 a 12, em um total de 132 artigos, resultando em 172 palavras-chave. Journal of Gay & Lesbian Mental Health um canal de comunicao cientfica interdisciplinar que agrega os profissionais e pesquisadores da rea de sade mental de gays, lsbicas, bissexuais, transexuais, transgneros etc., publicando artigos, revises, casos clnicos e revises crticas dessa literatura. Essa terceira parte do corpus da pesquisa versou sobre os artigos publicados entre os anos de 2005 a 2009, o que corresponde aos volumes de nmero 9 a 13, em um total de 108 artigos, resultando em 327 palavras-chave. Do corpus da pesquisa, ou seja, das trs revistas cientficas somaram-se 1705 palavras-chave candidatas indexao e, desse total, destacaram-se 93 que esto diretamente ligadas ao universo homossexual masculino sonegando as demais por tratarem de questes que, de certa forma, ampliariam o universo pesquisado. 3.2 Linguagens de Indexao Brasileiras As linguagens de indexao brasileiras utilizadas para a operao de traduo do corpus analisado foram: o Vocabulrio Controlado Bsico do Senado Federal, o Vocabulrio Controlado da USP Universidade de So Paulo e a Terminologia de Assuntos da Fundao Biblioteca Nacional, que esto disponveis publicamente pela internet. A escolha da primeira linguagem de indexao se deu pelo fato de que o Vocabulrio Controlado Bsico utilizado para a indexao dos registros bibliogrficos da rede de bibliotecas coordenada pela Biblioteca do Senado Federal. Esse Vocabulrio originado de tipos de literaturas diferentes pertencentes s bibliotecas da rede, cujos acervos variam de especializao. A escolha da segunda se deu por ser uma produo nacional emanada dos acervos de tal GT2 359

universidade (39 bibliotecas da USP que pertencem ao Sistema Integrado de Bibliotecas), que representam uma parte da produo nacional e refletem o trabalho de profissionais brasileiros. A escolha da terceira foi motivada pelo fato de ela ter como base o Cabealho de Assunto da Biblioteca do Congresso Norte-Americano. No se trata, no entanto, de uma traduo fiel, uma vez que os ajustes so elaborados pela Coordenadoria de Servios Bibliogrficos da Biblioteca Nacional e, alm disso, inmeros assuntos tm tratamento muito diferenciado na realidade brasileira em relao norte-americana. 4 ANLISE DOS DADOS A comparao entre as palavras-chave extradas das revistas e as linguagens de indexao brasileiras traz consigo uma abordagem qualitativa e indutiva. As 93 palavras-chave destacadas das revistas foram comparadas, conforme o quadro 1, abaixo, s linguagens de indexao com intuito de diagnosticar a especificidade da temtica no mbito do instrumento. Logo em seguida, fez-se uma anlise para identificar a adequao das palavras junto s linguagens. Palavras-chave 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Amor homoertico Anti-gay Anti-homossexualidade Atitudes anti-gay Armrio (Closet) Assumir-se Atitudes de apoio homossexualidade Ativismo gay Bareback (Sexo sem preservativo) Bares gays BDSM1 Bispos gays Bissexual Bissexualidade Homofobia Comportamento sexual VCB Senado Federal Homofobia Homossexualidade (Discriminao) Homossexuais (aspectos polticos) Bissexualidade VCA USP Homofobia Homossexualidade assumida Movimento de Libertao Gay Sadomasoquismo Ordenao de homossexuais Homens bissexuais Bissexualidade Terminologia FBN

GT2 360

15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37

Casamento gay Comunidade gay Coro gay Couro (Leather) Crossdresser Cruising2 (Caar) Desenvolvimento da identidade gay Direitos gays Dogging3 (Banheiro) Dois espritos4 Drag Queen Efeminao Efeminofobia Esteretipo Estigma Estudos gays Estudos LGBT Estupro masculino Fag hag (mulher amiga do gay) Famlia adotiva gay Filmes gays Frango5 (Chicken) Gay

Homossexualismo masculino

Unio Civil de Pessoas do Mesmo Sexo Homossexualidade (Aspectos sociais) Homossexualidade (Psicologia) Homossexuais (Aspectos legais) Esteretipos (Psicologia) Estigma Estupro Homossexuais (masculino)

Casamento entre homossexuais Travestis Homossexuais masculinos - identidade Direitos dos homossexuais Travestis Estigma (Psicologia Social) Homossexualismo Estudo e ensino Homossexualismo Estudo e ensino Estupro Adoo por homossexuais Jovens homossexuais Homossexuais masculinos

GT2 361

38 39 40 41 42

GLBT Homens gays Homens que fazem sexo com homens Homoerotismo Homofobia

Homossexualismo masculino Homossexualismo masculino Homofobia

Homossexuais (masculino) Homossexuais (masculino) Homofobia Homossexualidade (Discriminao) Homofobia Homossexualidade (Discriminao) Homossexuais (masculino) Homossexualidade Identidade sexual Homofobia Masculinidade Masoquismo -

Minorias sexuais Homossexuais masculinos Homossexuais masculinos Homofobia

43

Homonegatividade

Homofobia

Homofobia Homossexuais Homossexuais masculinos Homossexualismo Identidade de gnero Homossexuais masculinos Identidade Teoria Queer Minorias sexuais Homofobia Jovens homossexuais Masculinidade Masoquismo Homossexuais nas foras armadas

44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59

Homossexual Homossexualidade Homossocialidade6 Identidade de gnero Identidade gay Identidades queer Imagem dos homossexuais Intersexo Intersexualidade Inverso de gnero LGBT Linguagem homofbica Lolito (Dude) Masculinidade Masoquismo Militares gays

Homossexualismo masculino Homossexualismo masculino Homofobia Masculinidade (Psicologia) Masoquismo -

GT2 362

60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86

Movimento gay No pergunte, No fale Orientao sexual Pais gays Parceiros gays Parceria civil Parentalidade gay Pederastia Pedofilia Poltica gay Pornografia Preconceito anti-gay Preconceito sexual Prostituio masculina Psicologia LGBT Queer Relacionamento gay Relacionamento romntico entre o mesmo sexo Sadismo Sadomasoquismo Saunas gays Sexo em instalaes pblicas Sexualidade Sodomia Subcultura gay Teoria Queer Trabalho sexual masculino

Pornografia Homofobia Discriminao sexual Prostituio Sadismo Sexualidade Prostituio

Homossexuais (aspectos polticos) Orientao sexual Pedofilia Homossexuais (aspectos polticos) Pornografia Homofobia Prostituio Sadismo Sadomasoquismo Sexualidade Prostituio

Movimento de Libertao Gay Orientao sexual Pai homossexual Companheiros homossexuais Casamento entre homossexuais Pai homossexual Pedofilia Movimento de Libertao Gay Pornografia Homofobia Discriminao de sexo Prostituio masculina Teoria Queer Sadismo Sadomasoquismo Teoria Queer Prostituio masculina

GT2 363

87 88 89 90 91 92 93

Transexual Transexualidade Transexualismo Transgnero Travesti Unio civil gay Ursos (Bears)

Transexualismo -

Transexualismo Transexualismo Travestis Unio Civil de Pessoas do Mesmo Sexo -

Transexuais Transexualismo Transexualismo Travestis Casamento entre homossexuais -

Quadro 1: Palavras-chave extradas do corpus pesquisado e comparadas com as linguagens de indexao brasileiras.
Fonte: Elaborado pelos autores.

De acordo com o quadro comparativo, foi possvel verificar que o Vocabulrio Controlado Bsico do Senado Federal foi receptivo para 22,58% (21) das palavras destacadas, o Vocabulrio Controlado da USP, por sua vez, conseguiu um ndice de 40,86% (38) de incorporao das palavras e a Terminologia de Assuntos da Fundao Biblioteca Nacional foi a que mais palavras conseguiu abarcar, perfazendo um total de 63,44% (59). Essa primeira anlise sugere que linguagens de indexao analisadas ainda no possuem uma adequao, tampouco uma especificidade suficiente para a representao da temtica em questo. Alm do mais, isso no se deve somente pela baixa proporo com a qual conseguem traduzir ou normalizar os termos, mas tambm por alguns fatores que se verificam, discutidos a seguir. Num primeiro momento, ressalta-se que a Terminologia de Assuntos da Fundao Biblioteca Nacional est baseada no Cabealho de Assunto da Biblioteca do Congresso Norte-Americano e esse um fator primordial para entender porque essa linguagem abarcou mais palavras que as outras. Como o corpus da pesquisa foi composto por termos oriundos de revistas cientficas norte-americanas, fcil entender que a adaptao de uma linguagem de indexao dessa mesma cultura lingustica possa ser mais suscetvel a uma indexao mais pertinente. Isso no ocorreu, no entanto, com a totalidade das palavras. O que ocorre, por vezes, de a traduo dos termos para a cultura lingustica brasileira necessitar de adaptao, como foi o caso de dude para lolito, dogging para banheiro, cruising para caar e bareback para sexo sem proteo. exceo desses termos, queer e hag fag permaneceram sem traduo. Em comparao com as outras duas linguagens, o percentual foi baixo para a indexao e isso deve ser destacado quando se trabalha com a preciso na recuperao da informao. Num segundo momento, deve-se levar em considerao que, no contexto lingustico norteamericano, gay est livre da conotao pejorativa advinda do contexto mdico-jurdico e , por isso, aceitvel pela comunidade falante, inclusive porque seu uso est intimamente ligado ao mbito das lutas GT2 364

para reconhecimento dessa subcultura. Por sua vez, homossexual carrega consigo, nessa ambincia lingustica norte-americana, toda a carga pejorativa advinda do contexto mdico e, especialmente, por realizar uma distino primria atravs da sexualidade. Contudo, no contexto brasileiro, ao contrrio do norte-americano, gay possui uma carga pejorativa e, nesse sentido, observa-se nas linguagens de indexao brasileiras a preferncia pelo uso de homossexual ao invs de gay. Constata-se, mais especificamente no quadro 1, que gay possui correspondente em homossexuais masculinos nas linguagens analisadas. Como exemplo, verifica-se tambm que, das palavras destacadas, todos os substantivos que carregam consigo gay como qualificativo, ou seja, como adjetivo, possuem correspondente na linguagem de indexao como homossexual ou no possuem correspondente. Vejam-se os termos: Ativismo gay, Bares gays, Bispos gays, Casamento gay, Comunidade gay, Coro gay, Direitos gays, Estudos gays, Famlia adotiva gay, Filmes gays, Homens gays, Identidade gay, Militares gays, Movimento gay, Pais gays, Parentalidade gay, Poltica gay, Relacionamento gay, Saunas gays, Subcultura gay, Unio civil gay. exceo dos termos Ativismo gay, Movimento gay e Poltica gay, todos os outros que encontraram termos correspondentes o fizeram de forma a substituir gay por homossexual. A exceo se deu porque o cabealho proposto pela Terminologia de Assuntos da Fundao Biblioteca Nacional foi por Movimento de Libertao Gay, preservando o adjetivo da linguagem de indexao norte-americana. Com isso, percebe-se que no existe um entendimento em relao ao emprego de gay e de homossexual. Entende-se que, no contexto brasileiro, gay resulta em algo pejorativo, mas mesmo assim foi empregado. Ocorre que, no contexto norte-americano, gay tem carter eufemstico, diferentemente do contexto brasileiro, no qual ele possui carter disfmico. Dessa maneira, a traduo no carregou consigo esses aspectos das figuras de linguagem. Homossexual, no contexto lingustico brasileiro, possui carter ortofmico. O multilingusmo, enquanto um valor no mbito da organizao e representao do conhecimento, considera que deve haver um equivalente equnime nas linguagens de indexao multilngues. Num terceiro momento, percebe-se, contudo, que as palavras destacadas representam a especificidade com a qual a temtica tem se desenvolvido. Isso pode ser percebido pela representatividade com a qual essas palavras no encontraram correspondentes nas trs linguagens de indexao brasileiras, isto , 29 delas (31,18%) tenderiam a ter um termo mais geral para poder represent-las, perdendo em preciso. Nesse aspecto, chama-se a ateno para Efeminao, Efeminofobia, Pederastia e Sodomia, que possuem ligao direta com a questo homossexual e, por vezes, um entendimento inadequado da questo, consequncia da discriminao. A presena de Efeminao, Pederastia e Sodomia em linguagens de indexao necessitar de explicaes e direcionamento corretos, de forma a dirimir formulaes incorretas sobre a questo, alm de se destacar eticamente no processo de recuperao da informao pelo usurio. GT2 365

Da mesma maneira, ocorre com os termos Amor homoertico e Relacionamento romntico entre o mesmo sexo, que, de certa forma, podem ser considerados sinnimos e revelam um aspecto importante da homossexualidade, at ento relegada ao simples ato sexual entre duas pessoas do mesmo sexo. Represent-los em linguagens de indexao uma possibilidade de realizar essa diferena do que foi entendimento anteriormente para o que atualmente, perfazendo uma questo tica. Outro ponto de destaque o de Homossexualidade, que encontra respaldo em apenas uma linguagem de indexao o Vocabulrio Controlado de Assunto da USP. Nas outras duas linguagens (Senado e Biblioteca Nacional), o termo correspondente encontrado Homossexualismo. Interessante notar que o radical da palavra juntamente com o sufixo ismo no o preferido justamente por refletir uma posio que no a entendida atualmente. Ressalta-se novamente que esse sufixo remete a uma posio cientfica que atrelou ao conceito a ideia de patologia e que hoje no mais entendida como tal. Portanto, ocorre nesse caso um exemplo tpico de problema tico que deve buscar solues dentro da poltica de gesto da linguagem de indexao. Destacam-se, tambm, as siglas como termos candidatos indexao GLBT e LGBT que, em muitas linguagens, possuem restries quanto sua incorporao. De qualquer forma, salutar que elas faam parte da linguagem de indexao porque essas siglas refletem a identidade da subcultura estudada. O seu teor representativo carrega consigo uma gama de informaes que, por vezes, podem auxiliar o usurio no entendimento da formao da identidade desse grupo. Essa sigla congrega as vrias expresses da sexualidade que compe o universo homossexual que no homogneo e que, por sua vez, busca reconhecimento junto sociedade. So eles: gays, lsbicas, bissexuais, travestis, transexuais, trangneros e intersexo. A mudana e a ampliao dessa sigla demonstram a complexidade e a especificidade do assunto que no cabe e no se restringe apenas sob o rtulo de homossexualidade. Essa especificidade substrato da preciso. Num quarto momento, destacam-se as figuras de linguagens presentes nos candidatos indexao, so elas: Armrio, Assumir-se, Bareback, Couro, Cruising, Dogging, Dois espritos, Fag hag, Frango, Lolito, No pergunte, No fale e Ursos. A exceo de Lolito e Frango, que encontraram respaldo na Terminologia de Assuntos da Fundao Biblioteca Nacional, nenhuma outra foi passvel de incluso na indexao. A hiptese mais provvel a presena do carter figurativo, o que muito comum nessa comunidade discursiva. Obviamente que no possvel subverter as categorias das linguagens de indexao, mas nenhuma das palavras retiradas dos artigos cientficos conseguiu especificidade nas linguagens analisadas. Armrio expressa a condio de um homossexual que no se assumiu publicamente para seus entes e amigos, condio essa muito comum quando da no aceitao da homossexualidade pela sociedade em geral. uma metfora para algum que est escondido, trancado. Assumir-se ou Coming out (em ingls) uma metfora para o ato de sair do armrio, ou seja, assumir publicamente sua orientao sexual. Bareback no possui uma traduo para o portugus, pois sua traduo literal cavalgar sem GT2 366

cela apenas confundiria o sentido metafrico; assim, no contexto homossexual, significa a prtica sexual sem o uso de preservativo. Couro ou Leather (em ingls) uma categoria dentro do grupo homossexual para congregar aqueles indivduos que possuem afinidades com esse material durante a prtica sexual ou, ainda, que se estimulam sexualmente com esse material. , pois, uma palavra que expressa um grupo de indivduos. Cruising e Dogging, ambos sem traduo, tm significados eufemsticos. Cruising significa o ato de ir busca de uma pessoa para prticas sexuais que, em portugus, tambm em sentido eufemstico, seria caar. Dogging, cujo sentido eufemstico seria a prtica sexual em lugares pblicos, mesmo no possuindo um termo em portugus, aproxima-se, no universo homossexual, e tambm com sentido eufemstico, a banheiro. Dois espritos, enquanto uma expresso eufemstica, busca, no mbito da cultura amerndia, dar significado ao que se entenderia por homossexual, ou seja, uma pessoa que possui tanto o carter masculino quanto o feminino. Fag hag, por sua vez, longe de ter um significado em portugus (fag = viado, hag = bruxa), uma palavra eufemstica que se refere a uma mulher que est em companhia constante de um homossexual masculino, seja por amizade ou relacionamento amoroso. Frango e Lolito, respectivamente, Chicken e Dude, em ingls, aproximam-se muito em seus significados, sendo um eufemismo que designa um homossexual masculino jovem. No pergunte, no fale (Dont ask, dont talk, em ingls) uma expresso eufemstica que designa o ato sexual entre homossexuais que pertencem ao crculo militar e, por isso, considerada uma expresso exclusiva que reflete a necessidade de esconder e dissimular a relao homossexual nessa ambincia. Ursos (Bears, em ingls) se trata de um eufemismo que congrega homossexuais masculinos que possuem determinadas caractersticas fsicas e, dessa forma, buscam interesses comuns. Esse termo est no mesmo caminho de significao de Couro. Num quinto e ltimo momento, destacam-se as palavras que representam grupos especficos dentro do universo homossexual. Grupos que buscam suas identidades dentro do aspecto da homossexualidade masculina, que so: BDSM, Couro, Drag Queen, Intersexo, Transexual, Transgnero, Travesti e Ursos. Cada palavra representa um agregado de indivduos que possuem caractersticas formadoras de sua identidade dentro do grupo da homossexualidade masculina. 5 CONSIDERAES FINAIS A indexao busca uma nova dinmica para os registros do conhecimento que, por sua vez, resistem cronologia e s categorias previsveis e, por isso, deve ser a materializao de uma dinmica de natureza tica, um fazer cujos procedimentos, instrumentos e produtos so perpassados por um vasto e cambiante universo de valores. Tais valores devem ser sempre trazidos tona, mormente quando as pontes entre o conhecimento registrado e aqueles que se apropriaro desse conhecimento para gerarem outro refletem universos culturalmente distintos. No caso desta pesquisa, as linguagens de indexao brasileiras analisadas no so suficientemente precisas em relao representao da temtica da homossexualidade masculina, especialmente porque tal assunto no est devidamente estruturado nessas linguagens. Em relao gay e homossexual, apesar de o primeiro no ser preferido nas linguagens de GT2 367

indexao brasileiras, ele usado e, dessa forma, constata-se uma incongruncia. A falta de controle terminolgico percebida tambm quanto ao uso do qualificativo pessoas do mesmo sexo, entendido aqui como sinnimo para homossexuais. Vislumbrou-se que algumas palavras da temtica analisada so figuras de linguagem que, por vezes, foram apropriadas pelo grupo com seus significados reconsiderados como, por exemplo, gay e queer. Significados como esses, que possuam carter pejorativo, so tomados com outro sentido, no intuito de minimizar uma ambincia hostil. As tradues para o contexto brasileiro foram realizadas de forma aproximada ao seu significado no contexto norte-americano. Nesse sentido, esta pesquisa destacou cinco momentos durante a comparao das palavras com as linguagens de indexao brasileiras. O primeiro refere-se adequao ao contexto brasileiro que, por sua vez, encontrou uma aproximao de significados. O segundo trouxe tona a falta de preciso com a qual os termos so usados nas linguagens de indexao. Em seguida, no terceiro momento, a especificidade da temtica analisada apontou que as linguagens de indexao brasileiras representam-na de forma inadequada e, por vezes, imprecisa. No quarto momento, tem-se a presena de figuras de linguagem que so subjacentes comunidade discursiva e que no encontram respaldo nas linguagens de indexao analisadas. Alm disso, num quinto momento, verificou-se a presena figuras de linguagem representando categorias dentro da prpria temtica analisada. Portanto, esta pesquisa sugere que a falta de preciso das linguagens de indexao brasileiras pode prejudicar a recuperao da informao pelos usurios interessados na temtica analisada. Esse usurio possui uma identidade de quem busca, usa ou produz informao, inclusive, como comunidade discursiva. Abstract: The studies on ethics in Knowledge Organization and Representation, especially in the Subject Approach to Information, have collaborated to establish the theoretical and methodological aspects of Information Science which are justified by the assumption of social inclusion, as a metavalue, it situated itself between social prejudice and proselytize, creating a situation where three axiological universes coexist: the document or information, the user and the librarian. Therefore, the indexing is linked to an ethical dimension because it must concern itself with its reliability and usefulness in certain discourse communities or specific domains. In this direction, it is proposed through an exploratory and documental research with qualitative and inductive characteristics to identify the maximum specific terminological that Brazilian indexing languages allow for terms relating to male homosexuality, analyzing like investigative corpus the terms assigned to papers published in the Journal of Homosexuality, Sexualities and Journal of Gay & Lesbian Mental Health, between the years 2005 to 2009. From confrontation and analysis of terms and the Brazilian indexing languages there is an approximation of meaning in the Brazilian context, imprecision in the terminology, with indications of prejudices disseminate by politically correct, the biased representation of the thematic and the presence of figures of speech. Keywords: Information ethics. Knowledge representation. Figures of speech. REFERNCIAS ALMEIDA, J. R. P. Homossexualismo: a libertinagem no Rio de Janeiro. Rio de Janeiro: Laemmert, GT2 368

1906. BAKHTIN, M. Questes de literatura e de esttica: a teoria do romance. 4. ed. So Paulo: UNESP, 1998. BARROS, L. A. Curso bsico de terminologia. So Paulo: EDUSP, 2004. (Acadmica, 54). BUCKLAND, M. Information as thing. Journal of the American Society of Information Science, Washington, v. 42, n. 5, p. 351-360, 1991. CABR, M. T. La Terminologa hoy: concepciones, tendencias y aplicaciones. Cincia da Informao, Braslia, v. 24, n. 3, 1995. Disponvel em: <http://revista.ibict.br/ciinf/index.php/ciinf/ article/view/487>. Acesso em: 1 ago. 2011. CABR, M. T. La Terminologa: representacin y comunicacin: elementos para una teora de base comunicativa y otros artculos. Girona: Documenta Universitaria, 2005. FOSKETT, A. C. A abordagem temtica da informao. So Paulo: Polgono, 1973. GUIMARES, J. A. C. A dimenso terica to tratamento temtico da informao e suas interlocues com o universo cientfico da International Society for Knowledge Organization (ISKO). Revista Ibero-americana de Cincia da Informao (RICI), Braslia, v. 1, n. 1, p. 77-99, 2008. HJRLAND, B. Deliberate bias in knowledge organization? In: ARSENAULT, C.; TENNIS, J. T. (Org.). Culture and identity in knowledge organization. Wrzburg: Ergon Verlag, 2008. p. 256261. (Advances in knowledge organization, 11). HJRLAND, B. Domain analysis in information science: eleven approaches traditional as well as innovative. Journal of Documentation, London, v. 58, n. 4, p. 422-462, 2002. HJRLAND, B. Fundamentals of knowledge organization. Knowledge Organization, Wrzburg, v. 30, n. 2, p. 87-111, 2003. HJRLAND, B.; ALBRECHTSEN, H. Toward a new horizon in information science: domainanalysis. Journal of the American Society for Information Science, Washington, v. 46, n. 6, p. 400-425, 1995. HOLDER, R. W. How not to say what you mean: a dictionary of euphemisms. Oxford: Oxford University Press, 2002. HORNBY, A. S. Oxford advanced learners dictionary. 5th. ed. Oxford: Oxford University Press, 1995. HOUAISS, A. Dicionrio Houaiss da Lngua Portuguesa. Rio de Janeiro: Objetiva, 2001. HULME, E. W. Principles of book classification. Library Association Record, London, v. 13, p. 354-358, 1911. GT2 369

HULME, E. W. Principles of book classification. Library Association Record, London, v. 14, p. 39-46, 1912. KOBASHI, N. Y.; SMIT, J. W.; TLAMO, M. F. G. M. A funo da terminologia na construo do objeto da Cincia da Informao. DataGramaZero: Revista de Cincia da Informao, Rio de Janeiro, v. 2, n. 2, abr. 2001. Disponvel em: <http://dgz.org.br/abr01/Art_03.htm>. Acesso em: 1 ago. 2011. LE COADIC, Y.-F. A cincia da informao. 2. ed. rev. atual. Braslia: Briquet de Lemos/Livros, 2004. LPEZ-HUERTAS, M. J. Some current research questions in the field of knowledge organization. Knowledge Organization, Wrzburg, v. 35, n. 2/3, p. 113-136, 2008. LOURO, G. L. Um corpo estranho: ensaios sobre a sexualidade e teoria queer. Belo Horizonte: Autntica, 2004. TREVISAN, J. S. Devassos no paraso. So Paulo: Max Limonad, 1986. (Notas da Tabela)

1 Sigla para a expresso Bondage, Disciplina, Sadismo e Masoquismo. 2 Ato de dirigir-se at uma localidade em busca de um parceiro sexual. 3 Ato sexual em lugar pblico. 4 Termo originrio de tribos amerndias que desempenham vrios papis de gnero. Muito comum em tribos indgenas nativas americanas e canadenses. Atualmente, o termo usado pelos homossexuais para descrever a si prprios e o papel que reivindicam. 5 Homossexual masculino jovem. 6 Fortes laos de consenso entre os homens, que, quando se erotizam, do lugar homossexualidade.

GT2 370

COMUNICAO ORAL

O BLOOD PROJECT: UMA INICIATIVA PARA ORGANIZAO DA INFORMAO EM BIOMEDICINA


Almeida, M.B.; Coelho, K.C.; Andrade, A.Q.; Carneiro, L.E.S.; Oliveira, J. A.; Mendona, B.M.; Souza, R.R.1 Resumo. A terminologia mdica abrangente e complexa, contendo ambiguidades e diferentes interpretaes para termos especializados. Esse tipo de problema, dentre outros relacionados, tem sido abordado h anos pela Cincia da Informao. Apesar da variedade de vocabulrios, tesauros e glossrios disponveis em biomedicina, observa-se a inexistncia de iniciativas dedicadas hematologia. O objetivo do presente trabalho descrever uma pesquisa sobre vocabulrios formais para hematologia, baseados em princpios ontolgicos. Para tal, apresenta-se aqui o Blood Project, uma iniciativa que visa auxiliar na recuperao, uso e anlise de dados sobre o sangue, bem como a integrao com outras reas mdicas na busca por melhorias nos diagnstico. O projeto, uma iniciativa interinstitucional em andamento, est organizado de acordo com os seguintes eixos temticos: organizao da informao, aquisio de conhecimento, visualizao da informao e segurana da informao. No presente artigo, descreve-se o projeto, discutem-se resultados parciais significativos, bem como expectativas para continuidade da pesquisa. Palavras-chave: ontologias, representao da informao, recuperao da informao, hematologia, sangue humano 1- INTRODUO O avano das tecnologias da informao e da comunicao vem causando grande impacto na conduo da prtica mdica. Sistemas de informao so capazes de manipular grandes volumes de dados e de process-los automaticamente, trazendo novos insights para pesquisadores e profissionais de sade. O processamento e a recuperao da informao so dependentes da qualidade e da uniformidade dos dados registrados em pronturios e sistemas de informao clnicos, uma vez que a terminologia mdica abrangente e complexa (KITANO, 2002). comum, por exemplo, que o mesmo termo tenha diferentes significados de acordo com o contexto, o que sabidamente dificulta a interpretao e recuperao. Em um documento sobre clulas-tronco, o termo pluripotente pode ter mais de um significado caso se faa referncia a clulas em estado embrionrio ou clulas adultas (GOLDSTEIN e SCHNEIDER, 2010). Este tipo de problema, dentre outros, tem sido enfrentados pela Cincia da Informao j h anos (BOWKER, 1998).
1 Todos os autores trabalharam igualmente.

GT2 371

Os esquemas de classificao utilizados em medicina tm um papel essencial na organizao da informao mdica. A Classificao Internacional de Doenas (CID) (OMC, 2010), por exemplo, permite realizar comparaes entre taxas de mortalidade internacionais, contribuindo para o entendimento das causas de doenas. Com o advento da Internet e a disseminao massiva de dados, os esquemas de classificao, ainda que responsveis em larga escala pela organizao da informao mdica, tm sido utilizados para fins para os quais no foram projetados, por exemplo, para organizar dados para o processamento automtico de um volume de material produzido, diariamente, em medicina. Um exemplo comum o uso de descritores como outro ou no classificado, comum em esquemas de classificao bibliogrficos, os quais inserem ambiguidades e dificultam o processamento automtico. De fato, existem diferenas entre instrumentos de organizao da informao conforme se pretenda que sejam utilizados por pessoas ou por sistemas e computadores (ALMEIDA, SOUZA e FONSECA, 2011). Por exemplo, para interpretar a descrio correspondente a um cdigo denominado CID-10 D72.8 outros transtornos especificados dos glbulos brancos preciso ter uma viso do todo sobre os transtornos dos glbulos brancos listados no CID-10. Na presena de um especialista, tais questes parecem triviais. Entretanto, para criar definies teis no contexto dos sistemas mdicos rigor necessrio adicional na descrio de termos e relaes. Situaes desse tipo so comuns, como por exemplo, os itens D75 outras doenas do sangue e dos rgos hematopoiticos, e D76 algumas doenas que envolvem o tecido linforreticular e o sistema retculo-histioctico. Nesse contexto, uma alternativa que tem sido adotada para representar a informao uso de princpios formais, baseados em fundamentos ontolgicos utilizados pela Filosofia. Em condies ideais, os termos so definidos sem superposies e ambiguidades, em um tipo de estrutura que se convencionou chamar de ontologia (AITKEN, WEBBER e BARD, 2004; BAKER et al 1999; KUMAR e SMITH, 2002). Ontologia um termo com origens na Filosofia, que tem sido usado em Cincia da Informao para descrever um vocabulrio formal composto por termos e relaes organizados de acordo com princpios filosficos. Ontologias so resultados de esforos de pesquisas interdisciplinares, e tem gerado modelos que podem ser usados em aplicaes capazes de lidar automaticamente com a informao produzida massivamente em medicina (SMITH, 2003; GUARINO, 1998; SOWA, 2000). Neste contexto, o presente artigo descreve um projeto de pesquisa em andamento, denominado Blood Project, para organizao da informao no campo da hematologia e hemoterapia. Para tal descrevem-se eixos temticos do projeto, apresentam-se e discutem-se resultados parciais de pesquisa. Os eixos temticos so: organizao da informao via ontologias, aquisio do conhecimento de especialistas, aquisio de conhecimento2 de documentos mdicos, visualizao da informao e segurana da informao. Nesse contexto, a mais importante atividade diz respeito ao desenvolvimento de ontologias.
2 A expresso aquisio do conhecimento de uso comum na rea de sistemas (vide seo 2.2).

GT2 372

O restante do presente artigo est organizado conforme segue: a seo 2 apresenta uma viso geral do projeto; a seo 3 apresenta resultados parciais de pesquisa; a seo 4 discute os resultados parciais luz de problemas verificados no contexto mdico em estudo; a seo 5 apresenta consideraes finais e expectativas de desenvolvimentos futuros. 2- VISO GERAL DO BLOOD PROJECT O Blood Project3 uma iniciativa interinstitucional que envolve instituies nacionais (Fundao Hemominas4 e Universidade Federal de Minas Gerais5) e internacionais (New York Center of Excellence of Bioinformatics and Life Sciences6). O projeto tem por objetivos duas contribuies principais, uma de carter social e outra de carter cientfico. A contribuio social reside no fato que os resultados sero utilizados por instituio de sade de utilidade pblica, a Fundao Hemominas. Essa instituio o segundo maior banco de sangue do pas, responsvel por servios de hematologia e hemoterapia no estado de Minas Gerais. O resultado prtico mais evidente o vocabulrio resultante da etapa de organizao do conhecimento, bem como os desdobramentos provenientes do processo de seu desenvolvimento na instituio. Do ponto de vista cientfico, a contribuio para o campo da informao representada por uma nova instncia de pesquisa que relaciona medicina e organizao da informao. O projeto consiste de cinco eixos temticos, os quais norteiam a pesquisa: 1. Organizao da informao: consiste no desenvolvimento de uma ontologia sobre aspectos bsicos da fisiologia do sangue humano, produtos do sangue, documentos da rea de hematologia, processos de hemoterapia, dentre outros; 2. Aquisio de conhecimento de especialistas: pesquisa conduzida com especialistas em hematologia (mdicos, bilogos, pesquisadores, estudantes e professores); 3. Aquisio do conhecimento de textos: uso de tcnicas de processamento de linguagem natural e estabelecimento de parmetros especficos para a literatura sobre sangue; 4. Visualizao da informao: pesquisa e desenvolvimento de ferramentas centradas no usurio, visando processos de avaliao e alinhamento de ontologias; 5. Segurana da informao: identificao de problemas de segurana de dados em uma instituio de sade, do ponto de vista da trade pessoas-processos-tecnologia. 6. No restante da presente seo, esses eixos temticos so descritos de acordo no escopo do desenvolvimento do projeto. A seo 3 descreve resultados parciais obtidos em cada caso.

3 4 5 6

Disponvel Disponvel Disponvel Disponvel

na na na na

Internet Internet Internet Internet

em: em: em: em:

<http://mba.eci.ufmg.br/blood/>. Acesso em: 22/04/2011. < http://www.hemominas.mg.gov.br >. Acesso em: 28/07/2011. <http://www.ufmg.br>. Acesso em: 1/08/2011. <http://www.bioinformatics.buffalo.edu/>. Acesso em: 1/08/2011.

GT2 373

2.1- Organizao da informao: a ontologia do sangue A Blood Ontology7 (BLO) um vocabulrio formal, em desenvolvimento, abrangendo o conhecimento especializado sobre hematologia, hemoterapia, e doenas relacionadas ao sangue humano. A criao de um conjunto especfico de recursos de informao sobre o sangue objetiva lidar com a complexidade e a variedade das questes presentes nesse contexto. Alm disso, visa proporcionar uma infra-estrutura de sistemas para auxiliar especialistas no mbito institucional e profissional. Para lidar com a complexidade do assunto, a BLO foi organizada em um conjunto de sub-vocabulrios distintos, conforme segue: BLO-Core: ontologia para representar o conhecimento bsico essencial, necessrio para lidar com hematologia ; BLO-Management: ontologia para representao dos processos da hemoterapia, abrangendo servios usuais em bancos de sangue; BLO-Products: ontologia para representar os produtos originados da manipulao do sangue humano, os quais so usados em hospitais e unidades de sade; BLO-Administrative: ontologia que representa a variedade de documentos oficiais relacionados ao sangue, bem como sua manipulao e uso. O desenvolvimento da BLO adota os seguintes pressupostos como diretrizes de desenvolvimento: alinhamento com iniciativas internacionais, reuso de informaes, aquisio de conhecimento com especialistas e uso de princpios ontolgicos. A premissa de alinhamento com iniciativas internacional fomenta a integrao da terminologia brasileira internacional. A BLO se fundamenta em experincias anteriores bem consolidadas com destaque para aquelas pertencentes ao OBO Foundry8, um repositrio digital que rene mais de oitenta vocabulrios biomdicos (dados de 2011). Os recursos OBO so submetidos auditoria e verificao, constituindo-se finalmente em fontes relevantes para o projeto de sistemas de recuperao da informao mdica. Exemplos de vocabulrios formais nesse estgio so a Gene Ontology9, a Protein Ontology10 e a Cell-Type Ontology11 . A fundamentao ontolgica est implcita na adoo da Basic Formal Ontology (GRENON, SMITH e GOLDBERG, 2004) como modelo, uma iniciativa internacional criada para uniformizar a terminologia de pesquisa cientfica biomdica. O nvel de formalidade adotado varivel, exibindo desde um estgio semi-formal, adequado fase de aquisio de conhecimento; at um estgio semiformal para sistemas (ALMEIDA, 2006).
7 8 9 10 11 Disponvel Disponvel Disponvel Disponvel Disponvel na na na na na Internet Internet Internet Internet Internet em : <http://mba.eci.ufmg.br/BLO/>. Acesso em: 20/11/2010. em : <http://www.obofoundry.org/ >. Acesso em: 30/10/2010. em : <http://www.geneontology.org/>. Acesso em: 22/10/2010. em: <http://pir.georgetown.edu/pro/> . Acesso em: 23/10/2010. em: <http://www.obofoundry.org/>. Acesso em: 3/11/2010.

GT2 374

O reuso de informaes possvel atravs da abordagem experimental denominada Minimal Information to Reference External Ontology Terms (MIREOT). O MIREOT (COURTOT et al., 2009) foi desenvolvido como parte do projeto da Ontology for Biomedical Investigations (OBI CONSORTIUM, 2010) e oferece ferramentas para interligar conjuntos de dados biomdicos. A FIG. 2 apresenta tela do Ontofox12, o qual implementa a abordagem MIREOT em uma interface web.

Fig. 1: Tela do OntoFox utilizado para reuso de dados

2.2- Aquisio de conhecimento de especialistas Investigar como o conhecimento produzido por especialistas traduzido em conhecimento de um campo cientfico, bem como os meios para organiz-lo e represent-lo atividade essencial no mbito da pesquisa. A expresso aquisio de conhecimento tem sido empregada desde a dcada de 1980 para se referir as formas de se obter expertise para representao em sistemas especialistas (BOOSE e GAINES, 1989; MILTON et al, 2006). Compreende um conjunto complexo de atividades que empregam teorias e mtodos provenientes de campos diversos, com destaque para Cincia da Computao (NEWELL e SIMON, 1975), Cincia Cognitiva (HAWKINS, 1983), Lingustica (HARRIS, 1976), Semitica (CAMPBELL, 1998) e Psicologia (KELLY, 1955). A aquisio de conhecimento no Blood Project consiste das seguintes atividades: i) a coleta de termos a partir da viso de especialistas; ii) organizao preliminar do conhecimento mdico; iii)
12 Disponvel na Internet em: <http://ontofox.hegroup.org/>. Acesso em: 10/12/2010.

GT2 375

conexo entre os termos via relacionamentos hierrquicos e partitivos; iv) validao de termos por especialistas.

Fig. 2: tela do BLO-KAE13 (Blood Ontology Knowledge Acquisition Environment)

Um roteiro experimental para aquisio, foi inicialmente proposto, ao longo do qual foram identificadas questes e problemas peculiares da biomedicina, com o objetivo de propor melhorias. O roteiro de tarefas para AC contempla trs fases principais: i) levantamentos: compreende identificao de especialistas, do conhecimento que produzem e das fontes cientficas das quais fazem uso; ii) contatos: consiste de entrevistas com especialistas, utilizando como parmetro um template do ProtegFrames baseado em Scheuermann et al (2009); iii) validao: utiliza ferramentas colaborativas wiki para anlise de termos candidatos ontologia, bem como de suas definies (FIG. 2).

2.3- Aquisio do conhecimento de textos O fluxo de informaes nas instituies de sade, em geral, est registrado em papel ou meios digitais na forma de um registro eletrnico do paciente. Apesar do uso de registros eletrnicos no ser ainda uma realidade em muitas instituies, possvel observar tendncias no sentido de adotar um padro, por exemplo, no Brasil para pronturios mdicos (ver OpenEHR14). Uma das vantagens do armazenamento digital a facilidade nas buscas e consultas, possibilitando melhorias na recuperao da informao. Sistemas de informao das instituies de sade, em geral, apresentam restries que limitam a recuperao automtica, a qual uma quase exigncia frente ao grande volume de dados a tratar. Uma restrio, por exemplo, reside no fato de que registros eletrnicos tais como anamnese, resultado
13 Disponvel na Internet em: <http://mbaserver.eci.ufmg.br/BLO-wiki/>. Acesso em: 1/08/2011. 14 Open Eletronic Health Records. Disponvel em: <http://www.openehr.org/>. Acesso: 22/08/2010.

GT2 376

dos exames laboratoriais, laudos e prescries, esto registrados em texto, sob a forma de narrativas, e no em uma forma estruturada. Segundo Friedman e Hripcsak (1999), h duas abordagens principais para extrair e representar informao de narrativas mdicas: i) abordagem manual, na qual pessoas capacitadas extraem dados e os correspondem com os descritores de terminologia mdica (por exemplo, o SNOMED Clinical Terms)15; ii) abordagem automtica, em que sistemas de processamento de linguagem natural (PLN) extraem dados de registros mdicos. No mbito do projeto, as duas abordagens tm sido aplicadas em momentos distintos, a partir da possibilidade de lidar com registros eletrnicos ou no. A arquitetura apresentada na FIG.3 descreve a insero das tcnicas de PLN no escopo de pesquisa do Blood Project. Cabe observar que os tipos de dados da parte inferior da figura permanecem na forma de textos, e sujeitos a tratamento via PLN.

Fig. 3: Arquitetura de sistema de informao mdico, centrada em registros

2.4- Visualizao da informao As tcnicas de visualizao de informao recebem diferentes denominaes de acordo com o campo de pesquisa em que so empregadas: visualizao cientfica, visualizao geogrfica, visualizao de negcios, visualizao de software, dentre outras. As principais modalidades de tcnicas para visualizao so as bidimensionais (LUZZARDI, 2003), tridimensionais (KATIFORI et al. 2007), multidimensionais (GRGIO, FILHO e MONTES, 2009), e hierrquicas (LIMA, 2007). Nessa ltima, incluem-se as tcnicas de visualizao de ontologias. Softwares para visualizao de ontologias tm proliferado junto ao desenvolvimento crescente de ontologias. Exemplos de ferramentas desse tipo so plug-ins do editor de ontologias Protg como
15 Recurso da US National Library of Medicine. Disponvel em: <http://www.nlm.nih.gov/research/umls/Snomed/ snomed_main.html>. Acesso: 20/02/2010.

GT2 377

o Ontoviz, o Jambalaya e o TGViz; alm de softwares como o OntoSphere, o OntoTrack, o GoSurfer e o Ozone (KATIFORI et al., 2007). No mbito do projeto, tem sido desenvolvida e testada uma ferramenta para alinhamento e avaliao de ontologias, como o objetivo de auxiliar o responsvel pela construo da ontologia. Trata-se de uma ferramenta orientada ao usurio, que faz uso de teorias de diversas reas, como Cincia da Informao, Computao e Cincia Cognitiva. 2.5- Segurana da informao Segurana da informao uma questo multifacetada, que inclui variveis diversas interagindo em um ambiente nico. Uma instituio demanda confidencialidade frente aos riscos, ameaas e vulnerabilidades, sem perder a disponibilidade da informao. A tecnologia da informao est envolvida na maioria das solues para a segurana da informao. Sistemas, contudo, so projetados, implementados e operados por pessoas. O fator humano determinante nas formas como os sistemas de informao so usados nos processos institucionais (LACEY, 2009). De fato, so pessoas que proporcionam segurana fsica, concedem acesso aos sistemas, causam, relatam e gerenciam a resposta das instituies frente s violaes e incidentes de segurana. Uma proposta efetiva de segurana da informao uma abordagem abrangente. Segundo Sveen, Torres e Sarriegi (2009), o desenvolvimento de um plano estratgico de segurana da informao efetivo depende de trs aspectos: i) pessoas, como formadoras da cultura organizacional; ii) processos, como condutores do fluxo informacional; e iii) tecnologias, ferramentas que sustentam processos e necessidades dos usurios. No mbito do Blood Project, a pesquisa em segurana da informao biomdica avalia documentos participantes de processos, pessoas envolvidas e a tecnologia que permeia toda a instituio de sade. Consiste de trs etapas principais: i) organizao de dados registrados em documentos e sistemas, compreendendo a organizao dos documentos e dos relatrios gerados por sistemas, por contedo e provenincia; padronizao de documentos; e redesenho de processos; ii) organizao da informao especializada, atividade em que se obtm com especialistas as informaes sobre suas atividades, sobre os documentos que utilizam, sobre as prticas organizacionais e pesquisas cientficas em andamento; iii) criao de terminologia preliminar sobre segurana, etapa, na qual, os dados so obtidos agrupando-se termos candidatos a conceitos e verbos candidatos s relaes na ontologia.

3- RESULTADOS
A presente seo descreve resultados parciais de pesquisa de cada eixo temtico do projeto, obtidos at a data de publicao do presente artigo. Os resultados so apresentados de acordo com os tpicos que descrevem o projeto na seo 2. GT2 378

3.1- Resultados sobre a organizao da informao O desenvolvimento da BLO um projeto de longo prazo, e se encontra na fase de aquisio de conhecimento. O conhecimento de especialistas tem sido reunido e organizado em uma estrutura preliminar semi-formal. As mtricas do vocabulrio apontam quase mil termos e relaes definidos no subconjunto denominado BLO-Core (FIG.4). O contedo do vocabulrio objeto de pesquisa especializado em quatro temas principais conforme descrito na seo 2: BLO-Core: contm dados sobre aspectos fisiolgicos essenciais para a prtica da hematologia, como por exemplo, DNA e RNA, genes, protenas, aminocidos, bases, enzimas; alm das bases moleculares, imunolgicas e celulares do sangue; BLO-Management: abrange processos que tem lugar em bancos de sangue, ao longo das atividades de manipulao do sangue, por exemplo, sistemas de qualidade para bancos de sangue, processo de seleo de doadores, coleta de sangue; procedimentos de teste sanguneo e sorologia de grupos sanguneos (AABB, 2005). BLO-Products: inclui produtos derivados do processamento de sangue em escala mundial, como por exemplo, concentrado de clulas vermelhas, plasma fresco e congelado, concentrado de plaquetas, crioprecipitados (ICCBBA, 2010). BLO-Administrative pesquisa a documentao oficial de interesse de bancos de sangue, como por exemplo, polticas de agncias regulatrias (Organizao Nacional de Acreditao16), legislao (Ministrio da Sade), documentos de associaes profissionais, sistemas de classificao e padres (ISBT-128)17.

Fig. 4: Tela de resultados da ontologia com dados sobre anemia hemoltica

16 Disponvel em: <https://www.ona.org.br/>. Acesso em: 15/03/2011 17 Disponvel em: <http://iccbba.org/>. Acesso em: 20/02/2010.

GT2 379

3.2- Resultados da aquisio de conhecimento com especialistas A aquisio de conhecimento de especialistas tem sido realizada, na verdade, ao longo de todo o projeto. No se trata de uma etapa definida, mas sim que ocorre simultaneamente a outras. A atividade gera dados para desenvolvimento da etapa de organizao da informao (FIG. 5), tendo como resultado quase mil termos e definies, conforme citado na seo 3.1.

Fig.5: template do Proteg-Frames com dados parciais sobre a doena do sangue

A atividade resulta ainda em um mapeamento das competncias dos principais especialistas da instituio (FIG.6), bem como um levantamento de problemas comuns atividade. No estgio atual, os primeiros entrevistados so especialistas do grupo de pesquisa sobre HTLV (vrus linfotrpico de clulas T humanas) da Fundao Hemominas.
Experts (*) Formao Atuao Especiali-dade A. B.C.F. Mdico Pesquisa Hemoterapia Virologia Epidemiologia Linhas de Pesquisa Hematologia Virologia M.A R. Mdico Pesquisa e Medicina Infectologia Epidemiologia Epidemiologia Infectologia D.U.G. Mdico Pesquisa e Ensino Infectologia Med. Tropical Otoneurologia Infectologia E.F.B. Veterinrio Pesquisa e ensino Microbiologia Virologia Virologia ... ... ... ... ... ... ...

Fig. 6: Extrato do levantamento de especialistas para atividade de AC


(*)

os especialistas so aqui identificados por cdigos

Exemplos de dificuldades encontradas ao longo da pesquisa, os quais tm sido registrados para estudos sobre usos e necessidades de informao de especialistas em medicina, so: i) a curva de aprendizado na biomedicina longa e complexa; ii) o assunto multidisciplinar e os especialistas atuam em subdomnios: existem poucos especialistas para consulta e eles so super-especializados; GT2 380

iii) entidades de alto nvel da ontologia nem sempre encontram respaldo no dia a dia do especialista, o que dificulta o dilogo. 3.3- Resultados da aquisio do conhecimento em textos O uso de tcnicas de PLN no Blood Project ainda incipiente. At o momento, os termos usados nas ontologias em desenvolvimento so provenientes de tcnicas manuais, conforme mencionado na seo 2.2 e 2.3. Os resultados parciais significativos, referentes aquisio de textos, correspondem ao conjunto de observaes realizadas ao longo dos experimentos sobre a especificidade do domnio da hematologia para fins de extrao automtica. Cabe destacar as seguintes observaes: Os vocabulrios especializados mdicos apresentam menos variaes que narrativas, do ponto de vista sinttico de complexidade semntica; Uma prtica comum em vocabulrios mdicos consiste em criar novos termos para designar as descobertas dos cientistas, como uma nova clula ou um novo vrus; Textos mdicos tm carter eminentemente descritivo e narrativo, so compostos por um nmero de termos tcnicos de uso restrito e super-especializados por domnio, evidenciando a necessidade de vocabulrios especficos por rea. 3.4- Visualizao da informao O prottipo previsto para auxlio na avaliao e alinhamento de ontologias est em teste. A programao da ferramenta envolve as linguagens Python, C++ e JavaScript, e no servidor de aplicativos Zope. Consiste de dois mdulos distintos e independentes: um mdulo local e um mdulo de interface web. O mdulo local proporciona pesquisa na ontologia ao traduzir a estrutura Ontology Web Language (OWL) em Java Script Object Notation, um formato de intercmbio, e enviar os dados interface de visualizao. O mdulo local tambm faz uso da biblioteca libxml2 (do C++), a qual executa o parser do arquivo OWL carregado pelo mdulo de interface web. O arquivo de entrada um arquivo texto, transformado em estrutura de dados (rvore) e consultado por mtodos desenvolvidos em Python. O mdulo de interface web responsvel por carregar a ontologia, pela apresentao dos dados (forma textual e grfica) e pelo recebimento dos termos de busca. Alm disso, transmite dados para o mdulo local, onde so processados pelo parser. O mdulo interface web composto por submdulos de busca, de apresentao dos dados textuais e grficos, fazendo uso do Zope e JavaScript (Infoviz ToolKit). Uma tela do estgio de desenvolvimento das tcnicas de visualizao no projeto, mostrando exemplo de duas ontologias sendo alinhadas, apresentada na Fig.7:

GT2 381

Fig. 7: tela do prottipo com alinhamento experimental 3.5- Resultados sobre segurana da informao A pesquisa sobre segurana na informao se encontra em estgio que se convencionou chamar de terminolgico (ALMEIDA, 2006), ou seja, um estgio de organizao preliminar de dados. A Fig. 8 resume as entidades consideradas bsicas sobre segurana, alm de uma descrio obtida no mbito da organizao de sade.
Entidade Organizao Atributo de segurana Ativo Controle Ameaa Vulnerabilidade Descrio Organizao uma entidade social composta por recursos materiais e humanos, e caracterizada por objetivos, procedimentos de controle e limites. Ex. pblica, privada. Atributo de segurana caracteriza um ativo e diz respeito a requisitos de segurana sobre tal ativo. Pode ser um atributo de confidencialidade, ou de integridade. Ativo um bem da organizao, seja fsico ou imaterial, utilizado pelos seus membros para alcanar os objetivos estipulados. Ex. um, um sistema, um documento. Controle um procedimento sistematizado para atenuar vulnerabilidades, bem como para estabelecer medidas preventivas e corretivas com vistas proteo de ativos. Ameaa uma possibilidade de dano aos ativos da organizao, que afeta atributos de segurana e explora vulnerabilidades. Ex. de origem humana ou natural. Vulnerabilidade a situao caracterizada por falta de medidas de proteo e que possui um grau de severidade associado. Pode ser administrativa, tcnica ou fsica.
Fig. 8: Exemplos de termos e definies da ontologia de segurana

O conjunto terminolgico, resultado parcial da pesquisa, composto por mais de cento e sessenta termos representativos de conceitos no domnio da segurana da informao, bem como relaes. Os termos esto distribudos da seguinte forma: quinze tipos de ativo (por ex., mvel, sistema), quatro tipos de organizao (por exemplo, pblica), quinze tipos de atributos de segurana GT2 382

(por ex. confiabilidade), mais de cinquenta tipos de ameaas (por ex., controle de servidores), e mais de quarenta tipos de vulnerabilidades (por ex. trmino de contrato de trabalho de colaborador).

4- DISCUSSO
Uma vez apresentados os eixos temticos e os principais resultados parciais de pesquisa, cabe agora discutir resultados e questes, destacando alguns dos problemas que justificaram a iniciativa. O restante da presente seo se ocupa dessa tarefa. Os tpicos em que o projeto foi organizado refletem questes inerentes atividade de organizao da informao, mas tambm necessidades especficas do contexto, ou seja, o domnio do conhecimento inserido no ambiente da instituio. Algumas dessas necessidades tm sido intensificadas devido a nova realidade, como por exemplo, o j mencionado aumento expressivo do volume de dados em medicina. Nesse sentido, as instituies tm exigido sistemas mais sofisticados em relao queles disponveis h alguns anos. preciso tambm destacar alm da necessidade de tratamento automtico, a crescente valorizao do ser humano nas instituies, seja na aquisio de conhecimento, seja como elemento desencadeador de incidentes ou solues em segurana, seja para o uso de ferramentas (como as ferramentas de visualizao) para auxiliar na busca por um consenso cientfico. Cabe destacar que o desenvolvimento da ontologia tem sido o aspecto mais importante do trabalho, uma vez que para sua produo necessrio criar novas atividades ou incrementar as existentes no mbito da instituio. Na verdade, construir uma ontologia, no sentido amplo, no considerando apenas o artefato computacional, mas considerando o conjunto de atividades, promove a integrao de importantes foras presentes na instituio (ALMEIDA e BARBOSA, 2009). Constata-se ainda, ao longo do projeto, que apesar da importncia do sangue humano no mbito da prtica e da pesquisa mdica, dados sobre a hematologia e hemoterapia continuam espalhados por diversas fontes distintas e heterogneas. A iniciativa apresentada promove integrao, facilitando a recuperao da informao por mdicos, bilogos, pesquisadores e pessoal tcnico em bancos de sangue. Vocabulrios formais biomdicos tm a importante funo de definir consensualmente o significado de termos utilizados na prtica e pesquisa mdica (SMITH, 2006). Isso possvel justamente pela aquisio de conhecimento realizada diretamente com especialistas. Uma vez definidos e formalizados, os termos so organizados em uma estrutura computacional que possibilita a recuperao automtica da informao. Esquemas de classificao adotados em hematologia, como o j mencionado ISBT-128, nem sempre possibilitam representaes ideais para processamento por sistemas automticos. Tais esquemas mantm uma interpretao implcita para o significado de cdigos numricos, tornando imprescindvel a interveno de especialistas e limitando as possibilidades de recuperao automtica. Por exemplo, em um distrbio hemorrgico causado por anticorpos anti-fosfolpides, a entidade GT2 383

distrbio hemorrgico uma entidade complexa, constituda a partir de outros fatos elementares. Em um esquema de classificao, tal distrbio pode ser considerado um tipo de desordem, ou uma patologia relacionada a protenas, ou desordem de sangue, dentre outras possibilidades. Observa-se, entretanto, que conhecimento altamente especializado necessrio para entender este tipo de noo e que uma classificao ad-hoc pode comprometer a qualidade da representao. Tal conhecimento obtido com um especialista, e transposto na forma adequada a sistemas atravs de atividades j apresentadas no projeto. No caso apresentado, fatos implcitos ao conhecimento mdico precisam ser explicitados visando tratamento automtico, como por exemplo: O sangramento uma condio a qual um organismo humano pode ser submetido; O sangramento pode ser causado por um distrbio; O sangramento pode ter consequncias graves para seres humanos; A protena anti-fosfolpides um anticorpo; As protenas so macromolculas compostas de aminocidos; Os sangramentos podem ser causados por anticorpos da protena anti-fosfolpides, ou de forma genrica, pelos anticorpos; Manter todo esse conhecimento no tarefa simples. Em muitos casos, no se percebe a complexidade da tarefa em funo da presena de um especialista. Embora os esquemas de classificao no domnio mdico so suficientes para a recuperao da informao por especialistas, nem sempre eles proporcionam a representao adequada para uso por sistemas automticos. Apesar da variedade de vocabulrios em desenvolvimento na biomedicina (SMITH et al., 2007), observa-se a inexistncia de iniciativa dedicada exclusivamente a bancos de sangue. O Blood Project preenche esta lacuna ao propor vocabulrios temticos distintos, usados de acordo com necessidades especficas, mantendo a conexo com o conhecimento mdico produzido internacionalmente atravs de outros vocabulrios biomdicos fundamentais. Alm disso, a ontologia desenvolvida no mbito do projeto serve a diversos fins, como: fonte para desenvolvimento de sistemas interoperveis, base de conhecimento para inferncias computacionais, recurso educacional, repositrio para registro de dados clnicos, dentre outros. Na investigao cientfica, o Blood Project foi concebido para se alinhar s pesquisas em omics, seguindo os mesmos princpios de anotaes e descoberta de biomarcadores como os praticados no mbito do PRO e GO j mencionados. Repositrios baseados em omics (por exemplo, PharmGKB18, EPO-KB19) vm recebendo uma ateno crescente como recursos para a pesquisa de questes patolgicas. Na pesquisa em omics tambm existem iniciativas relacionadas com o proteoma do plasma, tais como o Plasma Proteome DataBase (PPD)20.
18 Pharmacogenomics Knowlegde base. Disponvel em: http://www.pharmgkb.org/ Acesso: 25/10/2010 19 Empirical Proteomics Ontology Knowledge Base. Disponvel em: http://www.dbmi.pitt.edu/EPO-KB Acesso: 25/10/2010 20 Plasma Proteome Database. Disponvel em: http://www.plasmaproteomedatabase.org/ Acesso: 25/10/2010

GT2 384

Cabe ainda citar que o Blood Project considera a perspectiva dos fluidos humanos. A realizao de diagnsticos utilizando fluidos no uma novidade na medicina, como por exemplo, investigao envolvendo a saliva e o sangue (YAN et al., 2009). No contexto de fluidos, a ontologia desenvolvida est conectada Saliva Ontology (SALO)21, um vocabulrio formal sobre saliva utilizada para recuperar e a integrar dados relativos salivaomics entre vrios campos de pesquisa (AI, SMITH e WONG, 2010). Investigam-se ainda tecnologias de diagnstico salivar (clinicamente utilizadas) no escopo de atuao do grupo de pesquisa Salivaomics da University of California22. O Blood Project ainda se vale de pesquisas em hematologia conduzidas pela Fundao Hemominas, as quais enfatizam doenas do sangue como Von Willebrand, anemia falciforme, dentre outros. Alm disso, um dos grupos de pesquisa da Fundao Hemominas tem concentrado seus esforos em pesquisas relacionadas ao histrico, diagnstico e tratamento da infeco do vrus T-linfotrpico humano (HTLV). Esse cenrio colaborativo determinante para alcanar consenso entre vocabulrios representativos do domnio de conhecimento da hematologia e adequados para ser utilizado em sistemas de informao automatizados.

5- CONSIDERAES FINAIS
O presente trabalho descreveu o Blood Project, uma iniciativa de longo prazo, em curso, e desenvolvida com o objetivo de facilitar o acesso, uso e anlise de dados sobre o sangue. Trata-se de uma iniciativa dedicada a atividades de hemoterapia e hematologia, conectando pesquisa e prtica. A abordagem terica contempla a colaborao com iniciativas internacionais, objetivando melhorias para o diagnstico de doenas. A abordagem prtica compreende a representao dos processos em bancos de sangue. A importncia desse tipo de projeto, sobre conhecimento especializado em medicina, reside na constatao de que apesar de toda a evoluo muitos processos biolgicos no so completamente compreendidos. Em muitos casos, por causa dos limites da cincia, em outros por deficincias na organizao da informao. Como explica Vickery (1997), existe uma grande proximidade entre os trabalhos na Cincia da Informao e na pequisa em ontologias, o que sugere benefcios no caso de colaborao entre as reas. Expectativas de trabalhos futuros na continuidade do projeto envolvem: a especializao da ontologia de sangue por tipos de doenas; a concluso e testes com usurios das ferramentas de visualizao; o uso de tcnicas para extrao automtica de termos (o que no significa abrir mo da organizao intelectual); pesquisa quantitativa com funcionrios da instituio de sade envolvida para a definio dos fatores intervenientes na segurana da informao biomdica.

21 Saliva Ontology. Disponvel em: http://www.skb.ucla.edu/SALO/ Acesso: 25/10/2010 22 Salivanomics. Disponvel na Internet em http://www.hspp.ucla.edu/ Acesso: 25/10/2010

GT2 385

Agradecimentos
Essa pesquisa conta com o apoio da Fundao Hemominas (Belo Horizonte MG). Abstract. The medical terminology is comprehensive and complex, being plenty of ambiguity and different interpretations to specialized terms. This sort of problem, in addition to similar others, has been approached for years within the Information Science field. Despite the variety of vocabularies, thesaurus and glossaries available within biomedicine, we observe the lack of initiatives devoted to hematology and blood transfusion. The goal of this paper is to describe research about biomedicine formal vocabularies, which are based in ontological guidelines. Thus, we here present the Blood Project, an enterprise designed to facilitate the processes of retrieval, usage and analysis of data about blood, as well as to foster collaboration with other medical fields seeking for diagnostics improvements. The project, an underway inter-institutional initiative, is ordered according to themes as follows: information organization, knowledge acquisition, information visualization, and information security. In this paper, we describe the Blood Project, argue valuable findings, and offer our prospects for future work. Key-words: ontologies, information representation, information retrieval, hematology, human blood

REFERNCIAS

AITKEN, J. S.; WEBBER, B. L.; BARD, J. B. Part-of relations in anatomy ontologies: a proposal for RDFS and OWL formalisations. Proceedings of the Pacific Symp Biocomput. 2004, p.166-77. ALMEIDA, M. B. Um modelo baseado em ontologias para representao da memria organizacional. 316f. Tese (Doutorado em Cincia da Informao) - Escola de Cincia da Informao, Universidade Federal do Minas Gerais, Belo Horizonte, 2006. ALMEIDA, M. B.; BARBOSA, R. R. Ontologies in knowledge management support - a case study. Journal of the American Society for Information Science and Technology, v. 60, n.10, p. 20322047, 2009. ALMEIDA, M. B.; SOUZA, R. R.; FONSECA, F. Semantics in the Semantic Web: a critical evaluation. Knowledge Organization Journal, v. 38, n.3, p. 187, 203, 2011 AMERICAN ASSOCIATION OF BLOOD BANKS. AABB Homepage. 2005. Disponvel em: <http://www.aabb.org/>. Acesso em: 20/11/2009. AI, J.; SMITH, B. WONG, D. T. Saliva Ontology: an ontology-based framework for a Salivaomics Knowledge Base. BMC Bioinformatics. v. 11.2010;11:302, 2010. BAKER, P.G.; et al. An ontology for bioinformatics applications. Bioinformatics. v. 15, p. 510-20, 1999 BOWKER, G. C. The history of information infrastructures: The case of the international classification ofdiseases. Information Processing and Management, v. 32, n.1., p. 49-62, 1996. BOOSE, J. H; GAINES, B. R.. Knowledge Acquisition for Knowledge-Based Systems: Notes on the state of the artg. 1989. Disponvel em: <http://www.springerlink.com/content>.Acesso em: 20/10/2010. GT2 386

CAMPBELL K. E. et al. Representing thoughts, words, and things in the UMLS. Journal of the Americam Medical Information Association., v. 5, n. 5, p. 42131, 1998. COURTOT, M.. et al. MIREOT: the Minimum Information to Reference an External Ontology Term. Nature Precedings, v.6. 2009. FRIEDMAN, C.; HRIPCSAK G. Natural language processing and its future in medicine. Academic Medicine, v. 74, n. 8, Agosto, 1999. GOLDSTEIN, L.S.B.; SCHNEIDER, M. Stem Cells. Indianapolis: Wiley, 2010. 421 p. GRENON, P.; SMITH, B; GOLDBERG, L. Biodynamic ontology: applying BFO in the biomedical domain. 2004. Disponvel em: <http://ontology.buffalo.edu/medo/biodynamic.pdf>. Acesso em: 22/02/2008. GRGIO, A. R. A., FILHO, B. P. C. e MONTES, R. S. A. . Tcnicas de visualizao de dados aplicadas segurana da informao. 2009. Disponvel em: <http://www.ppgia.pucpr. br/maziero/lib/exe/fetch.php/ceseg:2009-sbseg-mc5.pdf>. Acesso em: 20/01/2009. GUARINO, N. Formal Ontology and Information Systems. 1998. Disponvel em: <http://citeseerx. ist.psu.edu/>. Acesso em 4/10/2009. HARRIS, Z. On a theory of Language. The Journal of Philosophy, v. 73, n. 10, p. 253-276, 1976. HAWKINS, D. An analysis of expert thinking. International Journal of Man-Machine Studies. v. 18, p. 1-47, 1983. ICCBBA. ISBT-128: Standard Terminology for Blood, Cellular Therapy, and Tissue Product Descriptions. 2010. Disponvel em: <http://www.iccbba.org/ >. Acesso em 3/09/2010 KELLY, G. The psychology of personal constructs. New York: Norton, 1955. 152 p. KATIFORI, A. et al. Ontology visualization methods. ACM Computer, v.50, n. 5, 2007. KITANO, H. Computational systems biology. Nature, v.420. p.:206-210, 2002. KUMAR A; SMITH B. The ontology of blood pressure; a case study in creating ontological partitions in biomedicine. 2002. Disponvel em: <http://citeseer.ist.psu.edu/696679.html>. Acesso em 22/10/2010. LACEY, D.(2009). Managing the human factor in information security. New York: Wiley, 2009. 384p. LIMA, G. B. A. Gerenciamento do contedo semntico no prottipo mapa hipertextual-mhtx: perspectivas. Anais do VII ENANCIB, 2007. MILTON, N. R. Knowledge acquisition in practice: a step-by-step guide. Cranfield: Springer, 176p, 2007.

GT2 387

NEWELL, A; SIMON, H.A. Computer science as empirical inquiry: symbols and search. 1975. Disponvel em: <http://citeseerx.ist.psu.edu/>. Acesso: 2 ago. 2010 OBI Consortium. Ontology for Biomedical Investigations. 2010. Disponvel em: <http://obiontology.org/page/>. Acesso em 19/02/2011. ORGANIZAO MUNDIAL DE SADE (OMC). Classificao Internacional de Doenas (CID). 2008. Disponvel em: http://cid10.datasus.gov.br/webhelp/cid10.htm/. Acesso em 19/02/2011. SCHEUERMANN, R et al. Toward an ontological treatment of diasease and diagnosis. Proceedings of the 2009 Summit on Translational Bioinformatics, San Francisco, CA, pp. 116-120. SVEEN, F. O.; TORRES, J. M.; SARRIEGI, J. M. . Blind Information Security Strategy. International Journal of Critical infrastructure Protection, v.2, p.95-109, 2009. SMITH, B. Ontology and information systems. 2003. Disponvel em: <http://ontology.buffalo. edu/ontology_long.pdf>. Acesso em 19/02/2011. SMITH, B. From concepts to clinical reality: An essay on the benchmarking of biomedical terminologies. Journal of Biomedical Informatics. V. 39, p. 288-298, 2006. SMITH, B. et al. The OBO Foundry: coordinated evolution of ontologies to support biomedical data integration. Nature Biotechnology. v.25, p.1251-1255, 2007. SOWA, J. F. Ontology. 2000. Disponvel na Internet em: <http://www.jfsowa.com/ontology/>. Acesso em: 23/12/2008. YAN, W. et al. Systematic comparison of the human saliva and plasma proteomes. Proteomics Clinical Applications. 2009 v. 3, p. 116-134, 2009.

GT2 388

COMUNICAO ORAL

INDICADORES DE QUALIDADE DA INFORMAO EM SISTEMAS BASEADOS EM FOLKSONOMIA: UMA ABORDAGEM SEMITICA


Juliana de Assis e Maria Aparecida Moura Resumo: Este estudo teve por objetivo geral identificar, sistematizar e analisar as concepes que norteiam a composio dos indicadores de qualidade da informao em ambientes digitais colaborativos a fim de compreender o lugar atribudo linguagem na validao dos contedos informacionais. A hiptese inicial considerou que ante o aspecto colaborativo das prticas de organizao da informao contemporneas, redes sociais criadas e potencializadas pelos Sistemas Baseados em Folksonomia contribuam para a formalizao de indicadores de qualidade da informao. Foi utilizada na construo da metodologia uma triangulao de mtodos e teorias, mediante o uso da Semitica de matriz peirciana enquanto arcabouo terico que possibilita a observao e compreenso dos fenmenos de linguagem e significao; da Netnografia como instrumento de identificao dos interesses, discursos e pertencimentos dos sujeitos e de caracterizao das prticas informacionais desenvolvidas pelos mesmos; da Anlise de Redes Sociais como auxilio terico e metodolgico que propicia o estabelecimento de recortes necessrios ao universo emprico e a compreenso das dimenses estruturais e relacionais que constituem as formas de organizao e atuao dos atores sociais no contexto digital. As unidades de observao emprica foram comunidades virtuais de prtica, em mbito nacional e internacional, que se agregam em torno dos temas Sade e Jogos Digitais nos servios de social bookmarking Delicious, Diigo e Stumble Upon. Foram visualizados e descritos como indicadores de qualidade da informao: a colaborao, a integrao, a personalizao, a renovao e a sedimentao da linguagem, o compromisso ontolgico, a concepo semisica e a relevncia. Foram apontadas dimenses semiticas nesses ambientes. Concluiu-se que os agenciamentos da linguagem contribuem para o modo como o sujeito percebe e constri a qualidade da informao por meio da proposio de percursos de significao, da captao e reproduo destes atravs de cenrios semiticos e das aes colaborativas em que se destaca a curadoria de contedos. Palavras-chave: Semitica. Qualidade da Informao. Folksonomias. Colaborao. Redes sociais. Indicadores. Abstract: The study is aimed at performing the identification, systematization and the analysis of concepts that guide the composition of information quality indicators in digital environments in order to approach the role given to language when validating informational content. The initiative hypothesis states that considering the collaborative characteristic of contemporary strategies for information organization, social networks that were created and maximized by Folksonomy BasedSystems should contribute to formalizing information quality indicators. It was used a triangulation of methods and theories through the use of Peircean Semiotics as a theoretical matrix that enables the observation and understanding of the phenomena of language and meaning; Netnography as an instrument for identifying interests, discourses and affiliationsof the subjectsand characterization of theirinformational practices. Social Network Analysis is used as a theoretical support to the GT2 389

methodology that provides the establishment of necessary cuts to the empiric universe and the understanding of structural and relational dimensions that constitute ways of organization and interaction of social actors on digital environments. The empirical observation units are virtual communities of practice that congregate around themes such as Health and Digital Games in social bookmarking services Delicious, Diigo and Stumble Upon. The study describes and elucidates integration, personalization, renewal of language, sedimentation of language, ontological commitment, semiotic conception and relevance as quality indicators. Semiotics dimensions were highlighted in Folksonomy Based-Systems. In conclusion, the language contributes to the way the subject perceives and construes information quality through the proposal of signifying process, by capturing and reproducing those through semiotic scenarios and collaborative actions in which the content curation is highlighted.. Keywords: Semiotics. Information quality. Folksonomy. Collaboration. Social networks. Indicators. 1 INTRODUO Em um contexto de discusses crescentes na rea de Cincia da Informao (CI) sobre a diversificao das ferramentas utilizadas para a organizao e o compartilhamento de contedos informacionais no mbito da Web 2.0, este trabalho buscou uma aproximao entre a Semitica de matriz peirciana e a CI no que tange abordagem e explicao dos fenmenos informacionais. As formas contemporneas de produo, validao e uso da informao em contextos digitais, desafiam a dimenso social da CI, tanto no entendimento, quanto na sistematizao de suas manifestaes a partir da concepo do usurio enquanto o elemento ativo das alteraes e remodelagens do ciclo informacional. A consolidao dos espaos digitais colaborativos de criao e compartilhamento de recursos informacionais tem se refletido na constante produo de inovaes e na multiplicidade das funes desempenhadas pelos sujeitos, que alternam ou sincronizam papis de produtores, validadores e consumidores de contedos. Assim, no apenas denominados usurios, estes sujeitos so visualizados, principalmente aps a emergncia da fase 2.0 da web, como atores que se articulam atravs das redes sociais mediadas por computadores caracterizadas, sobretudo, pelo imbricamento estrutural1. Na concepo de aplicaes e servios Web 2.0 percebem-se, alm do apelo mercadolgico, inmeras tentativas que objetivam estimular e potencializar as interaes sociais on-line. Desse modo, a noo de rede, conceito elementar aos seres vivos, tanto em aspectos biolgicos, quanto em aspectos sociais, ganha centralidade enquanto instrumento de anlise e consideraes relacionadas redefinio de seus efeitos sobre a produo e disseminao da informao no mbito da apropriao de novas Tecnologias de Informao e Comunicao (TICs) fazem-se necessrias. A problemtica na qual esta pesquisa se insere, questionou se as abordagens convencionais do conceito de qualidade da informao atendem a um contexto caracterizado pela interatividade,

1 Conceito oriundo da metodologia de ARS que denota a participao de um indivduo em diversas redes sociais online.

GT2 390

colaborao e trocas simblicas constantes, mediadas pela arquitetura de redes sociais, no qual o usurio passa a atuar como sujeito, que no apenas utiliza, mas tambm produz, remodela e qualifica os contedos atravs da linguagem. Foram consideradas abordagens convencionais da qualidade da informao, aquelas que emergem de estudos cuja caracterstica preponderante a listagem de uma grande quantidade de critrios originrios de pesquisas quantitativas e centradas no sistema. Destaca-se nestes estudos, a influncia de uma perspectiva top-down, na qual h um modelo dominante de validao de publicaes cientficas em que o contedo avaliado e qualificado por especialistas e entidades para depois ser publicado aos usurios finais. Contudo, as redes telemticas e os dispositivos computacionais se mostram cada vez mais integrados e ubquos no cotidiano das pessoas. Atravs de dispositivos como smartphones e cmeras digitais elas produzem textos, fotos e vdeos com possibilidades de publicao e replicao instantneas na web. Isso altera a cadeia de validao e a eficcia de um modelo dominante em que o sujeito no visto como criador e validador e sim como mero usurio. Argumenta-se que a preocupao com as alteraes nos modos de produo, disseminao e validao dos contedos informacionais luz do constante desenvolvimento e apropriao das TICS se reflete no grande percentual de artigos de reviso identificados na literatura sobre a qualidade da informao. Dentre os quais destacamos: Nehmy e Paim (1998); Eppler e Wittig (2000); Knight e Burn (2005) e Parker et al. (2006). A partir da observao desse cenrio e do desenvolvimento de uma reviso de literatura que estabeleceu um panorama dos estudos sobre a qualidade da informao na web, foram feitos os questionamentos norteadores desta pesquisa. Como os agenciamentos da linguagem contribuem para o modo como o sujeito percebe a qualidade da informao? Seria possvel abordar a qualidade da informao em sua dimenso sgnica? Acredita-se nessa possibilidade se a mesma for considerada como um processo no qual os sujeitos desempenham um papel crucial. Ante o aspecto colaborativo das prticas de organizao da informao, no qual a dimenso da linguagem aparece como um vetor estratgico para que o contedo informacional atue como um catalisador das relaes sociais, considerou-se a possibilidade de que as redes sociais contribuam para a formalizao de novos indicadores de qualidade da informao. Assim, esta pesquisa teve como objetivo geral identificar, sistematizar e analisar as concepes que norteiam a composio dos indicadores de qualidade da informao em ambientes digitais colaborativos que adotam a folksonomia, com o objetivo de compreender o lugar atribudo linguagem na validao dos contedos. A folksonomia vista como o resultado da indexao social e uma alternativa s formas tradicionais de organizao da informao em ambientes digitais. O termo, cunhado pelo arquiteto da informao Thomas Vander Wal em 2004, designa uma classificao popular resultante da ao de se

GT2 391

atribuir uma tag2 a um determinado contedo, dotado de uma URL, em ambientes abertos, para fins de recuperao da informao (VANDER WAL, 2007). Os sistemas ou aplicaes que adotam folksonomias denotam a maximizao da autonomia dada aos sujeitos e manifestam o potencial das redes sociais na produo de metadados agregados de contextualizaes que organizam e compartilham os contedos e viabilizam conexes entre os atores sociais. Esses sistemas se enquadram num movimento de aperfeioamento constante, a partir da incorporao das experincias de seus usurios, alm de explorarem o mercado voltado para o aproveitamento da inteligncia coletiva e para o marketing viral e segmentado. Eles seguem uma tendncia de personalizao da recuperao da informao na web. Ressalta-se que as pesquisas no apontam consensos sobre a denominao de sistemas e aplicaes que viabilizam e utilizam a folksonomia. So citados na literatura de diversas maneiras, dentre as quais destacamos: Ferramentas de Social Bookmarking3, Sistemas de Etiquetagem Social4, Sistemas de Etiquetagem Colaborativa5, Sistemas de Classificao Social6 e Sistemas de Classificao Distribuda7 . Contudo, neste trabalho, optou-se por denomin-los Sistemas Baseados em Folksonomia (SBFs) conforme (NORUZI, 2006) e (BASSO; SILVA 2008). A partir da observao das folksonomias intuiu-se que o surgimento de alteraes nas formas de validao e mediao dos contedos informacionais nos contextos digitais colaborativos, evidencie potencialidades que contribuam para uma nova abordagem da qualidade da informao que considere a atuao das redes sociais na web e as manifestaes da linguagem. Acredita-se que estudos sobre a composio de indicadores de qualidade da informao na web forneam elementos inovadores para a concepo de ferramentas que considerem a fluidez e a mutabilidade da informao no meio digital, bem como a variedade de papis que so desempenhados pelos sujeitos enquanto produtores, mediadores e consumidores desta. O percurso investigativo sintetizado neste trabalho apontou que as pesquisas sobre a qualidade da informao na web necessitam de abordagens que reconheam esse ambiente como um espao de articulao dos processos de significao e de evidenciao das dinmicas de produo e compartilhamento de significados. Ele permitiu destacar que a principal contribuio da Semitica peirciana aos estudos sobre qualidade da informao evidenciar que os mesmos devem enfocar os processos e no os produtos finais. 2 QUADRO TERICO-METODOLGICO Na relao das folksonomias com a qualidade da informao, observou-se a salincia de trs
2 Uma tag uma palavra-chave extrada da linguagem natural de modo intuitivo. 3 Social Bookmarking Tools (VAN HOOLAND, 2006). 4 Social Tagging Systems (TRANT, 2009). 5 Collaborative Tagging Systems (KIPP; CAMPBELL, 2006). 6 Social Classification Systems (FEINBERG, 2006). 7 Distributed Classification Systems (PIKER, 2009)

GT2 392

elementos principais: as redes sociais, a linguagem e a colaborao. Buscou-se uma abordagem integrativa desses fenmenos com os propsitos de descrio, explicao e interpretao. Entretanto salienta-se que [...] o estado da arte de um campo de conhecimento ou de uma temtica dentro deste campo que ir delinear as possibilidades e limites da descrio, da explicao e da interpretao (FROTA, 2007, p. 49). Devido ao tipo de questionamento proposto e s caractersticas do universo emprico, optouse pela pesquisa qualitativa e pela triangulao de mtodos e teorias. A pesquisa qualitativa uma modalidade de investigao cientfica que se volta para a abordagem de fenmenos em que a subjetividade, a significao, as estruturas e processos sociais se fazem presentes, constituindo um nvel da realidade em que dificilmente se obtm compreenso com o uso de abordagens quantitativas (MINAYO, 2009). J a triangulao de mtodos indicada por Flick e Costa (2009) quando a insuficincia de uma abordagem metodolgica ante a uma questo de carter complexo exige o uso de dois ou mais mtodos de pesquisa. A triangulao desenvolveu-se mediante articulaes tericas e metodolgicas da Semitica, da Netnografia e da Anlise de Redes Sociais. A Semitica de Charles Sanders Peirce uma Teoria da significao concebida com elevado nvel de generalizao e abstrao. Enquanto abordagem terica, ela [...] o estudo de todos os tipos possveis de signos, verbais, no-verbais e naturais, seus modos de significao, de denotao e de informao; e todo o seu comportamento e propriedades (SANTAELLA; NTH, 2004, p.76). O signo uma entidade abstrata que exerce diferentes formas de mediao. De modo genuno, ele representa algo para algum de alguma maneira ou intensidade (CP 2:228). Como perspectiva metodolgica, a Semitica fornece as categorias que possibilitam a anlise dos processos de significao e cognio (SANTAELLA, 2002). Foram utilizadas neste estudo categorias semiticas que subsidiaram desde a escolha das ferramentas at a anlise dos dados obtidos. Tais conceitos foram: semiose, experincia colateral, concepo semisica e cenrio semitico. Por semiose, entende-se a dinmica de carter infinito em que ocorre a gerao de signos mais desenvolvidos a partir da ao de signos anteriores. Este processo pode ser moldado pela experincia colateral que nas palavras de Peirce [...] uma prvia familiaridade com aquilo que o signo denota (CP 7:179). Ou seja, os processos de significao produzidos na mente de um sujeito ao se deparar com determinado signo tendem a ser infinitos e so moldados pela experincia ou conhecimento anterior que ele possa ter em relao ao que o signo representa. Numa perspectiva que se originou de um estudo semitico do processo criativo, a concepo semisica o modo como um primeiro sujeito tenta intervir na semiose do outro por intermdio da interao deste intrprete com uma dada estrutura semisica construda pelo primeiro (MOURA, 2002, p.65), neste sentido, a concepo semisica caracterizada pela intencionalidade de um sujeito ao conceber uma estrutura ou cenrio semisico com vistas a intervir na semiose do outro com o qual estabelece interao. J o cenrio semitico, GT2 393

a representao de uma estrutura genrica ou um modelo controlado para a especificao e a modelagem de um produto de informao (STOCKINGER, 1999, p. 146). Ele o contexto no qual so geradas as condies de acesso aos contedos informacionais baseadas no estmulo sensibilidade dos sujeitos propondo um percurso de significao. Desse modo, manifesta-se nos arranjos sgnicos gerados tanto por desenvolvedores quanto pelos usurios do sistema ao descreverem e qualificarem os contedos atravs de tags e comentrios. A abordagem semitica dos processos interpretativos inerentes s prticas informacionais que ocorrem atualmente na web ressalta o hibridismo das manifestaes sgnicas bem como as constantes marcas de semioses deixadas pelos sujeitos no meio digital. Como os sujeitos e a identificao de seus interesses, universos, discursos e pertencimentos, so fatores que compem as articulaes que eles desenvolvem nas redes sociais, julgou-se pertinente o uso da Netnografia como ferramenta auxiliar com propsitos de observao, monitoramento e registro. A Netnografia um mtodo de pesquisa qualitativa adaptado da Etnografia, e por isso, se volta para o estudo de culturas e comunidades que emergem da comunicao mediada por computadores (KOZINETS, 2002). As dimenses das estruturas e relaes que constituem as formas de organizao dos sujeitos informacionais no contexto digital foram abordadas com o aporte terico e metodolgico da Anlise de Redes Sociais (ARS). Por sujeito informacional, entende-se um sujeito social que manifesta a sua subjetividade atravs do estabelecimento de identidades e percursos informacionais (MOURA 2009a). Ele visto como um sujeito social pragmtico, uma vez que constri suas relaes pela via da linguagem e do compartilhamento de significados. J a ARS uma abordagem metodolgica que possibilita destacar os tipos de relaes possveis entre os atores e a atuao destes em papis sociais e posies na estrutura da rede que empoderam a anlise qualitativa e apontam indivduos centrais em determinados processos e fluxos de informao. De acordo com Marteleto (2001)
A anlise de redes estabelece um novo paradigma na pesquisa sobre a estrutura social. Para estudar como os comportamentos ou as opinies dos indivduos dependem das estruturas nas quais eles se inserem, a unidade de anlise no so os atributos individuais (classe, sexo, idade, gnero), mas o conjunto de relaes que os indivduos estabelecem atravs das suas interaes uns com os outros. A estrutura apreendida concretamente como uma rede de relaes e de limitaes que pesa sobre as escolhas, as orientaes, os comportamentos, as opinies dos indivduos. (MARTELETO, 2001, p.72)

Tal anlise estrutural forneceu elementos metodolgicos e tericos para se pensar a qualidade da informao sob uma perspectiva que incorpora os efeitos das dinmicas e das formas de compartilhamento que se do ao longo das redes sociais e comunidades virtuais de prtica, que so grupos informais ou formalizados que compartilham competncias e experincias com certa regularidade (WELSER et al. 2007), O desenvolvimento da metodologia da pesquisa apresentou algumas dificuldades, como a GT2 394

escolha das ferramentas a serem analisadas, devido s instabilidades das mesmas; a delimitao de um universo amplo de significaes e sujeitos e a natureza tnue das mediaes entre pesquisador e sujeitos da pesquisa. Aps observaes sistemticas que tiveram como foco: as ferramentas, os sujeitos e a linguagem; as unidades de observao emprica foram definidas a partir da identificao e da formalizao de comunidades virtuais de prtica que se agregam pelo uso das ferramentas Delicious8, Diigo9 e Stumble Upon10. A fim de promover a delimitao desse universo gigantesco de usurios, comunidades e tags foram definidos: Assuntos Jogos digitais por ser especfico e com ampla atuao de um pblico mais adepto cibercultura e Sade, por ser genrico e possuir um pblico que agrega diversos interesses e nveis de atuao no ciberespao. Critrios para a definio dos sujeitos da pesquisa - frequncia de utilizao, tamanho da coleo pessoal, tamanho da rede pessoal, quantidade e qualidade das tags11, posies de centralidade. A posio dos atores sociais na estrutura da rede pode ser analisada atravs da centralidade destes. Para tanto, foram consideradas trs modalidades de centralidade descritas por Marteleto (2001): Centralidade de informao: remete ao indivduo cujo posicionamento possibilite o recebimento de informaes oriundas de vrias partes da rede. Centralidade de proximidade: atribuda ao indivduo que devido ao seu posicionamento percorre o menor caminho para acessar toda a rede. Centralidade de intermediao: atribuda a indivduos cuja posio na rede o possibilita atuar como intermedirio (ponte) nas mediaes informacionais. Como tcnicas de coleta de dados foram empregadas a pesquisa bibliogrfica, a observao participante, o questionrio semi-estruturado, a entrevista e o monitoramento de tags; auxiliado pelo uso das ferramentas Google Trends e Google Insight, que possibilitam testar regularidades e tendncias na linguagem a exemplo do que foi proposto por Moura (2009). As atividades de coleta de dados foram divididas em etapas de monitoramento que cobriram a escolha das ferramentas supracitadas, a observao e delimitao do selecionado de sujeitos da
8 O Delicious foi criado em 2003 pelo engenheiro Joshua Schachter e adquirido em 2005 pela Yahoo Company. considerado o precursor dos servios Web 2.0 que possibilitam a gesto e o compartilhamento de links favoritos. 9 O Diigo um servio, lanado em 2005, que oferece uma plataforma para a gesto e o compartilhamento de contedos e atua como uma ferramenta voltada para a pesquisa e a colaborao cientfica. 10 O Stumble Upon um servio criado em dezembro de 2001 pelos empresriosGarrett CampeGeoff Smith, enfatiza a validao e o compartilhamento de contedos atravs da navegao social. 11 Por qualidade da tag, considerou-se o potencial representativo do termo em relao ao assunto.

GT2 395

pesquisa e a anlise da linguagem compartilhada pelos mesmos. A sistematizao dessas atividades apresentada no quadro abaixo:
QUADRO 1 Sistematizao das atividades de coleta de dados. Objetivo Identificar os SBFs, as comunidades virtuais de prtica e os sujeitos da pesquisa. Armazenamento dos dados referentes aos sujeitos da pesquisa. Identificar grupos, tipos de lao e medidas de centralidade. Captar universos de origem, prticas informacionais e noes de qualidade da informao. Identificar acordos semnticos e relaes entre colaborao e linguagem. Compreender as prticas colaborativas e as concepes de qualidade da informao.

Atividade Monitoramento de usurios e servios de social bookmarking Criao e preenchimento de formulrios de banco de dados Formalizao das redes sociais Aplicao de questionrio semiestruturado

Instrumento (s) Sites de social bookmarking, blogs e outras pginas da web.

Produto (s) Unidades de observao emprica Banco de dados e backups Grafos de rede Dados e grficos da pesquisa Laos sociais e indicadores de qualidade da informao Dados da pesquisa

Software Microsoft Access

Software Yed Graph Editor. Ferramenta de construo e distribuio de formulrios do Google Docs. Site TagcloudGenerator, Google Trends, Google Insights, nuvens de tags e perfis dos sujeitos da pesquisa. Ferramentas de bate-papo do Facebook, Skype e Gtalk.

Levantamento da terminologia

Realizao de entrevistas em profundidade


Fonte: (ASSIS, 2011).

Aps a fase de monitoramento que possibilitou a identificao e a escolha dos sujeitos da pesquisa, foram enviados questionrios para 73 atores sociais. No selecionado brasileiro, cujos integrantes so usurios do Delicious, houve uma taxa de retorno de 50%. E no selecionado internacional, cujos integrantes so usurios do Diigo e do Stumble Upon, houve uma taxa de retorno de cerca de 20%. Os resultados foram codificados e sistematizados atravs de grficos gerados no software Excel. O desenvolvimento e a anlise dos questionrios possibilitaram identificar prticas informacionais e iniciar a investigao sobre a relao entre colaborao e qualidade da informao. A fim de verticalizar algumas noes de qualidade da informao, bem como a relao destas com a colaborao, foram feitas entrevistas atravs de servios de mensagens instantneas oferecidos pelo Gtalk e pelo Skype. Inicialmente, foram selecionados seis atores sociais, mas devido indisponibilidade de alguns em participar das entrevistas, manifesta pela demora em responder s GT2 396

solicitaes, agendamentos no cumpridos e o no retorno aos convites enviados, foram efetivamente entrevistados quatro deles. Ressalta-se que graas delimitao precisa, proporcionada pelos critrios de recorte e pela ARS, mesmo com quatro entrevistados foi possvel observar o critrio de saturao nas respostas obtidas. A composio do universo emprico da pesquisa foi constituda por 149 usurios, distribudos pelos trs SBFs da seguinte maneira:

22% Delicious 52% Diigo Stumble Upon 26%

GRFICO 1 Composio do selecionado de sujeitos da pesquisa por SBF.

Fonte: (ASSIS, 2011).

De modo simultneo identificao dos sujeitos e formalizao de comunidades virtuais de prtica, foi realizado o monitoramento de tags, que teve como propsito observar a dinmica e a evoluo da linguagem utilizada para representar e validar os contedos informacionais. Este procedimento foi desenvolvido em trs etapas: Nvel pessoal: baseado na observao das tags mais utilizadas por um sujeito e de todas as tags que ele possui no perfil. Nvel coletivo: observao e representao da co-ocorrncia de uso e de frequncia das tags ao longo dos perfis dos atores que se encontravam em posies de centralidade. Nvel global: observao e o monitoramento do grau de maturidade da linguagem atravs do Google Trends e do Google Insight. Salienta-se que a terminologia visualizada no nvel de monitoramento coletivo constitui modelos conceituais dos assuntos Jogos Digitais e Sade que emergiram dos acordos estabelecidos pelos sujeitos em colaborao e percebeu-se tanto a consolidao de termos, quanto a incluso de novidades nessas reas. Nesta etapa do percurso metodolgico intentou-se captar a influncia que a colaborao exerce GT2 397

sobre a linguagem utilizada na organizao da informao. O uso das ferramentas Google Trends e Google Insights para analisar as tags mais utilizadas pelos atores centrais visou correlacionar a linguagem utilizada pelos usurios da web para representar suas necessidades informacionais com a que utilizada para representar e compartilhar os contedos atravs dos SBFs. 3 RESULTADOS A colaborao foi destacada pelos respondentes como um elemento que leva obteno de contedos de qualidade. Os sujeitos adicionam pessoas s redes sociais que mantm nos SBFs em funo da qualidade do contedo compartilhado por elas. Alm disso, quando aderem a algum grupo ou tpico nesses ambientes, a principal expectativa a obteno de contedos de qualidade. Dentre os respondentes, 84% apontaram que o espao colaborativo contribui para a melhoria da qualidade da informao. Tal apontamento corrobora com Neus (2001) no tocante ao papel desempenhado pelas comunidades virtuais na validao dos contedos e no estabelecimento de padres implcitos e explcitos de qualidade. Por isso, o estudo de como os sujeitos concebem a qualidade da informao a partir desses ambientes, preconiza a observncia da dinamicidade que eles apresentam e incorpora o carter relativo da prpria noo de qualidade. Considera-se que existe uma dinmica relacionada no apenas aos cenrios semiticos e prpria estrutura de redes sociais, mas tambm aos laos relacionais estabelecidos entre os atores e experincia colateral que explorada pelos desenvolvedores ao captarem e proporem percursos de significao. Nesse sentido, quanto maior a familiaridade dos sujeitos com os arranjos sgnicos que o cercam, maior a capacidade dos SBFs em contriburem com a organizao e a recuperao da informao de uma forma que se aproxime das exigncias e necessidades de cada usurio. Por propiciarem a atuao de comunidades virtuais de prtica, percebeu-se nesses ambientes um compartilhamento simblico em que as concepes de relevncia tornam-se implcitas nas prticas e nas trocas que os sujeitos efetuam por intermdio dos sistemas. A relevncia apontada pelos sujeitos no se configura como um produto comercializvel, ela uma relevncia pessoal que pode se tornar coletiva ao longo das redes sociais. Ou seja, o que considerado relevante para um ator social frequentemente relevante para aqueles que estabelecem laos relacionais com o mesmo. A relevncia definida de acordo com o conceito atinncia (aboutness), que nos estudos de Fairthorne (1969) e Begthol (1986) referenciado como o resultado de um processo de atribuio de sentido a um contedo informacional de modo objetivo. Apesar do contedo, ou objeto informacional, gerar vrias significaes ao longo do tempo e dos contextos em que acessado, ele representado de um modo especfico para reduzir esse amplo escopo de significaes. Percebeu-se que a relevncia exerce um papel fundamental na curadoria de informaes que esses sujeitos realizam na rede. Devido essa estrutura multidimensional, a variedade de significaes GT2 398

que o conceito de atinncia visa limitar expandida de acordo com os perfis e necessidades dos sujeitos.

Quem acompanha minhas atualizaes na web se identifica com as informaes que compartilho, isto , com o fragmento de pessoa que esses dados compartilhados desenham. Para meus leitores, se que se pode usar esse termo nesse caso, (talvez seguidores fosse mais adequado), a informao mais relevante, no que me diz respeito, aquela que de fato tem a ver com o meu perfil. Se eu passar a propagar informaes que no tem a ver com meu perfil, estarei desvirtuando essa imagem, ainda que fragmentada. E, como editor, como hub de contedos, acabarei perdendo relevncia para meu seguidor. Assim, s posso te responder com uma frase meio ridcula: relevante tudo aquilo que eu considero relevante. (Sujeito A1, grifos nossos)

A curadoria digital um ato de sntese e interpretao com o propsito de apresentar um registro completo relacionado a um conceito (BECKLAND, 2010). Ela uma atividade exercida por vrios hubs nas redes analisadas. Os hubs so atores sociais centrais, que se caracterizam pelo recebimento de uma grande quantidade de apontamentos pelos demais atores. Ao salvarem contedos relevantes para si eles tambm atendem s concepes de relevncia daqueles que os seguem. Constata-se que a atribuio de relevncia, figura como uma concepo semisica de um ator para outro. Essa afirmao corrobora com Moura (2002) apud Ziller (2005)
[...] ao conceber semiosicamente uma informao, o indivduo que elabora essa informao deve aproximar-se do usurio e quanto maior for a semelhana entre o usurio concreto e as estratgias que configuram o leitor-modelo, determinadas por quem concebe a informao, maiores as possibilidades de se atingir efetivamente o usurio com uma informao de qualidade. (ZILLER, 2005, p.86)

As autoras se referem concepo semisica que ocorre no mbito da produo de um contedo enquanto o presente estudo apontou a repercusso desse fenmeno de significao no mbito da representao dos contedos. Em ambos, a concepo semisica se manifesta como uma modelagem sgnica. Ocorre que no contexto digital colaborativo que se analisou, as dinmicas das redes sociais acentuam a proximidade de modelos sgnicos entre os sujeitos ou estabelecem modelos sgnicos compartilhados. A aproximao e o compartilhamento de modelos sgnicos so representados pelas prticas de curadoria digital. Nos SBFs, a curadoria digital apresenta nfase na qualificao e compartilhamento de contedos, ou seja, privilegiada a dimenso de uma prtica que visa promover a agregao de valor aos objetos informacionais e a disseminao dos mesmos como uma maneira de superar a grande quantidade de contedos informacionais disponveis e a escassez do tempo e da ateno para avali-los. Nesse sentido, as redes sociais atuam como filtros e alguns atores sociais desempenham o papel de curadores de contedo.

GT2 399

3.2 Dimenses semiticas dos SBFs e indicadores de qualidade da informao A fase de monitoramento da terminologia propiciou testes relacionados ao efeito da colaborao na sedimentao e na renovao da linguagem. As tags so entidades que figuram as trocas geradas pelos laos cognitivos entre os atores sociais (MIKA, 2007). Ou seja, elas remetem ligao gerada a partir do compartilhamento de narrativas, linguagens e signos comuns promovendo a troca de conhecimentos. So nas comunidades virtuais de prtica smbolos, ou representaes, comuns a um grupo. Por isso, a consolidao e a renovao de uma determinada terminologia denotam os movimentos de qualificao dos contedos representados por ela. A partir das categorias fenomenolgicas de Peirce desenvolveu-se a seguinte descrio dos sistemas folksonmicos em relao qualidade da informao enquanto processo:
QUADRO 2 Dimenses semiticas dos SBFs

CATEGORIA Primeiridade Secundidade Terceiridade

DIMENSO Espao social semntico Rede social Linguagem Fonte: (ASSIS, 2011).

MANIFESTAO Estruturas sugestivas Estruturas relacionais Estruturas simblicas

As folksonomias, enquanto espaos sociais semnticos, manifestam-se como estruturas sugestivas que se originam da incorporao dos percursos de significao desenvolvidos pelos sujeitos. Espaos sociais semnticos so o conjunto das representaes objetivas, subjetivas e prticas dos contedos informacionais (QIN, 2008). Definidos pelos arranjos das colees pessoais, das tags e da arquitetura da participao, eles influenciam os processos de significao. Por isso, correlacionamse ao nvel da Primeiridade, visto que esta a categoria fenomenolgica que descreve os signos, ou os cenrios sgnicos, dotados de um elevado potencial sugestivo. J a dimenso de rede social, posiciona-se num nvel de secundidade, ao e reao, dada pelo carter relacional dessas estruturas. As posies estruturais e os papis desempenhados pelos atores, os laos estabelecidos e os fluxos gerados pela arquitetura de redes so elementos pertinentes ao entendimento da formao de consensos e implicam na existncia de acordos tcitos e explcitos previamente estipulados como marcos de regulao e mobilidade dos padres de qualidade da informao. As folksonomias como expresses de linguagem, possuem como anloga a Terceiridade peirciana e dessa forma, caracterizam-se pela presena das duas dimenses supracitadas, pela GT2 400

sobreposio do simblico, pela renovao e pela expanso. A linguagem viabiliza um sistema em que ocorre a integrao de cenrios semiticos e redes sociais. Ela exerce a funo de mediadora das aes colaborativas e da construo da qualidade da informao. As redes sociais e os cenrios semiticos so mediadores na construo da qualidade da informao de modo colaborativo. Nesse sentido, a colaborao promove curadoria e segmentao de contedos num ambiente em que se observa a integrao como a configurao que interliga cenrios semiticos e redes sociais em um nico sistema ou ferramenta e viabiliza a personalizao como uma tendncia que norteia a obteno de produtos sgnicos de modo adaptado s necessidades e perfis. Por isso colaborao, integrao e personalizao, assim como a renovao e a sedimentao da linguagem, so indicadores de qualidade da informao. Considerando a relao dos sujeitos com os cenrios semiticos, ou seja, com as trilhas de significado implementadas por eles, o compromisso ontolgico, definido como a relao entre o sujeito e sua representao e a concepo semisica enquanto uma modelagem sgnica, so indicadores que confluem para a obteno de relevncia, visto que ela definida como grau de aplicabilidade e utilidade de um contedo informacional em relao a um determinado assunto. Assim, o compromisso ontolgico, a concepo semisica e a relevncia so tambm ndices desse movimento interpretativo pelo qual os sujeitos concebem a qualidade da informao na web. QUADRO 3 Indicadores de qualidade da informao em SBFs. Fonte: (ASSIS, 2011) INDICADOR
Colaborao Integrao Personalizao

DEFINIO
. Ao em que ocorre a mediao da linguagem no compartilhamento de smbolos e significados comuns. . Configurao que interliga cenrios semiticos e redes sociais em um nico sistema ou ferramenta. . Tendncia que norteia a formulao de produtos sgnicos de modo adaptado a necessidades e perfis. . Consolidao de uma determinada terminologia. . Incluso do novo que promove a expanso da terminologia.

MEDIAO
Redes sociais

Sedimentao da linguagem Renovao da linguagem

Redes sociais e Cenrios semiticos

GT2 401

Compromisso ontolgico Concepo semisica Relevncia

. Relao entre o sujeito e sua representao. . Modelagem sgnica. . Grau de aplicabilidade e utilidade de um contedo em relao a um determinado assunto. Cenrios semiticos

Tal movimento (indicadores como ndices de um processo) escapa s tentativas de quantificao promovidas pelas pesquisas convencionais sobre a qualidade da informao visto que os nmeros no revelam a complexidade que envolve as concepes, nem to pouco as formas de interao entre os sujeitos e as manifestaes dos mesmos no contexto digital. Sob esta perspectiva, os modelos de qualidade da informao propostos, so um recorte arbitrrio e operacionalizvel de um universo multidimensional e complexo de significaes, sendo criados para contextos e propsitos especficos e desse modo, propensos a sofrerem desatualizaes. Assim, ao invs de propor um modelo conceitual que aponta uma listagem de critrios que visam avaliar a qualidade da informao, este estudo a evidencia como um processo caracterizado pela gerao e pelo compartilhamento de significados. 4 CONCLUSES Considera-se que as abordagens convencionais do conceito de qualidade da informao no atendem a um contexto interativo, colaborativo e permeado por trocas simblicas constantes mediadas pela arquitetura de redes sociais em que o modelo de usurio passivo d lugar a um sujeito informacional que no apenas utiliza, mas tambm produz, remodela e qualifica os contedos informacionais atravs da linguagem. Os estudos sobre qualidade da informao devem enfocar os processos e no os produtos finais. Conclui-se que os agenciamentos da linguagem contribuem para o modo como o sujeito percebe e constri a qualidade da informao por meio das aes colaborativas, da proposio de percursos de significao e da visualizao e reproduo destes atravs de cenrios semiticos. Ressalta-se que a metodologia possibilitou caracterizar as prticas informacionais, identificar os tipos de laos estabelecidos entre os atores sociais e a terminologia gerada pelos mesmos. E ainda apontar a influncia que a colaborao exerce sobre a linguagem utilizada na organizao da informao. Dadas as contingncias atuais e a natureza dos fenmenos envolvidos, as metodologias desenvolvidas no mbito da Organizao e Uso da Informao (OUI) necessitam incorporar experimentos pautados pela diversidade, inovao e integrao sem, contudo, preterirem o rigor necessrio ao percurso de descrio, explicao e interpretao que preconiza a formalizao do conhecimento cientfico. GT2 402

REFERNCIAS
ASSIS, Juliana de. Indicadores de qualidade da Informao em sistemas baseados em folksonomia: uma abordagem semitica. Orientadora: Maria Aparecida Moura. 2011. 209f. Dissertao (Mestrado em Cincia da Informao) Escola de Cincia da Informao, Universidade Federal de Minas Gerais UFMG, Belo Horizonte, 2011. BASSO, Carlos A. M.; SILVA, Srgio R. P. da. Uma proposta para a evoluo de ontologias a partir de folksonomias. In: WORKSHOP DE TESES E DISSERTAES (WTD), 8., 2008, Vila Velha-ES. Anais do Simpsio Brasileiro de Sistemas Multimdia e Web (WebMedia), 14., 2008. p.197-200. BECKLAND, Jamie. Social Media Content Curators Are Not Just Filters. 2010. Disponvel em: <http:// jamiebeckland.com/2010/04/social-media-content-curators-are-not-just filters/#axzz1IlgE5Mu6>. Acesso em: 10 mar. 2010. BEGHTOL, Clare. Bibliographic classification theory and text linguistics: aboutness analysis, intertextuality and the cognitive act of classifying documents. Journal of documentation, v.42, n.2, p.84-113, 1986. EPPLER, Martin; WITTIG, Dorte. Conceptualizing information quality: a review of information quality frameworks from the last ten years. In: CONFERENCE ON INFORMATION QUALITY, 2000. Proceedings, 2000. p.83-96. [on line]. FAIRTHORNE, R.A. Content analysis, specification, and control. Annual Review of Information Science and Technology, v. 4, p. 73-109, 1969. FEINBERG, M. An examination of authority in social classification systems. Advances in Classification Research, v.17. In: FURNER, Jonathan; TENNIS, Joseph T. (Ed.) ASIST & T. CLASSIFICATION RESEARCH WORKSHOP, 17., 2006. Proceedings, Austin, 2006. FLICK, Uwe.; COSTA, Roberto Cataldo. Desenho da pesquisa qualitativa. Porto Alegre: Artmed, 2009. 164 p. FROTA, Maria Guiomar da Cunha. Desafios terico-metodolgicos para a cincia da informao: descrio, explicao e interpretao. In: REIS, Alcenir Soares dos.; CABRAL, Ana Maria Rezende (Org.). Informao, cultura e sociedade: interlocues e perspectivas. Belo Horizonte: Novatus, 2007. p. 49-59. HINE, C. Virtual methods and the sociology of cyber-social-scientific knowledge. In: HINE, Christine (Org.).Virtual methods. Oxford: Berg, 2005. [Issues in Social Research on the Internet]. KIPP, M. E.; CAMPBELL, D. G. Patterns and inconsistencies in collaborative tagging systems: an examination of tagging practices. In: AMERICAN SOCIETY Of INFORMATION SCIENCE & TECHNOLOGY ANNUAL CONFERENCE 2006, Austin, Texas (US), 2006 KOZINETS, R. The field behind the screen: using netnography for marketing research in online communities. Journal of Marketing Research, v.29, n.1, p.61-72, Feb. 2002. KNIGHT, Shirlee-ann; BURN, Janice. Developing a framework for assessing information quality on the World Wide Web. Informing Science Journal, v.8, p.161-172, 2005. MARTELETO, Regina. Anlise de redes sociais: aplicao nos estudos de transferncia da informao. Cincia da Informao, Braslia, v.30, n.1, p.71-81, jan./abr. 2001. Disponvel em: <http://dici.ibict.br/ archive/00000204/01/Ci[1].Inf-2004-261.pdf>. Acesso em: 14 jun. 2009.

GT2 403

MINAYO, Maria Ceclia de Souza. O desafio da pesquisa social. In: MINAYO, Maria Ceclia de Souza; DESLANDES, Suely Ferreira; GOMES, Romeu (Org.). Pesquisa social: teoria mtodo e criatividade. Petrpolis: Vozes, 2009. p.9-29. MIKA, Peter. Social networks and the semantic web. New York: Springer, 2007. 234 p. MOURA, Maria Aparecida. Semitica e mediaes digitais: criao e recepo de hipermdias. Orientador: Arlindo Machado. 2002. 208f. Tese (Doutorado em Comunicao e Semitica) Pontifcia Universidade Catlica de So Paulo, So Paulo, 2002. MOURA, Maria Aparecida. Informao, ferramentas ontolgicas e redes sociais AD HOC: a interoperabilidade na construo de tesauros e ontologias. Revista informao e sociedade, v. 19, n.1, p. 59-73, 2009. NEUS, Andras. Managing information quality in virtual communities of practices. In: PEIRCE, E.; KATZHAAS, R. Proceedings of the 6th International Conference on Information Quality at MIT. Boston, MA: Sloan School of Management, 2001. NORUZI, Alireza. Folksonomies: why do we need controlled vocabulary?. E- prints in Library and Information science, 2006. p.7. Disponvel em: <http://eprints.rclis.org/archive/ 00011286/>. Acesso em: 28 nov. 2007. NEHMY, Rosa Maria Quadros; PAIM, Isis. A desconstruo do conceito de qualidade da informao. Cincia da Informao, Braslia, v.27, n.1, p.36-45, jan./abr. 1998. Disponvel em: <http://www.scielo.br/scielo. php?script=sci_arttext&pid=S0100-19651998000100005>. Acesso em: 12 ago. 2009. PEIRCE, Charles Sanders. Collected papers of Charles Sanders Peirce. [on line]. Disponvel em: <http:// www.textlog.de/charles_s_peirce.html>. Acesso em: 15 mar. 2011. PARKER, M. B. et al. An evaluation of information quality frameworks for the World Wide Web. 2006. Disponvel em: <http://eprints.ecs.soton.ac.uk/12908/1/WWW2006_MParker.pdf>. Acesso em: 21 jun. 2009. PIKER, Samuel. An evaluation of Flickrs distributed classification system, from the perspective of its members, and as an image retrieval tool in comparison with a controlled vocabulary. Computing Research Repository. 2009. Disponvel em: <http://arxiv.org/abs/0912.1767>. Acesso em: maio 2010. QIN, Jian. Folksonomies and taxonomies: where the two can meet. In: NKOS WORKSHOP, Washington. Set. 2008. Disponvel em: <http://nkos.slis.kent.edu/2008workshop/JianQin.pdf>. Acesso em: 21 mar. 2011. SANTAELLA, Lcia. Semitica aplicada. So Paulo: Cengage Learning, 2002. 186p. SANTAELLA, Lcia; NOTH, Winfried. Comunicao e semitica. So Paulo: Hacker, 2004. 250p. STOCKINGER, Peter. Les nouveaux produits d information: conception et smiotique du document. Paris: Hermes, 1999. TRANT, Jennifer. Studying social tagging and folksonomy: a review and framework. Journal of digital information, v.10, n.1, 2009. Disponvel em: <http://dlist.sir.arizona.edu/2595/01/trant-studyingFolksonomy. pdf>. Acesso em: 12 set. 2009. VAN HOOLAND, Seth. From spectator to annotador: possibilities offered by user-generated metadata for digital cultural heritage collections. Bruxelles, p.1-15. Sept. 2006. Disponvel em: <http://homepages.ulb.

GT2 404

ac.be/~svhoolan/Usergeneratedmetadata.pdf>. Acesso em: maio 2010. VANDER WAL, Thomas. Folksonomy coinage and definition. Feb. 2007. Disponvel em: <http://www. vanderwal.net/folksonomy.html>. Acesso em: 12 ago. 2010. WELSER, Howard T et al. Visualizing the signatures of social roles in online discussion groups. Journal of Social Struture, v.8, 2007. Disponvel em: <http://www.cmu.edu/joss/content/articles/volume8/Welser/>. Acesso em: 18 abr. 2009. ZILLER, Joana. Qualidade da informao em web jornais: a demanda e a traduo intersemitica. 2005. 250f. Dissertao (Mestrado em Cincia da Informao) Escola de Cincia da Informao, Universidade Federal de Minas Gerais, Belo Horizonte, 2005.

GT2 405

COMUNICAO ORAL

A IMPORTNCIA DOS PRESSUPOSTOS ONTOLGICOS COMO BASE PARA O USO ARTICULADO DE ONTOLOGIAS NO CONTEXTO DA WEB SEMNTICA
Linair Maria Campos, Maria Luiza Almeida Campos, Maria Luiza Machado Campos e Miguel Gabriel Prazeres de Carvalho Resumo: A adoo de ontologias tem aumentado nos ltimos anos, tendo como uma de suas motivaes a necessidade de descrever recursos de forma a apoiar sua interoperabilidade, notadamente na rea de Biomedicina. Recentemente, as iniciativas de web semntica reforam essa tendncia, com o crescimento exponencial das publicaes de dados interligados, que se apiam fortemente no uso de descritores, vocabulrios e ontologias de diversas origens e temticas. Nesse cenrio, onde a dinmica ou urgncia da criao desses vocabulrios por vezes suplanta a adoo de prticas sistemticas para sua organizao, observamos uma carncia na explicitao dos princpios que norteiam a sua construo. Especialmente se considerarmos a necessidade do uso articulado desses vocabulrios, construdos de forma independente, e muitas vezes descentralizada, onde a identificao da natureza dos conceitos envolvidos elemento chave para se evitar ambigidades nas correspondncias a serem efetuadas entre eles. O objetivo desse trabalho ajudar a divulgar e esclarecer a importncia dos pressupostos ontolgicos no uso de ontologias no contexto da web semntica, e situar sua diferena em relao aos pressupostos comumente adotados pelo cientista da informao no mbito da classificao bibliogrfica. Como resultado, temos um conjunto proposto de pressupostos ontolgicos bsicos a serem adotados pelo cientista da informao como ponto de partida na organizao de ontologias. O apoio a esta tarefa pode se constituir em um importante nicho de atuao para a Cincia da Informao, que j vem trabalhando h dcadas na organizao de taxonomias, tesauros e vocabulrios controlados, com uma valiosa experincia acumulada. Palavras-chave: Construo de Ontologias. Pressupostos ontolgicos. Ontologias de fundamentao. Web Semntica. Dados Ligados. Abstract: The adoption of ontologies has increased in recent years, having as one of its motivations the need to describe resources in order to help their interoperability, especially in the area of B iomedicine. Recently, the semantic web initiatives reinforce this trend, with the exponential growth of publication of linked data, which relies heavily on the use of vocabularies from different sources and topics. In this scenario, where the dynamics or urgency of creating these vocabularies often supplants the adoption of systematic practices for their organization, we observed little support to explicit the principles that guide their construction. Especially considering the need to articulate these vocabularies, independently constructed and often maintained decentralized, the identification of the nature of the concepts involved is a key element to avoid ambiguities when making correspondences between them. The aim of this work is to help disseminate and explain the importance of ontological assumptions in the use of ontologies in the context of semantic web, and to discuss differences to assumptions commonly adopted by the information scientist in the scope of bibliographical classification. The result is a proposed set of basic ontological assumptions, to be adopted by an information scientist GT2 406

as a starting point to organize ontologies. Support for this task may represent an important niche for Information Science, which has been working for decades on the organization of taxonomies, thesauri and controlled vocabularies, accumulating a valuable experience. Keywords: Ontology engineering. Ontological Assumptions. Foundational ontologies. Semantic Web. Linked Data. 1 INTRODUO Informaes originalmente publicadas na web eram formadas principalmente por contedos na forma de hipertexto e hipermdia, permitindo uma navegao pelos links existentes e buscas por palavraschave. Se por um lado esse tipo de estrutura contribuiu para a sua popularidade e para o crescimento vertiginoso de informaes publicadas na web, por outro lado esse crescimento, desordenado, tem trazido problemas para a sua recuperao (HORROCKS, 2008). Em especial se considerarmos que esses contedos, potencialmente articulveis, se encontram isolados em silos de informao. Nesse contexto, o desafio que se coloca sua articulao, de forma dinmica e inteligente, de modo a potencializar seu valor, combinando informao e servios de mltiplas fontes, de forma automtica. Em outras palavras, almeja-se integrar os silos de informao em redes de informao, promovendo suaa interoperabilidade semntica e lanando a fundao para a recuperao mais precisa dessas informaes, como forma de tentar minimizar o problema, recorrente, da exploso informacional. O que nos remete ao passado recente do avano da literatura cientfica do ps-guerra e das idias inovadoras de Paul Otlet, que j nos idos da dcada de 1930, antecipava a web dos dias atuais:
Tudo no universo, e tudo do homem, poderia ser registrado distncia, medida que estiver sendo produzido. Desta forma, uma imagem em movimento do mundo ser estabelecida, um verdadeiro espelho de sua memria. De longe, todos vo ser capazes de ler textos, ampliados e limitados ao assunto desejado, projetados em uma tela individual. Assim, da sua poltrona todos seriam capazes de contemplar a criao, como um todo ou parcialmente. (OTLET, 1935).

A web semntica, atravs de ontologias e tecnologias especificamente voltadas para a combinao (mashups) de informaes, recria uma rede significativa de ligaes, tal como projetado por Otlet: a materializao de ligaes com significado que antes somente era percebida por um sujeito cognoscente1 e que hoje pode ser passvel de interpretao pela mquina. A web semntica surgiu para resolver problemas da web atual, tambm conhecida como web sinttica, onde os computadores somente fazem a apresentao do contedo deixando a cargo do usurio a interpretao das informaes (BREITMAN, 2005). Essa web representada pelas assim chamadas web 1.0 e web 2.0. Na web 1.0 surgem os grandes portais de informao, porm cujo contedo no era criado de forma colaborativa. J a web 2.0 foi marcada pela gerao de contedos para web com a participao colaborativas dos usurios, podendo ser exemplificada pela utilizao das redes sociais como o Facebook e tambm de ferramentas

Sujeito que detm o conhecimento.

GT2 407

de gerao colaborativa do contedo como a Wikipdia. A web 3.0, tambm considerada por alguns autores (BREITMAN, 2005) como a prpria web semntica, na verdade um conjunto de tecnologias semnticas integradas ou que facilitam a criao de aplicaes web em larga escala (HENDLER, 2009). Surgiu da necessidade de promover a interligao da grande quantidade de contedo da Web 2.0, e para isso conta com o auxlio de diversas tecnologias para interligao dos contedos como, por exemplo, ontologias e metadados para sua descrio, agentes inteligentes para realizao de buscas e formalismos como o RDF para ligao entre os diversos tipos de recursos (BREITMAN, 2005). Na web semntica, ontologias podem ajudar a aumentar a semntica associada representao de contedos de natureza diversa na web, contribuindo para o entendimento comum de conceitos e para a explicitao do conhecimento de diferentes domnios. Entretanto, considerando a natureza espontnea e social da web, a tendncia a utilizao de diversos vocabulrios, para descrever recursos de temticas distintas, onde a facilidade de uso um atrativo para a sua aceitao (ALLEMANG, HENDLER, 2008). Assim a semntica desejada, mas a criao de vocabulrios simples parece ser uma tendncia nesse cenrio mais geral de uso da web. Isso contrasta com o uso de ontologias para descrever contedos de uma rea especfica como a Biomdica, por exemplo, onde possvel considerar a adoo de um conjunto controlado de vocabulrios, geralmente complexos, desenvolvidos sob a coordenao de algum rgoresponsvel por sua manuteno e gerncia. Nesse cenrio de uso de mltiplos vocabulrios independentes e de temticas variadas para apoiar a integrao de informaes, existem vrias questes a serem resolvidas. Essas questes dizem respeito a problemas j discutidos no mbito das iniciativas de reso de ontologias e de linguagens documentrias, tais como a compatibilizao de termos semelhantes com nvel de detalhe diferente, com sentidos no exatamente iguais, ou com nomenclatura homnima, e, ainda presentes em estruturas hierrquicas conflitantes (NEVILLE, 1972) (DING, et al., 2006). Outro aspecto importante identificar e explicitar, para fins computacionais, a semntica associada aos contedos disponveis. Por exemplo, ao encontrar em uma pgina o texto Joo ensina Lgica, desejado fornecer para as ferramentas de software subsdios para que estas reconheam que Joo um professor e que Lgica uma disciplina da graduao de um curso em uma dada instituio. Alm disso, importante estabelecer que Joo ministra aulas (ensina) dessa disciplina. preciso identificar a natureza dos conceitos e suas relaes e quanto mais rica for essa identificao, mais conhecimento se pode obter. No caso acima, por exemplo, dependendo da semntica explicitada atravs da identificao dos conceitos e suas relaes, seria possvel inferir (ou seja, deduzir sem que esteja explicitamente informado dessa forma) que Joo faz parte do corpo docente da graduao de um certo curso naquela determinada instituio. Para isso, por exemplo, preciso definir quais as caractersticas que identificam um docente e uma disciplina, de modo a poder atribuir a Joo o tipo docente (sinnimo de professor) e a Lgica o tipo disciplina, de modo a depois relacionar um a outra, o que pode ser apoiado pelo uso de ontologias. Para promover uma integrao semntica de dados descritos por ontologias, importante GT2 408

compreender as noes que so adotadas como pressupostos bsicos para a estruturao e definio dos conceitos dessas ontologias, ponto central do presente artigo. O desafio como criar simplicidade a partir de noes complexas. O restante do texto est estruturado da seguinte maneira: na seo 2 apresentamos os cenrios de uso de ontologias na web; na seo 3 um conjunto de pressupostos ontolgicos bsicos, que podem ser utilizados como ponto de partida para a descrio semntica de recursos na web; na seo 4 os trabalhos relacionados e, por fim, na seo 5 as nossas concluses. 2 CENRIOS DE USO DE ONTOLOGIAS NA WEB SEMNTICA A iniciativa de Dados Interligados vem como resposta para a interligao semntica de recursos descritos na web, e, para isso, Tim Berners-Lee2, prope que sejam adotados os seguintes princpios: (1) uso de URIs como nomes para coisas; (2) uso de URIs via http, de modo que as pessoas possam buscar por esses nomes na web; (3) Quando algum procurar por uma URI, que se fornea informao til, usando padres (RDF, SPARQL); (4) Incluso de associaes com outras URIs, de modo que as pessoas possam descobrir mais coisas. Esses princpios trazem como um diferencial o uso de URIs via http, que na prtica se constituem em um mecanismo para atribuir a cada coisa (concreta, abstrata, ou ainda um conceito qualquer) na web um identificador nico. Diferente das URLs, que se propem a ser endereos para recursos, por exemplo, o endereo da pgina web de uma pessoa, a URI via http permite que se referencie a pessoa em si. Existe tambm a idia bsica de fornecer informao til, que pode ser trabalhada para que sejam divulgados dados efetivamente relevantes sobre o recurso descrito. Alm disso, a proposta de incluir lligaes para outras URIs, fornece as bases para a almejada integrao de dados, cruzando a fronteira dos silos de informao e enriquecendo o resultado final a ser apresentado ao usurio final. Essas ligaes podem ser de diversos tipos, no s ajudando na sua caracterizao (ex: professor x ministra disciplina d), mas tambm a traar sua identidade (ex: professor x o mesmo que professor y) e ainda a estabelecer mapeamentos com outros vocabulrios mais conhecidos que possuem descritores semelhantes aos que estiverem sendo usados para descrever o recurso. Dados interligados, se disponveis livremente na web usando padres no proprietrios, so denominados de Dados Abertos Interligados (em ingls Linked Open Data, ou LOD). A publicao de LOD parece ser uma tendncia de fato, conforme se pode observar pelo crescimento constante dos acervos sendo disponibilizados, assim como de iniciativas, como a incubadora do W3C3, que buscam agregar comunidades relativas a bibliotecas e reas afins, promover e discutir estudos de caso bem sucedidos de como colocar em prtica a publicao de seus dados, ligando-os a uma nuvem de dados abertos interligados (Figura 1). A interligao de dados abertos na web 3.0 traz a estes valor agregado, aumentando assim
2 3 http://www.w3.org/DesignIssues/LinkedData.html http://www.w3.org/2005/Incubator/lld/

GT2 409

a sua utilidade. Porm, devido aos problemas de compatibilidade mencionados anteriormente, deve-se incentivar o reso de vocabulrios j existentes. Para favorecer o reso, fundamental que se explicite, tanto quanto possvel, o compromisso ontolgico dos vocabulrios. O compromisso ontolgico definido, no contexto desse trabalho, como um acordo partilhado por uma comunidade sobre o significado consensual pretendido para a ontologia, no s considerando sua compreenso por pessoas, como tambm pelos agentes de software, contribuindo para aumentar a semntica dos conceitos descritos.

Figura 1: Nuvem de dados abertos interligados, em 2007 e 2010. Adaptado de: Heath e Bizer (2011).

A explicitao do compromisso ontolgico favorece o reso na medida em que permite capturar o significado (embora aproximado) do conceito, que vai alm do que possvel representar atravs de sua nomenclatura, e permite ainda compreender de forma mais precisa a natureza das suas relaes com outros conceitos, favorecendo a integrao semntica de dados. (TODOR, PASCHKE, HEINEKE, 2010). Na web semntica, ontologias vm sendo utilizadas no contexto de dados abertos interligados para descrever recursos diversos, que incluem as iniciativas voltadas para a divulgao de dados governamentais, de cincias biolgicas, de publicaes cientficas e, ainda, servios bibliogrficos de modo geral (HEATH e BIZER, 2011). Esses dados publicados como LOD fornecem uma viso integrada que permite o cruzamento dinmico de informaes que antes estariam dispersas dificultando sua viso crtica. Por exemplo, dados abertos ligados publicados pelo governo ingls permitem populao acompanhar de forma dinmica o uso de verbas pblicas, consolidando informaes de origens distintas sobre o tipo e rea da despesa, a entidade contratante e o fornecedor, o valor da verba, dentre outros4. Na rea Biomdica, iniciativas de LOD tm se aproveitado da abundncia de dados publicados, no s relativos a experimentos em si, bem como a literatura cientfica associada. Como exemplo, podemos citar o projeto ChemCloud (TODOR, PASCHKE e HEINEKE, 2010), que integra dados de elementos qumicos e publicaes cientficas, dentre outros, DBpedia, permitindo uma melhor classificao dos conceitos relativos a compostos qumicos, bem como da sua descrio em outros idiomas e o uso de sinnimos.
4 http://data.gov.uk/

GT2 410

No que diz respeito aos servios bibliogrficos, destaca-se a crescente mobilizao de profissionais ligados rea da biblioteconomia de alguns pases, tais como, Inglaterra, Alemanha, Sucia e Estados Unidos e Espanha (PESET, FERRER-SAPENA e SUBIRATS-COLL, 2010), cujos esforos tm resultado na publicao de grandes bases de dados bibliogrficos em LOD (HEATH e BIZER, 2011) (SDERBCK e MALMSTEN, 2009). A descrio desses dados, entretanto, idealmente deveria seguir um modelo rico de interligaes, como sugere Tim Berners-Lee, com informaes teis agregadas e com conexes a recursos externos disponveis na web de dados. O que se observa em um primeiro momento, no entanto, que nem sempre isso ocorre. Em algumas iniciativas, adota-se o uso de um conjunto limitado de descritores com poucas interligaes com recursos externos, o que parece sugerir uma inteno inicial de se privilegiar a disponibiizao do dado. Sua descrio e interligao mais elaborada seriam postas em prtica em um momento futuro, aps um amadurecimento maior:
Quando se trata da melhoria da gesto da informao, a ligao entre diferentes bases de dados, possibilitada pelos dados ligados, mostra-se muito promissora para a cooperao e interoperabilidade entre bibliotecas, bem como para preencher a lacuna entre as bibliotecas e outras organizaes de conhecimento. Isto algo que ns apenas comeamos a explorar. (...) Embora neste momento s tenhamos alguns links para a dbpedia, esperamos que a adio futura de um nmero substancial de links proporcionar possibilidades interessantes para ns, assim como para os outros. (SDERBCK e MALMSTEN,

2009, p. 2).

atravs da descrio e interligao mais elaborada dos dados que se viabiliza a recuperao de informao mais rica e precisa, atravs do uso desses descritores e de suporte a inferncias, como explicado a seguir.

2.1 Ontologias como apoio inferncia de conhecimento Ontologias apresentam um diferencial semntico em relao s linguagens documentrias, pois estas ltimas so voltadas basicamente para a representao e recuperao de informao, fornecendo um vocabulrio padronizado, cujo sentido no explicitado com vistas a ser tratado computacionalmente. As ontologias, por outro lado, se apiam em mecanismos de representao baseados em lgica e que permitem definir, atravs de axiomas, os conceitos nela contidos e suas relaes. As relaes tambm possuem atributos que facilitam a descoberta de conhecimento. Esses atributos indicam, por exemplo, se a relao inversa (ex: filho de e pai de), ou simtrica (ex: irmo de), ou ainda transitiva (ex: pr-requisito de), dentre outros. Porm o uso de tais recursos depende da forma de modelagem dos conceitos na ontologia, podendo ser utilizados em maior ou menor escala. Para que o seu potencial seja plenamente realizado, as ontologias na web semntica devem lanar mo de seus recursos formais, de modo que permitam explicitar conceitos de diferentes graus de expressividade e dar conta de requisitos computacionais complexos (DING, et al., 2006). Nesse sentido, espera-se que seja possvel expressar no s a identidade dos conceitos e seus atributos, mas tambm as GT2 411

suas relaes com outros, e que dependem do contexto onde os dados abertos esto inseridos. Algumas dessas relaes expressam aspectos dinmicos, como, por exemplo, o papel que uma pessoa exerce e que pode mudar com o tempo, enquanto outras podem ser influenciadas pelo contexto social. Estas ltimas colocam em destaque a interao das pessoas com os recursos descritos pelas ontologias, podendo, de acordo com o perfil e contexto do usurio, sugerir associaes com outros recursos potencialmente de interesse (MENDES et al., 2010). Cabe observar que a interligao de recursos de LOD pode se dar no nvel das instncias, onde basicamente se apontam relaes de identidade entre indivduos ou no nvel do esquema, indicando relaes de subclasse e axiomas que no envolvem noes individuais (JAIN et al., 2010). Essas ltimas so as mais raras e que possuem maior potencial semntico. Saber explorar o potencial semntico que as ontologias fornecem, e trazer conhecimentos novos para o usurio que consome os dados abertos interligados, esse o desafio a ser enfrentado na web 3.0, e essa a oportunidade criada para o cientista da informao. Nossa proposio que para utilizar plenamente o potencial semntico das ontologias, em especial considerando seu reso e uso combinado, importante conhecer e explorar os aspectos epistemolgicos e ontolgicos que fundamentam esses vocabulrios, conforme explicado a seguir. 3 PRESSUPOSTOS ONTOLGICOS BSICOS O potencial semntico de uma dada ontologia medido pelo modelo conceitual associado, e este est fundamentalmente relacionado com o compromisso ontolgico passvel de ser representado por este modelo, onde aspectos epistemolgicos e ontolgicos convivem. Nesta perspectiva, a abordagem epistemolgica nos coloca diante de questes que visam responder sobre a natureza do conhecimento de um dado domnio, colocando o foco na discusso da relao entre conhecedor e o que pode ser conhecido. J a abordagem ontolgica pretende identificar qual a forma e a natureza da realidade e, portanto, o que que se pode saber sobre ela. Ambas as abordagens so temas de discusso desde os estudos filosficos na Antiguidade Clssica, e tambm, como a literatura da Cincia da Informao tem evidenciado, estas questes j vem sendo tema de pesquisa de diversos estudiosos na atualidade (DOUSA, 2010; GNOLI e POLI, 2004). Assim, a perspectiva epistemolgica diz respeito natureza do conhecimento, ou seja, a maneira como a realidade percebida, medida e compreendida. Ela fornece bases tericas para as ontologias, em especial as de fundamentao, e influenciam as escolhas que se encontram representadas nos conceitos nelas presentes :
Ontologia no epistemologia, mas tem uma relao complexa com a epistemologia. Ontologia versa primariamente sobre as entidades, relaes e propriedades do mundo, as categorias de coisas. Epistemologia versa sobre as entidades percebidas do mundo e as que se acreditam existir, suas relaes e propriedades, i.e., maneiras de conhecer ou verificar coisas. (POLI e OBRST, 2009, p. 3).

Dessa forma, a perspectiva epistemolgica apoiada por crenas sobre a natureza da realidade e da verdade, que podem ser adotadas a partir de um acordo em um dado domnio, a partir de pressupostos GT2 412

ontolgicos, ou seja, diferente da perspectiva epistemolgica a perspectiva ontolgica permitiria estabelecer quais classes de conceitos seriam admissveis, suas relaes e sua modelagem em relao a aspectos tais como existncia no espao e tempo. Por motivos de limitao de espao, a seguir apresentamos um subconjunto de pressupostos ontolgicos, que se mostrou til para a definio de um recorte de domnio de conhecimento na rea Biomdica (CAMPOS, 2011). Universais e Particulares A noo de universais est ligada idia de que existem categorias bsicas de coisas que so comuns, ou compartilhadas por diferentes objetos. Por exemplo, dois objetos diferentes que possuem a mesma cor, possuem algo em comum. Considerando que universais existem, podemos definir universais como padres de caractersticas que podem ser instanciados em um nmero de diferentes indivduos. (GUIZZARDI, FALBO, GUIZZARDI, 2008). Esses indivduos, por sua vez, existem na realidade, possuindo uma identidade nica e so chamados de particulares (GUIZZARDI, FALBO, GUIZZARDI, 2008). Desta forma, a noo de universal diz respeito ao que comum a vrios indivduos que so denominados particulares. Os particulares podem ser concretos (por exemplo, uma cadeira) ou abstratos (por exemplo, um nmero), enquanto que os universais so sempre conceitos abstratos. A distino entre universais e particulares tem sido usada em ontologias de topo para o estabelecimento mais coerente de relaes lgicas (gnero-espcie e partitivas), que so usadas para estruturar as hierarquias dessas ontologias (SMITH, KUMAR, BITTNER, 2005). Ou seja, para definir essas relaes necessrio levar em conta no s os universais, mas tambm os particulares, pois essa anlise revela aspectos da semntica da relao (SMITH et al., 2005). Por exemplo, podemos dizer que os ovrios so parte_de ser humano, mas no podemos dizer que ser humano tem_parte ovrio, pois existem seres humanos homens e mulheres e, no primeiro caso, eles no possuem ovrio. Na Cincia da Informao a noo de universais e particulares tambm trabalhada, embora com terminologia por vezes distinta. Dahlberg (1978) menciona a distino entre objetos individuais e objetos gerais, e considera que os objetos gerais prescindem das formas do tempo e do espao:

(...) toda vez que o objeto pensado como nico, distinto dos demais, constituindo uma unidade inconfundvel (coisas, fenmenos, processos, acontecimentos, atributos, etc) pode-se falar de objetos individuais. Pode-se dizer que o que caracteriza os objetos individuais a presena de formas no tempo e espao. Os objetos individuais esto aqui e agora. Ex.: esta casa, esta mesa, este automvel, esta partida de futebol. (...) Mas, alm dos objetos individuais (...) podemos referir-nos a objetos gerais que, de certo modo, prescindem das formas do tempo e do espao. A estes objetos (...) correspondem os chamados conceitos gerais (...). (DAHLBERG, 1978, p.101).

Continuantes e Ocorrentes GT2 413

A idia de ocorrentes e continuantes est baseada na discusso epistemolgica sobre a questo da persistncia e da mudana ao longo do tempo, tratada pelas correntes filosficas do endurantismo e do perdurantismo (MUIS, 2005). Organismos, clulas e molculas so exemplos de entidades cuja natureza continuante (ou endurante). Por exemplo, uma clula no existe por intervalos de tempo descontnuos. E, ainda, durante sua existncia ela se manifesta por completo, continuamente, em todos os intervalos de tempo. De acordo com Grenon, Smith e Goldberg (2003) isto significa que embora ns segmentemos o intervalo de tempo durante o qual um continuante existe, ns achamos esse mesmo continuante em cada segmento.. Alm disso, as partes de um continuante so sempre continuantes. Exemplos de ocorrentes (ou perdurantes) so: eventos, processos, atividades. De acordo com Grenon, Smith e Goldberg (2003) Isto significa que se ns segmentamos o intervalo de tempo durante o qual um ocorrente ocorre ento ns segmentamos tambm o ocorrente.. Alm disso, as partes de um ocorrente so sempre ocorrentes, embora os continuantes possam participar de ocorrentes. A noo de dependncia De forma simplificada, a noo de dependncia nos remete a algumas questes, a saber: (i) se a existncia de um indivduo implica na existncia de outro indivduo especfico (dependncia rgida); (ii) se a existncia de um indivduo implica na existncia de algum indivduo que pertena a uma classe especfica (dependncia genrica); (iii) se a existncia de um indivduo que pertence a uma determinada classe implica na existncia de um indivduo diferente pertencente a uma classe diferente (dependncia de classe) (GUARINO, 1997). Uma outra questo relacionada noo de dependncia a situao em que a existncia de uma entidade depende da existncia simultnea de outra, denotando um acoplamento forte entre elas. Desta forma, universais (e particulares) que no dependem de simultaneamente de outros para existir, so denominados de substanciais e os que dependem simultaneamente de outros so denominados de modo. Um modo denota a instanciao de uma propriedade, sendo que um modo s pode existir em outros indivduos ( inerente a esses indivduos). Exemplos de universais substanciais so: ma, planeta e pessoa, e de universais de modo so: cor, carga eltrica e dor de cabea (GUIZZARDI, FALBO, GUIZZARDI, 2008). As noes de qualidade, propriedade e atributo A noo de qualidade e outras relacionadas, no contexto da anlise ontolgica, dizem respeito a aspectos das entidades, que intuitivamente podemos exemplificar por conceitos, tais como: vermelho, alto, pesado, dentre outros, sendo alvo de estudos diversos na literatura, como, por exemplo, seus tipos e modos de formalizao (MASOLO et al., 2002) (GRENON, SMITH, 2004). Entretanto, como destaca Mizoguchi (2000), observamos o uso de terminologias distintas para a noo de atributo, por vezes utilizadas de forma ambgua. GT2 414

A noo de atributo na filosofia encontrada na literatura como sinnimo de propriedade (OLIVER, 1996), ou como generalizador dos conceitos de qualidade e propriedade (SMITH, 1990), ou ainda sendo intuitivamente associada a adjetivos utilizados para caracterizar entidades (JONES, 1949). Nesse contexto, observa-se uma diferenciao entre entidades substanciais e seus atributos, sendo que os ltimos so existencialmente dependentes dos primeiros (CHAPPELL, 1997). Na Cincia da Computao, observamos que a noo de atributo como propriedade tambm envolve a distino entre atributo de instncias e de classes:
Atributos de instncia descrevem instncias de conceitos, de onde eles tomam seus valores. Estes atributos so definidos em um conceito e herdados pelos seus conceitos subordinados e instncias. Por exemplo, a data de um Contrato prpria de cada instncia. Atributos de classe descrevem conceitos e tomam seus valores a partir do conceito onde so definidos () no so herdados nem pelas subclasses nem pelas instncias. Um exemplo o atributo Primeiro Nome como parte de uma Pessoa Natural. (GMEZ-PREZ, ORTIZ-RODRGUEZ, VILLAZN-TERRAZAS, 2006, p.308).

Considerando que a noo de atributo tem sido ligada s noes de qualidade e propriedade (LEVINSON, 1978), cabe observar que existe uma distino entre estas ltimas, envolvendo, dentre outras, a questo epistemolgica da existncia de universais. Para ajudar a diferenciar propriedade de qualidade, pode-se usar o aspecto da quantificao (LEVINSON, 1978). Nesse contexto, uma qualidade quantificvel, ou seja, pode ser medida, enquanto que uma propriedade no pode. Desta forma, por exemplo, a propriedade de uma entidade ter uma altura, ou ter uma cor, no pode ser medida, mas a altura de uma entidade, ou a sua vermelhido , que uma qualidade, esta pode ser medida:
a minha afirmao de que ser azul e azul designam entidades distintas, sendo a primeira uma propriedade e sendo esta ltima o que vou chamar de qualidade. Uma diferena entre ser azul, ser paciente, ser caridoso, etc, e azulido, pacincia, caridade, etc, (...) que o ltimo parece admitir quantificao, enquanto que o primeiro no. Ns podemos falar de uma abundncia de caridade em uma comunidade, de mostrar muita pacincia, de uma gravata possuir mais vermelhido do que outra - mas no de uma abundncia de ser caridoso, ou de exibir muita quantidade de ser paciente, ou ter muita quantidade de ser vermelho (LEVINSON, 1978).

A diferenciao entre propriedades e qualidades (JONES, 1949) pode estar centrada na questo da particularizao de caractersticas:

Uma importante conseqncia desta diferenciao () que qualidades admitem particularizao, enquanto propriedades no. O que tenho em mente com isso , por exemplo, a tenacidade do Joo pode designar uma entidade que pertence necessariamente apenas ao Joo, e da qual todos os outros objetos que no o Joo so excludos logicamente de possuir, enquanto que Joo sendo tenaz nunca designa uma entidade com tais caractersticas. Em outras palavras, se existem particulares abstratos eles so derivados de qualidade, no de propriedade (LEVINSON, 1978).

Nesse sentido, propriedades so existencialmente dependentes dos objetos que as possuem. Se x uma propriedade e y um objeto possuindo x, ento, necessariamente, x existe apenas se y existir GT2 415

(LOWE, 1998, p.139). Associada noo de propriedade est o conceito de trope, discutido a seguir. O problema dos universais e a noo de trope A questo epistemolgica da existncia dos universais desdobrada na filosofia como o problema dos universais e diz respeito crena de se existem (ou no) universais que instanciem as propriedades, ou seja, se uma mesma propriedade est presente em diferentes particulares ou se a propriedade de cada particular nica e inerente a este particular, no estando presente em outros particulares:
Aqui esto cinco diferentes tringulos equilteros pretos: ppppp. So eles cinco instncias (particulares) de uma e da mesma cor universal, preto, ou so eles, ao contrrio do que a linguagem natural pode sugerir, meramente cinco particulares? So eles cinco instncias (particulares) de uma e da mesma forma geomtrica universal, triangularidade equilateral, ou so eles meramente cinco particulares? Este o problema dos universais. (...) Se h um universal triangularidade equilateral, ento esta entidade singular iria aqui de alguma forma existir em cinco lugares e em cinco particulares ao mesmo tempo. literalmente um-em-muitos. Coisas individuais ordinrias e instncias de propriedades, por outro lado, existem apenas em um lugar de cada vez e so, podemos dizer, um-emum. (JOHANSSON, 2009, p. 7).

A questo de propriedades em relao ao conceito de universais e particulares nos remete noo de trope. Um trope pode ser definido como uma instncia de uma propriedade de uma entidade especfica (ou seja, como um particular), sendo possvel se estabelecer relaes de semelhana entre tropes, e no sendo necessrio o compromisso de assumir a existncia de universais (GUIZZARDI, MASOLO, BORGO, 2006):
Ento algum alega que a brancura de um pedao especfico de papel que algum est segurando um trope (uma propriedade localizada ou uma qualidade individual) enquanto que o universal branco de fato no existe (BORGO, VIEU, 2008).

Por outro lado, existem autores que afirmam no haver incompatibilidade entre as noes de tropes e a existncia de universais (LOWE, 2002), sendo que Guizzardi, Mazolo e Borgo (2006) defendem a idia da fuso das duas noes:

() a e b possuem a propriedade de serem vermelhos porque o trope avermelho e o trope bvermelho so ambos instncias do universal Vermelho. Neste caso, universais existem, mas eles so instanciados apenas pelos tropes (GUIZZARDI, MAZOLO E BORGO, 2006).

Neste caso, entende-se no s que o trope uma entidade abstrata, que depende do particular para existir, mas ainda que reflete uma caracterstica cuja intensidade (abstrao) fornecida por um universal que o trope instancia. Ao considerarmos propriedades como universais, estamos dizendo que uma propriedade pode ser instanciada para dois particulares distintos, exemplificando exatamente a mesma propriedade, ou seja, exemplificando um nico universal. De acordo com essa perspectiva, admite-se a existncia de uma variedade de tipos ou categorias de atributos (LOUX, 1972). Ao contrrio, se considerarmos propriedades como particulares, ento no vai haver duas propriedades iguais, no importa o quo semelhantes elas sejam, da mesma forma que no existem dois indivduos iguais (SEMY, PULVERMACHER, OBRST, 2004).

GT2 416

As noes de identidade, rigidez, unidade As noes de identidade e unidade, como discutidas na filosofia e cincias cognitivas, tm sido tratadas na literatura de ontologias por diversos autores (GUARINO, 1999) (GUIZZARDI e HALPIN, 2008), fornecendo apoio para a formao de hierarquias mais claras e para tornar o compromisso ontolgico explcito, facilitando o reso. Identidade diz respeito a estabelecer as caractersticas nicas que distinguem uma determinada instncia de uma classe das outras instncias (GUARINO e WELTY, 2000). Termos que fornecem critrios de identidade so denominados de sortais. Diretamente ligada ao conceito de identidade est a noo de rigidez. Uma propriedade considerada rgida se aplicvel a todas as instncias de uma entidade ao longo do tempo (GUARINO e WELTY , 2000), durante toda a sua existncia. Por exemplo, costumamos tomar a propriedade de ser pessoa como rgida, pois podemos entender que uma entidade nunca deixa de possuir a propriedade de ser pessoa enquanto existir. Por outro lado, e propriedade de ser estudante no rgida, pois um indivduo no necessariamente estudante ao longo de toda a sua existncia (GUARINO e WELTY, 2000). Guizzardi e colegas, por sua vez, definem rigidez de forma semelhante:
Em termos simples, um tipo T considerado rgido se toda instncia x de T necessariamente (no senso modal) uma instncia de T. Em outras palavras, x no pode deixar de instanciar T sem deixar de existir (GUIZZARDI e GUIZZARDI, 2010).

Em outras palavras, uma instncia de um conceito rgido no pode cessar de ser uma instncia desse conceito sem perder sua identidade (...) . Exemplos de conceitos rgidos so Pessoa, Cachorro, e Planeta () (GUIZZARDI, PIRES, SINDEREN, 2002).

Guarino e Welty (2000) alertam ainda para a distino entre carregar (ou ser portador de) uma condio de identidade e de fornecer esta condio. Nesse sentido, podemos dizer que propriedades rgidas fornecem uma condio de identidade, enquanto que propriedades que no so rgidas apenas carregam essa condio. Unidade, por outro lado, diz respeito a estabelecer quais as partes que caracterizam uma determinada instncia de uma entidade, formando um todo (possuindo uma condio de unidade), atravs de uma relao de unificao que une essas partes, e vlida para todas as instncias dessa entidade. Guarino e Welty (2000) propem a noo de todo como sendo essencial, ou seja, perdurando para uma entidade durante toda a sua existncia. As noes de tempo e espao A noo de espao multifacetada, envolvendo caractersticas como as de adjacncia, contato e separao, as quais dizem respeito aos limites do espao (SMITH e VARZI, 2000). Essas caractersticas so importantes para determinadas ontologias, como, por exemplo, as da rea biomdica, devido natureza dos processos biolgicos que ocorrem em nvel molecular e celular. Para estes, pode ser relevante descrever informaes de diferentes nveis de granulosidade, tais GT2 417

como a superfcie da clula onde determinado processo ocorre, ou o local onde uma molcula permite ligao com outra (binding site). A localizao no espao pode ser considerada como um tipo de qualidade, do mesmo modo que a cor de um objeto (BATEMAN e FARRAR, 2004). Dessa forma, existe a noo de uma regio do espao que se pode associar a um objeto ou evento para determinar sua localizao espacial. Esta pode mudar com o tempo, embora o objeto no possa ser separado de sua localizao, o que caracteriza uma dependncia espacial entre o espao como qualidade e a entidade que possui essa qualidade. Por outro lado, o espao pode ser considerado como uma entidade continuante que pode ser decomposta em partes. Nesse caso, alinhado com essa viso, o conceito de regio do espao pode ser usado para definir entidades as quais existem de forma independente das coisas que podem estar localizadas nelas. Essas entidades podem mudar com o tempo. Nesse caso, so exemplos de regies do espao: o espao ocupado por um tomate em um determinado tempo, o espao que foi ocupado pelo tomate em um determinado tempo, mas que agora est vazio devido ao fato de o tomate ter sido movido, e a soma total de todo o espao do universo (SMITH, KUMAR e BITTNER, 2005). Uma outra forma de encarar a espacialidade sob a perspectiva da localizao relativa entre entidades. Sob essa perspectiva, existem entidades que possuem natureza espacial, mas cujas instncias no so regies espaciais. Como exemplo, podemos citar a cavidade onde se localiza o crebro, o qual fornece uma forma espacial em relao ao crebro, sendo ocupada por este (PISANELLI, 2004, p.25). Como podemos observar, a noo de espao est tambm ligada noo de tempo, uma vez que a realidade, onde se inserem os espaos, dinmica (GRENON e SMITH, 2004). Mais precisamente, capturar aspectos de espao-tempo particularmente importante para determinados fins, como, por exemplo, para descrever a natureza dinmica dos processos biolgicos, que se desdobram no s no espao, mas tambm no tempo. De forma semelhante s regies do espao, regies do espao-tempo so entidades que existem de forma independente dos processos que podem estar situados nela. Nesse contexto, uma regio de espao-tempo pode ser contnua ou descontnua. O espao-tempo contnuo pode ser til, por exemplo, para situar a localizao espao-temporal do desenvolvimento de um feto, ou da vida de um organismo. J o espao-tempo descontnuo pode ser til, por exemplo, para situar o espao-tempo de cada excreo realizada por um microorganismo ao longo de um dia. O tempo tambm pode ser considerado de maneira semelhante, porm de forma independente do espao e pode ainda ser encarado de dois modos: para caracterizar tempo contnuo, como, por exemplo, o intervalo de tempo em que ocorre uma diviso celular, ou descontnuo, tal como o tempo ocupado por cada excreo de um vacolo em um microorganismo ao longo de um dia. possvel ainda contemplar aspectos de localizao no tempo de maneira semelhante s de espao, ou seja, como aspectos de qualidade. Dessa forma, existe a noo de uma regio do tempo que se pode associar a um objeto ou evento para determinar sua localizao no tempo (GANGEMI et al., 2002). Para que a obteno de inferncias mais precisas fundamental que a ontologia seja modelada GT2 418

levando em conta os princpios comentados na presente seo, e as implicaes lgicas que estes trazem, conforme explicado anteriormente. Nesse sentido, ontologias de alto nvel podem ser consideradas teis para guiar a estruturao e o mapeamento de ontologias de domnios especficos, conforme explicado a seguir. 4 TRABALHOS RELACIONADOS Ontologias de alto nvel, como, por exemplo, a UFO (GUIZZARDI e HALPIN, 2008), a DOLCE (GUARINO, 1997) e a BFO (SMITH, KUMAR e BITTNER, 2005), fornecem perspectivas de modelagem fundamentadas por escolhas ontolgicas (notadamente as de rigidez e identidade, existncia ao longo do tempo, unidade, dependncia, e qualidades) que buscam formalizar a natureza das suas entidades. A UFO, assim como a DOLCE, possui um modelo mais rico em detalhes e com maior flexibilidade para modelar determinados aspectos, como, por exemplo, o da qualidade e o do encadeamento de processos no tempo, porm para isso assume o compromisso com a existncia de entidades abstratas, que no possuem correspondente no mundo real. A BFO, em contrapartida, apresenta um modelo menos detalhado, porm bastante aderente com as entidades que se observam no mundo real, com um vis estritamente cientfico e, at onde pudemos perceber, adequado para as necessidades de comunidades cientficas, notadamente a biomdica. Iniciativas de representaes conceituais utilizando ontologias de alto nvel como a UFO (GUIZZARDI, MASOLO e BORGO, 2006; GUIZZARDI e GUIZZARDI, 2010) podem ser utilizadas como aprendizado para modelar a descrio de recursos nas iniciativas de LOD. Um exemplo de ontologia de alto nvel sendo usada em LOD pode ser encontrada no trabalho de Janik, Scherp, e Staab (2010), que descreve a interligao de dados de msicas (lbuns e suas trilhas) com as de programas da BBC (rede de notcias inglesa), em uma estrutura denominada pelos autores de rede de ontologias, onde ontologias de domnio e nucleares5, esto compatibilizadas entre si, sendo que a ontologia DOLCE fornece solues de modelagem para intermediar essa compatibilizao. O apoio de esquemas classificatrios como o utilizado pela Wikipdia tambm tem sido usado como soluo para interligar dados LOD no nvel do esquema, como o caso do sistema BLOOMS, de Jain et al. (2010) . Os autores, entretanto, destacam que poderiam ter usado ontologias de alto nvel em vez das categorias hierrquicas da Wikipdia, tendo optado por estas ltimas devido ao fato de serem mais intuitivas. A questo da simplicidade de uso em contraste com a necessidade de uma semntica mais precisa, parece ser um desafio a ser vencido para concretizar a web semntica, entretanto, para que se criem solues simplificadas, preciso antes compreender o complexo. 5 CONCLUSES
5 De acordo com os autores, ontologias nucleares fornecem uma definio precisa do conhecimento estruturado dentro de um campo especfico que perpassa vrios domnios de aplicao.

GT2 419

A web 3.0 traz desafios e oportunidades, para tornar realidade a promessa de interligar de maneira til os imensos silos de informao disponveis na web. Para isso, espera-se que esses dados sejam publicados de forma aberta e descritos e articulados de forma mais semntica, permitindo que agentes de software possam revelar, atravs de inferncias, novos conhecimentos e tambm possam recuperar informao relevante, de forma mais precisa. Na web 3.0 as ontologias desempenham papel central, no s para definir a identidade dos dados, disponveis como recursos, mas tambm para articul-los entre si, o que levanta questes como as da compatibilizao de conceitos, temtica amplamente estudada na Cincia da Informao e tambm na Cincia da Computao. No centro dessas questes, est a discusso sobre os pressupostos epistemolgicos e ontolgicos que fundamentam, ou deveriam fundamentar a construo de ontologias, e que possuem uma complexidade de entendimento que contrasta com a necessidade de gerar vocabulrios que sejam to simples quanto possvel, naturalmente dependendo do domnio considerado e propsito. Nesse contexto, o presente trabalho apresenta como contribuio uma descrio sumria dos conceitos bsicos que esto representados nas ontologias de fundamentao. Estes podem ser usados pelo cientista da informao como instrumental e ponto de partida para a modelagem que deveria preceder a publicao de dados abertos ligados, oferecendo assim uma camada semntica mais rica, e cujo propsito diferente daquele das linguagens documentrias. Por outro lado, a larga experincia da Cincia da Informao no desenvolvimento e compatibilizao dessas linguagens documentrias, traz ao cientista da informao um diferencial de vivncia que no pode ser desperdiado. preciso, entretanto, que esse profissional abrace novas formas de representao da informao, mais complexas, e que envolvem as noes filosficas apresentadas de forma sumria no presente trabalho. REFERNCIAS ALLEMANG, D., HENDLER, J. Semantic web for the working ontologist: modeling in RDF, RDFS and OWL, Elsevier, MA, USA, 2008. BATEMAN, J. A.; FARRAR, S. Towards a generic foundation for spatial ontology. In: PROCEEDINGS OF THE THIRD INTERNATIONAL CONFERENCE ON FORMAL ONTOLOGY IN INFORMATION SYSTEMS (FOIS-2004), Amsterdam, p. 237-248, 2004. BORGO, S.; MASOLO, C.. Foundational choices in DOLCE. In R. Poli, Healy M., and Kameas A., editors, Theory and Applications of Ontology, v. 2, C.12. Springer Verlag, 2008. BORGO, S.; VIEU, L.. Artifacts in formal ontology. In Handbook of the Philosophy of the Technological Sciences, v. 2: Artifact ontology and artifact epistemology. Elsevier, 2008. BREITMAN, K.K. Web Semntica: A Internet do Futuro. LTC: Rio de Janeiro, 2005. CAMPOS, L. M. Diretrizes para definio de recorte de domnio no reso de ontologias biomdicas: uma abordagem interdisciplinar baseada na anlise do compromisso ontolgico. Tese de Doutorado em Cincia da Informao. Convnio UFF/IBICT, 2011, 323p. CHAPPELL, V. Descartess ontology, 1997. Topoi v.16, n.2. Disponvel em <http:// www.springerlink. GT2 420

com/content/x85m25277v5l4g68/fulltext.pdf>. Acesso: 25 jan. 2011. DAHLBERG, I. Teoria do conceito. Cincia da Informao, v. 7, n. 2, p. 101-07, 1978. DING, L., KOLARI, P., DING, Z., AVANCHA, S., Using Ontologies on the Semantic Web: A Survey, Ontologies, p.79-113, Springer, 2006. DOUSA, T. M. The simple and the complex in E.C. Richardsons theory of classification: observations on an early KO model of the relationship between ontology and epistemology. In: Paradigms and conceptual systems in knowledge organization, p. 15-22, 2010. GANGEMI, A.; GUARINO, N.; MASOLO, C.; OLTRAMARI, A. Sweetening ontologies with Dolce. In: PROCEEDINGS OF THE 13TH INTERNATIONAL CONFERENCE EKAW, Lecture Notes in Artificial Intelligence, v. 2473, p. 166181. Berlin: Springer, 2002. GNOLI, C., POLI, R. Levels of reality and levels of representation. Knowledge Organization, v. 31, n.3, p. 151-160, 2004. GMEZ-PREZ, A.; ORTIZ-RODRGUEZ, F.; VILLAZN-TERRAZAS, B.: Legal Ontologies for the Spanish eGovernment. In: Current Topics in Artificial Intelligence, p. 301-310. Springer, Heidelberg, 2006. GRENON, P.; SMITH, B. SNAP and SPAN: Prolegomenon to geodynamic ontology, In: Spatial Cognition and Computation, 2004. GRENON, P.; SMITH, B.; GOLDBERG, L. Biodynamic Ontology: Applying BFO in the Biomedical Domain, In: PROCEEDINGS OF THE WORKSHOP ON MEDICAL ONTOLOGIES, Rome, Italy, 2003. GUARINO, N. Some Organizing Principles for a Unified Top-Level Ontology. National Research Council LADSEB-CNR Int. Rep. 02/97, March 1997. GUARINO, N. The Role of Identity Conditions in Ontology Design. In PROCEEDINGS OF IJCAI-99 WORKSHOP ON ONTOLOGIES AND PROBLEM-SOLVING METHODS: LESSONS LEARNED AND FUTURE TRENDS. Stockholm, Sweden, 1999. GUARINO, N.; WELTY, C. Towards a methodology for ontology based model engineering. In: PROCEEDINGS OF THE ECOOP WORKSHOP ON MODEL ENGINEERING, 2000. GUIZZARDI, G.; FALBO, R.; GUIZZARDI, R. S. S . A importncia de Ontologias de Fundamentao para a Engenharia de Ontologias de Domnio: o caso do domnio de Processos de Software. Revista IEEE Amrica Latina, v. 6, n.3, p. 244-251, 2008a. GUIZZARDI, G.; HALPIN, T.: Ontological Foundations for Conceptual Modeling, Applied Ontology, v.3, n.1-2, p. 91-110, 2008. GUIZZARDI, G.; MASOLO, C.; BORGO, S. In the Defense of a Trope-Based Ontology for Conceptual Modeling: An Example with the Foundations of Attributes, Weak Entities and Datatypes, 25th Intl. Conf. on Conceptual Modeling, Berlin, 2006. GUIZZARDI, G.; PIRES, L.F.; SINDEREN, M.J. On the role of Domain Ontologies in the design of Domain-Specific Visual Modeling Languages. In: PROCEEDINGS OF THE. 2ND WORKSHOP ON DOMAIN-SPECIFIC VISUAL LANGUAGES. OOPSLA, 2002. GUIZZARDI, R.S.S.; GUIZZARDI, G. Ontology-Based Transformation Framework from Tropos to AORML. Social Modeling for Requirements Engineering, Cooperative Information Systems GT2 421

Series, MIT Press, Boston, 2010. HEATH, T., BIZER, C. Linked Data: Evolving the Web into a Global Data Space. Synthesis Lectures on the Semantic Web: Theory and Technology, Morgan&Claypool, 2011. HENDLER, J. Web 3.0 Emerging, Computer, v. 42, n.1, p 88-90, January, 2009. HORROCKS, I.. Ontologies and the semantic web. Communications of the ACM, v.51, n.12, p. 58-67, December 2008. JAIN, P., HITZLER, P., SHETH, A.P., VERMA, K., E YEH, P.Z. Ontology Alignment for Linked Open Data. In: PROCEEDINGS OF INTERNATIONAL SEMANTIC WEB CONFERENCE., p. 402-417, 2010. JANIK, M., SCHERP, A., STAAB, S. The Semantic Web: Collective Intelligence on the Web. In: Informatik Spektrum, Springer, 2011. JOHANSSON, I., Roman Ingarden and the Problem of Universals. Metaphysica. International Journal for Ontology and Metaphysics, v. 10, p. 65-87, 2009. JONES, J. R. Are the Qualities of Particular Things Universal or Particular. The Philosophical Review, v. 58, n. 2, p. 152-170, 1949. LEVINSON, J., Properties and Related Entities. Philosophy and Phenomenological Research, v.. 39, n. 1, p. 1-22, 1978. LOUX, M. J. Recent Work in Ontology. American Philosophical Quarterly, v.9, p. 119-138, 1972. LOWE, E. J. A Survey of Metaphysics, Oxford: Oxford University Press, 2002. LOWE, E. J. The Possibility of Metaphysics: Substance, Identity, and Time. Oxford University Press, USA, 1998. MASOLO, C., BORGO, S., GANGEMI, A., GUARINO, N., OLTRAMARI, A., SCHNEIDER, L.: WonderWeb Deliverable D17, 2002. MENDES P.N., KAPANIPATHI P., CAMERON D., SHETH A.P., Dynamic Associative Relationships on the Linked Open Data Web, In: PROCEEDINGS OF THE WEB SCIENCE, 2010. MIZOGUCHI, R. Yet another top-level ontology: Yato. In: PROCEEDINGS OF THE SECOND INTERDISCIPLINARY ONTOLOGY MEETING, p. 91101, 2000. MUIS, R. Review of Four-Dimensionalism: An Ontology of Persistence and Time, Ars Disputandi, 2005. NEVILLE, H. H. Thesaurus reconciliation. Aslib Proceedings, v.11, n.24, p. 620-626, 1972. OBO. Open Biomedical Ontologies, 2009. Disponvel em: <http://obo.sourceforge.net.>. Acesso em 24 jan. 2011. OLIVER, A. The Metaphysics of Properties. Mind, New Series, v. 105, n. 417, p. 1-80, 1996. OTLET, P. Monde: essaie duniversalisme - connaissance du monde; sentiment du monde;action organise et plan du monde,Brussels,Editions Mundaneum, p.390-391, 1935. PISANELLI, D.M. Ontologies in Medicine. Amsterdam, IOS Press, 2004. SEMY, S.K.; PULVERMACHER, M.K.; OBRST, L.J. Toward the Use of an Upper Ontology for U.S. Government and U.S. Military Domains: An Evaluation, MITRE TECHNICAL REPORT, GT2 422

2004. SMITH B.; KUMAR A.; BITTNER T. Basic Formal Ontology for Bioinformatics. Journal of Information Systems. p.1-16, 2005 SMITH, A.D. Of Primary and Secondary Qualities. The Philosophical Review, v. 99, n. 2, p. 221254, 1990. SMITH, B.; VARZI, A. C. Fiat and Bona Fide Boundaries. Philosophy and Phenomenological Research, v.60, n. 2, p. 401420, 2000. SMITH, B; CEUSTERS, W; KLAGGES, B; KOHLER, J; KUMAR, A; LOMAX, J; MUNGALL, C.J.; NEUHAUS, F.; RECTOR, A; ROSSE, C. Relations in Biomedical Ontologies.Genome Biology, v.6. n.46, 2005. SDERBCK, A., MALMSTEN, M. LIBRIS Linked Library Data. In: Nodalities Magazine, n. 5, January, 2009. TODOR, A., PASCHKE, A., HEINEKE, S. ChemCloud: Chemical e-Science Information Cloud. In: PROCEEDINGS OF CoRR, 2010. PESET, F., FERRER-SAPENA, A., SUBIRATS-COLL, I. Open data y Linked open data: su impacto en el rea de bibliotecas y documentacin. El Profesional de la Informacin, vol. 20, n. 2, p. 165174, 2011.

GT2 423

COMUNICAO ORAL

O VOCABULRIO CONTROLADO COMO INSTRUMENTO DE ORGANIZAO E REPRESENTAO DA INFORMAO NA FINEP


Tatiana Almeida Rosali Fernandes Souza Resumo: A Financiadora de Estudos e Projetos (FINEP), como empresa nacional de financiamento, possui potencial relevante de dados das propostas recebidas de pesquisa e desenvolvimento em cincia, tecnologia e inovao no pas. Como tal, se caracteriza como sistema de recuperao da informao. O trabalho analisa o Vocabulrio Controlado FINEP (VCF) enquanto instrumento de organizao e representao da informao das propostas de financiamento. A anlise do VCF feita por abordagem histrico-metodolgica da construo do vocabulrio, ressaltando aspectos da concepo e das etapas de desenvolvimento do instrumento, destacando as principais mudanas no tempo. Investiga a viabilidade de aplicao do processo de categorizao dos descritores em uso como contribuio para avaliao e reestruturao do vocabulrio e conclui sobre a viabilidade de aplicao do mtodo de categorizao no VCF, destacando a importncia fundamental da definio dos descritores nesse processo. Palavras-chave: Sistema de Recuperao da Informao. Vocabulrio Controlado. Categorizao. Abstract: The Financial National Agency (FINEP) has relevant data originated from research proposals on fields in science, technology and innovation. As such FINEP may be characterized as an information retrieval system. This work analyses the FINEP Controlled Vocabulary (VCF) as an instrument of organization and representation of information originated from the research proposals received. The VCF analyses are based on a historical and methodological approach on the vocabulary construction, pointing out aspects of its conception and improvements over time. It investigates the feasibility of applying classification methods for descriptors in use, aiming to contribute to the present vocabulary. Results indicate advantages of applying categorization methods on the controlled vocabulary, and emphasize the fundamental role played by the descriptors definition as an effective element to the whole process. Palavras-chave: Information Retrieval Systems. Controlled Vocabulary. Categorization. 1 INTRODUO O volume informacional gerado nos dias atuais desafia os profissionais de informao no que diz respeito ao armazenamento e ao tratamento da informao. Como representar o contedo de forma satisfatria de modo a permitir que os usurios tenham acesso a informaes relevantes? A organizao do conhecimento assume cada vez mais um papel estratgico nas tomadas de deciso pelas Empresas. GT2 424

Somente com a modernizao dos instrumentos que auxiliam essa organizao ser possvel adequarse s rpidas mudanas no crescimento da importncia do uso e da capacidade de recuperao da informao. Alm disso, um dos maiores problemas enfrentados pelas grandes empresas hoje em dia a quantidade de informao produzida por seus departamentos e servios. A gesto da informao pressupe a atuao dos profissionais de informao como mediadores entre a informao localizada nos estoques informacionais (qualquer que seja o tipo de documento, formato ou suporte) e os seus usurios (entendidos como indivduos que buscam informao para uma necessidade especfica). O aumento da informao em circulao nas empresas traz diversos problemas relacionados ao tratamento e recuperao de informao, sendo necessrios estudos para aprimorar os instrumentos de busca. A conjuntura atual de produo de informao representa um desafio em relao ao acesso. Numa empresa como a Financiadora de Estudos e Projetos (FINEP), na qual circula uma quantidade significativa de informaes relevantes sobre o desenvolvimento e o avano da cincia, da tecnologia e da inovao no pas, a realidade no diferente. cada vez mais importante, no contexto de empresas como a FINEP, poder contar com ferramentas que aumentem a agilidade e a preciso na recuperao da informao e auxiliem na padronizao da linguagem documentria. Para que as etapas de seleo e anlise das propostas de financiamento sejam cumpridas com xito, a empresa necessita de uma infraestrutura informacional que esteja de acordo com a poltica nacional de Cincia, Tecnologia e Inovao (C,T&I). A FINEP atua no fomento aos projetos de pesquisa voltados inovao tecnolgica. Como rgo oficial do Ministrio da Cincia e Tecnologia (MCT), atende s necessidades de institutos de pesquisa, empresas privadas e pblicas, agncias internacionais, investidores e organizaes do Terceiro Setor. Um elemento importante nesta infraestrutura informacional a organizao das informaes das propostas de financiamento, alocadas no Ncleo de Documentao, e do material de apoio anlise realizada pelos tcnicos, que so as revistas especializadas e os livros, que constituem o acervo da Biblioteca da empresa. primordial que haja um padro na organizao e representao da informao, visando eficcia na recuperao. Atualmente, os vocabulrios controlados tornaram-se instrumentos importantes para os sistemas informatizados. Esses vocabulrios tm por objetivo principal o controle da polissemia que ocorre na linguagem natural, fazendo com que uma palavra que pode eventualmente assumir diversos significados passe a ter s um, determinado pelo contexto no qual a palavra est inserida. Este controle terminolgico diminui a polissemia existente na linguagem natural, fazendo com que indexadores (na entrada de dados) e usurios (na busca da informao) consigam resultados mais eficazes. Neste contexto, o trabalho de desenvolvimento do Vocabulrio Controlado FINEP (VCF) surge, objetivando uma padronizao e unificao da linguagem, em princpio da Biblioteca e do Ncleo de Documentao e, posteriormente, para uso de toda a FINEP, na recuperao de informao. A elaborao do projeto VCF visou contribuir com a organizao do conhecimento e, GT2 425

consequentemente, com o trabalho da equipe de tcnicos e analistas da FINEP, numa iniciativa conjunta da Biblioteca e do Ncleo de Documentao. A melhoria dos servios de informao prestados encontra aliado nas novas tecnologias de informao e comunicao, considerando a importncia da recuperao de informao relevante e seu valor na tomada de deciso da empresa. O VCF, elaborado por uma equipe de profissionais da informao (Arquivistas, Bibliotecrios e Cientistas da Informao), visa unificar a terminologia no tratamento da informao dos acervos bibliogrficos e de projetos aprovados pela FINEP atravs do uso de uma linguagem de indexao padronizada. O VCF a base para indexao das propostas de financiamento do Ncleo de Documentao e do material do acervo contido na Biblioteca. Atualmente, o uso de instrumentos de controle terminolgico para apoio indexao e recuperao da informao torna-se imprescindvel diante dos Sistemas de Recuperao da Informao, acesso online base de dados na internet e organizao de bibliotecas visando o incremento na qualidade da informao recuperada pelos usurios. Com base nos elementos expostos, o objetivo principal do presente estudo analisar o VCF, enquanto instrumento de organizao e representao da informao, no contexto da FINEP, enfatizando a metodologia de construo deste vocabulrio e, mais especificamente, seu processo de categorizao. A categorizao foi ressaltada neste estudo, por se tratar de um processo que se encontra em fase de reavaliao e de reestruturao para atender s necessidades de informao dos usurios. 2 CATEGORIZAO O mtodo de Categorizao ou Facetao foi desenvolvido na dcada de 20, do sculo XX, por Shiyali Ramamrita Ranganathan para a construo de uma tabela de classificao bibliogrfica. Ranganathan conduziu seu trabalho no sentido de discutir a natureza dos domnios de conhecimento a partir da fundamentao do que se entende por conhecimento e formao de conceitos para definir o modo pelo qual a Teoria da Classificao Facetada se prope a dividir estes domnios. Para Campos e Gomes (2008):
A Categorizao um processo que requer pensar o domnio de forma dedutiva, ou seja, determinar as classes de maior abrangncia dentro da temtica escolhida. Na verdade, aplicar a categorizao analisar o domnio a partir de recortes conceituais que permitem determinar a identidade dos conceitos (categorias) que fazem parte deste domnio.

Esta diviso se concretiza a partir do mtodo das categorias fundamentais. Categorias fundamentais so ideias que permitem recortar um universo de assunto em classes abrangentes. Atuam como primeiro corte classificatrio e fornecem uma viso do conjunto dos agrupamentos que ocorrem na estrutura, possibilitando o entendimento global da rea. Para Vickery (1960), categorias so conceitos de alta generalidade e ampla aplicao empregados na interpretao do mundo. As categorias tambm so utilizadas para determinar as relaes entre as facetas. Para Ranganathan, facetas so manifestaes GT2 426

de categorias do universo de um conhecimento estudado, so as classes mais abrangentes dentro de um universo de ideias em que se formam os renques e as cadeias. Para o entendimento das Categorias Fundamentais, encontramos no trabalho de Campos; Gomes; Motta (2006) a seguinte sntese: Personalidade - Categoria fundamental de grande dificuldade de identificao. Ranganathan prope o mtodo do resduo para identificar sua manifestao: no Tempo, no Espao, no Energia, ou Matria, portanto considerada uma manifestao da categoria fundamental Personalidade. Aqui ele aplica o princpio hindu No isso, no isso Matria - As manifestaes da categoria Matria so de duas espcies: Material e Propriedade. Energia - A manifestao da categoria Energia se caracteriza pela ao de uma espcie ou outra. A ao pode ser entre e por todas as espcies de entidade, inanimada, animada, conceitual, intelectual e intuitiva. Espao - A categoria Espao entendida como o local de pertencimento de um dado objeto, seja ele indivduo, coisa, ideia, fenmeno, entre outras entidades. A superfcie da terra, o espao dentro dela e o espao fora dela so manifestaes desta categoria. Tempo - A categoria Tempo est de acordo com o que geralmente entendemos por esse termo. As ideias isoladas de tempo, como milnio, sculo, dcada, ano, e assim por diante. A partir dessas categorias podemos ento identificar e aplicar a categorizao em conceitos utilizados por diferentes reas do conhecimento que, no domnio interdisciplinar, se agregam nas pesquisas desenvolvidas em seu interior, preservando a sua ideia fundamental, o seu atributo. Segundo Campos; Gomes; Motta (2006)
[...] economia: teorias, poltica econmica (instrumentos/agentes); planejamento (operaes); e assim por diante. Na construo civil: edificaes, como casas, edifcios, teatros, praas (personalidade); tcnicas de edificao (tcnicas); cimento, pedra, cermica, vidro (materiais); os profissionais envolvidos (agentes); e assim por diante. Na biblioteconomia: instituies e organizaes, bibliotecas, documentos, usurios, suporte documental (personalidade); tratamento documentrio, recuperao de informao, aquisio (processos); linguagens documentrias (agentes dos processos); profissionais envolvidos (agentes dos processos); e assim por diante.

Posteriormente, o Classification Research Group (CRG) - fundado nos anos 50 do sculo XX com o objetivo de desenvolver estudos tericos e prticos no mbito da classificao - desdobrou estas categorias para a elaborao de classificaes facetadas. Tais categorias, como bem colocado por Campos e Gomes (2006), so desdobramentos das categorias fundamentais de Ranganathan (PMEST) e se apresentam da seguinte forma:

GT2 427

Coisas, substncias, entidades que ocorrem naturalmente produtos instrumentos constructos mentais Suas partes constituintes rgos Sistemas de coisas Atributos de coisas qualidades, propriedades, incluindo Estrutura

Medidas processo, comportamento Objeto da ao (paciente) Relaes entre coisas, interaes efeitos reaes Operaes sobre coisas experimentos, ensaios operaes mentais Propriedades de atributos, relaes e operaes Lugar, condio Tempo

O processo de categorizao consiste em identificar as possveis classes gerais (categorias) de conceitos que a rea do conhecimento abrange, serve para orientar os profissionais no levantamento dos termos e auxilia na organizao do domnio de conhecimento. Dahlberg (1978 apud CAMPOS; GOMES, 2006) enfatiza a importncia fundamental da categoria na estruturao do conceito e do sistema de conceitos:
Podemos ver que as categorias tm uma capacidade de estrutura: no apenas estruturam, de fato, todos os nossos elementos de conhecimento e unidades do conhecimento; elas fornecem, ao mesmo tempo, por este meio, o esqueleto, os ossos e tendes para estruturar todo o nosso conhecimento. Com seu uso consciencioso, ento, o corpo do nosso conhecimento pode se manter unido, pode se mover, pode se manter flexvel - e pode crescer organicamente (DAHLBERG, 1978, p. 34 apud CAMPOS; GOMES, 2006).

A seo a seguir tem como objetivo apresentar o histrico e a metodologia de construo do VCF. Esta apresentao de fundamental importncia para o desenvolvimento e o embasamento dos procedimentos de anlise realizados, tendo em vista que a metodologia de elaborao do instrumento estudado (o VCF) tem caractersticas especficas. Essas especificidades se destacam por se tratar de um instrumento para a recuperao da informao de uma empresa com a temtica voltada para a rea de Cincia, Tecnologia e Inovao (C,T&I) e se preocupa com a organizao, representao e recuperao da informao, visando atender seus usurios com maior eficincia. 3 HISTRICO E METODOLOGIADE CONSTRUO DO VOCABULRIO CONTROLADO FINEP (VCF) A Biblioteca e o Ncleo de Documentao da FINEP perceberam, alm da importncia, GT2 428

a necessidade do tratamento para a recuperao das informaes contidas tanto nos projetos, que solicitam financiamento, quanto nos documentos, que compem o acervo da Biblioteca. Neste sentido, essas unidades tiveram a iniciativa conjunta de desenvolver um instrumento que desse conta da representao temtica de seus documentos, ou seja, por assunto. At ento, o que vinha sendo feito era a representao descritiva dos aspectos formais dos documentos1 e sua representao temtica por meio de palavras e sem padronizao terminolgica. Esta prtica mostrou-se pouco eficaz no momento da busca pela informao desejada, pois dispersa documentos que tratam dos mesmos conceitos, expressos por palavras diferentes. Para suprir esta deficincia, foi criado um projeto para a elaborao do VCF. Desde a sua concepo, o VCF vem passando por diversas modificaes decorrentes de mudanas na sua coordenao, acarretando modificaes metodolgicas. No ano de 2003, a elaborao de uma proposta metodolgica para a construo de um novo instrumento, que tinha como pr-requisito atender s necessidades tecnolgicas atuais da FINEP, teve como fundamento os princpios metodolgicos que regem a Teoria da Classificao Facetada de Shiyali Ramamrita Ranganathan (1963), a Teoria da Terminologia de Eugene Wester (1981) e a Teoria do Conceito de Ingrid Dalhberg (1978). Este novo instrumento foi definido, na poca, como um vocabulrio sistematizado, pois era regido por princpios terminolgicos com uma estrutura sistematizada de conceitos, no qual um termo, que no interior de um domnio, juntamente com os outros conceitos, formavam um sistema de conceitos, permitindo uma interface mais simples e til para o pesquisador final. Esta primeira etapa objetivou determinar os domnios temticos para a elaborao do Vocabulrio Sistematizado. Definiu-se que os recortes temticos seriam determinados pelos Fundos Setoriais2. Os Fundos foram recortados por domnios de conhecimento ou atividade, o que facilitou a reunio de conceitos dentro de uma mesma rea, formando um todo coeso. As reas escolhidas foram Biotecnologia e Energia, que somaram um total de 845 termos levantados a partir da lista j existente na biblioteca (proveniente da indexao do acervo bibliogrfico), dentro de cada domnio e a partir da indexao dos projetos dos Fundos Setoriais destas reas (CT-BIOTEC e CT-ENERG). Esta primeira fase envolveu as seguintes atividades: Definio das fontes para o levantamento dos termos; Anlise dos conceitos; Organizao da estrutura do vocabulrio (estabelecimento das relaes, elaborao das notas de definio, implantao do vocabulrio no software e validao da forma do termo, da definio e dos relacionamentos pelos especialistas); e Apresentao do Vocabulrio para os setores da FINEP. O processo de categorizao nesta fase foi apoiado na anlise das definies e nas categorias estabelecidas tendo como base as categorias fundamentais de Ranganathan (PMEST). Por exemplo, na rea de Biotecnologia, foram estabelecidas apenas trs categorias: Domnios de atividade, que so
1 No caso da Biblioteca: registro do nome do autor, ttulo, editor, ano de publicao, ttulos de revistas, etc.; no caso do Ncleo de Documentao: nome da instituio, ano e Estado do projeto, n do contrato, etc. 2 Os Fundos Setoriais, criados a partir de 1999, so instrumentos de financiamento de projetos de pesquisa, desenvolvimento e inovao no Pas. H 16 Fundos Setoriais, sendo 14 relativos a setores especficos e dois transversais.

GT2 429

as reas em que a Biotecnologia atua; Entidade, que formada por conceitos que representam objetos concretos e abstratos; e as Tcnicas Biotecnolgicas, que representam os processos e aes dentro do domnio de Biotecnologia. Na segunda fase do projeto de elaborao do VCF, os termos j existentes na base de dados da Biblioteca foram definidos, padronizados e estruturados atravs de relacionamentos hierrquicos e associativos. E logo em seguida, o foco voltou-se para a indexao das propostas de financiamento aprovadas que compem o acervo corrente do Ncleo de Documentao (arquivo central) da empresa. Nesta fase, foi decidido utilizar uma nova forma de categorizao, com base na Tabela de reas do Conhecimento (TAC) do Conselho Nacional de Desenvolvimento Cientfico e Tecnolgico (CNPq). Para esta funo foram utilizados somente dois nveis das reas do conhecimento estabelecidas pelo CNPq, as grandes reas e as subreas, os outros nveis existentes no se mostraram necessrios para o agrupamento de descritores, pois so nveis muito especficos. Por exemplo: Matemtica, Estatstica e Cincia da Computao, entre outros, foram agrupados em Cincias Matemticas e Naturais. J as subreas de Engenharia Civil, Engenharia Sanitria e Ambiental, Engenharia Eltrica e outros tipos de Engenharia, foram agrupados na grande rea Engenharias. E assim por diante. Alm disso foi necessrio tambm, inserir notaes (cdigos alfanumricos) para identificar as grandes reas e as respectivas subreas. Como, por exemplo, a grande rea Cincias Matemticas e Naturais que recebeu a notao A e as respectivas subreas agrupadas neste grupo que receberam a notao, de acordo com a ordem em que apareciam na tabela do CNPq. A subrea Matemtica, por exemplo, tinha notao A1, Estatstica tinha notao A2. No caso dos descritores no se enquadrarem em nenhuma das reas do CNPq, ora seriam classificados na rea Cincia e Tecnologia, ora numa rea criada chamada Multidisciplinar. (FINANCIADORA DE ESTUDOS E PROJETOS, 2002, 2003, 2005, 2007; CAMPOS, 2004). Porm, com o desenvolvimento do trabalho, este tipo de categorizao comeou a apresentar alguns problemas conflitantes com a metodologia originalmente concebida - Ranganathan (1963), Dalhberg (1978) e Wester (1981). Para Ranganathan, a poli-hierarquia na categorizao dos termos no admitida, cada descritor deve ser inserido em uma s categoria / faceta. Esta metodologia foi utilizada na primeira fase de desenvolvimento do VCF, conflitando-se na segunda fase com a Tabela de reas do Conhecimento (TAC) do CNPq, por ser esta uma tabela enumerativa, subdividida em reas cannicas do conhecimento. Exemplificando: um descritor muito utilizado na indexao dos documentos da FINEP - Inovao de processo poderia se inserir em vrias reas do conhecimento; pode haver inovao de processo na rea Engenharia de produto ou na rea de Agronomia, ou at mesmo na rea de Administrao. Desta forma, a TAC foi considerada como no adequada para o uso na funo para a qual foi designada no desenvolvimento do VCF. Atualmente o Vocabulrio est passando por um processo de reviso e avaliao, tendo como foco principal a qualidade do tratamento, da indexao e da recuperao da informao relevante para a FINEP. Diretamente vinculada a esta reviso, encontra-se a categorizao dos termos. O presente GT2 430

trabalho explora o estabelecimento de novas categorias para a organizao dos descritores do VCF, cujas anlises e resultados so apresentados a seguir. 4 ANALISE E RESULTADOS A etapa de coleta de dados foi realizada no VCF, que se encontra disponvel no Portal da Informao da Intranet da FINEP. Na busca realizada em outubro de 2010 foram identificadas 559 propostas de financiamento indexadas pelos Tipos de Inovao, sendo 113 por Inovao de processo, 421 por Inovao de produto e 25 por Inovao de servio. Neste trabalho, para efeito de anlise, foram selecionados os projetos indexados por Inovao de processo, descritor que definido pela FINEP como:
Adoo de mtodos de produo novos ou significativamente melhorados, incluindo mtodos de entrega dos produtos. Tais mtodos podem envolver mudanas no equipamento ou na organizao da produo, ou uma combinao dessas mudanas, e podem derivar do uso de novo conhecimento. Os mtodos podem ter por objetivo produzir ou entregar produtos tecnologicamente novos ou aprimorados, que no possam ser produzidos ou entregues com os mtodos convencionais de produo, ou pretender aumentar a produo ou eficincia na entrega de produtos existentes. (FINANCIADORA DE ESTUDOS E PROJETOS, 2010).

A escolha de anlise por este tipo de Inovao justifica-se pelo fato desse descritor ter sido usado mais enfaticamente pela FINEP nos ltimos anos, indicando um interesse da instituio pelo financiamento de projetos desta temtica. Alm disso, as inovaes de processo so sabidamente importantes como diferencial no desenvolvimento socioeconmico dos pases. A segunda etapa da coleta de dados consistiu da extrao da amostra para anlise. Tendo como base o Portal de Informao da FINEP foi construdo um relatrio de todos os projetos indexados pelo descritor Inovao de processo. Este relatrio possibilitou a identificao de cada projeto por trs itens de informao: o nmero de referncia, o ttulo do projeto e os descritores atribudos. A partir da leitura do relatrio foi possvel extrair os descritores que indexaram os projetos, nos quais necessariamente constava o descritor Inovao de processo. Foi contabilizado o total de 291 descritores nicos, aps descarte dos descritores duplicados. Cumpre ressaltar que tais descritores foram atribudos pela equipe de elaborao do VCF a partir da indexao dos projetos na ntegra, tendo como base o ttulo, o objetivo e o plano de trabalho, uma vez que estas trs partes so consideradas pela equipe do VCF como as que contem as principais informaes da temtica do projeto. Importante ressaltar que somente a partir de 2007 os projetos aprovados pela FINEP passaram a ser indexados e que cada projeto recebe uma mdia de 5 a 7 descritores temticos. Este total foi estabelecido pela equipe do VCF como satisfatrio, em termos de exaustividade para os objetivos da FINEP em relao recuperao da informao dos projetos sob financiamento. No entanto, em busca de maior especificidade de indexao por assunto das propostas foi criado no Portal de Informao o campo busca livre, atravs do qual o usurio tem a possibilidade de inserir qualquer palavra que GT2 431

desejar e o programa, por sua vez, recupera tal palavra em qualquer parte do projeto. Isto torna o VCF um sistema hbrido, segundo Lancaster (1993, p. 223) o termo hbrido empregado para designar qualquer sistema que funcione com uma combinao de termos controlados e linguagem natural. Lancaster ainda aponta que muitos autores chegaram concluso de que o sistema de recuperao ideal inclui uma parte de termos controlados e uma parte de texto livre. A etapa seguinte do presente trabalho constituiu-se da definio dos descritores extrados do relatrio que formam a amostra analisada. Cumpre ressaltar que a definio do descritor para a elaborao de um instrumento de organizao e recuperao da informao etapa de extrema importncia, porque este o elemento de anlise que vai permitir no apenas estabelecer a estrutura classificatria como identificar os termos equivalentes que constituem os parmetros necessrios para o processo de categorizao dos descritores. Ou seja, somente com os descritores devidamente conceituados possvel identificar a categoria a qual pertence cada descritor. No presente trabalho (como no processo habitual de elaborao do VCF) as fontes utilizadas para a definio dos descritores foram de natureza diversa. Esto mencionadas, a seguir, segundo a ordem de relevncia adotada na busca das definies: Glossrios e Dicionrios Especializados em diversas reas do conhecimento, Dicionrios de Termos Tcnicos, Tesauros, Legislaes, Manuais Tcnicos e Dicionrios de Lngua Portuguesa. Quando no foi possvel encontrar uma definio para os descritores nas fontes impressas disponveis no acervo da FINEP e nos Glossrios Especializados existentes na internet, a busca foi realizada em sites institucionais, como de universidades e empresas pblicas e privadas renomadas e tambm na enciclopdia livre Wikipdia. O uso da Wikipdia se justifica no caso dos termos deste vocabulrio pelas seguintes razes. Primeiro por servir de fonte de referncia inicial para o entendimento de termos muito complexos. E, segundo, por ser o VCF um vocabulrio que lida com termos da rea de inovao e, por esse motivo, muitos desses termos ainda no se encontram dicionarizados, principalmente no caso de equipamentos ou produtos novos, que ainda no foram inseridos no mercado. Com os descritores organizados e definidos, a etapa da categorizao foi iniciada. Como j mencionado, o elenco de categorias escolhido para anlise foi a do Classification Research Group (CRG). Justifica-se esta escolha pelo fato de a classificao do CRG ter um maior nmero de categorias que a PMEST e, por este motivo, possibilitar uma hospedagem mais flexvel dos termos em categorias. Alm disso, por ser um desenvolvimento das Categorias Fundamentais de Ranganathan (PMEST), a classificao do CRG no apresenta conflito com a metodologia original, anteriormente estabelecida para a elaborao do VCF. No processo de desenvolvimento da categorizao da amostra dos descritores pertencentes ao VCF fez-se necessrio o entendimento de cada uma das categorias que foram utilizadas neste processo. Neste ponto cumpre destacar que a teoria do CRG no est centrada em fonte nica, sendo apresentada por um nmero considervel de trabalhos escritos por diferentes membros deste grupo. Alm disso, o CRG no apresenta sua teoria de forma explicita em uma lista organizada de princpios, como fez GT2 432

Ranganathan. Sendo assim, no foi encontrado na literatura nenhum estudo descritivo sobre cada uma das categorias do CRG. Para estabelecer o que foi entendido por cada uma das categorias utilizadas nesta amostra, a natureza exploratria deste estudo permitiu que se considerasse como base de anlise: os conceitos das categorias fundamentais de Ranganathan, os dicionrios de lngua portuguesa, alm do prprio agrupamento dos descritores, que de certa forma descrevem as categorias s quais pertencem. A seguir, sero apresentadas as categorias identificadas a partir da definio dos descritores. Tambm ser explicitado o significado de cada uma destas categorias, ou seja, o que aqui foi entendido como o conceito de cada categoria, bem como apontados os casos de equivalncia ou semelhana com as categorias fundamentais de Ranganathan: Efeito o resultado produzido por uma ao ou um agente; Entidade equivalente categoria Personalidade de Ranganathan, portanto utilizou-se o mtodo do resduo para identificar os descritores que aqui se inseriram, ou seja, o que no se caracterizava como alguma das outras categorias foi inserida nesta; Instrumento aparelhos, objetos ou utenslios que servem para executar uma obra ou levar a efeito uma operao mecnica em qualquer arte, cincia ou ofcio; Lugar equivalente categoria Espao de Ranganathan, o lugar diz respeito ao local de pertencimento de um dado objeto, seja ele indivduo, coisa, ideia, fenmeno, entre outras entidades; Operao semelhante categoria Energia de Ranganathan, a operao foi aqui entendida como uma ao ocorrida entre coisas; Operaes mentais compreende os tipos de estudos, pesquisas ou anlises; Parte parte de entidade; Processo categoria tambm semelhante categoria Energia de Ranganathan, porm, se caracteriza por um tipo de ao que ocorre naturalmente, como por exemplo, as reaes qumicas ou as doenas; Produto resultado de uma produo; Propriedade qualidade ou atributo inerente a alguma entidade; Sistema conjunto ou combinao de coisas ou partes de modo a formarem um todo complexo ou unitrio; Substncia - aquilo que subsiste por si, sem dependncia de quaisquer outros elementos acidentais, a matria pura. No desenvolvimento do processo de categorizao verificamos que algumas categorias/facetas como, por exemplo: aparelho, tcnica e material - foram tambm identificadas. Porm, como o nmero de descritores encontrados para tais categorias no justificava a incluso das mesmas, todos os descritores dessas categorias puderam ser adequadamente agrupados em categorias afins, como indicado a seguir: As Cincias, aqui entendidas como domnios do conhecimento, foram inseridas na categoria Entidade; Os Equipamentos e os Aparelhos foram agrupados na categoria Instrumento; As Tcnicas e os Mtodos foram categorizados como Operao; Os Materiais foram agrupados na categoria Produto; Os Setores e os Ramos de um domnio do conhecimento foram categorizados como Parte de coisa; Os atributos foram agrupados juntamente com as propriedades. Como sntese do processo de coleta, tratamento dos dados do presente trabalho, os descritores foram organizados alfabeticamente numa planilha. Para cada descritor foi acrescentada a respectiva definio e a categoria em que foi classificado. No processo de categorizao da amostra de descritores do VCF, os principais resultados foram: 1 descritor na categoria Efeito, 32 descritores na categoria GT2 433

Entidade, 21 descritores na categoria Instrumento, 15 descritores na categoria Lugar, 67 descritores na categoria Operao, 3 descritores na categoria Operaes mentais, 19 descritores na categoria Parte, 14 descritores na categoria Processo, 41 descritores na categoria Produto, 7 descritores na categoria Propriedade, 42 descritores na categoria Sistema e 29 descritores na categoria Substncia. Como etapa complementar de tratamento de dados foi realizada a anlise das definies atribudas aos descritores contidos na amostra selecionada para este estudo. O objetivo desta anlise foi identificar palavras e expresses, presentes nas definies dos descritores, que tiveram maior influncia no processo de classificao no elenco definido de categorias anteriormente descrito. O resultado desta anlise ser descrito a seguir: Efeito - com apenas 1 descritor, a categoria foi caracterizada com seu prprio nome, j que o descritor, aqui categorizado, foi Efeito especial e foi definido como Efeito mecnico; Entidade - esta categoria apresentou poucas caractersticas comuns entre as definies de seus descritores, uma vez que esta uma categoria bastante diversificada. Nesta categoria foram encontradas manifestaes como Coisas, Plantas, Frutas, Indstrias, Disciplinas, Empresas, entre outras; Instrumento - as palavras mais significativas encontradas nas definies dos descritores foram: Dispositivo, Mquina, Equipamento, Aparelho e Ferramenta; Lugar - no h consideraes acerca desta categoria, pois a maioria de seus descritores so Identificadores e no VCF este tipo de descritor no definido; Operao - as palavras mais significativas encontradas nas definies dos descritores foram: Ao, Atividade, Implementao, Investigao, Mtodo, Processo, Procedimento, e Utilizao; Operaes mentais - as palavras mais significativas encontradas nas definies dos descritores foram: Estudo e Pesquisa; Parte - as palavras mais significativas encontradas nas definies dos descritores foram: Parte, Ramo e Setor; Processo - as palavras mais significativas encontradas nas definies dos descritores foram: Alterao biolgica, Doena e Processo; Produto - as palavras mais significativas encontradas nas definies dos descritores da categoria foram: Agente, Material, Mistura e Produto; Propriedade - as palavras mais significativas encontradas nas definies dos descritores foram: Capacidade, Equilbrio, Propriedade; Sistema - as palavras mais significativas encontradas nas definies dos descritores foram: Conjunto, Sistema e Variedade; Substncia - as palavras mais significativas encontradas nas definies dos descritores foram: Substncia, Material e Composto qumico. Importante destacar que os resultados desta anlise complementar corroboraram os resultados das anlises anteriores do processo de definio das categorias, anteriormente descrito. Em outras GT2 434

palavras, os projetos com pedidos de financiamento aprovados pela FINEP, indexados por Inovao de processo, puderam ser categorizados satisfatoriamente com respaldo da definio dos descritores. Como principal resultado do processo de categorizao, destacamos que as categorias Operao e Processo so entendidas como ao entre coisas, condio para a implantao de um Sistema, cujo resultado um Produto, definido e/ou pesquisado por uma Entidade e/ou Parte. A Substncia a prpria matria, que pode ser objeto da pesquisa cientfica. A categoria Instrumento nos indica como operacionalizar a pesquisa, localizando-a em Lugar. A categoria Propriedade indica os benefcios, ou no, advindos do objeto pesquisado atravs das Operaes Mentais e seus Efeitos. Outro aspecto a destacar da anlise a ordem das categorias que aps o estudo estatstico apresentou a seguinte sequencia de ocorrncia: Operao, Sistema, Produto, Entidade, Substncia, Instrumento, Parte, Lugar, Processo, Propriedade, Operaes Mentais e Efeito. Esses resultados no s respaldam satisfatoriamente o encaminhamento terico-metodolgico adotado no presente trabalho, como tambm indicam uma possvel nova forma de organizar as categorias na indexao de propostas de financiamento encaminhadas e aprovadas FINEP para recuperao da informao. 4 CONSIDERAES FINAIS O presente trabalho teve como objetivo analisar o Vocabulrio Controlado FINEP enquanto instrumento de organizao e representao da informao e investigar a aplicao do mtodo de categorizao neste instrumento. A partir das anlises realizadas foi possvel observar que o trabalho de elaborao de um instrumento de controle terminolgico bastante minucioso e requer uma srie de estudos, pesquisas, decises e testes. Um ponto importante a ser ressaltado neste estudo foi a busca por definies atribudas aos descritores. Por ser o VCF um instrumento que abarca diversas reas do conhecimento necessrio que se tenha um acervo bastante diversificado de glossrios, dicionrios especializados, dicionrios tcnicos, manuais, etc. No presente trabalho, foi necessrio, em alguns casos, recorrer a sites da internet, j que no se conseguiu encontrar as definies nas obras de referncia existentes no acervo FINEP, o que no caso estudado no chegou a comprometer as anlises. No entanto, cumpre ressaltar que a falta de credibilidade das fontes de onde so retiradas as definies dos descritores de um vocabulrio controlado pode comprometer a estrutura em relao consistncia da categorizao e dos relacionamentos entre os descritores. Outra questo importante, ainda sobre a definio, a validao por parte de especialistas das reas das propostas financiadas abarcadas pelo VCF. O vocabulrio em questo deve ter uma validao peridica das definies, uma vez que sabido que a qualidade da definio est diretamente ligada qualidade da categorizao e, consequentemente, qualidade da organizao e recuperao da informao. GT2 435

Um ponto relevante a ser destacado neste estudo foi a complexidade e a dificuldade da tentativa de conceituar o elenco das categorias do CRG, principalmente porque este processo exige um esforo intelectual considervel, alm de um conhecimento de todo o referencial terico da rea de organizao e representao do conhecimento. Porm, mesmo considerando que algumas decises tomadas acerca dos conceitos de cada uma das categorias possam suscitar crticas ou questionamentos, os resultados da aplicao demonstraram que esses conceitos auxiliaram na diminuio da margem de erro no processo de categorizao, o que no descarta a possibilidade de serem aprimorados futuramente. Quanto categorizao, durante o desenvolvimento deste processo constatou-se que h categorias mais simples de se identificar e outras mais complexas que requerem uma interpretao mais cautelosa. Esta constatao fica bem visvel na parte da anlise das palavras e expresses significativas das definies. Destacamos que, numa definio bem estruturada, estas palavras ou expresses costumam aparecer logo no incio da definio, em que indicada a natureza do descritor: se Entidade, Processo, Sistema etc. O restante da definio, via de regra, descreve a funo ou a composio do descritor. Nas categorias mais simples de se identificar, as palavras significativas que aparecem so, na maioria, quase sinnimas do nome da categoria, enquanto nas categorias mais abstratas essas palavras precisam/necessitam ser interpretadas a partir da definio do descritor e do conceito da categoria. A partir da anlise do processo de categorizao foi possvel verificar a importncia da aplicao deste processo na construo de instrumentos de controle terminolgico, visando eficincia na representao do conhecimento para a recuperao da informao. Apesar de no projeto inicial de implantao do VCF ter sido preconizado a utilizao das categorias de Ranganathan (PMEST) e, por conjunturas variadas, ter sido adotada posteriormente a organizao dos descritores pelas reas do conhecimento do CNPq - que logo se mostrou insuficiente para atender s demandas da FINEP - verificou-se que a escolha da aplicao das categorias do CRG no VCF seria satisfatria, no sendo necessrias modificaes nas categorias j existentes, uma vez que foram suficientes para agrupar os descritores da amostra estudada. Alm disso, no caso do VCF, os resultados revelaram que a categorizao possibilitou uma estruturao sistemtica dos descritores, qualificando ainda mais este instrumento e otimizando os processos de indexao e recuperao da informao na FINEP. Desta forma, acredita-se tambm que a classificao do CRG apresenta potencial para ser aplicada s outras reas do vocabulrio. Para que isso ocorra, prope-se um estudo mais aprofundado sobre os resultados desta aplicao na representao e recuperao da informao na FINEP. Alm disso, tambm desejvel um estudo das necessidades dos usurios deste instrumento. O processo de controlar/padronizar um vocabulrio dinmico, como dinmica tambm a prpria construo do conhecimento. Desta forma, acredita-se no encaminhamento metodolgico de elaborao do VCF como proposto neste trabalho, principalmente porque esta metodologia sustentada por teorias clssicas da organizao e representao do conhecimento, j estabelecidas na Biblioteconomia e na Cincia da Informao. GT2 436

Por outro lado, a metodologia e o produto gerado neste trabalho permitiro FINEP avanar com qualidade no tratamento terminolgico de temticas de pesquisa no mbito da Cincia, Tecnologia e Inovao. Por ltimo, necessrio reforar que o tratamento informacional em uma organizao fator fundamental para a tomada de decises e, no caso especfico da FINEP, um elemento estratgico para o gestor. REFERNCIAS ARAJO, Vnia M. R. H. Sistemas de recuperao da informao: nova abordagem terico conceitual. Cincia da Informao, Braslia, v. 24, n. 1, 1995. BATTAGLIA, Maria Glria Botelho. A inteligncia competitiva modelando o Sistema de Informao de Clientes FINEP. Cincia da Informao, Braslia, v. 29, n. 2, p. 200-214, maio/ago. 1999. CAMPOS, Maria Luiza de Almeida. Linguagem Documentria: teorias que fundamentam sua elaborao. Niteri: EdUFF, 2001. CAMPOS, Maria Luiza de Almeida. Vocabulrio controlado: instrumento para a gesto dos recursos informacionais dos acervos da FINEP. Apresentao. Rio de Janeiro, 2004. CAMPOS, Maria Luiza de Almeida; GOMES, Hagar Espanha. Metodologia de elaborao de tesauro conceitual: a categorizao como princpio norteador. Perspectiva em Cincia da Informao, Belo Horizonte, v. 11, n. 3, p. 348-359, set./dez. 2006. Disponvel em: <http://www. scielo.br/scielo.php?pid=S1413-99362006000300005&script=sci_arttext>. Acesso em: 20 jan. 2011. CAMPOS, Maria Luiza de Almeida; GOMES, Hagar Espanha. Taxonomia e classificao: o princpio de categorizao. DataGramaZero: Revista de Cincia da Informao. v. 9, n. 4, ago. 2008. Disponvel em: <http://www.dgz.org.br/ago08/Art_01.htm>. Acesso em: 22 out. 2010. No Paginado. CAMPOS, Maria Luiza de Almeida; GOMES, Hagar Espanha; MOTTA, Dilza (Coord.) Fonseca da. Elaborao de tesauro documentrio: tutorial. 2006. Disponvel em: <http://www.conexaorio.com/ biti/tesauro/>. Acesso em: 20 fev. 2011. No Paginado. CINTRA, Ana Maria et al. Para entender as linguagens documentrias. 2. ed. rev. e ampl. So Paulo: Polis, 2002. FINANCIADORA DE ESTUDOS E PROJETOS. Disponvel em: <www.finep.gov.br>. Acesso em: 16 jun. 2010. FINANCIADORA DE ESTUDOS E PROJETOS. Glossrio. Disponvel em: <http://www.finep. GT2 437

gov.br/o_que_e_a_finep/conceitos_ct.asp>. Acesso em: 22 ago. 2010. FINANCIADORA DE ESTUDOS E PROJETOS. Portal da Informao. Disponvel em: <www. finep.gov.br/intranet>. Acesso em: 07 jan. 2011. FINANCIADORA DE ESTUDOS E PROJETOS. Proposta de consultoria para os acervos da FINEP: indexao e recuperao da informao. Proposta. Rio de Janeiro, 2005. FINANCIADORA DE ESTUDOS E PROJETOS. Relatrio das atividades da consultora Maria Luiza de Almeida Campos. Relatrio de atividades. Rio de Janeiro, 2003. FINANCIADORA DE ESTUDOS E PROJETOS. Vocabulrio controlado FINEP (VCF): indexao e recuperao do acervo arquivstico. Relatrio de atividades. Rio de Janeiro, 2007. FINANCIADORA DE ESTUDOS E PROJETOS. Vocabulrio controlado: uma nova metodologia visando o tratamento terminolgico de documentos para fins de recuperao. Proposta. Rio de Janeiro, 2002. FOSKETT, Antony Charles. A abordagem temtica da informao. So Paulo: Polgono; Braslia: Ed. Universidade de Braslia, 1973. LANCASTER, F. W. Construo e uso do tesauro: curso condensado. Trad. de Csar Almeida de Menezes e Silva. Braslia: IBICT, 1987. 114p. ______. Indexao e resumos: teoria e prtica. Braslia: Briquet de Lemos, 1993. 347p. ______. Indexao e resumos: teoria e prtica. 2. ed. Braslia: Briquet de Lemos. 2004, 452p. ______. Vocabulary Control for Information Retrieval. Virginia: Information Resources Press, 1986. 270p. XII Encontro Nacional de Pesquisa em Cincia da Informao ENANCIB 2011

GT2 438

COMUNICAO ORAL

TRATAMENTO TCNICO DA DOCUMENTAO AUDIOVISUAL NA TV DA UNIVERSIDADE FEDERAL DE GOIS


Maria Leticia Costa Miranda, Maria de Ftima Garbelini RESUMO Atualmente a televiso considerada um meio de grande exploso informacional e o surgimento dela trouxe uma nova etapa na evoluo da documentao audiovisual. Este tipo de documentao vem crescendo consideravelmente em emissoras de televiso muito embora ainda no possuam um tratamento tcnico adequado para este tipo de documentao. A presente pesquisa e estudo uma proposta e implementao de um tratamento tcnico [catalogao, descrio, indexao e preservao] dos documentos audiovisuais da TV UFG (Universidade Federal de Gois), levantando conceitos de documentao audiovisual e documentao audiovisual em televiso, as etapas do tratamento tcnico para documentos audiovisuais para poder implementar o tratamento e fazer com que a informao seja melhor e mais rapidamente recuperada entres os editores e produtores dos programas da TV UFG e futuramente entre a comunidade em geral, alm de preservar a memria institucional da TV UFG. Palavras-Chave: Documentao Audiovisual. Documentao audiovisual em televiso. Indexao de imagens em movimento. Tratamento tcnico de documentos audiovisuais.

1 INTRODUO O crescimento da informao audiovisual no ambiente televisivo em nvel geral trouxe a necessidade de desenvolver formas de tratamento para esta documentao, alm do desenvolvimento de ferramentas que suportem uma indexao rpida e eficiente, sendo esta ltima a mais desafiadora, pois ainda existe muita dificuldade por ser de natureza peculiar. A TV UFG vinculada Fundao Rdio e Televiso Educativa FRTVE foi instituda para apoiar a Universidade Federal de Gois (UFG) em aes voltadas para as reas de radiodifuso, comunicao, educao e cultura. Sua atuao pautada nas polticas relativas ao ensino, pesquisa e extenso da UFG, tendo como principal ramo de atividade a radiodifuso. Com essa misso, desenvolve diversas atividades relacionadas comunicao, educao e cultura, apoiando instituies de ensino superior pblicas, especialmente a UFG. Desde 2009 concessionria da TV UFG que em GT2 439

parceria com a TV Brasil, transmitido em sinal aberto pelo Canal 14-E UHF. Sendo assim, o objetivo da pesquisa e estudo implementar um tratamento tcnico (registro, catalogao, classificao, indexao e preservao) dos documentos audiovisuais, em especial as imagens em movimento brutas, da TV UFG fazendo um levantamento do acervo j existente, identificando o contedo dos documentos para posteriormente implementar o tratamento e construir um banco de imagens deixando-a para consulta entre os funcionrios da TV UFG, mais especificamente os responsveis pela produo e editorao dos programas alm de contribuir para a preservao da memria da instituio. 2 DOCUMENTO AUDIOVISUAL: PRINCIPAIS CARACTERSTICAS A palavra audiovisual tem origem latina. Mas a palavra tal qual como conhecemos atualmente tem origem Norte-Americana, pois foi neste pas que comeou a se desenvolver as primeiras tcnicas de som e imagem. No Brasil, somente nos anos 50 esse termo passou a ser utilizado e em pouco tempo ao termo audiovisual foi acrescentado outros sinnimos como: multimeios, recursos audiovisuais, materiais no impressos, materiais especiais, no grficos, materiais no bibliogrficos e mdia, tornando assim, um campo de estudo bastante amplo, complexo e confundvel epistemologicamente, o que dificulta a padronizao e a conceituao vocabular. Segundo Cirne (2002, p. 117), um documento audiovisual um documento cuja informao veiculada atravs de um cdigo de imagens, fixas ou mveis, e de sons, carecendo de um equipamento apropriado para ser visto e ouvido. Rubio (2003) afirma que:
O documento audiovisual, como documento cientfico participa, conseqentemente das mesmas notas de informao e fonte informativa e se integra igualmente no processo informativo-documental: emissor (bibliotecrio audiovisual), canal ou meio de transmisso (suporte audiovisual), mensagem (documento audiovisual), receptor ou usurio da mensagem (documento audiovisual). (RUBIO, 2003, p.216).

Para Hidalgo Goyanes (2005, p.234), os documentos audiovisuais so um fenmeno relativamente recente no mbito da documentao, sobretudo se compararmos com a larga trajetria dos documentos textuais. E a mesma autora complementa que os documentos audiovisuais so considerados opacos, pois, seu contedo no legvel ou acessvel de forma direta, sendo que necessria a utilizao de aparatos de leitura, o que os converte em dependentes de meios tcnicos. Para a autora, documentos audiovisuais so tambm Multiformes e Incompatveis que esto gravados em mltiplos suportes materiais e diversos formatos. Isto indica que provavelmente estes documentos no so tratados tecnicamente pela maioria dos profissionais da informao por serem muitos mais complexos na sua natureza e produo de se fazer um tratamento tcnico eficiente, ou seja, classificar, indexar e conseqentemente, armazenar. GT2 440

3 INDEXAO DE IMAGENS EM MOVIMENTO Os primeiros registros de imagem surgem h pelo menos 22 mil anos, na forma de escritas pictogrficas. As pinturas rupestres das cavernas pr-histricas so testemunhos da necessidade do homem de representar os acontecimentos sua volta. A imagem (do latim Imago) uma representao visual, construda pelo homem, dos mais diversos tipos de objetos, seres e conceitos. Pode estar no campo do concreto, quando se manifesta por meio de suportes fsicos palpveis e visveis, ou no campo do abstrato, por meio das imagens mentais dos indivduos. Hoje vivemos em uma civilizao da imagem, onde a dominao visual macia, principalmente nos meios de comunicao que as utilizam para informar. O surgimento da fotografia, do cinema e da televiso, acentua ainda mais a presena das imagens no cotidiano do homem, sendo a imagem basicamente uma sntese que oferece traos, cores e outros elementos visuais em simultaneidade. Para Smith (1996, p. 29) o termo imagem abrange um vasto leque de documentos iconogrficos ou de ilustraes, incluindo pinturas, gravuras, psteres, cartes postais, fotografias, filmes (que se encaixa como sendo uma imagem em movimento), etc. A autora destaca ainda que estes registros, embora semelhantes no demandem as mesmas lgicas de tratamento documentrio uma vez que suas modalidades e usos so distintos. Na sociedade contempornea, a imagem ocupa lugar fundamental, e a visualidade torna-se, reconhecidamente, um dos mais importantes recursos cognitivos. Existe uma demanda, cada vez maior, pela utilizao sistemtica dos recursos audiovisuais tanto para a divulgao de informaes como para a pesquisa. Entende-se por imagem em movimento, segundo uma definio formulada nas Recomendaes sobre a Salvaguarda e a Conservao das Imagens em Movimento, aprovada pela United Nations Educational, Scientific and Cultural Organization UNESCO em 1980 como:
Qualquer srie de imagens captadas e fixadas em um suporte (independentemente do mtodo de captao das mesmas e da natureza do dito suporte como, por exemplo, filmes, fitas, disco, etc. utilizado inicial e ulteriormente para fix-las) com ou sem acompanhamento sonoro que, ao serem projetadas, do uma impresso de movimento e esto destinadas comunicao ou distribuio ao pblico ou se produzam com fins de documentao.

Quando se fala em tratamento tcnico o que mais possui subjetividade e que por conseqncia disto mais complexo de se fazer a indexao. Para Lancaster (2004), indexar significa fazer uma representao temtica dos documentos, ou seja, indicar do que se trata o documento e resumir o seu contedo. Toda rea do conhecimento bem como distintos formatos impressos, como jornais, leis, etc. suscitam problemas de indexao. Mais relevantes so as questes que surgem ao sairmos do texto impresso para outros formatos. GT2 441

A indexao de imagens, mais especificamente a imagem em movimento, considerada uma rea difcil, pois abarcam campos como tecnologia da fala, viso computacional e compreenso de documentos, que ultrapassaram em muito o escopo da maioria das aplicaes de indexao.
Essas questes tm atrado a ateno de novos interessados, tanto os preocupados com o contedo informacional das imagens, quantos aos interessados em desenvolver formas automatizadas de descrio e acesso s imagens e destaca ainda que o grande desafio representar a imagem com finalidade documental, propiciando a sua recuperao apropriada em resposta a uma demanda cada vez mais especializada do usurio. (JOS FILHO, 2004, p.2)

Smit (1996) aborda aspectos interessantes para serem analisados quando est sendo realizada a indexao de imagens, que podem ser absolutamente utilizveis em qualquer tipo de anlise documentria: segundo a autora, as categorias QUEM, ONDE, QUANDO e COMO/O QU, utilizadas por muitos estudiosos como parmetro para a anlise de textos, inclusive a documentria, tambm preconizada para a anlise documentria de imagem. QUEM seria a identificao do ser enfocado, ONDE o local em que a imagem foi gerada, QUANDO o tempo, ou seja, o ano, ms ou dia e COMO/O QUE aborda o assunto da imagem. A imagem possui caracterstica prpria de polissemia que dificultam sua classificao de forma eficiente. O acesso s imagens tem sido tradicionalmente indicado por sistemas de classificao baseados em palavras ou indexadores descritores na forma de vocabulrios controlados, conhecidos como tesauros alm da escolha de palavras-chave voltadas essencialmente para a descrio semntica de contedos informacionais, sendo esta ltima mais utilizada para a indexao e classificao das imagens em movimento. Assim sendo, cabe Cincia da Informao indicar os caminhos para o acesso mais eficiente a essas imagens enquanto documentos informacionais em seus Sistemas de Recuperao de Informao. 4. A DOCUMENTAO AUDIOVISUAL NA TELEVISO Atualmente a televiso considerada um meio de grande exploso informacional e o surgimento dela trouxe uma nova etapa na evoluo da documentao audiovisual. De acordo com Fuentes Pujol,
os meios de comunicao em massa so instrumentos bsicos de difuso. Devem informar de forma veraz e objetiva a um pblico variado e amplo, e o instrumento por excelncia que permite situar e analisar em seu contexto os feitos recentes da histria atual (...), so fontes de informao e, independentemente da diversidade de formas, audincias, periodicidade, etc [...]. (FUENTES PUJOL, 2006, p.135).

GT2 442

A documentao em meios de comunicao tem caractersticas especficas que diferenciam claramente da documentao em outros mbitos da informao segundo Fuentes Pujol (1995, p. 136) no quais so: Dualidade na origem das fontes; Multiplicao constante de informao heterognea; Rapidez na resposta; Obsolncia da informao; Dicotomia texto-imagem; Diversificao de usurios; Sendo que suas funes principais so: Proporcionar fontes concretas para poder comprovar rapidamente um feito ou uma data; Ter materiais suficientes para situar os distintos temas em seu contexto; Atuar como fontes de inspirao; 4.1 O TRATAMENTO TCNICO DA DOCUMENTAO AUDIOVISUAL EM TELEVISO Os meios de comunicao em especial televiso formam um arquivo documental muito valioso que deve ser organizado e tratado. A quantidade de informao produzida por estes meios bem significativa e conseqentemente muito dispersa o que requer tcnicas documentais mais adequadas para que possam ser usadas de forma retrospectiva para melhor satisfazer as demandas dos usurios, dentre eles os jornalistas, editores, produtores etc.os mais importantes - mas tambm investigadores estudiosos ou o pblico em geral que requer informao. Carlos Alberto Nogueira et. al (2008) complementa que: A produo de imagens para a televiso e o vdeo envolve em seu processo a gerao de um grande nmero de gravao de cenas material bruto. Na edio, apenas algumas cenas so aproveitadas. As gravaes no utilizadas ou parcialmente utilizadas devem receber tratamento tcnico visando a sua busca e recuperao para a reutilizao em outras produes audiovisuais, e em atividades de ensino, pesquisa e extenso, gerando estoques de informao. (NOGUEIRA et. al 2008 p. 2) Para Rayo (2007) a documentao audiovisual em emissoras de televiso passa pelas seguintes etapas desde o momento que chega a um centro de documentao at o seu destino final, para que seja recuperado de forma rpida e precisa. Estas fases so: Registro Seleo GT2 443

Anlise Documental Recuperao da informao Emprstimo Conservao Colocando uma proposta de fluxograma o resultado seria :

Em geral, o tratamento tcnico da documentao audiovisual em televiso apresenta diferenas quanto a sua procedncia (informativo ou programa) e o tipo de gravao (bruto ou editado) e este tipo de diferenciao se d na primeira etapa, ou seja, o registro do documento. Dentre as etapas apresentadas, a seleo, anlise documental e conservao so consideradas pela maioria dos autores nesta rea como o trip de todo o tratamento tcnico. Apresentaremos as etapas do tratamento tcnico e o porqu da sua importncia. 4.2 SELEO DOCUMENTAL Definir seleo documental no uma tarefa muito complicada, mas pratic-la em um Centro de Documentao sim, principalmente quando se fala em ambiente televisivo, onde a quantidade de material muito grande. Para Rayo (2007, p. 79) a seleo documental toda ao que tem por objetivo avaliar, descriminar e, em conseqncia, filtrar (escolher e/ou filtrar) um documento (...), ou seja, uma operao no qual se elegem, dentre todos os outros documentos existentes, aqueles que mais interessam a um servio. Em uma emissora de televiso, a seleo documental um procedimento regular de avaliao e para Hidalgo Goyanes (2005 p. 2), esta seleo uma tarefa importante que deve ser precedida pela existncia de uma poltica clara a respeito da entidade ou organismo em que se encontra o servio de GT2 444

documentao. Para uma seleo documental ser realizada com xito, preciso seguir alguns critrios bsicos, como cita Rayo (2007), Deve ser um procedimento regular; A avaliao do material fundamental A avaliao do material deve ser feita em funo de parmetros previamente estabelecidos; A seleo deve se adequar tanto aos objetivos como s necessidades da empresa; A seleo deve ser feita preferencialmente sobre o material original; A seleo deve ser feita por bibliotecrios e/ou documentalistas. 4.2.2 Anlise Documental A segunda etapa importante do tratamento tcnico consiste na extrao das informaes mais relevantes que sero utilizadas na localizao a posteriori das mesmas. considerado um procedimento anlogo indexao e classificao em categorias no qual se permite a recuperao dos dados. Outros elementos podem ser acrescentados quando necessrio tais como a cor da imagem, iluminao, movimentos da cmera, efeitos ticos, dentre outros, complementam a anlise, mas no precisam necessariamente ser acrescentados, variando de centro de documentao para centro de documentao. 5 TV / UFG A histria da TV UFG comea em 1962 quando a Universidade Federal de Gois - UFG solicitou a concesso de uma emissora de rdio, a Rdio Universitria, neste mesmo perodo, fez tambm o pedido de uma emissora de televiso. A concesso radiofnica foi outorgada Universidade, mas a televisiva no. Mais tarde, nas dcadas de 70 e 80, a UFG teve a oportunidade de ocupar dois canais, o 13 e o 11, mas no conseguiu reunir os recursos financeiros necessrios para colocar a emissora no ar e em funcionamento. O Canal 13 foi ento incorporado ao Estado e o canal 11, a grupos privados. Em 1996, a Fundao Rdio e Televiso Educativa - RTVE foi instituda com o objetivo de apoiar as aes de radiodifuso, comunicao, educao e cultura da UFG, atendendo inclusive a uma exigncia legal no que se refere rea, j que a concesso de radiodifuso no Brasil pblica, mas de direito privado. Em maio de 2004 foi publicado no Dirio Oficial da Unio o Decreto Presidencial que concedeu o Canal 14-E para a Fundao RTVE. O passo inicial para a efetivao da TV UFG estava consolidado. Desde a sua criao, a Fundao RTVE apoiou diversos projetos das reas de comunicao, GT2 445

educao e cultura, tanto da UFG, quanto da sociedade goianiense, contribuindo, de forma significativa, para a melhoria da educao e para a democratizao do acesso a produtos culturais, principalmente por meio da radiodifuso pblica.

5.1 O TRATAMENTO TCNICO DA DOCUMENTAO AUDIOVISUAL O processo de tratamento tcnico da documentao audiovisual, em particular as imagens em movimento brutas do acervo da TV UFG iniciou-se no ano de 2010. Para Cunha (2008, p.293) define tratamento tcnico [sinnimo de processamento tcnico] como um conjunto de atividades s quais um documento sucessivamente submetido at ser considerado pronto para ser includo no acervo [...], envolvem dentre outras o nmero de registro, catalogao, classificao e indexao. A pesquisa e estudo sobre o tratamento tcnico surgiram aps ter sido feita uma anlise da documentao audiovisual como um todo, no qual incluram uma reunio com os coordenadores de imagem da TV UFG e os pesquisadores. A anlise da documentao foi realizada atravs de uma observao direta do trabalho do editores, mas focado diretamente na localizao das imagens e tambm atravs da observao da organizao dos suportes, no qual muitos estavam sem numerao, no permitindo uma organizao seqencial, alm de no haver um documento no qual estivesse catalogado todas as informaes. O tratamento tcnico de toda a documentao foi dividido em quatro fases. So elas: a anlise do acervo audiovisual, a decupagem das fitas, a elaborao de novas etiquetas e por fim o armazenamento e conservao de toda a documentao. A princpio no havia uma organizao e a informao demandava muito tempo para ser localizada, necessitando assim, de uma catalogao e descrio a fim de serem mais rapidamente recuperadas. Toda a informao audiovisual estava armazenada em um suporte denominado Fitas MiniDvs, no havendo um documento com uma descrio detalhada de toda a informao, somente um breve resumo escrito mo do contedo existente na etiqueta original que vinha com o suporte. Antes de iniciar o tratamento tcnico da documentao, uma pesquisa foi feita com a equipe responsvel pelo audiovisual da TV UFG para saber qual informao era mais relevante ao se localizar uma imagem em movimento e o resultado desta pesquisa ser relatado mais adiante. No meio jornalstico e cinematogrfico h uma atividade primordial quando se deseja localizar rapidamente uma informao contida em um vdeo ou filme. Esta atividade denominada de decupagem. Segundo Nogueira (2008 p. 3), decupar dividir um filme ou vdeos em planos. No tratamento tcnico h uma etapa que a chamada Anlise Documental, no qual considerada uma das etapas mais importantes, a decupagem pode ser considerada como sendo uma anlise documental. GT2 446

Na decupagem h um elemento relevante que permite a localizao exata da imagem armazenada no suporte. o chamado time - code, que no resultado da pesquisa feita com a equipe da TV UFG foi o elemento considerado mais importante quando se deseja localizar a imagem com preciso sem demandar muito tempo. Esta atividade foi o marco inicial para que se comeasse a elaborar a proposta do tratamento tcnico. Inicialmente a TV UFG no dispunha de um software para fazer a decupagem das imagens brutas, ento, um modelo de ficha de decupagem foi elaborado manualmente pela coordenadora de produo para ser utilizado como base nas decupagens que viriam ser feitas posteriormente. Neste modelo continha as principais informaes tais como o time-code, a descrio da imagem e o tempo de durao, alm do nmero da fita. Baseado no modelo de ficha de decupagem j existente foi assistido fita por fita, utilizando o deck e o monitor disponveis, colocando o time-code, descrevendo a imagem, diferenciando-a de entrevista e por fim acrescentando a durao da mesma. Sendo assim, foi elaborado um modelo de ficha de decupagem no Microsoft Office Word que pudesse tambm ter a funo de uma ficha de catalogao. Logo abaixo o referido modelo.

Neste modelo acima, as informaes como nmero da fita, time-code, descrio do plano e o tempo de durao foram mantidos e outras foram acrescentadas tais como data de gravao, nome do programa e tambm o formato digital em que foi gravada a imagem. Existem dois formatos digitais que so utilizados nas gravaes, que so os formatos HDV e o DV. Ambos os formatos so GT2 447

armazenados em fitas Mini-Dvs. A captura das imagens ser o marco inicial para a montagem do banco de imagens que se pretende implementar. Um modelo de etiqueta foi elaborado no programa de desenho vetorialbidimensionalparadesign grfico denominado Corel Draw Graphics Suite X4, conforme modelo abaixo.

Nestas etiquetas, as informaes do plano foram acrescentadas bem resumidamente, que por ser de menor tamanho, no comporta informaes mais detalhadas. Para consultar as informaes de forma mais profunda, como por exemplo, pesquisando sobre qual assunto um entrevistado abordou necessrio consultar o documento elaborado no Microsoft Office Word, que fica disponvel direto para consulta. Na etiqueta h somente o nome do entrevistado. No caso das etiquetas dos interprogramas, a descrio dividida pelos dois interprogramas existentes, Ei! e Conhecendo a UFG. Assim foi feita a segunda parte do tratamento tcnico da documentao. 6 ARMAZENAMENTO E CONSERVAO Depois que as fitas passam pelo processo de decupagem e recebem novas etiquetas so encaminhadas para o arquivamento e conseqentemente a conservao em armrios de ao ainda improvisados at a compra de estandes adequadas. At o presente momento, a montagem do banco de imagens est sendo feita pela captura da fita, como por exemplo, quando vai capturar uma fita de um inteprograma, abre-se uma nova pasta com o nmero da fita e dentro da pasta as imagens especificadas, por exemplo, gerais da Cidade de Gois. O processo de implementao do banco de imagens ainda no est totalmente consolidado, ou seja, est na sua fase inicial podendo sofrer mudanas conforme a necessidade informacional da equipe. 7 CONCLUSO A documentao audiovisual vem crescendo consideravelmente no ambiente televisivo e isto acontece devido televiso ser um recurso tecnolgico muito importante na vida dos cidados GT2 448

e tambm devido quantidade de informao que a mesma produz e muitas vezes as emissoras no tm conhecimento de como trat-la e organiz-la adequadamente. Este trabalho e pesquisa tiveram como objetivo mostrar organizar toda esta informao de forma que a mesma possa ser mais rapidamente recuperada e tambm preservada, pois muitas vezes elas j fazem parte da histria da prpria emissora. Para organizar e tratar toda esta informao o papel do profissional bibliotecrio imprescindvel, pois ele lida com a informao a todo o momento e o profissional mais indicado para este tipo de atividade. Com este trabalho e pesquisa pretendeu-se tambm mostrar que existem outras reas de atuao do profissional da informao que no somente no mbito da biblioteca ajudando a quebrar a barreira existente entre a rea jornalstica e biblioteconmica alm de mostrar tambm que existe uma carncia destes profissionais qualificados por ser um nicho quase inexplorado pela categoria profissional (PEREIRA; MORAES, 2009, p. 81). A TV UFG ainda uma empresa de comunicao relativamente nova e est em crescimento e o processo de organizao da informao audiovisual est crescendo junto com ela. Ainda faltam muitos aspectos a serem melhorados, mas s de estar observando que o comeo desta organizao est visivelmente satisfatrio j um grande passo feito na histria desta jovem empresa que tanto contribui para disseminar o conhecimento produzindo programas de cunho educacional e cultural dentro e fora do mbito da Universidade Federal de Gois.

ABSTRACT Currently television is considered a medium huge information explosion and the appearance of it, brought a new stage in the evolution of audiovisual documentation. This type of documentation has increased considerably among TV stations even thought TV stations still do not have a technical adequate treatment for it. This work presents a proposal of a technical treatment [cataloging, describing, indexing and preservation] for audiovisual documents implemented at TV UFG station raising concepts of audiovisual documents and audio-visual documentation on television, the steps of the technical treatment to audiovisual documents in order to implement the treatment and make so that the information can be better and more quickly recovered by the editors and producers of TV programs and, in the future, by the general community, and the institutional memory of TV UFG station can be preserved. Keywords: Audiovisual documents. Audiovisual documents in television. Indexing moving images. Technical treatment of audiovisual documents.

GT2 449

REFERNCIAS

CIRNE, M. T.; FERREIRA, S. M. A tica para os profissionais da informao audiovisual: o devir tecnolgico a moldar uma atitude. Cadernos de Biblioteconomia Arquivstica e Documentao BAD, Lisboa, Portugal, n.1, p.115-129, 2002. Disponvel em: < http://redalyc.uaemex.mx/redalyc/ pdf/385/38505210.pdf > Acesso em: 20 Set. 2010. CUNHA, M. B. da.; CAVALCANTI, C. R. O. Dicionrio de Biblioteconomia e Arquivologia, Braslia,DF: Briquet de Lemos, 2008. 449 p. JOS FILHO E. A representao da imagem: indexao por conceito e por contedo. 2004. Trabalho de Concluso de Curso (Graduao) Escola de Comunicao e Artes, ECA, Universidade de So Paulo, So Paulo,2004. Disponvel em: < http://rabci.org/rabci/sites/default/files/Estorniolo-Imagem. pdf > Acesso em: 14 Ago. 2009. FUENTES PUJOL, M. E. Caractersticas generales de la documentacin periodstica y caractersticas especficas de los medios de comunicacin escritos. In:______.Manual de documentacin periodstica. 1. ed. Madrid: Sintesis, 1995. Cap. 7. GIMNEZ RAYO, M. Documentacin audiovisual de televisin: la seleccin del material. 1. ed. Espanha: Trea, 2007. 214p. HIDALGO GOYANES, P. La documentacin audiovisual de las televisiones. La problemtica actual y el reto de la digitalizacin. Documentacin de las Ciencias de la Informacin, s.l, v.28,p.159-171, 2005. Disponvel em: < http://revistas.ucm.es/inf/02104210/articulos/DCIN0505110159A.PDF > Acesso em: 26 abr.2010. ______. La seleccin de documentos audiovisuals en televisin: la seleccin en TVE. Documentacin de las Ciencias de la Informacin, s.l, v. 26, p.233-260, 2003. Disponvel em: < http://revistas.ucm. es/inf/02104210/articulos/DCIN0303110233A.PDF > Acesso em: 15 Abr. 2010. _______. Anlisis documental de audiovisuales. In: GUTIRREZ, Antnio Garca (Ed.). Introducin a la Documentacin Informativa y Periodstica. 1. ed. S.l: MAD, 1999. Cap. 11. ______.Documentacin audiovisual. In: GUTIRREZ, Antnio Garca (Ed.). Introducin a la Documentacin Informativa y Periodstica. 1. ed. S.l.: MAD, 1999. Cap. 16. LANCASTER, F.W. Bases de dados de imagens e sons. In:______.Indexao e Resumos: Teoria e Prtica. 2. ed. Braslia,DF: Briquet de Lemos, 2004. Cap. 13. NOGUEIRA, C.A.A.; FERREIRA, M.A.P.; FONSECA, M.T. Pedagogia do olhar: oficina permanente para tratamento tcnico de imagem em movimento. In: XV SEMINRIO NACIONAL DE BIBLIOTECAS UNIVERSITRIAS, 2008, Campinas Anais eletrnicos... So Paulo: Unicamp, 2008. Disponvel em: < http://www.sbu.unicamp.br/snbu2008/anais/site/pdfs/2638.pdf > Acesso em: 18 Set. 2010. GT2 450

PEREIRA, D. A.; MORAES, P. J. M. Recuperao de informao jornalstica audiovisual utilizando linguagem documentria: estudo de caso da TV Globo Braslia. 2009. 87p. Trabalho de concluso de curso (graduao) Faculdade de Economia Administrao Contabilidade e Cincia da Informao e Documentao FACE Departamento de Cincia da Informao e Documentao CID, Universidade de Braslia, Braslia, DF, 2009. Disponvel em: < http://bdm.bce.unb.br/ bitstream/10483/622/1/2009_DemianPereira_PauloJoseMedeirosMoraes.pdf > Acesso em: 24 Out. 2010. RUBIO, A. La documentacin audiovisual em el centro territorial de TVE en la Rioja. Berceo, s.l, n.144, p.215-233, 2003. Disponvel em: < http://dialnet.unirioja.es/servlet/articulo?codigo=698051 > Acesso em: 15 Abr. 2010. ______. Labor documental para programas de entretenimiento en las televisiones. Cincia da Informao, Braslia, DF, v.35, n.1, p.16-24, jan./abr.2006. Disponvel em: < http://www.scielo.br/ pdf/ci/v35n1/v35n1a02.pdf > Acesso em: 13 Abr. 2010. SMIT, J. W. A representao da imagem.Informare,Rio de Janeiro,v.2,n.2,p.28-36, jul./dez.1996. UNESCO. Recomendaes sobre a Salvaguarda e a Conservao das Imagens em Movimento. Paris: UNESCO, 1980.

GT2 451

COMUNICAO ORAL

A LINGUSTICA DOCUMENTRIA E A ANLISE DE DOMNIO NA ORGANIZAO DA INFORMAO


Julietti de Andrade, Marilda Lopes Ginez de Lara Resumo Apresenta anlise das abordagens Lingustica Documentria e Anlise de Domnio com o objetivo de identificar semelhanas, diferenas e uma possvel integrao entre elas. A metodologia utilizada compreendeu reviso de literatura do perodo de 1990 a 2010, focalizando textos dos pesquisadores da ECA-USP (Lingustica Documentria) e textos de Birger Hjrland, Anne Albrechtsen e JensErick Mai (Anlise de Domnio). A anlise permitiu verificar que ambas partem de fundamentos tericos distintos, apresentam diferenas na denominao dos conceitos, mas compartilham o reconhecimento da Organizao da Informao e do Conhecimento como uma atividade social ressaltando a importncia dos Domnios, embora sob ticas distintas. A Lingustica Documentria apresenta metodologias para Anlise Documentria e para construo de Linguagens Documentrias; a Anlise de Domnio pretende visar um universo mais amplo e apresenta contextos e situaes onde a Anlise de Domnio pode ser aplicada. Palavras-chave: Lingustica Documentria, Anlise de Domnio, Organizao da Informao, Organizao do Conhecimento. 1 INTRODUO A Lingustica Documentria (LD) nasceu na Espanha, na dcada de 90, com os trabalhos de Garca Gutirrez, com o objetivo de criar modelos de Anlise Documentria e para construo de Linguagens Documentrias. Tem como base a Lingustica Estruturalista, a Anlise do Discurso, a Anlise de Contedo, a Anlise Semitica, a Sociologia e o Mtodo Dialtico. A linha de trabalho de Garca Gutirrez subordina a Anlise e a Linguagem Documentria Lingustica Documentria. Os pesquisadores da ECA, que adotam o termo para denominar o subcampo da Cincia da Informao, complementam a abordagem acrescendo a Terminologia como referncia para a observao das reas do saber e de atividades. A Lingustica Documentria focaliza os mtodos e os processos de construo de Linguagens Documentrias e destaca o papel social e simblico desses instrumentos como meio para estabelecer as condies de comunicao e interpretao das informaes. Para Garca Gutirrez, o objeto da Lingustica Documentria a estrutura da Documentao, como a organizao de contedos codificveis e decodificveis, a qual se divide entre a estrutura cognitiva do produtor e a interpretativa do consumidor, o que, para o autor, contribui para o mtodo GT2 452

lnguo-documental (1990, p. 24). Entre o codificvel e o decodificvel ocorre o fluxo informacional, um movimento entre produtores e usurios da informao que mediado pelos processos e resultados da Organizao da Informao: a anlise, a sntese, a representao e a recuperao da informao. O profissional codifica a informao tendo como referncia instrumentos e mtodos a partir dos quais so construdas representaes ou informaes documentrias (Lara, 2002, Tlamo e Lara, 2006); o usurio decodifica as informaes documentrias (Lara, 2002) enquanto mensagens documentrias, num processo de semiose documentria (LARA, 2009). Para Tlamo e Lara, a estrutura simblica da Documentao (2006, p.204) coloca em jogo questes lingusticas advindas da mediao necessria entre os produtores e os usurios de informao. O adjetivo simblico sinaliza a importncia das referncias scio-culturais que sustentam a significao das representaes. Estas devem ser construdas com base na observao dos contextos, das culturas das quais fazem parte e de sua linguagem e terminologia, para que possam dar origem aos processos de comunicao e significao. A Anlise de Domnio, por sua vez, surgiu por volta de 1995 a partir dos trabalhos de Birger Hjrland e Hanne Albrechtsen, propondo-se como um novo paradigma em Cincia da Informao, cujas bases esto na Psicologia Social (Cognitivismo Social), na Sociologia da Cincia, na Filosofia da Cincia e na Bibliometria. Segundo os autores, esse paradigma constitui uma alternativa ao Cognitivismo marcado por caractersticas mais racionalistas e positivistas. No que se refere s questes de raciocnio, de produo e uso do conhecimento, de comportamento de busca de informao, bem como no mbito da organizao, da recuperao e da comunicao de informaes, o paradigma cognitivista volta-se ao indivduo, enquanto a Anlise de Domnio atuao dos indivduos nos grupos. Assim, o objetivo dos autores analisar a atuao dos indivduos nos grupos a partir do conceito de Domnio e de Comunidades Discursivas, tendo como base os mecanismos de funcionamento de produo e uso do conhecimento dentro das disciplinas, especialidades, profisses e outros ambientes de informao. Em 2008, Hjrland publicou um artigo chamado What is knowlegde organization (KO)? onde deixa mais explcito o modo como concebe a relao entre a Anlise de Domnio e a Organizao do Conhecimento (OC). A Anlise de Domnio a primeira abordagem que visa a uma fundamentao metodolgica de forma sistemtica para Organizao do Conhecimento (2008, p. 90). A Anlise de Domnio requer considerar atuao dos indivduos nos grupos enfatizando a importncia da comunicao nas especialidades (Wilson, 1993 citado por Hjrland e Albrechtsen, 1995), como tambm relacionar o tipo de rea temtica s necessidades de informao (Motes, 1962). Para Ambar e Lyer baseados em Motes o tipo da rea temtica determina o tipo de necessidade (Ambar e Lyer, 1992, p.98 citado por Hjrland e Albrechtsen, 1995, p. 401, traduo nossa) , o que inclui a forma como a rea est consolidada, como seus membros se relacionam, produzem e usam o conhecimento A rea temtica e as necessidades de informao configuram-se em contextos que devem ser levados em considerao nos processos de organizao, recuperao e comunicao da informao. O conceito de Comunidade Discursiva no definido por Hjrland e Albrechtsen no artigo GT2 453

de 1995. Em alguns momentos, os autores fazem uma equivalncia sinonmica entre Domnios do Conhecimento e Comunidades Discursivas, conforme podemos observar na definio inicial do paradigma Analtico de Domnio: para entender informao na Cincia da Informao necessrio estudar os Domnios do Conhecimento ou as Comunidades Discursivas. De fato, a relao entre os dois conceitos bastante forte. Isto posto, possvel identificar as relaes existentes entre a proposta da Lingustica Documentria e a da Anlise de Domnio.

2. RELAES ENTRE A LINGUSTICA DOCUMENTRIA E A ANLISE DE DOMNIO 2.1 A Face Social da Organizao da Informao e do Conhecimento A anlise dos textos relativos s duas abordagens permite afirmar que a Lingustica Documentria se prope como fundamentao terico-metodolgica para a Organizao da Informao e a Anlise de Domnio para a Organizao do Conhecimento. Ao preferir o termo Organizao da Informao, a Lingustica Documentria assinala sua diferena em relao ao conceito de conhecimento. Ambas as abordagens se referem preocupao com os aspectos sociais na concepo de suas teorias, instrumentos e metodologias, o que se manifesta de vrias maneiras. A Lingustica Documentria, ao menos inicialmente1, desenvolve suas anlises e aplicaes do ponto de vista da Documentao; a Anlise de Domnio, da perspectiva da Cincia da Informao. Para a Lingustica Documentria, h uma ntima relao entre a Documentao e a Cincia da Informao, salientando a importncia de Paul Otlet como um dos precursores da Cincia da Informao. Sob matrizes diferentes, tanto a Documentao, como a Cincia da Informao esto voltadas ao social, o que possvel verificar pelas afirmaes destacadas a seguir e que podem ser aplicadas reflexo e construo de teorias e metodologias de Organizao da Informao e do Conhecimento tomadas como atividades nucleares do campo, hoje identificado como sendo da Cincia da Informao. Para comprovar o que dizemos, retomamos Garca Gutirrez, para quem: O carter social da Documentao, portanto, a via pela qual a Lingustica Documentria estabelece relaes com a Sociolingustica, cincia que relaciona a lngua, a estrutura e os comportamentos sociais [...]. Os produtos transformados pelo mtodo documentrio so reflexo direto da composio, flutuaes, manifestaes e, inclusive, da relao de poder entre os diferentes extratos do grupo social produtor (GARCA GUTIRREZ, 1990. p.33-34, traduo nossa).
1 A produo bibliogrfica da Lingustica Documentria identifica, inicialmente, a Documentao como seu campo maior. Mais recentemente, especialmente nos textos elaborados por pesquisadores da ECA, a Lingustica Documentria inserida no contexto da Cincia da Informao como um de seus subdomnios.

GT2 454

A Lingustica Documentria trabalha a funo social quando v a Documentao sob a perspectiva da interrogao e do uso. Essa perspectiva tambm est implcita medida que tem como referncias, a Lingustica Estruturalista, as teorias da linguagem e a Terminologia (por meio das Linguagens de Especialidades) e a Semitica. Na perspectiva da Lingustica Estruturalista, a lngua um produto social: Mas o que a lngua? [...] , ao mesmo tempo, um produto social da faculdade de linguagem, e um conjunto de convenes necessrias, adotadas pelo corpo social, para permitir o exerccio dessa faculdade nos indivduos (SAUSSURE, 1972, p. 17). Tlamo & Lara ressaltam esse aspecto quando se referem linguagem: A linguagem como elemento constitutivo da cultura informacional no exerce funo meramente instrumental. Para alm de seu funcionamento codificador, ela se prope como representao, seja como insumo do processo social de gerao de sentido, seja como resultado textual desse processo (TLAMO e LARA, 2006, p.25). A Terminologia importante como apoio construo das linguagens documentrias. Via linguagens de especialidade, so buscadas referncias validadas socialmente nas comunidades de discurso. Os sistemas de conceitos dos domnios e reas de atividade justificam e contextualizam os relacionamentos semnticos entre descritores, pois constituem expresso de pontos de vista razoavelmente consensuais; os referenciais pragmticos das terminologias, por sua vez, asseguram referncia observao de objetivos institucionais e demandas localizadas de informao. A Semitica tambm contribui para o destaque da funo social da atividade documentria ao considerar a importncia da experincia colateral, que diz respeito ao conhecimento dos indivduos, para a interpretao e seleo de informaes: A perspectiva supe a informao como um signo contextualizado pragmaticamente. Sua abordagem como signo, via descritores da linguagem documentria, a insere num processo interpretativo, mas somente quando contextualizada de forma pragmtica que e a adquire um estatuto social, transformando-se, pela legitimao, em elemento efetivo de comunicao (LARA, 2006, p.343). Hjrland e Albrechtsen (1995) preconizam o carter social da Anlise de Domnio quando GT2 455

subordinam a abordagem Cincia da Informao, a qual consideram como uma cincia social. Referem-se tambm relao entre a diviso social do trabalho, produo e o uso do conhecimento e prpria Organizao do Conhecimento. A forma como se do as relaes no mundo do trabalho influenciam diretamente a produo e o uso do conhecimento, o que se estende aos objetivos, s metodologias e aos resultados da Organizao do Conhecimento. Os dois autores fazem um contraponto entre a viso cognitivista e a viso de Domnio especfico para demonstrar a importncia de se deslocar o foco do indivduo para o social. Reportamse filosofia de John Dewey, que afirma a centralidade das ocupaes na determinao dos modos de vida, dos hbitos e dos desejos de consumo. Utilizando tal referncia, procuram mostrar como as nossas atividades profissionais acabam por determinar a forma como agimos, pensamos e nos relacionamos com as pessoas, dentro e fora do cenrio profissional e como elas so traduzidas no contexto pragmtico da Organizao do Conhecimento. Ocupaes determinam os modos fundamentais da atividade, e por isso controlam a formao e os hbitos. As ocupaes determinam os modelos principais de satisfao, os padres de sucesso e fracasso. Por isso, elas fornecem as classificaes de trabalho e definies de valor [...]. Alm disso, elas decidem as relaes que so importantes, e assim oferecem o contedo ou material de ateno e as qualidades que so significativas. [...] (DEWEY, 19022, p.219-220 citado por HJRLAND e ALBRECHTSEN, 1995, p.405, traduo nossa). Para tentar compreender como as pessoas atuam nesse processo, Hjrland e Albrechtsen (1995), bem como Hjrland (2008) trabalham no desenvolvimento dos conceitos de Domnios do Conhecimento e Comunidades Discursivas, os quais por sua vez so discutidos por meio da anlise dos conceitos de disciplinas, especialidades, profisses, comunidades cientficas, pensamento coletivo, entre outros. A Psicologia Social utilizada principalmente para sustentar a argumentao a favor de um cognitivismo que contribua para a anlise da atuao dos indivduos nos grupos, bem como para o entendimento do funcionamento da linguagem. As especialidades esto hierarquicamente subordinadas s disciplinas: elas surgem em funo da grande quantidade de conhecimento produzido implicando a necessidade de seleo, uma vez que impossvel ter acesso a tudo ou informar-se sobre tudo o que produzido. Ambos os conceitos esto ligados s formas como as pessoas se organizam e se relacionam, bem como ao modo como essas relaes determinam as formas de produo, transmisso e consumo da informao pela sociedade. A Lingustica Documentria desenvolvida pelos pesquisadores da ECA tambm trabalha com o conceito de Domnio, porm do ponto de vista da Terminologia, mais especificamente, da Terminologia Comunicativa e da Socioterminologia. Um Domnio, segundo a norma ISO 704,
2 Dewey, J. Interpretation of savage mind. The Psychological Review, v. 9, p. 217-230, 1902.

GT2 456

constitui um subconjunto de uma rea determinado por um sistema de noes. Uma rea se define como uma parte do saber cujos limites so definidos segundo um ponto de vista particular de uma cincia ou tcnica. O termo domnio mais utilizado para falar dos conceitos relativos a reas do saber, enquanto o termo rea de Atividade, como o prprio nome o diz, para contemplar o fazer. Os Domnios e as reas de Atividade tm como funo balizar as hipteses de Organizao da Informao que sustentam o plano de classificao das Linguagens Documentrias. Embora na Lingustica Documentria raramente se utilize o termo comunidades discursivas, a referncia terminologia dos domnios e reas de atividade supe, necessariamente, um conjunto de discursos que caracterizam tendncias, compartilhamentos e temticas. Na Anlise de Domnio, o conceito de relevncia tem como base as pesquisas de Saracevic (1975)3, que diferencia relevncia da literatura do assunto e do conhecimento do assunto. Hjrland (2008) discute a relevncia do ponto de vista dos sistemas, criticando as abordagens da Recuperao da Informao, bem como a Orientada ao Usurio, pelo fato delas no lidarem com a questo da representao de forma contextualizada, ou seja, considerando os possveis usos dos documentos. O conceito de relevncia recuperado pela Lingustica Documentria a partir de textos de Capurro e Hjrland (2003; 2007). Lara (2009) concorda com os autores quando eles afirmam que, para a definio de algo como informativo para algum, concorrem estruturas informacionais, terminolgicas e de linguagem das comunidades discursivas, o que mostra que o conceito de informao subjetivo, porm no individual (HJRLAND , 20024; CAPURRO & HJRLAND , 2003; 2007 citados por LARA, 2009). A questo do contexto tambm discutida por ambas as abordagens. Garca Gutirrez fala sobre os aspectos lingusticos e extralingusticos da Documentao e discute o conceito de contexto com base em Wittgenstein. No Brasil, Kobashi e Fernandes (2010) buscam especificar tipos de contextos para operacionalizar o trabalho de organizao da informao com base na pesquisa de Armengaud5 (2006). Na Anlise de Domnio, a discusso sobre contexto aparece, em especial, no trabalho de Mai (2005), distinguindo-os a partir de uma abordagem objetivada e uma abordagem interpretativa (Talja, Keso, and Pietilainen6, 1999, p. 752, citados por Mai 2005, p. 605). O contexto , assim, referido no mbito da linguagem e dos processos de significao a envolvidos nas abordagens
3 Saracevic, T. Relevance: a review of and a framework for the thinking on the notion in information science. Journal of the American Society.for Information Science, v.26, p. 321-343, 1975. 4 Hjorland, B. .Domain analysis in information science: eleven approaches traditional as well as innovative. Journal of Documentation, v.58, n.4. p. 422-462, 2002.

4 5 5Armengaud, F. A pragmtica. So Paulo: Parbola, 2006. 6 Talja, S., Keso, H., & Pietilainen, T. The production of context in information seeking research: a metatheoretical view. Information Processing and Management, v. 35, p. 751763, 1999. 6

GT2 457

da Lingustica Documentria e da Anlise do Domnio. 2.2 Atividade Documentria, Organizao da Informao e Organizao do Conhecimento A Lingustica Documentria usa os termos Atividade Documentria e Organizao da Informao; a Anlise de Domnio prefere o termo Organizao do Conhecimento. A diferena de terminologia reside no fato da Lingustica Documentria ter como foco as atividades de tratamento da informao, tais como anlise, indexao/representao e construo de linguagens, consideradas nucleares na Cincia da Informao. Assim, ela prioriza as questes decorrentes do trabalho no universo da linguagem, buscando definir metodologias sem desprezar seus fundamentos epistemolgicos. A Anlise de Domnio opta por uma discusso de cunho mais epistemolgico e busca aplicar as metodologias de Organizao do Conhecimento com foco no Domnio a outros contextos, como por exemplo, na construo de Guias de Literatura. Observa-se que Hjrland (2008) ao falar de Organizao do Conhecimento, prope um sentido especfico (que se aproximaria daquele dado pela Lingustica Documentria, focando a atividade, ou a anlise e indexao dos documentos) e um sentido mais amplo (a organizao mais geral do conhecimento, mais ampla que a da atividade especfica, voltada forma como as instituies e os atores que produzem conhecimento se organizam para alcanar tal objetivo). Hjrland ressalta que o sentido amplo da OC deve dar subsdios ao sentido especfico da OC. Na Lingustica Documentria, o termo Atividade Documentria em alguns contextos mais amplo do que Organizao da Informao, como por exemplo, quando engloba todos os aspectos da Documentao, desde a criao do documento para o sistema documentrio (emisso) at sua utilizao pelo usurio (recepo). Em outros, o termo Atividade Documentria praticamente sinnimo de Organizao da Informao, referindo-se aos processos e s operaes utilizadas para registrar a informao e fazer circular a informao (que incluem a Anlise Documentria como metodologia). 2.3 Conhecimento, Informao, Documento Na Lingustica Documentria o conceito de Conhecimento discutido a partir de sua relao com o conceito de informao. Informao recebe, muitas vezes, o qualificativo documentria, de modo a salientar sua condio de produto construdo pela atividade documentria que se debrua sobre o conhecimento registrado. O conhecimento tambm compreendido como resultado da apropriao da informao. A Anlise de Domnio discute o conceito do ponto de vista da metodologia da cincia, salientando as vises positivista e a pragmtica do conhecimento de modo a fazer ressaltar suas implicaes epistemolgicas. Na tica da Lingustica Documentria, o conceito de informao construdo observando-se GT2 458

sua dependncia institucional, como resultado de um processo de seleo e de tratamento que se insere num contexto determinado e visa atender a demandas especficas. Ao utilizar o termo informao documentria, pretende salientar o carter construdo da informao como fruto de opes ideolgicas e intencionais. Num sistema documentrio-informacional, a funo desse produto desencadear processos de construo da significao no momento da recepo. Instrumentos e mtodos so utilizados com o objetivo de oferecer condies de negociao de sentido, ou seja, condies para que a informao seja efetivamente apropriada como conhecimento. A Anlise de Domnio procura entender o comportamento da informao nos Domnios do Conhecimento e nas Comunidades Discursivas a partir da diviso social do trabalho, ou seja, nas situaes de produo e uso do conhecimento. Compreende-se a informao como subjetiva enfatizando o pertencimento do indivduo a um grupo, condio que determina as possibilidades e modos de interpretao. O conceito de Documento em ambas as abordagens relaciona-se aos aspectos fsicos e de contedo, ao concreto e ao abstrato, sendo que tanto na Lingustica Documentria como na Anlise de Domnio a funo social do Documento envolve aspectos pragmticos. As duas vertentes rejeitam a ideia de uma materialidade que torna o documento algo objetivo e passvel de ser representado com neutralidade. Ambas relacionam a objetividade face material do documento, a face que lhe d identidade, e a subjetividade s questes de uso, de necessidades, de referncias que corroboram para estabelecer os pontos de vista pelo quais o documento pode ser visto. Para finalizar, ressalta-se que na Lingustica Documentria os conceitos de Documento, Informao, Conhecimento so subjacentes fundamentao terica da abordagem; na Anlise de Domnio esto ligados discusso sobre as formas de Organizao do Conhecimento. 2.4 As Metodologias e Aplicaes da Lingustica Documentria e da Anlise de Domnio No que se refere s questes metodolgicas verificamos que a Lingustica Documentria apresenta mtodos para Organizao da Informao relativos anlise de documentos e construo Linguagens Documentrias, o que resulta na criao e discusso de conceitos como Leitura Documentria, Produtos Documentrios, Mensagem documentria, Signo Documentrio, Semiose Documentria, Comunicao Documentria, entre outros. A Anlise Documentria, outro conceito que pode ser englobado pela Lingustica Documentria, ao menos na concepo de Garca Guitrrez (1990), no discutido detalhadamente neste texto, pois a produo sobre esse tema anterior ao perodo analisado. Conforme j assinalamos, no encontramos na Anlise de Domnio metodologia para o trabalho concreto de indexao ou de construo de linguagens documentrias. Hjrland e Albrechtsen (1995) afirmam que o melhor exemplo de aplicao do Domnio Especfico a representao/classificao de assuntos, lado interno do sistema, mas restringem-se a indicar contextos e situaes na qual GT2 459

ela poderia ser aplicada. Exceo deve ser feita ao trabalho de Mai (2005) que prope etapas para anlise do documento com foco no domnio, muito embora sua proposta no chegue a constituir uma metodologia detalhada. Embora Hjrland e Albrechtsen (1995) falem na Bibliometria, na perspectiva da Anlise de Domnio, como mtodo capaz de contribuir para a anlise de tendncias nas pesquisas cientficas, no chegam a explicar, nos textos analisados, uma indicao metodolgica para sua utilizao. Em relao s operaes documentrias, a Lingustica Documentria utiliza o termo representao documentria, embora tambm utilize o termo indexao quando se refere, em especial, Anlise Documentria enquanto processo metodolgico. Na Anlise de Domnio, o termo mais utilizado indexao, provavelmente justificado pela influncia da linha inglesa. O termo representao citado pelos autores no quadro comparativo que propem entre o Cognitivismo e o Domnio Especfico (HJRLAND e ALBRECHTSEN, 1995). Hjrland (2008) faz crticas viso das representaes como objetivas e neutras com base na viso pragmtica do conhecimento, perspectiva compartilhada pela Lingustica Documentria quando esta sugere falar em hipteses de organizao para a construo das linguagens documentrias, combinando referncias concretas das linguagens de especialidade aos objetivos institucionais do sistema documentrio. No que tange aos resultados da Organizao da Informao e do Conhecimento, a Lingustica Documentria rene, sob o termo Produto Documentrio, resumos, ndices e outros resultados da indexao e da representao documentria, bem como a prpria Linguagem Documentria. A Anlise de Domnio prope uma srie produtos, servios e estudos nos quais a metodologia da abordagem poderia ser aplicada, como os Guias de Literatura, as classificaes, tesauros, estudos bibliomtricos, etc. 3 CONSIDERAES FINAIS A comparao aqui realizada no esgota todos os aspectos passveis de serem cotejados das duas vertentes, at porque os textos analisados referem-se ao perodo de 1990 a 2010. Ao final da pesquisa, podemos afirmar que o conceito de Organizao da Informao uma opo da Lingustica Documentria utilizado para falar das metodologias, instrumentos, processos e operaes realizadas para que a informao seja registrada, recuperada, ou enfim, comunicada, interpretada e utilizada nos contextos documentrio-informacionais. Na tica da Anlise de Domnio, o conceito de Organizao do Conhecimento, muito embora os autores afirmem incluir os elementos acima, aplica-se mais propriamente observao das formas como as instituies produtoras de conhecimento se organizam para produzi-lo por meio das disciplinas, especialidades, profisses etc., o que permitiria distinguir melhor entre o que Hjrland afirma como sentido especfico e sentido geral da organizao. De fato, o modo como as instituies se organizam para produzir conhecimento influencia GT2 460

o contedo do conhecimento produzido e consequentemente, a Organizao da Informao e do Conhecimento. Por exemplo: uma disciplina denominada sistemas de recuperao de informao pode ter sentidos diferentes num curso de Biblioteconomia e num curso de Cincia da Computao, privilegiando traos que so mais particulares a uma atividade ou outra. Essa constatao corrobora a hiptese de que a Organizao da Informao e a Organizao do Conhecimento so atividades sociais que se relacionam intimamente formao das pessoas, aos contextos ou s situaes onde so produzidas ou processadas informaes. Nas palavras de Rendon Rojas (2008), os documentos do origem objetivao e subjetivao da informao: a objetivao acontece a partir da materialidade do documento; a subjetivao, no momento em que o sujeito entra em contato com o documento, na nossa tica, construindo-o e interpretando-o a seu modo como forma de conhecimento. A perspectiva da Lingustica Documentria ao utilizar o termo Organizao da Informao acaba por enfatizar um conjunto de preocupaes relativas comunicao documentria ou a comunicao em ambientes documentrio-informacionais que incluem necessariamente a observao das referncias simblicas e contextuais que orientam o processo de significao e de apropriao da informao como conhecimento. Estas observaes se traduzem em metodologias que orientam concretamente o trabalho documentrio-informacional. Todavia, as metodologias no acontecem num vazio terico: ao contrrio, constituem uma manifestao clara de perspectivas terico-epistemolgicas que se assentam na considerao da atividade documentria como atividade simblica que tem na linguagem e nas referncias scio-culturais sua base. A Anlise de Domnio privilegia a construo da viso epistemolgica do campo, destacando a importncia do contexto nos processos de organizao e o papel dos ambientes nos quais se produz informao e conhecimento, como as universidades, disciplinas, especialidades, profisses, etc. As nfases so diferentes, o que no significa necessariamente que ambas as abordagens no reconheam quer o papel do contexto, quer o papel da linguagem. Resta dizer que, para uma anlise mais ampla da Lingustica Documentria, seria necessrio retroceder no tempo, retomando a produo sobre Anlise Documentria que originalmente se apoiou em autores franceses, como M. Coyaud (1966) e J.-C. Gardin (1966; 1973), autores que tambm representam o principal apoio de Garca-Gutirrez e dos pesquisadores em Anlise Documentria da ECA-USP. Para finalizar, procuramos reunir em um quadro as principais semelhanas e diferenas entre as duas abordagens.

GT2 461

Quadro 1: Principais semelhanas e diferenas entre a Lingustica Documentria e a Anlise de Domnio. Lingustica Documentria Ponto de Partida Bases tericas Documentao, Cincia da Informao. Lingustica Estruturalista, Terminologia, Semitica, Lgica, Comunicao, Anlise do Discurso. Fundamentar terica e metodologicamente a elaborao de instrumentos e mtodos de organizao da informao. No perodo analisado, os pesquisadores da ECA focalizam a construo de linguagens documentrias Trabalha os aspectos sociais a partir das vises de lngua e linguagem propostas pela Lingustica Estruturalista de Saussure e de seus seguidores. Procura referendar seus recortes na Terminologia buscando referncias de validao social dos termos, ou seja, seu uso efetivo nos discursos dos domnios e reas de atividade. Anlise de Domnio Cincia da Informao. Psicologia Social, Sociolingustica, Sociologia da Cincia, Sociologia do Conhecimento, Filosofia. Discutir a Organizao do Conhecimento do ponto de vista epistemolgico, propondo a Anlise de Domnio como metodologia para organizao do Conhecimento. Trabalha o social a partir do desenvolvimento e discusso dos conceitos de Domnios do Conhecimento, Comunidades Discursivas, Disciplinas, Especialidades, Relevncia. No h metodologia explcita para operacionalizao da anlise, restringindo-se a apontar as reas que apiam a anlise, a exemplo da Bibliometria. Mai destaca as etapas para anlise em indexao com foco no domnio. Discute o conceito com base em anlise comparativa, rejeitando a viso positivista em favor da viso pragmtica.

Objetivos

Foco nos aspectos Sociais

Metodologias

Apresenta metodologia para Anlise Documentria e para a construo de Linguagens Documentrias, em especial, os tesauros.

Conhecimento

Discute o conceito de conhecimento com foco na relao informao e conhecimento. Viso pragmtica.

GT2 462

Informao

Trabalha com o conceito de informao institucionalizada para ressaltar os vnculos da seleo com os critrios de organizao. Adota o termo informao documentria para especificar o produto da atividade documentria. Destaca o papel da negociao de sentido para construir a informao, bem como as referncias validadas socialmente via terminologias. Documento, produto de seleo. Prefere utilizar texto como unidade de anlise. Conceito de Domnio abordado atravs da Terminologia. O Domnio referncia para delimitao da linguagem documentria, como um dos elementos para a escolha da hiptese de organizao e, consequentemente, para o engendramento das redes semnticas.

A informao um conceito subjetivo, mas no individual. Relaciona-se diviso social do trabalho, s Comunidades discursivas e aos Domnios do Conhecimento. No se refere a documento explicitamente, a no ser citando outros autores. Conceito de Domnio abordado a partir da Educao, da Psicologia, da Sociologia, etc. Tem como objetivo compreender como as pessoas e as instituies se organizam para produo e uso do conhecimento. Discusso do conceito de relevncia baseada na viso de Saracevic (1975). Discute o conceito do ponto de vista epistemolgico e do ponto de vista das abordagens de Recuperao da Informao e orientada ao usurio, as quais so criticadas por no trabalharem com a questo da representao no contexto.

Documento

Domnio

Relevncia

O conceito de relevncia recuperado pela Lingustica Documentria a partir de textos de Capurro e Hjrland (2003; 2007). Lara (2009) concorda com os autores quando eles afirmam que, para a definio de algo como informativo para algum, concorrem estruturas informacionais, terminolgicas e de linguagem das comunidades discursivas. Conceito discutido com base em Wittgenstein (o significado das palavras esclarecido pelo uso). Garca Gutirrez considera a concorrncia do lingustico e do extralingstico na Documentao. A Lingustica Documentria brasileira enfatiza relao com a linguagem de cunho estruturalista e seus desenvolvimentos, destacando a natureza simblica do processo de comunicao. Kobashi e Fernandes apresentam (2010) tipos de contextos com base na pesquisa de Armengaud (2006).

Contexto

Mai (1975) fala de contexto segundo uma abordagem objetivada e uma abordagem interpretativa.

GT2 463

Organizao da Informao, Organizao do Conhecimento, Atividade Documentria

Prefere o termo Organizao da Informao referindo-se aos processos e etapas da organizao no interior da atividade documentria. Utiliza o termo Atividade Documentria como conceito que rene a produo de documentos, seu tratamento e uso.

Utiliza o termo Organizao do Conhecimento para referirse aos processos e operaes utilizados para organizar informao para recuperao, bem como para falar sobre a forma como as instituies que produzem conhecimento se organizam para tal. Distingue sentido especfico e amplo de Organizao do Conhecimento. Guias de literatura, classificaes, construo de tesauros. Domnios do Conhecimento, Comunidades Discursivas, Disciplinas, Especialidades, Especializao, Profisses, Contexto, Domnio Especfico. Relevncia.

Produtos, Resultados Conceitos e contextos relacionados fundamentao terica da abordagem

Linguagens Documentrias, ndices nas bases de dados organizadas via linguagens documentrias, resumos. Documentao, Lingustica Estruturalista, Linguagem, Terminologia, terminologias, Semitica, Lgica.

Seleo, Contexto, Atividade Documentria, Conhecimento, Informao, Conceitos Anlise Documentria, Documento, Documento, Organizao do e contextos Informao Documentria, Informao Conhecimento, Organizao relacionados Institucionalizada, terminologias, linguagem Social do Conhecimento, Organizao de especialidade, domnios, reas de Organizao intelectual do da Informao atividade, Comunicao Documentria, Conhecimento, Processos de e do Signo Documentrio, Semiose Documentria, Organizao do Conhecimento, Conhecimento Mensagem Documentria, Definio, Rede Sistemas de Organizao do de relaes lgico-semnticas. Conhecimento. Andrade, J. A Lingustica documentria e a anlise de domnio na organizao da informao. 2010. 150 p. Dissertao de Mestrado. ECA-USP, So Paulo, 2010. Abstract Presents analysis of Documentary Linguistics and Domain Analysis approaches in order to identify similarities, differences and a possible integration between them. The methodology used understood a literature review the period 1990 to 2010, focusing on texts of the ECA-USP researchers (Documentary Linguistics) and Birger Hjrland, Anne Albrechtsen e Jens-Erick Mai texts (Domain Analysis). The analysis has shown that both start from different theoretical foundations, differ in the description of the concepts, but they share the recognition of the Information Organization and Knowledge Organization as a social activity highlighting the importance of domains, although under different optical. Documentary Linguistics presents methodologies for analysis and construction of documentary language, domain analysis is designed to meet a broader universe and presents contexts and situations where domain analysis can be applied. Keywords: Documentary Linguistics, Domain Analysis, Information Organization and Knowledge Organization. GT2 464

REFERNCIAS ANDRADE, J. A Lingustica documentria e a anlise de domnio na organizao da informao. 2010. 150 p. Dissertao de Mestrado. ECA-USP, So Paulo, 2010. CAPURRO, R; HJRLAND, B. O conceito de informao. Perspectivas em Cincia da Informao, v. 12, n.1, p. 148-207, jan/abr. 2007. CINTRA, A.M.M., et al. Para entender as Linguagens Documentrias. So Paulo: Editora Polis, 2002. 2 edio. 92 p. COYAUD, M. Introduction ltude des langages documentaires. Paris: C. Klincksiek, 1966. GARCA GUTIRREZ, A. Elementos de Lingustica en sistemas de informacin y documentacin. Revista Latina de Comunicacin Social, v. 7, 1998. Disponvel em. <http://www.ull.es/publicaciones/ latina/a/66ant.htm>. Acesso em Jan. 2009. GARCA GUTIRREZ, A. Estructura lingustica de la documentacin: teora y mtodo. Murcia: Universidad de Murcia, 1990. 167 p. GARDIN, J.-C. Anlise documentria e anlise estrutural em arqueologia; trad. de J. T. Coelho Netto. In: CORDIER, S. (editor). Lvi-Strauss. So Paulo: Documentos, 1968(a). GARDIN, J.-C. et al. Lautomatisation des recherches documentaires: un modle gneral, Le SYNTOL. Parais: Ed. de la Maison de lHomme, 1968 (b). HJRLAND, B. Core Concepts in Library and Information Science. 2005. Disponvel em: < http://www.db.dk/bh/core%20concepts%20in%20lis/home.htm> Acesso em: 2009 e 2010. HJRLAND, B. Domain analysis in information science: eleven approaches traditional as well as innovative. Journal of Documentation, v. 58, n.4, p. 422-462, 2002. HJRLAND, B.; Nicolaisen J. The Epistemological Lifeboat. Disponvel em: <http://www.iva.dk/ jni/lifeboat/>. Acesso em: 2009 e 2010. HJRLAND, B. Lifeboat for Knowledge Organization. Disponvel em: <http://www.iva.dk/bh/ lifeboat_ko/home.htm>. Acesso em: 2009 e 2010. HJRLAND, B. What is knowledge organization? Knowlegde Organization International Journal, v. 35, n. 2-3, p. 86-101, 2008. HJRLAND, B; ALBRECHTSEN H. Toward a new horizon in information science: domainanalysis. Journal of the American Society for Information Science. v. 46, n. 2, p. 400-425, 1995. KOBASHI, N.Y. Fundamentos semnticos e pragmticos da construo de instrumentos de representao de informao. DataGramaZero Revista de Cincia da informao, v.8, n.6, dez. GT2 465

2007. Disponvel em: < <http://www.dgz.org.br/dez07/Art_01.htm> Acesso em: Ago. 2008. KOBASHI, N.Y. Lingustica textual e elaborao de informaes documentrias: algumas reflexes. In: Ndea Regina Gaspar; Luclia Maria Souza Romo. (Org.). Discurso e texto: multiplicidade de sentidos na Cincia da Informao. So Carlos: EduFscar, 2008, v. 1, p. 47-66. ISO 704. Terminologa: princpios e mtodos. (1 projeto de norma). Rio de Janeiro: ABNT: 1996. KOBASHI, N.Y; FERNANDES J.C. Pragmtica lingustica e organizao da informao. In: Encontro Nacional de Pesquisa em Cincia da Informao, X, 2009, Paraba. Anais Eletrnicos... Joo Pessoa: UFPB, 2009, Comunicao Oral. Disponvel em: <http://dci2.ccsa.ufpb.br:8080/jspui/ handle/123456789/491>. Acesso em: Janeiro: 2010. LARA, M.L.G. Diferenas conceituais sobre termos e definies e implicaes na organizao da linguagem documentria. Cincia da Informao, v.33, n.2, p. 91-96, maio/agosto, 2004. LARA, M.L.G. possvel falar em signo e semiose documentria. Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, 2 nmero esp., 2 sem. 2006. LARA, M.L.G. Elementos de Terminologia: apostila para uso didtico. ECA-USP: So Paulo, 2005. LARA, M.L.G. Informao, informatividade e lingustica Documentria: alguns paralelos com as reflexes de Hjrland e Capurro. DataGramaZero. Revista de Cincia da Informao, v.9, n.6 2008. Disponvel em: <http://www.datagramazero.org.br/dez08/Art_01.htm>. Acesso em Dez. 2008. LARA, M.L.G. Linguagem Documentria e terminologia. Transinformao, Campinas, v. 16, n. 3, p. 231-240, 2004. LARA, M.L.G. Lingustica Documentria: seleo de conceitos. Ano de Obteno: 2009. Tese de Livre docncia. So Paulo, ECA-USP. 2009. LARA, M.L.G. O processo de construo da informao documentria e o processo de conhecimento. Perspect. cienc. inf., Belo Horizonte, v. 7, n. 2, p. 127-139, jul./dez. 2002. LARA, M.L.G. A representao documentria: em jogo a significao. Ano de Obteno 1993. Dissertao de Mestrado. So Paulo: ECA-USP, 1993. Orientador: Prof. Dr. Johanna W. Smit. LARA, M.L.G. Representao e linguagens documentrias: bases terico-metodolgicas, Ano de Obteno: 1999. Tese de Doutorado. So Paulo: ECA-USP, 1999. Orientador: Prof Dr. Jos Teixeira Coelho Netto. LARA, M.L.G; TALAMO M.F.G.M. Uma experincia na interface Lingustica Documentria e Terminologia. DataGramaZero. Revista de Cincia da Informao, v.8, n.5, 2007. Disponvel em: <http://dgz.org.br/out07/Art_01.htm>. Acesso em: Junho:2008. MAI, JE. Analysis in indexing: document and domain centered approaches. Information Processing and Management, v. 41, p. 599-611. 2005. GT2 466

ORTEGA, C.D; LARA, M.L.G. Documento e informao, conceitos necessariamente relacionados no mbito da Cincia da Informao. In: Encontro Nacional de Pesquisa em Cincia da Informao, XI, 2008, So Paulo. Anais do Encontro Nacional de Pesquisa em Cincia da Informao, 2008. RENDN ROJAS M.A. Bases tericas e filosficas de la bibliotecologia. 2 ed. Mxico: UNAM, 2005. 183 p. RNDON ROJAS, M.A. La ciencia de la informacin en el contexto de las ciencias sociales y humanas. Ontologa, epistemologa, metodologa e interdisciplina. DataGramaZero - Revista de Cincia da Informao - v.9 n.4ago/08. Disponvel em <http://dgz.org.br/ago08/Art_06.htm>. Acesso em: Setembro 2008. SAUSSURE, F. Curso de lingustica geral. So Paulo: Cultrix, 1972. 279 p. TALAMO, M.F.G.M. Linguagem Documentria. So Paulo: APB, 1997. (Ensaios APB, n. 45). TLAMO, M.F.G.M; KOBASHI, N.Y. Informao: fenmeno e objeto de estudo da sociedade contemporanea. TransInformao, Campinas, v. 15(edio especial), p.7-21, set/dez. 2003. TLAMO, M.F.G.M; LARA, M.L.G. O campo da Lingustica Documentria. TransInformao, Campinas, v. 18, n.3, p. 203-211, set./dez., 2006.

GT2 467

COMUNICAO ORAL

A ORGANIZAO DA INFORMAO EM SITES DE RECURSOS HUMANOS


Brigida Maria Nogueira Cervantes, Antonio Bezerra de Lima Filho Resumo: A organizao da informao em sites de recursos humanos tem como primazia proporcionar s instituies e aos usurios, agilidade, rapidez e economia de tempo para se buscarem as informaes que se fazem necessrias, contribuindo para o acesso informao e ao conhecimento, bem como a disseminao e o compartilhamento. Os sites emergem fazendo parte desse importante processo. Partindo desse pressuposto, abordaram-se, nesta investigao, especificamente os sites de recursos humanos das universidades pblicas estaduais da regio sul do Brasil. Delineou-se, como objetivo geral, realizar uma anlise da estrutura de organizao da informao nesses sites. O estudo caracterizase como uma pesquisa exploratria e descritiva, com abordagem quantitativa, a coleta de dados consistiu na anlise documental e o instrumento utilizado foi o formulrio, o qual compe-se de cinco das quinze regras de Eckerson (1999). Verificou-se que a maioria das universidades disponibilizam aos usurios alguma funo de ajuda, tais como Fale Conosco ou Entre em Contato, permitindo que o usurio entre em contato com os setores especficos para a resoluo de problemas e disponibilizando os seus contedos para downloads. Quanto tipologia documentria disponvel, predominam-se Decretos, Editais, Normas, Requerimentos e Resolues. Conclui-se que as universidades utilizam os sites de recursos humanos para disponibilizar seus contedos, mas acredita-se que seja necessrio um maior investimento no tocante organizao da informao nesses sites. Palavras-chave: Organizao da informao. Sites de recursos humanos. Universidades estaduais. 1 INTRODUO A organizao da informao de modo geral tem como caracterstica auxiliar a compreenso do mundo, bem como facilitar o processo de busca, acesso e recuperao da informao. Dentro desse raciocnio, este estudo tem como foco a Organizao da Informao em sites de recursos humanos, especificamente nas universidades pblicas estaduais da regio sul do Brasil. Ele identifica-se com os apontamentos de Guimares (2003, p. 100) por considerar o tratamento ou a organizao da informao em etapa intermediria voltada primordialmente para a garantia de um dilogo entre o produtor e o consumidor da informao, assumindo [...] funo de [...] ponte informacional. Neste contexto, acredita-se que se faz presente o profissional da informao, atuando no processo de busca, seleo, armazenamento e disseminao das informaes. Sabe-se que na atualidade vivemos interligados com o mundo inteiro e as pessoas cada vez mais buscam informaes e conhecimentos. Miranda (2005, p. 26) considera que a realidade contempornea permitiu a eliminao das fronteiras e das barreiras para o acesso ao conhecimento produzido pela GT2 468

humanidade, pois quanto mais informaes as pessoas possuem, mais crticas e mais preparadas para enfrentar os desafios do dia a dia, elas se tornam. As Tecnologias da Informao e Comunicao (TICs) se fazem presentes utilizando-se de suas ferramentas, tais como os portais e sites, exercendo um papel de fundamental importncia, pois fazem com que as informaes estejam presentes em toda parte e com rapidez, para serem acessadas e utilizadas a qualquer momento. Diante dessa realidade e frente a tantas informaes disponveis, perceptvel a dificuldade de saber em quais informaes acreditar e confiar, bem como de compreender a forma como esto organizadas, exigindo-se que as mesmas estejam organizadas facilmente para serem encontradas. Estas questes tornam-se muito pertinentes quando se trata da organizao da informao nos sites presentes nas instituies de ensino superior, especificamente nas universidades, que tm um papel relevante para a disseminao das informaes para a sociedade como um todo. Acredita-se que tais pontos no podem passar despercebidos, pois manter uma comunidade informada de todos os acontecimentos no uma tarefa muito fcil, desde os resultados de pesquisas, bem como atender as necessidades informacionais mais especficas. Acreditando-se que os sites esto presentes em todas as organizaes, seja pblica ou privada, optou-se em aprofundar o estudo a respeito da Organizao da Informao nos sites de recursos humanos. Contudo, para se compreender o que seja site, primeiramente necessrio conhecer o que venha a ser o Portal. Para efeito deste estudo, entende-se portal como a primeira ou principal porta de entrada para os contedos que as instituies gerenciam, e denominam-se sites todos os endereos ou pginas no mbito desses portais. Sendo assim, este estudo justifica-se, tendo em vista que, sendo funcionrio da Pr-Reitoria de Recursos Humanos e tendo percebido a dificuldade das pessoas em encontrar as informaes de que necessitam, bem como os formulrios e documentos disponveis no site, acredita-se que os sites desempenham um papel importante, operando como mediador entre a informao e o usurio ou o consumidor de informao. As universidades que disponibilizam os sites de recursos humanos devem utiliz-los como meio e recurso facilitador para a promoo do acesso s informaes e sua disseminao, diminuindo os entraves burocrticos e principalmente, no que se refere excluso informacional dos servidores, alm de mostrar as polticas e recursos para o acesso informao e isto s conseguido se os sites dispuserem as informaes organizadas e que viabilizem uma infra-estrutura que apoie a criao, o compartilhamento e o uso da informao. Nessa perspectiva, delineou-se como objetivo analisar a estrutura de organizao da informao dos sites de recursos humanos das universidades pblicas estaduais da regio sul do Brasil. A partir dos resultados obtidos, foi possvel analisar e detectar se essas instituies esto possibilitando o acesso ao seu contedo com rapidez e fcil localizao.

GT2 469

2 SITES DE RECURSOS HUMANOS Na sociedade moderna, produz-se uma infinidade de informaes e uma das maneiras para que as informaes sejam distribudas so as TICs, que so consideradas ferramentas de fundamental importncia, pois fazem com que as informaes estejam presentes em toda parte e rapidamente, para serem acessadas e utilizadas a qualquer momento por todas as pessoas e organizaes. Rezende e Abreu (2001, p. 76) consideram as TICs como recursos tecnolgicos e computacionais para gerao e uso da informao fornecendo s organizaes e pessoas outra maneira de ver o mundo, por meio de diversos caminhos e a adoo de novos paradigmas. Diante da diversidade de tecnologias existentes, pode-se considerar a internet como um dos principais meios responsveis por causar mudanas na vida das pessoas, seja na ordem social, econmica, familiar ou pessoal, fazendo com que todos se adaptem era digital. Ela proporciona a diminuio das distncias e aproxima as pessoas s informaes, muitas vezes em tempo real. Terra e Gordon (2002, p. 23) vo ao encontro dessa ideia, pois acreditam que as novas tecnologias baseadas nos padres da internet esto facilitando a troca de informaes entre organizaes e as possibilidades de colaborao entre as pessoas, em modos sncronos ou assncronos, independentemente de localizao fsica. A internet favorece a comunicao interna em uma organizao, proporcionando aos seus usurios o acesso fcil, rpido e imediato s polticas e informaes disponveis na empresa. Para tanto, Uriarte (2006, p. 40) enfatiza que as tecnologias muito utilizadas so os sites e os portais; e, embora tenham um cunho parecido, so coisas distintas. Um site considerado, de acordo com Cunha e Cavalcanti (2008, p. 347) e Hagedorn (c2000, p. 6), como um recipiente para objetos com contedos ou documentos que os usurios navegam por meio de busca e folheio. Para Rodrigues (2005, p. 1), o site o espao bsico da informao, [...] tem como principal objetivo organiz-la, estruturando uma hierarquia para que todo o contedo seja entendido e acessado com facilidade. Conforme Ferreira, Vechiato e Vidotti (2008), os sites possuem, em sua interface, elementos grficos que favorecem o contato com a informao por meio de barras/menus, de ferramentas/opes e caminhos de acesso. Assim, de acordo com estes autores, o site permite a integrao efetiva do usurio no processo de seleo, busca, acesso, criao e recuperao das informaes em um navegar hipertextual, de acordo com seu processo de aquisio de conhecimento (FERREIRA; VECHIATO; VIDOTTI, 2008, p. 116). De acordo com Dias (2007, p. 3), o portal normalmente o ponto de entrada ou o primeiro site a ser carregado quando voc inicializa seu navegador web. Alm disso, o portal considerado o carto de visita e o retrato da organizao; por meio dele, podem-se conhecer a sua misso, origem, estrutura e polticas administrativas. Logo, o portal reflete a imagem da instituio. Para Eckerson (1999, p. 13) o portal um aplicativo capaz de proporcionar aos usurios um nico ponto de acesso a qualquer informao necessria aos negcios, esteja ela dentro ou fora da corporao, sendo GT2 470

possvel encontrar vrios dispositivos oferecendo servios, notcias, negcios, entretenimento, links, comunidades virtuais, chats e outros mais. Eckerson (1999) elenca 15 regras que so consideradas requisitos para um portal ou site: Fcil para usurios eventuais, Classificao e pesquisa intuitiva, Compartilhamento cooperativo, Conectividade universal aos recursos informacionais, Acesso dinmico aos recursos informacionais, Roteamento inteligente, Ferramenta de inteligncia de negcios integrada, Arquitetura baseada em servidor, Servios distribudos, Definio flexvel das permisses de acesso, Interfaces externas, Interfaces programveis, Segurana, Fcil administrao, e Customizao e personalizao. Os sites de recursos humanos fornecem informaes a respeito de planos de cargos, salrios, carreira administrativa, demonstrativos de pagamentos, promoes, avaliaes, formulrios, requerimentos, documentos, frias, aposentadoria, regulamentaes, resolues, legislao, processos de seleo, concursos e outras informaes de sua competncia. 3 ORGANIZAO DA INFORMAO EM SITES DE RECURSOS HUMANOS Com o passar dos anos, o homem foi descobrindo como poderia se comunicar com o seu semelhante, com o ambiente em que vivia, e como manter esse conhecimento registrado. Esse registro das informaes simboliza a maneira de representar os nossos pensamentos e o conhecimento existente e, assim, frequentemente se v a necessidade de organizar estas informaes, visto que, na atualidade, produz-se uma quantidade imensa de informaes, de todos os tipos e assuntos e tambm para uma diversidade de pessoas. Nas organizaes, este fato tambm est presente, pois as mesmas produzem muita informao e convivem com dificuldades de organiz-las e utiliz-las, estas organizaes acabam se perdendo neste excesso de informaes. Quando nos referimos ao uso, devemos tambm ter a preocupao da relevncia a respeito do processo de acesso que dado s informaes e ao conhecimento existente, assim Andrade (2006, p. 46) enfatiza que tal acesso s se viabiliza se for precedido por aes [...] de organizao e representao do conhecimento, que culminem no processo de transferncia da informao. Desta forma, dentro deste processo de gesto, acesso e utilizao da informao, reside a necessidade de se conhecerem e organizarem as informaes possudas. O tratamento ou a organizao da informao, de acordo com Guimares (2003), visto como uma ponte informacional, ou seja, uma etapa que tem a funo de intermediar, logo, realiza a mediao entre aquele que produz (autor) e o usurio (consumidor) da informao. A organizao da informao entendida por Caf e Sales (2010, p. 118) como um processo de arranjo de acervos tradicionais ou eletrnicos, realizado por meio da descrio fsica e de contedo (assunto) de seus objetos informacionais. Entende-se, desta forma, que a representao e organizao da informao contribuem para o processo de acesso informao e ao conhecimento bem como so consideradas sustentculos para os processos de integrao e compartilhamento. Rosenfeld e Morville (2002, p. 50), de uma forma GT2 471

mais abrangente, acreditam que a organizao colabora com a nossa compreenso do mundo, com a nossa forma de viver, ajudando na adoo de valores, crenas e costumes, por isso a organizao da informao necessria em todos os ambientes, pois proporciona agilidade, rapidez e economia de tempo para se buscar aquilo que realmente se necessita. Os sites devem oferecer as informaes de maneira organizada, bem representada, de fcil entendimento, propiciando agilidade no acesso e recuperao, bem como ser o mais simples possvel e conter um mnimo de pginas e como em todo processo informacional, na adoo de sites, deve-se ter a preocupao com os usurios, pois so eles os que tero que utiliz-lo, os maiores beneficiados, deve-se adotar uma estrutura que possa refletir a maneira como as pessoas utilizam as informaes (DAVENPORT; PRUSAK, 1998). Guinchat e Menou (1994, p. 223) acreditam que os sistemas informatizados devem ser concebidos, mantidos e alimentados por pessoas. Isto significa que estes sistemas no substituem completamente o homem [...]. Quando se reflete sobre os desafios de organizar as informaes, sabe-se que este problema no nada novo, ele vem de muito tempo e a consequncia disto a existncia de pessoas convivendo com uma grande dificuldade de encontrar as informaes desejadas, assim h, alguns elementos ou desafios que dificultam a organizao da informao, tais como design, excesso de informao, layout, dentre outros (DIAS, 2001; 2007; FREITAS, QUINTANILLA, NOGUEIRA, 2004; TERRA; GORDON, 2002). Deve-se atentar para o fato de que, quando se projeta ou se adota um site, ele direcionado para vrios usurios e cada usurio tem maneiras diferentes de compreender a informao. Um ambiente, seja ele virtual ou fsico, quando desorganizado, causa o que se pode chamar de caos ou desordem informacional. A organizao da informao tende a colaborar com este processo, fornecendo uma padronizao, por isso as informaes disponveis nos sites ou em outro local no permanecero desorganizadas e desestruturadas. Os sites vm a colaborar com a organizao da informao, pois por meio deles possvel o controle da incluso, do armazenamento, da disseminao, do compartilhamento e, principalmente, a recuperao da informao. Assim, os portais e sites emergem para reunir informaes que esto dispersas, em um nico ponto de acesso, colaborando com o processo de busca, seleo, compartilhamento e disseminao das informaes, desta forma Fonseca e Fonseca (2005, p. 85) consideram que a disseminao do contedo permanece como razo de ser da maioria dos websites, e como resultado, a qualidade do contedo fornecido um fator importante motivando visitas repetidas. Snchez de Bustamante (2004, p. 3) descreve que a organizao da informao o processo onde se dispe e ordena a seqncia dos elementos que integram o contedo de um stio na web, e Benine e Zanaga (2009) acrescentam que, para este processo, necessria a existncia de uma estrutura informacional e uma hierarquia bem definida. Esta estrutura hierrquica se faz presente nos GT2 472

sistemas de navegao, apresentando ndices e meios de rotulagem ou etiquetas que facilitam a busca pelas informaes. Estes esquemas de navegao tm o intuito de serem facilitadores para o processo de busca, pois eles renem as informaes e, desta forma contribuem para a sua organizao. Benine e Zanaga (2009, p. 454), ainda, acrescentam que as informaes disponibilizadas na Web devem seguir modelos, formatos e padres denominados de metadados e estes so aplicados em registros eletrnicos para descrio de um documento. Os metadados facilitam a busca das informaes no meio digital, evitando a duplicidade de informaes e um re-trabalho das informaes existentes. Julga-se importante reforar, neste momento, alguns elementos que j foram citados, tais como facilidade de localizao, informaes organizadas e bem visveis, pois colaboram para que haja um processo eficiente de recuperao da informao. Este fato importante quando da construo de portais e sites, principalmente porque estes elementos so alvos de preocupaes constantes para que estejam presentes nos sites, desta forma faz-se necessrio a adoo de sistemas de organizao de informao. Rosenfeld e Morville (2002) esclarecem que os sistemas de organizao so compostos de esquemas e estruturas de organizao. Um esquema de organizao define a diviso de itens caractersticos, ao passo que uma estrutura de organizao define os tipos de relacionamento entre itens de contedo e grupos. Os esquemas e as estruturas de organizao so agrupados de maneira lgica, porm nos esquemas no h uma relao entre os itens; ao contrrio da estrutura, que relaciona os itens nela agrupados (SANCHES, 2004). Os Esquemas de Organizao dividem-se em trs formas de organizao: Esquemas de Organizao Exatos, Ambguos e Hbridos (ROSENFELD; MORVILLE, 2002). Os Esquemas de Organizao Exatos compreendem o Alfabtico, o Cronolgico e o Geogrfico. O Alfabtico organiza as informaes utilizando as letras ou palavras na ordem alfabtica. O cronolgico organiza as informaes por data, utilizando-se da ordem inversa, contnua, crescente ou decrescente. O Geogrfico organiza as informaes primando a localizao geogrfica (ROSENFELD; MORVILLE, 2002). Nos Esquemas de Organizao Ambguos, a informao pode pertencer a mais de uma categoria. So compostos das seguintes formas: Por Tpicos, Orientados a Tarefas, Especfico a um Pblico e Dirigido a Metforas (ROSENFELD; MORVILLE, 2002). Quando por Tpicos, as informaes so organizadas por assuntos, como exemplo os sumrios. O modelo Orientado a Tarefas organiza contedos e aplicaes em conjuntos de funes e processos, promovendo a interao do usurio por meio de determinadas aes. O modo Especfico a um Pblico direcionado a um tipo de usurio com objetivos definidos. Pode ser aberto para acesso a vrios contedos ou fechado, quando o acesso requer um cadastro prvio ou utilizao de senhas. GT2 473

O modo Dirigido a Metforas utiliza-se de metforas comuns ao usurio que o permite entender itens de informao que podero ser acessados. Os Esquemas de Organizao Hbridos so caracterizados como insuficientes, havendo a necessidade de complementao de outro esquema ou estrutura que melhor responda e satisfaa s necessidades das pessoas, desta forma, este esquema utiliza tanto os esquemas exatos como os ambguos. As Estruturas da Organizao dividem-se da seguinte forma: Estrutura Hierrquica, Base de Dados Relacional e Hipertexto (ROSENFELD; MORVILLE, 2002). Na estrutura Hierrquica as classes so ordenadas por ordem de subordinao podendo ser crescentes ou decrescentes e so mais conhecidas como de cima para baixo (top-down). A estrutura de Base de Dados Relacional possibilita a organizao de contedos diferentes e em vrios formatos; a definio de campos oferecidos para a busca pelo usurio conhecida como busca booleana (bottom-up). A estrutura de Hipertexto uma forma no linear de estruturao de contedo ou informao. Em rede, itens ou partes de informaes so interligados atravs de links, podendo formar hipermdias, proporcionando ligaes com informaes em vrios formatos, seja na forma de som, vdeo ou texto. Assim como os sistemas de organizao, compostos de esquemas de organizao e estruturas de organizao tm uma presena fundamental para organizar, acessar, recuperar e disseminar a informao, Curty e colaboradoras (2009, p. 4) acreditam que os sistemas de rotulagem so de suma importncia para se definir a estrutura de organizao do contedo de um web site. Estas autoras consideram que o sistema de rotulagem representa o acesso aos contedos, geralmente encontrados nos menus e nas barras de navegao, ou seja, por intermdio dos rtulos, possvel compreender as informaes que esto disponveis, logo, decidir o caminho a percorrer. Os rtulos so considerados por Curty e colaboradoras (2009, p. 4) como smbolos lingusticos que so utilizados para expressar um conceito. O conceito deve ser comunicado de forma eficiente e eficaz, exigindo pouco espao da interface e o menor esforo cognitivo do usurio para interpret-lo, pois tendem a agilizar e tornar fcil a identificao do contedo almejado. O processo de rotulagem visto como um passo importante para assegurar que os mecanismos de busca encontraro os documentos solicitados e para distribuir os documentos baseando-se em regras de personalizao (TERRA; GORDON, 2002, p. 100). Na adoo dos rtulos, necessrio tambm levar-se em considerao a linguagem utilizada e que a mesma seja acessvel e compreensvel ao usurio, logo, na criao ou utilizao de rtulos para Web site, preciso que se tenha uma conveno ou normalizao desses rtulos de forma que sejam ou se tornem mais familiares e precisos aos usurios (SANCHES, 2004, p. 72), ou seja, devem-se evitar, nos sites, termos, que no tenham significado para o usurio. Os rtulos podem ser de natureza textual (verbal), que utilizam palavras ou termos para representar certa categoria, ou no-textuais (iconogrficos) que direcionam s imagens, sons e gestos, GT2 474

geralmente os cones so os mais utilizados (CURTY et al, 2009). O sistema de rotulagem, de acordo com Sanches (2004, p. 73), deve procurar permitir que os usurios possam identificar-se rapidamente com a linguagem e toda a estruturao do site, baseados em rtulos consistentes, como consequncia estes usurios reconhecero as informaes disponveis nos sites e, como vantagem, haver uma diminuio no tempo de navegao. 4 PROCEDIMENTOS METODOLGICOS Para o desenvolvimento deste estudo e com base no objetivo proposto, realizou-se uma pesquisa exploratria e descritiva, com abordagem quantitativa. O universo da pesquisa representado pelas oito universidades pblicas estaduais da regio sul do Brasil: Universidade Estadual de Londrina (UEL), Universidade Estadual do Norte do Paran (UENP), Universidade Estadual de Maring (UEM), Universidade Estadual de Ponta Grossa (UEPG), Universidade Estadual do Oeste do Paran (UNIOESTE), Universidade Estadual do Centro-Oeste (UNICENTRO), Universidade do Estado de Santa Catarina (UDESC) e Universidade Estadual do Rio Grande do Sul (UERGS), especificamente os sites de recursos humanos. Salienta-se que a UERGS no possui site de recursos humanos, algumas informaes dessa competncia so disponibilizadas no portal da universidade ou no portal do servidor pblico, mas julgouse interessante const-la no rol das universidades pblicas. O desenvolvimento da pesquisa, com nfase na coleta, anlise e interpretao dos dados, classificou-se como Pesquisa Documental. Vale destacar que as pginas da Web so vistas como documentos. Para Gil (2008b, p. 147), so considerados documentos no apenas os escritos utilizados para esclarecer determinada coisa, mas qualquer objeto que possa contribuir para a investigao de determinado fato ou fenmeno. A coleta de dados consistiu na Anlise Documental, pois, conforme Gil (2008a, p. 89), uma tcnica que possibilita a descrio do contedo manifesto e latente das comunicaes. Esta anlise documental foi realizada em consultas nos sites de recursos humanos das universidades pblicas estaduais da regio sul do Brasil. O instrumento adotado foi o formulrio, em razo de ser uma tcnica de coleta de dados em que o pesquisador formula questes previamente elaboradas e anota as respostas (GIL, 2008a, p. 115). Por meio do formulrio, buscou-se identificar os elementos disponveis nos sites de recursos humanos selecionados para o estudo. Para a elaborao do instrumento de coleta de dados, baseou-se nas 15 regras elencadas por Eckerson (1999), entretanto, em razo das particularidades desta pesquisa e das caractersticas observadas nos sites de recursos humanos, tendo em vista a realizao de uma anlise preliminar nos sites, a qual se detectou a necessidade de aprimoramentos no instrumento de coleta, houve a necessidade de adequao das regras propostas, desta forma foram selecionadas 5 dessas regras, as quais foram sistematizadas em categorias e so apresentadas a seguir. O instrumento adotou a forma de planilha, facilitando a coleta e a anlise dos dados coletados. GT2 475

5 ANLISE E APRESENTAO DOS RESULTADOS A anlise e apresentao dos resultados foram sistematizadas em 5 categorias denominadas: 1) Fcil para usurios eventuais, 2) Classificao e pesquisa intuitiva, 3) Conectividade universal aos recursos informacionais, 4) Acesso dinmico aos recursos informacionais e 5) Interfaces externas. Para o estabelecimento das categorias, foi observada a prpria nomenclatura adotada por Eckerson (1999). As informaes foram coletadas conforme cada item discriminado nas categorias e, em seguida analisadas. Cabe salientar que, para a anlise dos resultados obtidos, considerou-se apenas as universidades que apresentaram as caractersticas selecionadas para a pesquisa, totalizando 7 sites em cada categoria de anlise. Categoria 1: Fcil para usurios eventuais Na primeira categoria englobaram-se algumas questes para reflexo, abordando temticas tais como: Se o site possui uma pgina de perguntas frequentes, a disponibilizao de funo de ajuda, meios de contato com os responsveis pelos setores especficos, se os usurios conseguem alcanar as informaes necessrias entre trs a quatro cliques e se todas as pginas informam ao usurio onde ele se encontra dentro da estrutura de organizao. Com base nas questes abordadas, percebeu-se que, entre as universidades pesquisadas, apenas a UENP possui uma pgina destinada s perguntas frequentes, Na referida universidade, este artifcio denominado dvidas frequentes, o qual tem o objetivo de agilizar a troca de informaes entre os membros docentes e funcionrios administrativos que integram a UENP, visam a [...] atender as dvidas e tratar de questes polmicas discutidas no mbito do RH da UENP (UENP, 2011). Quando se verificou a existncia de alguma funo de ajuda, detectou-se que, entre as funes disponveis nos sites da maioria das universidades, foi possvel encontrar o Fale Conosco e Entre em Contato; apenas a UEL e a UNICENTRO no disponibilizavam este servio. Esta opo considerada importante, pois perguntas frequentemente feitas, manuais de instruo, e formulrios com feedback so outros instrumentos comumente usados para apoio aos usurios (FONSECA; FONSECA, 2005, p. 120). Entre os pontos positivos encontrados nos sites das universidades pesquisadas, observou-se a existncia de recursos que permitem que o usurio entre em contato com os setores especficos para resoluo de problemas. Uma das maneiras utilizadas para esse contato refere-se a uma listagem contendo o nome, telefone e e-mail dos servidores ou a opo Fale Conosco. Desse modo, considerase que os sites devem proporcionar aos seus usurios a habilidade de localizar especialistas na organizao, de acordo com o grau de conhecimento exigido para o desempenho de alguma tarefa (DIAS, 2007, p. 22). Dentro desse pensamento Fonseca e Fonseca (2005, p. 119) acrescentam que os sites devem, GT2 476

de modo geral, conter alguma informao de contato para a organizao que eles representam, bem como para qualquer outra parte que os usurios alvo desejem contato, consequentemente, isso proporciona tambm a credibilidade das informaes disponveis. Ao verificar se os sites disponibilizavam aos usurios o acesso s principais partes do site acionando-as entre trs a quatro cliques, notou-se que as universidades tm mostrado sua preocupao com os usurios, ajudando-os para que consigam atingir seus objetivos com facilidade e rapidez. A esse respeito, corroboram Fonseca e Fonseca (2005, p. 79) ao afirmarem que os usurios devam ser capazes de acessar todas as pginas crticas ou importantes dentro de 3-4 cliques de hiper-conexo; esse princpio contribui para assegurar que os usurios encontrem facilmente as informaes disponveis nos sites. Outro ponto positivo percebido foi que as universidades tm procurado manter os seus usurios informados de sua localizao dentro de sua estrutura, de vez que os usurios necessitam saber onde eles esto [...], de modo a navegarem efetivamente. Isto especialmente importante para os maiores websites, que contem muitas pginas conforme Fonseca e Fonseca (2005, p. 77). Concordando com isto, Dias (2007, p. 195) recomenda que o site deve sempre manter o usurio informado quanto pgina em que ele se encontra, como chegou at essa pgina e quais so suas opes de sada, isto , onde ele se encontra numa sequncia de interaes. Em razo disso, os sites devem procurar fornecer, o mximo possvel, recursos facilitadores que ajudem os usurios a ter acesso s informaes com economia de tempo e rapidez. Assim, concorda-se com a argumentao de que os sites devem ser caracterizados pelas suas: [...] interfaces simples e objetivas, com os recursos que propiciem a movimentao pela fonte por meio de links e sistemas de busca, [...] e que possibilite, ao usurio, saber sua posio [...] dentro de um portal ou de uma fonte. (TOMAL; ALCAR; SILVA, 2008, p. 17). Categoria 2: Classificao e pesquisa intuitiva Com relao segunda categoria, consideraram-se para anlise as seguintes variveis: A disponibilizao de opo de busca, a existncia de opes de busca em todas as pginas, os tipos de buscas oferecidos nos sites, se as informaes esto dispostas em categorias, se os termos utilizados representam o contedo e se o contedo pertinente categoria adotada. A respeito das variveis analisadas, optou-se por englobar algumas dessas variveis, tendo em vista que somente duas universidades disponibilizaram as opes de busca para acesso s informaes do site de recursos humanos. Constatou-se que apenas a UEPG e UNIOESTE apresentaram esta opo: ambas oferecem opo de busca por palavra-chave, mas, enquanto a UNIOESTE possui a opo de busca em todas as pginas do site de recursos humanos, a UEPG oferece apenas na pgina principal do site de recursos humanos. certo que os usurios no dispem de muito tempo para realizar consultas nos sites, um dos motivos que fazem com que as opes de busca atuem fortemente, GT2 477

proporcionando economia de tempo para a realizao de tarefas ou pesquisas. Por esse motivo, opes de busca so ferramentas extremamente teis, [...] devem prover, no menor tempo, os resultados mais relevantes para uma dada consulta (TERRA; BAX, 2003, p. 41). Observou-se ainda que o site de recursos humanos da UNIOESTE no proporciona opo de busca restrita ao contedo de recursos humanos. Cabe salientar que apenas o site da UEPG que realiza esta operao, ou seja, sua busca restrita ao contedo de recursos humanos, sobre isto recomendado que os sites restrinjam a pesquisa dos servios de busca apenas ao contedo [...], de acordo com Dias (2007 p. 198). Acredita-se que as opes de busca se fazem necessrias nos sites, pois proporcionam agilidade na recuperao das informaes. Tomal, Alcar e Silva (2008, p. 18) consideram a busca como um sistema de pesquisa na fonte, com recursos que possibilitem acessar e recuperar rapidamente a informao. Nesse raciocnio, Freitas, Quintanilla e Nogueira (2004) acreditam que inegvel o valor das ferramentas de busca [...] frente profuso de informaes e contedo existente, pois estas so um enorme avano e agente facilitador para quem procura informaes [...] (FREITAS; QUINTANILLA; NOGUEIRA, 2004, p. 3). Em se tratando dos tipos de busca oferecidos nos sites, Fonseca e Fonseca (2005, p. 151) sinalizam que as opes de buscas oferecidas devem fazer sentido, considerando os tipos de fontes de informao que a busca cobre, e os tipos de perguntas que os usurios comumente perguntam. Complementam essa afirmao Terra e Bax (2003, p. 41), ao destacarem que pessoas diferentes procuraro por informaes de maneiras diferentes, aqui os autores relacionam a escolha pelos tipos de busca levando em considerao a preferncia pelos mesmos, experincia com estas opes e o conhecimento prvio. No que se refere s informaes dispostas em categorias, percebeu-se que os sites das universidades pesquisadas apresentam, unanimemente, as informaes de modo categorizado, iniciativa apoiada por Tomal, Alcar e Silva (2008, p. 17) ao afirmarem que as informaes devem estar apresentadas em categorias adequadas, que renem as similares, com possibilidade de insero de novos itens. Quando se verificaram os termos utilizados nos sites das universidades, especificamente se esses termos representam o contedo e tambm, se o contedo disponvel pertinente categoria adotada, percebeu-se que apenas a UEL apresentou discordncia neste quesito. A universidade disponibiliza contedo que no representativo ao termo utilizado nesta categoria, como exemplo, citamos a opo denominada Diversos, na qual possvel encontrar vrios tipos de assuntos, tais como: Lista dos Servidores, Calendrio Administrativo, JOSUEPAR (Jogos dos Servidores das Universidades Estaduais do Paran) e PCCS (Plano de Cargos, Carreira e Salrios) - Anlise da Carreira Tcnica das IEES/PR (Instituies Estaduais de Ensino Superior/Paran). Acredita-se que tais assuntos poderiam ser englobados dentro de categorias especficas j existentes no site de recursos humanos; neste prisma, Svenonius (2000) considera que, em uma linguagem perfeitamente GT2 478

ordenada, cada item tem apenas um nome e um nome usado para se referir a cada coisa nica. H, tambm, a opo denominada Carreira, na qual se encontram, alm de assuntos relacionados carreira Docente e Tcnica-Administrativa, o termo rea de conhecimento CNPQ/CAPES (Conselho Nacional de Desenvolvimento Cientfico e Tecnolgico/Coordenao de Aperfeioamento de Pessoal de Nvel Superior). Apesar de este link no estar funcionando no momento da anlise, ms de maio do corrente ano, cr-se que o assunto ali referendado possa ser englobado em outra categoria tambm. Percebe-se, como citado, o uso de siglas e possvel que, de forma geral, tais siglas no sejam compreensveis para os usurios. Os sites devem utilizar-se de termos que deixem o mais claro possvel o assunto a que se referem, ou seja, de acordo com Fonseca e Fonseca (2005, p. 87), o contedo [...] deve focar em descrever, estabelecer, instruir, ou apoiar temas ou tpicos especficos vigentes ligados ao propsito e estratgia do website, de modo que os usurios alvo o compreendero prontamente. Categoria 3: Conectividade universal aos recursos informacionais As questes adotadas para anlise foram: a existncia de redundncia de contedo nos sites, oferta de tradutor de idiomas, opo de modificao do tamanho da fonte, modificao da cor do fundo da pgina dos sites de recursos humanos e disponibilizao de downloads. A respeito da existncia de contedos redundantes nos sites de recursos humanos, detectou-se que os sites da UEL e UENP apresentaram essa caracterstica, ou seja, os contedos esto presentes em mais de um lugar. Segundo Fonseca e Fonseca (2005, p. 118), a redundncia pode algumas vezes agir como uma ferramenta, ou um aparato, empregado para reforar as mensagens, ou para persuadir uma certa viso de uma questo, entretanto acredita-se que a redundncia pode ocasionar confuso ao usurio ao mesmo tempo em que deixa a impresso de ser um site sem avaliao ou atualizao constante. Quando se encontra um documento em vrios lugares, isto pode causar dvidas sobre qual documento o mais recente e se houve alterao em algum deles, consequentemente, o usurio obrigado a verificar todos os documentos disponveis para utilizar o correto. Em se tratando da disponibilizao de um tradutor de idiomas, percebeu-se que nenhum site das universidades oferece alguma opo de tradutor de idiomas. Esse fato preocupante, pois muito se ouve falar nos dias de hoje de incluso, acredita-se que esse um assunto polmico e, talvez, caminha a passos lentos. Entretanto, Dias (2007, p. 107) considera que os sites e os portais devem se preocupar em utilizar linguagem simples, compatvel com o tipo de produto, pblico e situao de uso, e ainda facilitar a identificao de termos em outros idiomas para que sejam traduzidos por ferramentas auxiliares. A respeito da opo de modificao do tamanho da fonte, apenas o site da UENP disponibilizou este servio, sendo possveis as opes de aumentar ou diminuir o tamanho das fontes e, ainda, alterar a disposio da tela, tais como tela estreita ou tela expandida. De acordo com Dias (2007, p. 106), as GT2 479

informaes apresentadas em um formato (visual, auditivo, tctil) s so percebidas por pessoas que tenham esse sentido em nveis normais. Ainda acrescenta que facilitar a compreenso do contedo informacional do produto tambm essencial para o design universal (DIAS, 2007, p. 107). Percebeu-se, tambm, que nenhum dos sites analisados disponibilizou a opo de modificao de cor do fundo da pgina do site de recursos humanos. Sobre este assunto, Dias (2007, p. 151) acredita que no basta ser acessvel: um portal [...] deve ser tambm eficaz, eficiente e agradvel ao usurio, para que seja efetivamente um meio de comunicao e fonte de informaes ao pblico em geral. A autora entende que o site deve fornecer ao usurio procedimentos e opes diferentes para atingir o mesmo objetivo, da forma que mais lhe convier (DIAS, 2007, p. 199). Em se tratando de permitir aos usurios a realizao de downloads do contedo disponvel, constatou-se que todos os sites de recursos humanos das universidades pesquisas disponibilizaram os seus contedos para downloads. Desta forma, acredita-se que esta disponibilizao de arquivos para downloads algo importante, pois, quando os sites de recursos humanos oferecem este recurso, proporcionam aos usurios economia de tempo, principalmente pelo fato de esses usurios no precisarem se deslocar at o setor responsvel para buscar formulrios, requerimentos ou outros documentos ou informao, os usurios podem acessar o contedo disponvel e grav-lo em seu computador. Categoria 4: Acesso dinmico aos recursos informacionais Em relao quarta categoria, as variveis escolhidas para anlise foram: Avisos ou notificaes aos usurios a respeito de novos contedos e quais as tipologias documentrias disponveis nos sites de recursos humanos. No tocante ao quesito de se manterem os usurios informados a respeito de novos contedos, notou-se que a UEL, UEM, UEPG e UNIOESTE procuraram manter os seus usurios informados a respeito de novos contedos e atualizaes, utilizando-se do prprio site de recursos humanos. Cabe salientar que a UEPG utilizava tanto o site de recursos humanos, como a pgina principal da universidade para fazer esta disponibilizao. Por outro lado, a UNICENTRO, a UDESC e a UENP disponibilizavam seus novos contedos na pgina principal da prpria universidade. As universidades recorriam de artifcios para chamar a ateno dos usurios para esses contedos, apontando-os como novo ou novidades. A respeito das tipologias documentrias disponveis nos sites das universidades pblicas estaduais pesquisadas, percebeu-se que houve predominncia na disponibilizao de Decretos, Editais, Normas, Requerimentos e Resolues. Esclarece-se que, para efeito desta pesquisa, devido s caractersticas dos sites, englobou-se o formulrio no item requerimento. Esses documentos se referem aos seguintes assuntos: frias, inscrio em cursos ou treinamentos, licenas, alterao classe/ nvel, dispensa de cargo, promoo, vale transporte, gratificaes e outros. Ainda sobre esse assunto, observou-se que a UENP disponibiliza aos usurios apenas requerimentos que se referem ao TIDE GT2 480

Tempo Integral e Dedicao Exclusiva, que um regime de trabalho. Percebeu-se tambm que, em nenhum site, foram encontrados disponveis para acesso pblico os seguintes documentos: Ata, Atestado, Certido, Contrato e Declarao. Estes documentos podem estar disponveis nos portais ou sites de acesso restrito aos servidores, como o Portal do Servidor. Categoria 5: Interfaces externas Com base na quinta categoria, englobaram-se algumas questes para anlise, tais como: a existncia de links internos e externos, o funcionamento dos links e a possibilidade dos usurios de retorno pgina inicial ou anterior. Dentre os sites pesquisados, todos apresentaram links internos; no que diz respeito aos links externos, apenas UEL, UEM, UEPG e UENP apresentaram esses links. A UNIOESTE, UNICENTRO e UDESC no disponibilizavam links para acesso aos portais e sites externos, percebeu-se que esses links esto disponveis apenas na pgina principal da universidade. Os links so a identificao para onde apontam; relao apropriada entre as informaes do documento original e para o que apontam, ou seja, so as ligaes entre as partes de uma mesma fonte e/ou com elementos que a complementam (TOMAL; ALCAR; SILVA, 2008, p. 17). Quando se verificou o funcionamento dos links e se eles remetem aos contedos corretamente, constatou-se que apenas os links da UNICENTRO, UDESC e UENP funcionam corretamente; nos outros sites, foram detectadas algumas falhas, tais como link quebrado, no encontrado, ou outro de erro. Principalmente os links que direcionam s agncias bancrias so os que no completaram o carregamento. Tomal, Alcar e Silva (2008, p. 18) consideram os links ativos (denotam qualidade e atualidade da fonte) ou quebrados (denotam abandono e desatualizao da fonte), deixam claro que os links precisam estar ativos: apontar para um site que esteja on-line, ou seja, uma fonte atualizada no apresenta links quebrados (TOMAL; ALCAR; SILVA, 2008, p. 20). Com referncia possibilidade de os usurios retrocederem para a pgina inicial ou anterior a partir de todas as pginas dentro do site, apenas no site da UEM que no estava disponvel essa opo. Entre as outras universidades, UEL, UEPG, UNICENTRO, UNIOESTE, UDESC e UENP, esse recurso se faz presente. A esse respeito, Dias (2007) argumenta que as aes devem ser reversveis, podendo desfazer pelo menos a ltima ao realizada, assim, o usurio sabe que se cometer algum erro ele pode ser corrigido e se encoraja a explorar outras opes desconhecidas. 7 CONCLUSES Diante da anlise realizada, percebeu-se que a estrutura de organizao da informao disponvel nos sites de recursos humanos tem promovido o acesso ao seu contedo com rapidez e fcil localizao, haja vista a disponibilizao de algumas funes de ajuda, meios de contato com os responsveis pelos setores, permisso para downloads e a possibilidade de se alcanarem as principais GT2 481

pginas com poucos cliques, assim, de modo geral, as universidades pesquisadas tm utilizado os sites de recursos humanos para disponibilizar aos usurios os seus contedos, ou seja, informaes e vrios tipos de documentos. tais como Ato Executivo, Decreto, Edital, Estatuto, Instruo Normativa, Leis, Requerimentos e Resolues. Por outro lado, algumas melhorias so necessrias nos sites de recursos humanos, por exemplo, o cuidado com links que no funcionam corretamente, o uso de termos que no representam a categoria adotada, por exemplo, o uso do termo Diversos, expresso que pode confundir os usurios, visto que no deixa claro realmente qual o seu contedo e, at mesmo a sua abrangncia, a ambiguidade que leva o usurio a ficar confuso diante de uma informao que se encontra em vrios locais, a disponibilizao de opes de busca que proporcionaro economia de tempo, j que os usurios geralmente no dispem de tempo para a realizao de consultas nos sites, e tambm com relao utilizao de siglas e abreviaturas, uma realidade que se faz presente em alguns sites. Desta forma, acredita-se que o objetivo proposto foi alcanado, analisar a estrutura de organizao da informao nos sites de recursos humanos das universidades pblicas da regio sul do Brasil e que o desenvolvimento de novas pesquisas poder aprofundar os estudos a respeito da organizao da informao em sites de recursos humanos de modo geral. ABSTRACT: The organization of information in human resources sites has the purpose of providing institutions and users with agility, speed and time saving in order to seek information that is needed. Thus, through the organization of information, the search, selection, storage and information retrieval processes are strengthened, contributing to information and knowledge access as well as dissemination and sharing. Sites emerge as part of this important process. Based on this assumption, the human resources sites of public state universities in southern Brazil were specifically addressed in this research. The general objective was to analyze the structure of the information organization from the human resources websites of public state universities in southern Brazil. The study is characterized as an exploratory and descriptive research. Data collection consisted of document analysis and the instrument used was the form, consisting of five of the fifteen rules by Eckerson (1999). It was observed that most universities provide users with a certain kind of help, such as Contact Us, allowing the user to contact the specific sectors to solve their problems and providing content for download. As for the type of documents available, the Decrees, Edicts, Standards, Requirements and Resolutions predominate. It was concluded that universities use the human resources sites to provide its contents, but it is believed that more investment is needed concerning information organization in these sites. Key words: Information organization. Human resources sites. State universities. REFERNCIAS ANDRADE, M. E. A. Um olhar sobre representaes no universo do conhecimento: o caso de micro e pequenas empresas. In: NAVES, Madalena Martins Lopes; KURAMOTO, Hlio (Org.). Organizao da informao: princpios e tendncias. Braslia, DF: Briquet de Lemos, 2006. p. 4661. BENINE, F.; ZANAGA, M. P. Organizao da informao em portais de bibliotecas universitrias, Revista ACB: Biblioteconomia em Santa Catarina, Florianpolis, v.14, n.2, 451-467, jul/dez. 2009. GT2 482

Disponvel em: <http://revista.acbsc.org.br/index.php/racb/article/viewArticle/672>. Acesso em: 25 ago. 2010. CAF, Lgia; SALES, R. Organizao da informao: Conceitos bsicos e breve fundamentao terica. In: ROBREDO, J.; BRSCHER, M. (Org.). Passeios no Bosque da Informao: estudos sobre representao e organizao da informao e do conhecimento. Braslia, DF: IBICT, 2010. Cap. 6, p. 115-129. Disponvel em: <http://www.ibict.br/publicacoes/eroic.pdf>. Acesso em: 26 maio 2011. CUNHA, M. B. da; CAVALCANTI, C. R. de O. Dicionrio de biblioteconomia e arquivologia. Braslia, DF: Briquet de Lemos, 2008. CURTY, R. G.; ARAUJO, N. C.; CERVANTES, B. M. N.; GIRALDES, M. J. C. A. organizao e a descrio de estruturas de informao em repositrios institucionais acadmicos: uma anlise com base em elementos de arquitetura de informao. In: CONGRESSO BRASILEIRO DE BIBLIOTECONOMIA, DOCUMENTAO E CINCIA DA INFORMAO, 23., 2009, Bonito. Anais... Bonito: FEBAB, 2009. p. 1-12. DAVENPORT, T. H.; PRUSAK, L. Ecologia da Informao: por que s a tecnologia no basta para o sucesso na era da informao. So Paulo: Futura, 1998. DIAS, C. Portal corporativo: conceitos e caractersticas. Cincia da Informao, Braslia, v.30, n.1, p.50-60, jan./abr. 2001. Disponvel em: <http://www.scielo.br/pdf/ci/v30n1/a07v30n1.pdf>. Acesso em: 12 maio 2010. ______. Usabilidade na web: criando portais mais acessveis. 2.ed. Rio de Janeiro: Alta Books, 2007. ECKERSON, W. 15 rules for enterprise portals. Oracle Magazine, July/Aug. 1999. FERREIRA, A. M. J. F. C.; VECHIATO, F. L.; VIDOTTI, S. A. B. G. Arquitetura da informao de web sites: um enfoque universidade aberta terceira idade (UNATI). Revista de Iniciao Cientifica da FFC, v. 8, n. 1, p. 114-129, 2008. Disponvel em: <http://www2.marilia.unesp.br/ revistas/index.php/ric/article/view/184>. Acesso em: 04 jul. 2010. FONSECA, A.; FONSECA, A. F. Avaliando websites: perguntas chaves para revises efetivas de websites. 1.ed. Joo Pessoa, PB: Ed. UNIP, 2005. FREITAS, R. A.; QUINTANILLA, L. W.; NOGUEIRA, A. S. Portais corporativos: uma ferramenta estratgica para a gesto do conhecimento. Rio de Janeiro: Brasport, 2004. GIL, A. C. Como elaborar projetos de pesquisa. 4.ed. So Paulo: Atlas, 2008a. ______. Mtodos e tcnicas de pesquisa social. 6.ed. So Paulo: Atlas, 2008b. GUIMARES, J. A. C. A anlise documentria no mbito do tratamento da informao: elementos histricos e conceituais. In: RODRIGUES, G. M.; LOPES, I. L. L. (Org.). Organizao e representao do conhecimento na perspectiva da Cincia da Informao. Braslia, DF: Thesaurus, 2003. (Estudos Avanados em Cincia da Informao, v.2). GUINCHAT, C.; MENOU, M. Introduo geral s cincias e tcnicas da informao e documentao. Braslia, DF: IBICT, 1994. HAGEDORN, K. The information architecture glossary. [s.1.]: Argus Center for Information Architecture, c2000. Disponvel em: <http://argus-acia.com/white_papers/iaglossary.html>. Acesso em: 05 jul. 2011. MIRANDA, M. L. C. Organizao e representao do conhecimento: fundamentos tericometodolgicos na busca e recuperao da informao em ambientes virtuais. 2005. Tese (Doutorado GT2 483

em Cincia da Informao) Universidade Federal do Rio de Janeiro/ECO, Rio de Janeiro, 2005. REZENDE, D. A.; ABREU, A. F. de. Tecnologia da informao aplicada a sistemas de informao empresariais: o papel estratgico da informao e dos sistemas de informao nas empresas. 2. ed. So Paulo: Atlas, 2001. RODRIGUES, B. Site ou portal? as diferenas entre site, portal, hotsite e minisite. Postado em 18 abr. 2005. Disponvel em: <http://websinder.uol.com.br/2005/04/18/site-ou-portal/>. Acesso em: 05 jul. 2011. ROSENFELD, L.; MORVILLE, P. Information architecture for the Word Wide Web. 2nd. ed. Sebastopol, CA: OReilly, 2002. p. 50-55. Disponvel em: <http://books.google.com.br/ books?id=OM3DvakML-MC&dq=information+architecture+ for+the+world+wide+web&printsec=frontcover&source=bn&hl=pt-R&ei=ghGJTPHZG4T48 AbwxaWMAg&sa=X&oi=book_result&ct=result&resnum=4&ved=0CCgQ6AEwAw#v=onepage &q&f=false>. Acesso em: 20 ago. 2010. SANCHES, S. A. S. Arquitetura da informao em web sites: elementos, tcnicas e mtodos. 2004. Trabalho de Concluso de Curso (graduao), Faculdade de Filosofia e Cincias, Universidade Estadual Paulista, So Paulo, 2004. SNCHEZ DE BUSTAMANTE, A. M. de O. Arquitectura de informacin y usabilidad: nociones bsicas para los profesionales de la informacin. Acimed, Havana, v.12, n.6, 2004. Disponvel em: <http://bvs.sld.cu/revistas/aci/vol12_6_04/aci04604.htm>. Acesso em: 27 ago. 2010. SVENONIUS, E. Bibliographic Entities. In: ______.The intellectual foundation of information organization. London, England: The MIT Press, 2000. p. 31-52. TERRA, J. C. C.; GORDON, C. Portais corporativos: a revoluo na gesto do conhecimento. 6.ed. So Paulo: Negcio, 2002. ______. ; BAX, M. P. Portais corporativos: instrumento de gesto de informao e de conhecimento. 2003. Disponvel em: <http://www.bax.com.br/research/publications/ portaiscorporativosInstrumentosGesto.pdf>. Acesso em: 25 ago. 2010. TOMAL, M. I.; ALCAR, A. R.; SILVA, T. E. Fontes de informao na internet: critrios de qualidade. In: TOMAL, M. I. (Org.). Fontes de informao na internet. Londrina: EDUEL, 2008. p. 3-28. URIARTE, F. M. N. Portal corporativo como canal para gesto do conhecimento. 2006. Dissertao (Mestrado em Engenharia e Gesto do Conhecimento) Universidade Federal de Santa Catarina, Florianpolis, 2006. Disponvel em: <http://btd.egc.ufsc.br/wp-content/uploads/2010/06/ Flavia-Maia-da-Nova-Uriarte.pdf>. Acesso em: 26 maio 2010.

GT2 484

COMUNICAO ORAL

RELAES CONCEITUAIS E CATEGORIAS FILOSFICAS: APORTES DAS ONTOLOGIAS E DA TERMINOLOGIA PARA A REPRESENTAO DO CONHECIMENTO
Walter Moreira, Marilda Lopes Ginez de Lara Resumo: Discute os subsdios que as interfaces entre terminologia, ontologia filosfica, ontologia computacional oferecem para a organizao das relaes conceituais nos processos de representao do conhecimento em sistemas de informao documentria. Considera que a ontologia, em quaisquer dos seus aspectos, possui funo de fornecer sistemas de categorizao que permitam ao homem organizar a realidade. Estabelece, portanto, como objetivos: a) discutir o fundamento filosfico da aplicao de ontologias com base no estudo das categorias ontolgicas presentes em Aristteles e Kant e b) fornecer subsdios iniciais para a compreenso da inter-relao entre ontologia filosfica, ontologia formal e representao documentria baseada em categorias de assunto. Defende a vinculao mais forte dos estudos sobre ontologias compreenso filosfica do termo. A representao do conhecimento o aspecto que une, por semelhana de propostas, a cincia da computao, por meio das ontologias, e a cincia da informao, por meio dos tesauros, por isso so utilizados referenciais tericos de ambos os campos. Considerando-se, ainda, que a interseco entre estes campos, na abordagem do mesmo objeto, ocorre por meio da compreenso e aplicao de categorias de assunto, insere tambm os estudos filosficos na fundamentao terica que sustenta a reflexo. Aponta, como consideraes finais, que a construo de ontologias no pode prescindir do tratamento terminolgico-conceitual, como compreendido pela terminologia e pela cincia da informao, acumulado nos referenciais tericos e nas metodologias para construo de linguagens documentrias e que, por outro lado, a construo de linguagens documentrias mais flexveis no pode ignorar o modelo de representao do conhecimento praticado nas ontologias, com mais predisposio para a formalizao e para a interoperabilidade. Palavras-chave: Relaes conceituais. Categorias. Ontologias. Terminologia. Representao do conhecimento. 1 INTRODUO Em se tratando de atribuir semntica aos fluxos de informao na web, as ontologias tm sido amplamente estudadas na cincia da computao e, na mesma condio de instrumentos de representao do conhecimento, tambm interessam cincia da informao. No raramente o computador e as tecnologias que lhe so associadas tm sido tratados como panaceia ou, por outra associao com a cultura grega, como o deus ex machina (o artefato que o teatro grego produziu para resolver inesperadamente, todos os problemas de uma trama). Com o fim de evitar este engano, buscou-se sustentar esta pesquisa no apenas no carter da racionalidade tcnica, mas tambm da racionalidade reflexiva. Busca-se, especificamente, refletir a aplicao de ontologias GT2 485

nos processos de representao do conhecimento, considerando-se, principalmente, a compreenso da cincia da informao. As condies para a comunicao efetiva da informao e do conhecimento formam, na definio clssica de Saracevic (1996, p. 47), a preocupao central da cincia da informao; entendida como

um campo dedicado s questes cientficas e prtica profissional voltadas para os problemas de efetiva comunicao do conhecimento e de seus registros entre os seres humanos, no contexto social, institucional ou individual do uso e das necessidades de informao. No tratamento destas questes so consideradas de particular interesse as vantagens das modernas tecnologias informacionais.

Destacam-se dois aspectos desta definio: os problemas de efetiva comunicao do conhecimento e as vantagens das modernas tecnologias informacionais. O primeiro d conta de um olhar pragmtico para o objeto da cincia da informao, isto , ainda que no se possa garantir totalmente a produo de conhecimento com a simples comunicao da informao, essa a finalidade dos sistemas documentrios. O segundo aspecto, referente s tecnologias, confere definio um carter indispensvel s definies clssicas: a peremptoriedade. A questo das ontologias tem interessado cincia da computao, que registra, alis, avanos significativos, e cincia da informao, por meio do refinamento de propostas das linguagens documentrias, notadamente com o aporte da terminologia. Passados quase 15 anos, ainda possvel verificar a falta de dilogo entre os dois campos apontada por Vickery (1997), no que se refere aos processos e aos produtos que ambas geram. Assumindo-se que a representao do conhecimento ou a representao documentria jamais so fins em si mesmas, o compromisso maior que tanto um campo quanto outro adota relaciona-se, no limite, com o desenvolvimento da cincia e da tecnologia, j que o fluxo do conhecimento cientfico e tecnolgico tambm se d por meio de suas representaes, sejam ontologias ou tesauros. Acredita-se, ento, que a compreenso mais terminolgica das ontologias pode oferecer colaboraes para a organizao de um acesso menos quantitativo e mais qualitativo informao. Mais de dois mil anos depois do surgimento das primeiras formas de ndice, ainda se d primazia, grosso modo, para a frequncia e/ou ocorrncia como indicadores de relevncia. Esta reflexo apia-se nos seguintes pressupostos: a) a construo de ontologias no pode prescindir do tratamento terminolgico-conceitual, como compreendido pela terminologia e pela cincia da informao, acumulado nos referenciais tericos e nas metodologias para construo de linguagens documentrias; b) a construo de linguagens documentrias mais precisas e mais flexveis expressas em relacionamentos conceituais mais dinmicos pode beneficiar-se do conhecimento das metodologias utilizadas na construo de ontologias de domnio e suas regras de inferncias e relacionamentos. Estabeleceu-se como objetivo, portanto, investigar as interfaces entre terminologia, ontologia filosfica, ontologia computacional e lingustica documentria e os subsdios que oferecem para a organizao das relaes conceituais nos processos de representao do conhecimento em sistemas de informao documentria. GT2 486

1.1 Justificativa A quantidade de informaes em circulao atualmente, consideradas as facilidades de acesso, armazenamento e, principalmente, circulao, trazidas pelas tecnologias da informao e da comunicao, continua provocando a busca de novas metodologias para a organizao destas massas que agora, em vista da maior oferta e diversidade de documentos, so ainda mais incoerentes, para utilizar a expresso que aparece no pargrafo de abertura do clssico otletiano (OTLET, 1996, p. 6). No fossem outras razes, esta seria suficiente para motivar uma reflexo sobre este que tem sido um dos problemas mais caros cincia da informao: as condies de produo, acesso e circulao da informao, bem como o comprometimento com a produo, acesso e circulao do conhecimento, que envolve, naturalmente, aspectos semnticos. O tratamento semntico, pela relao semitica contextual que visa a estabelecer, inerentemente complexo e tambm tem sido proposto como tarefa para as ontologias computacionais, principalmente em aplicaes para a internet. O uso de ontologias neste ambiente visa a sanar um problema histrico recente: a rede cresceu como meio para a troca de informaes entre pessoas e deixou a desejar no que se refere s condies da troca de dados e informaes que possam ser processados automaticamente (BREITMAN, 2005). Ainda que trate de um tema cuja literatura mais vasta encontra-se no interior da cincia da computao, esta pesquisa tem como fundamentao terica a literatura da cincia da informao e da terminologia, com especial ateno para a teoria comunicativa da terminologia, cuja concepo de unidade terminolgica mais flexvel e admite a possibilidade de variao conceitual e denominativa, alm de admitir tambm relaes entre conceitos que ultrapassam as relaes lgicas e ontolgicas estabelecidas pela teoria clssica. As ontologias permitem melhorar significativamente a representao computacional de um domnio do conhecimento. Esta melhoria d-se inicialmente num nvel mquina-mquina e depois mquina-homem, para posteriormente interferir na relao homem-homem. Sendo as ontologias conjuntos estruturados de conceitos especializados representados por denominaes, a terminologia pode igualmente contribuir para o aprofundamento da compreenso. 2 A BASE FILOSFICA DAS ONTOLOGIAS Considerada em quaisquer de seus aspectos, pode-se atribuir ontologia a funo de fornecer sistemas de categorizao que permitam ao homem organizar a realidade. Insere-se neste ponto sua proximidade com o domnio da cincia da informao e objetiva-se, desse modo, com a presente seo: a) discutir o fundamento filosfico da aplicao de ontologias com base no estudo das categorias ontolgicas presentes em Aristteles e Kant e b) fornecer subsdios iniciais para a compreenso da inter-relao entre ontologia filosfica, ontologia formal e representao documentria baseada em categorias de assunto. A adoo de princpios ontolgicos no campo de pesquisa que envolve a representao e a GT2 487

recuperao da informao e do conhecimento, ainda que a base tecnolgica atual possa fazer parecer incipiente, no recente, embora seja, por sua complexidade, insipiente. Aristteles, um sbio de Estagira cuja cabea sustenta ainda hoje o Ocidente1, inaugura, com o que chamou de metafsica2, estes estudos. Posteriormente, Porfrio (explicador de Aristteles), Brentano, Kant e Peirce entre outros, retomam e atualizam o pensamento aristotlico, direta ou indiretamente, concordando com ou divergindo dele, conforme apontado na discusso que se segue. Defende-se, juntamente com Smith (2002; 2004, entre outros), que se corre o risco de realizar um uso pobre da ontologia se isso ocorrer desvinculado da compreenso filosfica. A maioria dos trabalhos sobre metodologias para desenvolvimento de ontologias para sistemas de informao, como foi possvel comprovar (MOREIRA, 2010) tomando-se como ponto de partida a sustentao de Smith (2002; 2004), ignoram o trabalho feito na filosofia. A exemplo do que ocorre com as classificaes bibliogrficas, cuja compreenso no pode ser separada da compreenso das classificaes filosficas, acredita-se que no se pode desenvolver ontologias (conforme compreendidas pela cincia da computao/inteligncia artificial) sem o necessrio aporte da ontologia (conforme compreenso da filosofia). 2.1 Categorias aristotlicas Aristteles (384-322 a.C.) compreende o mundo fsico como a realidade ltima, concepo que se revela nas categorias com as quais quer analisar os predicados do ser: substncia, qualidade, quantidade, relao, lugar, tempo, posio, estado, ao e paixo. A substncia pode ser considerada como a categoria primeira, pois em torno dela giram as afirmaes possveis pelo uso das demais categorias. Kant, posteriormente, ir criticar os problemas de derivao presentes nas categorias aristotlicas. Sowa (2000; 2009) estabelece um interessante paralelo entre as categorias de Aristteles e seus desdobramentos diretos ou indiretos. Neste trabalho, que acompanha seu raciocnio em alguns aspectos, ater-se- somente j clssica representao de Porfrio e s representaes posteriores de Kant por consider-las mais prximas do que se pretende como organizao e representao do conhecimento no universo da cincia da informao em sua necessidade de operar com esses conceitos. Estudos posteriores devero comparar a evoluo da representao ontolgica em outros pensadores. Um dos maiores divulgadores das ideias aristotlicas acerca da categorizao foi Porfrio (232305), cuja dicotomia deve sua larga e longa aceitabilidade, certamente, ao que se pode chamar de vontade humana de que o mundo pudesse assim ser compreendido e representado, notadamente no medievo. Feliz ou infelizmente a realidade complexa e no pode ser facilmente representada em face
1 Verso da msica Alexandre, de Caetano Veloso, gravada em seu lbum Livro, de 1997. 2 Aristteles qualificou os pr-socrticos, por seu esforo em compreender o universo (physis) de fsicos (physikoi) e props, para diferenciar-se deles, o termo metafsica.

GT2 488

da presena/ausncia de determinados traos. Dentre as contribuies mais importantes de Porfrio esto os comentrios sobre as categorias de Aristteles: a Isagoge (uma variao lingustica arcaica equivalente a preliminar ou prembulo). Nesta obra aparece sua conhecida concepo arborescente (embora ele mesmo no use esta forma de representao). Baseando-se na teoria dos predicados de Aristteles, a rvore de Porfrio constitui-se num conjunto hierrquico finito de gneros e espcies, identificados por dicotomias sucessivas. A influncia de Porfrio estende-se pela posterior teoria da definio e classificao dos seres e igualmente pelas classificaes das cincias, seja originando classificaes dicotmicas, seja exigindolhes simetria (POMBO, 1998). Essa influncia estende-se ainda, naturalmente, com maior ou menor intensidade pela classificao bibliogrfica e outras linguagens documentrias de um modo geral e tambm est presente nas taxonomias e nas ontologias. A rvore de Porfrio deve sua limitao relatividade de sua construo, conforme apontado por Tlamo et al. (1992), pois depende da seleo do atributo de qualidade que compreender as subdivises sucessivas. O homem, no exemplo de Eco (1984), tambm citado pelas autoras, s mortal numa hierarquia que focalize o problema da durao da vida. Considerados outros aspectos, pode-se, por exemplo, inseri-lo numa hierarquia que considere sua natureza orgnica ou inorgnica. A seleo se d, ento, pelo que Tlamo et al. (1992) chamam de presso contextual, podendo-se consider-la verdadeira apenas em relao a um determinado cdigo e no em relao s propriedades dos objetos em si mesmos. Neste tipo de diviso, o contexto no incorporado, ou ento incorpora-se apenas um contexto determinado, o qual ir suportar a interpretao. 2.2 As categorias de Kant A razo, para Immanuel Kant (1724-1804), uma estrutura vazia, inata, independente da experincia, uma espcie de forma pura, sem contedos, universal. Os contedos so dados pela experincia. Sem sensibilidade, pode-se ler em Kant (1996, p. 92), no que considerado como uma sntese entre racionalistas e empiristas, nenhum objeto nos seria dado, e sem entendimento nenhum seria pensado. Pensamentos sem contedo so vazios, intuies sem certos conceitos so cegas [...]. Na Crtica da razo pura, Kant props uma primeira mudana radical nas categorias aristotlicas: a combinao dos relacionamentos num julgamento, considerando que a realidade se d na possibilidade de emisso de juzos, afirmaes ou negaes. Em outros termos, no basta apenas que algo esteja num contexto de tempo e de espao para que seja considerado real, antes preciso que se possam emitir juzos a seu respeito. Apresentando-se a realidade nos juzos, pode-se afirmar a correspondncia condicionada entre juzo e realidade, o que permite ao homem formar um conjunto de juzos que sustenta sua expresso das coisas reais. Os juzos no possuem, contudo, sempre a mesma natureza. A afirmao ou negao das propriedades de algum objeto, variam e condicionam a percepo do objeto, como ocorre, por exemplo, GT2 489

com as seguintes afirmativas: A USP uma universidade brasileira, que no possui a mesma natureza de: A USP a melhor universidade do Brasil. Ambas referem-se a propriedades da USP; so portanto juzos e podem dar a impresso de simplesmente descrev-la. Basta um exame mais atento, entretanto, para que sejam percebidas suas diferenas: a primeira afirmativa refere-se ao que se denomina por fatos, enquanto a segunda envolve um juzo de valor, representando, neste caso, uma opinio, para a qual no se pode esperar o mesmo grau de concordncia. A partir de uma tbua dos juzos, Kant prope e lhe faz derivar e corresponder uma tbua das categorias, ambas organizadas em quatro grupos de trs. Esta considerada a primeira grande mudana imposta s categorias aristotlicas, mas ainda parte delas (SOWA, 2000; 2009). o prprio Kant (1996, p. 108), alis, quem informa sobre seu desejo de rever Aristteles: seguindo Aristteles, denominaremos tais conceitos categorias na medida em que nossa inteno, em princpio, identifica-se com a de Aristteles, se bem que se afaste bastante dele na execuo. Considera que por meio desses conceitos puros possvel compreender algo do mltiplo da intuio e segue sua crtica ao modelo aristotlico:
[...] a procura desses conceitos fundamentais constituiu um plano digno de homem perspicaz como Aristteles. Entretanto, por no possuir nenhum princpio catouos como se lhe deparavam, reunindo primeiramente dez, que denominou categorias (predicamentos). A seguir, creu ter encontrado ainda mais cinco conceitos que acrescentou sob a denominao de ps-predicamentos [...] (KANT, 1996, p. 109).

Aristteles, na viso de Kant, enumera, mas no justifica as categorias, no apresenta provas de sua derivao. A diferena em Kant o foco no sujeito como princpio orientador da descoberta. O mundo ordenado pelos seres humanos segundo a distino que possuem. Se no se conhece a distino mesa, por exemplo, no se pode observ-la. Pode-se ver diferenas de cor, forma, textura etc., mas no uma mesa (SALATIEL, 2006). Para utilizar um exemplo corriqueiro, os esquims podem observar mais distines de branco do que os brasileiros, a diferena entre os povos, neste caso, no biolgica. Em Kant, so as categorias que permitem organizar os dados da experincia, por esta razo se diz que o entendimento kantiano apriorstico (anterior experincia e independente dela). Munido das categorias, o sujeito forma os conceitos. As categorias permitem ao sujeito o enquadramento do mundo, por isso condicionam, num certo sentido, sua viso de mundo e sua racionalidade. Conhecimento, em Kant, relao e no contemplao. Chamou-se revoluo copernicana sntese que Kant realizou do embate filosfico entre racionalistas e empiristas. Sua concepo filosfica aceita argumentos de uns e de outros na compreenso de que o conhecimento comea com a experincia, mas que esta no age sobre um ser sujeitado; o sujeito constri esquemas interpretativos de organizao dos dados da experincia. Estes esquemas permitem transformar em conhecimento os dados da experincia. Em vez de explicar os conceitos em funo da experincia, Kant dedicou-se a explicar a experincia em funo dos conceitos, considerando que antes que as impresses que irrompem nos GT2 490

sentidos se transformem em conhecimento, devem ser organizadas ou unificadas de algum modo pela atividade do entendimento (RUSSELL, 2001, p. 345). Enquanto a filosofia centra suas preocupaes ontolgicas no que existe no mundo, a aplicao de ontologias no domnio da representao computacional do conhecimento bem mais modesta; entende pragmaticamente o que existe como o que pode ser representado (GRUBER, 1995). Neste ltimo caso, as preocupaes ontolgicas restringem-se a domnios especficos e visam antes solues de problemas (aplicaes prticas) absolutamente demarcados, que reflexes. Nestes tipos de aplicaes, envolvem-se basicamente: a) um conjunto de termos e conceitos que so utilizados para a descrio do domnio (uma ontologia); b) uma base de conhecimento que permita aplicar isso a uma determinada realidade e c) agentes inteligentes (programas de computador com capacidade autnoma de ao), assim denominados porque visam a simular o comportamento humano na resoluo de tarefas. Os agentes, mediante as instrues do usurio, coletam dados na internet e processam as informaes por meio de regras lgicas de inferncias, como as ontologias. importante lembrar que outra caracterstica dos agentes a cooperao, ou seja, a troca de informaes que podem realizar entre si. Ainda que Gruber (1995) tente simplificar a questo, conforme apontado anteriormente, afirmando que para a inteligncia artificial o que existe o que pode ser representado, no escapa do problema ontolgico e filosfico fundamental: o que de fato existe para ser representado? Quais so as entidades dessa condio virtual? Do modo como a questo est colocada faz parecer que a oposio se d entre o real (a realidade, o que existe) e o potencial (o que pode ser representado). Optar pela potencialidade algo simplesmente irrealizvel, pois no existem opes neste caso. No h como separar efetivamente o que pode ser representado do que no pode s-lo. O problema da representao no se resolve deste modo. Talvez fosse melhor pensar a relao atual e virtual, conforme a concepo deleuzeana para definir o escopo das relaes categoriais nas ontologias. O virtual, esclarece Deleuze (1988, p. 203), no se ope ao real, mas apenas ao atual. O virtual possui plena realidade enquanto virtual. 2.3 Categorias, ontologias e informao documentria Ainda em busca da compreenso das inter-relaes apontadas anteriormente, pergunta-se: como os estudos sobre categorizao realizados no interior da cincia da informao se relacionam com as ontologias e estas com a construo de informao documentria? Os sistemas de informao tm sua eficcia condicionada adoo de critrios explcitos e de recortes institucionais no delineamento de categorias, no sendo assim, corre-se o risco de tomar casos concretos por princpios estabelecidos. Nas linguagens documentrias as categorias herdam alguns princpios filosficos, pois se referem a agrupamentos que manifestam particularidades em relao aos campos do conhecimento ou de atividade, mas como contraexemplo do que ali se d, no so universais (ou no pretendem s-lo), pois servem a propsitos institucionais objetivados e denotam interpretaes particulares. GT2 491

A institucionalizao, a necessidade de um olhar apriorstico que atenda s necessidades institucionais de categorizao do conhecimento para fins de representao e posterior recuperao da informao em sistemas de informao pode levar crena de que a abordagem kantiana a soluo para tais problemas. Com base em que princpios, contudo, podero ser produzidas as categorias do conhecimento (categorias do entendimento, diria Kant)? O nico princpio norteador da escolha a prpria experincia concreta dos sistemas de informao e sua complexidade, que envolve os usurios da informao (considerados de forma coletiva), as linguagens documentrias, os profissionais da informao e a base tecnolgica disponvel. A cincia da informao, uma cincia social aplicada, vale lembrar, pretende organizar o conhecimento no apenas para represent-lo, mas tambm para garantir seu uso e seu reuso. Sem a adoo de critrios explcitos arrisca-se a reduzir a discusso sobre a apropriao ao nvel do indivduo e dessa forma perder o parmetro social. 3 CARACTERSTICAS DAS ONTOLOGIAS A definio de ontologias tem ocupado espao considervel na literatura especializada. Guarino e Giaretta (1995), num trabalho que discute a formao, o significado do termo e suas interpretaes partem da definio clssica de Gruber (1995) para construir um (j ento necessrio) esclarecimento terminolgico, como denuncia, alis, o subttulo de seu artigo. Passados dezesseis anos, o campo ainda incipiente e o significado do termo amplo, ambguo e ainda est em negociao, variando conforme sua aplicao. Em cincia da computao (mais especificamente no domnio da inteligncia artificial) compreendem-se as ontologias, numa abordagem sinttica, como um conjunto de conceitos e termos que podem ser usados para descrever alguma rea do conhecimento ou construir sua representao. Trata-se, conforme a j clssica definio de Gruber (1995), de uma especificao formal explcita de uma conceitualizao compartilhada. Por formal entende-se que esta representao seja expressa num formato legvel por computadores; explcita significa que os conceitos, as propriedades, as relaes, as funes, as restries e os axiomas devem estar formalmente definidos e passveis de serem manipulados por computadores. Entende-se por conceitualizao que tal representao seja referente a algum modelo abstrato de algum fenmeno do mundo real e, finalmente, por compartilhada, compreende-se que esse conhecimento seja consensual (MOREIRA, 2010). A definio de Jacob (2003), reproduzida abaixo, tangencia a de Gruber e acrescenta-lhe aspectos importantes: as ontologias focam, sem prejuzo da informao sinttica, o compartilhamento da informao semntica entre sistemas de informao. [...] uma ontologia uma conceitualizao parcial de um determinado domnio do conhecimento, compartilhado por uma comunidade de usurios, que foi definida numa linguagem formal processvel por mquina para o propsito explcito de compartilhar informao semntica entre sistemas automatizados (JACOB, 2003, p. 20, traduo livre). GT2 492

Considera-se relevante citar ainda, pela abrangncia, a definio de Jasper e Uschold (apud BREITMAN, 2005, p. 31): independentemente do formato que assuma, uma ontologia deve incluir um vocabulrio de termos e alguma especificao de seu significado. Esta deve abranger definies e uma indicao de como os conceitos esto inter-relacionados, o que resulta na estruturao do domnio e nas restries de possveis interpretaes de seus termos. A expresso restries possveis merece ser observada com mais cuidado. Considerando-se que o compartilhamento de conhecimentos deve ser consensual, espera-se que os atores envolvidos possam, de alguma forma, expressar interpretaes que possuam pontos de contato entre si, que possuam potencial dialgico. No que se refere aos elementos que compem uma ontologia, segue-se a descrio de GmezPrez (1999, p. 35, traduo livre): a) conceitos organizados numa taxonomia (classes e subclasses) os conceitos podem ser abstratos ou concretos, simples ou compsitos (composite), reais ou fictcios; b) relaes entre os conceitos, formalmente definidas; c) funes casos especiais de relacionamento em que um conjunto de elementos tem uma relao nica com um outro elemento; d) axiomas regras, sempre verdadeiras; e) instncias usadas para representar elementos. A indicao da instncia como componente das ontologias causa, na literatura da cincia da computao, discusso semelhante que provoca na cincia da informao a utilizao de conceitos individuais na organizao de tesauros, que, alis, no os admite. Os nveis de modelagem das relaes conceituais nas ontologias, contudo, admitem maiores variaes e podem exigir no vaso das ontologias de aplicao, por exemplo, esta especificao. Veja-se, como ilustrao, a classificao de ontologias apresentada por Maedche (2002): a) ontologias de alto nvel descrevem conceitos genricos, como espao, tempo, evento e outros, os quais so independentes de domnios particulares; ajustam-se melhor s aes de interoperabilidade, pois podem ser compartilhadas por grande nmero de usurios; b) ontologias de domnio descrevem o vocabulrio relacionado com um domnio genrico por meio da especializao dos conceitos introduzidos nas ontologias de alto nvel; c) ontologias de tarefa descrevem o vocabulrio relacionado com uma tarefa ou atividade genrica por meio da especializao dos conceitos introduzidos na ontologia de alto nvel; d) ontologias de aplicao so as ontologias mais especficas; os conceitos neste tipo de ontologia frequentemente correspondem s especializaes dos conceitos usados nas ontologias de domnio ou de tarefa. 3.1 Interoperabilidade semntica As novas possibilidades de interao e de interatividade influem, de modo natural, nos sistemas de informao e o interesse em interoperabilidade (que no novo) cresce proporcionalmente ao tambm renovado interesse em intercmbio de informaes documentrias. Superar as barreiras tecnolgicas e de organizao (representaes e garantias de acesso) tornou-se objetivo comum hoje a todos os envolvidos nos processos de tratamento da informao. Um dos problemas mais claramente colocados interoperabilidade, que, alis, tambm influenciou o projeto de adoo uniforme dos sistemas de classificao, como queriam seus GT2 493

idealizadores, refere-se questo da complexidade das culturas envolvidas nos processos de construo da informao documentria. Se num contexto particular de uma unidade de informao j muito difcil garantir a coerncia intraindexadores e interindexadores, o problema agrava-se muito em contextos desterritorializados de intercmbio intercultural ou internacional. Dentre as principais justificativas para o desenvolvimento e a adoo de ontologias esto, certamente, suas possibilidades de reuso. Isto de deve, vale recordar, ao fato de serem projetadas com foco tambm nas interaes entre sistemas de agentes inteligentes, o que lhes exige maior grau de formalizao. Os conceitos de interoperabilidade e de reuso implicam uma dupla caracterizao das ontologias, por um lado as ontologias devem ser especficas o suficiente para descrever o campo de aplicao, por outro, no podem prescindir de certo nvel de generalizao que possa garantir seu intercmbio em contextos diferenciados. A tarefa seria simples se os termos fossem rtulos e se fosse possvel operar, em todos os contextos, com macro-ontologias, como se fora uma linguagem universal e se os termos fossem estticos em face dos conceitos que pretendem representar. Como operam no terreno do simblico, as ontologias, como qualquer outra construo simblica, demandam alinhamento. 3.2 As relaes entre interoperabilidade e categorias A compreenso da realidade prima pelo conforto, pela ordem, como elementos quase naturais do homem. Se os elementos da realidade no se encaixam nas categorias de que o indivduo j dispe, se suas hipteses so rejeitadas, foroso ajust-las como condio para o conhecimento; caso em que se prope um novo modelo, uma nova hiptese Lara (2001). A categorizao um dos aspectos mais importantes da linguagem, pois possibilita encontrar caractersticas semelhantes em objetos individuais, ainda que tais objetos sejam dessemelhantes (MOREIRA, 2011). A categorizao torna-se assim, no uma estrutura para definir ou enquadrar o universo, mas um processo para formar ferramentas para o pensamento, grupos momentaneamente teis por associao. Esta abordagem especialmente relevante num cenrio que inclui de usurios buscando por informao e na identificao do modo como eles categorizaram os conceitos naquele momento, para expressar sua necessidade imediata de informao. 4 AS ONTOLOGIAS E A CONSTRUO DE INFORMAES DOCUMENTRIAS 4.1 Informao documentria e terminologia O desenvolvimento terminolgico considerado como componente e consequente do desenvolvimento cientfico e tecnolgico. No h conhecimento cientfico sem terminologia e, por esta razo, a legitimao da cincia se d por meio da legitimao de sua prpria terminologia, como ensina Benveniste (1989, p. 252):
A constituio de uma terminologia prpria marca, em toda cincia, o advento ou o

GT2 494

desenvolvimento de uma conceitualizao nova, assinalando, assim, um momento decisivo de sua histria. Poder-se-ia mesmo dizer que a prpria histria particular de uma cincia se resume na de seus termos especficos. Uma cincia s comea a existir ou consegue se impor na medida em que faz existir e em que impe seus conceitos, atravs de sua denominao. Ela no tem outro meio de estabelecer sua legitimidade seno por especificar seu objeto denominando-o, podendo este constitui uma ordem de fenmenos, domnio novo ou um modo novo de relao entre certos dados. O aparelhamento mente consiste, em primeiro lugar, de um inventrio de termos que arrolam, configuram ou analisam a realidade. Denominar, isto , criar um conceito , ao mesmo tempo, a primeira e ltima operao de uma cincia.

Considerando-se que no h mais delimitao rgida de domnios do conhecimento (SANTOS, 2002; 2003; VOGT, 2008), suas terminologias tambm no so mais to facilmente demarcadas, mas sua identificao torna-se condio para os dilogos que a cincia e a tecnologia estabelecem entre si e com seus pblicos. Sem que se conhea a abrangncia terminolgica de um determinado campo no se podem negociar sentidos ou mesmo significados em seu interior. Esta impossibilidade de negociao reduz (se no inviabiliza) a comunicao eficaz. O termo, na linguagem especializada, assume funo muito semelhante atribuda palavra, na linguagem natural. A palavra, na linguagem natural, tambm depende de negociao de sentido e essas negociaes tambm se inserem em contextos regulatrios mais ou menos especficos. A diferena fundamental, ento, est na pr-definio, no pr-acordo com relao ao grau de especificidade do domnio que o termo requer, com vistas a diminuir consideravelmente a ambiguidade da linguagem natural. A univocidade comunicacional desconsidera os diferentes significados e os sentidos que a linguagem no uso pode emprestar aos termos. Isso aparece tambm nas normas de elaborao de tesauros que, como observou Lara (2009), nem mencionam a polissemia. Se o critrio orientador para a semntica o uso dirio, fica fcil deduzir que os sistemas de recuperao da informao foram o pesquisador a utilizar a linguagem de forma no natural. Neste sentido, importante apontar o auxlio que as metodologias para construo de ontologias podem oferecer linguagem documentria. Os tesauros, na condio de linguagem documentria, de cdigo comutador, so instrumentos que visam a orientar as relaes entre os conceitos e a atribuio de descritores pelo sistema de informao documentria e seu posterior uso para fins de recuperao. Na condio de cdigo comutador, o tesauro lida, necessariamente, com a reduo semntica. As experincias com o uso da linguagem natural podem at mesmo melhorar as condies de recuperao da informao (embora ainda no se conheam resultados satisfatrios sobre isso), mas escapam das questes da lingustica documentria, porque no envolvem a representao (ou a construo de informaes documentrias). O mapeamento terminolgico, ou seja, a identificao dos termos representativos do domnio, seus conceitos bsicos e seus relacionamentos, enquanto fase da criao de ontologias, possibilita a identificao da informao no discurso, dos termos que devem ser modelados como classes, propriedades ou axiomas (BREITMAN, 2005), fixando as regras de inferncia.

GT2 495

4.2 Informao documentria e representao do conhecimento Pode-se efetivamente representar o conhecimento para fins de recuperao da informao? Esta questo tem unido os esforos de pesquisadores da cincia da computao e da cincia da informao, mas tem origem mais remota; nasce na filosofia, mais precisamente estudada pela teoria do conhecimento. Do ponto de vista da cincia da informao, entretanto, preciso complet-la com objetivos tambm pragmticos, pois preciso perguntar tambm pela qualidade e pela efetividade desta possvel representao. 5 CONSIDERAES FINAIS Estabeleceu-se como objetivo geral para esta reflexo investigar as interfaces entre a lingustica documentria, terminologia e ontologias (filosficas, como aporte terico, e computacionais, como conjunto de metodologias). A discusso partiu de um ponto de observao preciso, do interior do qual se analisou a problemtica: os subsdios terico-prticos que as ontologias oferecem para a construo de informaes documentrias em sistemas de informao documentria. A interdependncia inerente aos sistemas de informao, considerados seus objetivos, impede a insistncia em modelos isolados ou nucleares de organizao do conhecimento. Observou-se que, conquanto compartilhem alguns objetivos comuns, ainda h pouco dilogo entre a cincia da informao (e, no seu interior, a lingustica documentria) e a cincia da computao (ontologias), principalmente desta ltima para com a primeira. Dessa forma, em alguns momentos foi necessrio evidenciar as relaes que guardam entre si a cincia da informao e a cincia da computao. Este dilogo teve como base a convico de que a aplicao dos recursos da informtica no resolve, por si, todos os problemas decorrentes da organizao e do fluxo da informao, como quer acreditar o senso comum, e que, por outro lado, no possvel, considerando-se a base tecnolgica atual, resolver estes problemas sem o auxlio do tratamento automtico da informao. Os mtodos automticos de organizao da informao consideram basicamente os seus aspectos sintticos e estatsticos, possivelmente por conta da facilidade com que os softwares aplicativos podem operar com este tipo de insumo. Defende-se, para dar conta dos aspectos semnticos ausentes, que os aportes da terminologia e das ontologias respondem, com maior acuidade, aos problemas de acesso menos quantitativo e mais qualitativo informao. A abordagem automtica quantitativa utilizada com base no argumento de uma pretensa objetividade, o mesmo princpio de objetividade, alis, que norteou algumas teorias iniciais referentes anlise documentria, que ensinavam a indexar o verdadeiro contedo do documento e no aquele que o autor gostaria de ter escrito (LANCASTER, 1993, p. 31) ou aquele que resultado da interpretao do indexador . No mbito dos sistemas de informao documentria, a abordagem automtica quantitativa da informao, embora se preste ao levantamento de dados de importncia para um trabalho de construo de filtros semnticos, no responde adequadamente s necessidades relativas ao tratamento GT2 496

documentrio-informacional dos discursos, quer em relao aos contedos ou ao atendimento das necessidades territorializadas de informao. Interessou tambm neste trabalho, verificar a contribuio das ontologias para o desenvolvimento de tesauros e vice-versa. Acredita-se que haja um conjunto de conhecimentos desenvolvido na cincia da informao referentes organizao e recuperao da informao e organizao e fluxo do conhecimento que resultante de um longo processo de desenvolvimento, visando alcanar o seu aperfeioamento. Neste sentido so questionadas algumas pesquisas sobre ontologias por seu carter absolutamente utilitarista, voltados que so formalizao sem considerar as particularidades dos campos de conhecimento e de atividade. Sobre esse aspecto, observou-se que, com raras excees, como Sowa (2000; 2009), Smith (2002; 2004) e Schwarz e Smith (2008), por exemplo, as discusses sobre ontologias no so realizadas a partir de fundamentao terico-filosfica. Defende-se nesta reflexo, ao contrrio e na linha dos ltimos autores citados que a construo de ontologias concretas e as ontologias filosficas no so eventos completamente independentes que guardam entre si apenas a similaridade de denominao. A discusso sobre categorias e categorizao na cincia da computao, nem sempre possui, pelo que pde observar (MOREIRA, 2010) nos limites desta reflexo, a nfase que recebe na cincia da informao no mbito dos estudos sobre organizao e representao do conhecimento. No que diz respeito s interfaces entre a cincia da computao e a cincia da informao, foi possvel confirmar que, do lado da cincia da informao em especial no que tange construo de linguagens documentrias pode haver uma profcua apropriao de metodologias para a construo de instrumentos documentrios mais precisos, flexveis e dinmicos a partir do conhecimento acumulado, na cincia da computao, com a construo de ontologias de domnio e suas regras de inferncias e relacionamentos. O tesauro, cujo surgimento coincide com o da cincia da informao, resultante da necessidade de resolver os problemas de fluxo de informao (acesso e uso) decorrentes da rpida ampliao da produo do conhecimento cientfico e tecnolgico neste perodo. A consequente dificuldade que este contexto trouxe para a organizao e recuperao da informao cientfica tambm colaborou para sua aceitao e uso. O tesauro possibilitou, por meio do estabelecimento de rede lgico-semntica de conceitos, maior independncia do pesquisador e maior eficcia nas buscas que necessita realizar em bases de dados. Este novo arranjo possibilitou organizar os termos e conceitos de um determinado campo e facilitar, dessa forma, o acesso informao. Um dos fatores que limitam os tesauros, entretanto, refere-se ausncia de regras de inferncia explicitamente formuladas. O modo como as relaes entre os conceitos so estabelecidas, cuja base precpua a garantia literria, bem como a estrutura de sua apresentao, possibilitam que o tesauro assuma tambm funo pedaggica. Esta funo, contudo, sempre tributria das necessidades de informao e das condies de interpretao que o usurio manifesta. Com exceo das notas de aplicao, portanto, no h indicaes explcitas sobre o ponto de vista pelo qual o conceito formulado. GT2 497

Como resultante disso, o tesauro precisa admitir alguma estabilidade do conceito para que possa operar. Espera-se que o sistema conceitual que o tesauro estabeleceu repita-se nos documentos futuros. A modelagem conceitual possibilitada pelas ontologias, pelo seu alto grau de formalizao, tende a ser mais consistente nos aspectos que envolvem a interoperabilidade, porque incorpora semntica de um modo mais formalizado, o que no significa, evidentemente, que consegue resolver todos os problemas de significao. Na condio de instrumentos de modelizao do conhecimento, as ontologias computacionais precisam envolver, alm dos aspectos cognitivos e lingusticos, os aspectos terico-filosficos. A escolha das formas de organizao (as relaes conceituais) das ontologias implica, ento, necessariamente, uma viso que se rebate, de certo modo, numa posio filosfica. Dessa forma, no se deve adotar como ponto de partida os mundos substitutos construdos dentro de modelos de software existentes. Pelo contrrio, preciso, concorda-se com Smith (2004), abordar a realidade em si, aproveitando a riqueza e a diversidade das descries cientficas possveis em face das formas de organizao reconhecidas pelas comunidades discursivas. As inter-relaes entre ontologia filosfica, ontologia computacional e representao documentria baseada em categorias de assunto tambm foram objeto desta reflexo. certo que as fronteiras entre os campos cientficos, bem como a prpria concepo de cincia, veem sendo paulatinamente dissolvidas, mas elas ainda existem e insistem. As questes sobre disciplinaridade (a aproximao da realidade por meio de um recorte possvel) e interdisciplinaridade (os espaos contraditrios decorrentes) ainda fomentam calorosos debates. Desse modo, ainda que a cincia da informao e a cincia da computao (que j fora confundida com a informtica) no cheguem a um acordo nem mesmo sobre o que informao e ainda discutam territrios, foroso aceitar: a cincia da informao, por meio da documentao, principalmente, vem desenvolvendo metodologias para a organizao da informao (os catlogos, por exemplo) e para a organizao do conhecimento (as classificaes, por exemplo), desde que isso se tornou uma preocupao humana. Por outro lado, a cincia da computao avanou consideravelmente no trato da informao sinttica (resolveu questes de fluxo e ajustou algumas propostas da catalogao para a descrio dos metadados) e desenvolveu metodologias e perspectivas interessantes para a representao e a organizao do conhecimento, como as que oferecem as ontologias e sua interface com a web semntica. Em sntese: a construo de ontologias no pode prescindir do tratamento terminolgico-conceitual, como compreendido pela terminologia e pela cincia da informao, acumulado nos referenciais tericos e nas metodologias para construo de linguagens documentrias. A construo de linguagens documentrias mais flexveis no pode ignorar o modelo de representao das ontologias, com mais predisposio para a formalizao e para a interoperabilidade. A representao do conhecimento o aspecto que une, por semelhana de propostas, a cincia da computao, por meio das ontologias, e a cincia da informao, por meio dos tesauros. Se h alguma identidade na origem da proposta, contudo, ela no existe no destinatrio, que no o mesmo. GT2 498

Os tesauros so construdos para funcionar como instrumento de representao do conhecimento e recuperao da informao em atividades de busca realizadas por seres humanos (especialistas). As ontologias so construdas para funcionar como instrumentos de representao do conhecimento e recuperao da informao em atividades de busca delegadas a agentes inteligentes. O computador (o que computa) opera, como no poderia deixar de ser, de forma mais eficaz em ambientes quantitativos de recuperao de informao, justamente porque h nestes mais previsibilidade. Comparadas as funes de representao e recuperao da informao, tem-se que a segunda apresenta mais instabilidade e um nmero maior de variveis. A relativa estabilidade atribuda representao neste caso refere-se ao fato de que esta toma como ponto de partida interesses institucionais determinados e estabelece, por este meio, o ponto de vista pelo qual o objeto ser focalizado. Na recuperao da informao, o usurio parte de alguma necessidade ou desejo de informao e navega pelas estruturas de informao em busca do modo preciso pelo qual foi organizada a informao que atenda aos seus interesses. A atividade de seleo que um usurio no determinado qualquer realiza , inerentemente, uma atividade intelectual e sempre inserida em contextos dinmicos e, por este motivo, mais difcil de ser formalizada por meio de um algoritmo. Em sntese, os sistemas de informao documentria no podem prescindir das tecnologias desenvolvidas para o aperfeioamento das ontologias, pois perderiam, dessa forma o momento histrico, como quase perderam, num sentido vago, com os metadados. preciso, ento, pens-los com as ontologias e ajustar as metodologias desenvolvidas pela cincia da computao para os objetivos da cincia da informao e incorporar os fundamentos da cincia da informao aos procedimentos da cincia da computao no que tange ao universo dos fluxos da informao e do conhecimento. Abstract: Discusses the benefits that the interfaces between terminology, philosophical ontology, and computational ontology offer to the organization of conceptual relations in the processes of knowledge representation in documentary information systems. Considers that ontologies, in any of its aspects, offer categorization systems that enable human beings organize the reality. Therefore establishes the following objectives: a) discuss the philosophical foundation of the application of ontologies based on the studies of ontological categories present in Aristotle and Kant and b) provide grants for the initial understanding of the interaction between philosophical ontology, formal ontology and documentary representation based on subject categories. Advocates a stronger linkage between the studies about ontologies with the philosophical understanding of the term. The knowledge representation is that aspect that unites, for its similar proposals, computer science, by means of ontologies, and information science, through the thesaurus, so the reflection is based on both theoretical fields. Also considering that the intersection between these fields, addressing the same object, occurs by means of the comprehension and application of subject categories, adds the philosophical studies to the theoretical foundations of the reflection. Points out, as final considerations, that the construction of ontologies cannot ignore the terminological-conceptual treatment comprehended by terminology and information science, accumulated on the theoretical references and on the methodologies to the construction of documentary languages and, by the other side, that the construction of more flexible documentary languages cannot ignore the knowledge representation modeling adopted by ontologies, with more predisposition to the formalization and interoperability. Keywords: Conceptual relations. Categories. Ontologies. Terminology. Knowledge representation. GT2 499

REFERNCIAS BENVENISTE, mile. Problemas de lingstica geral II. Campinas: Pontes, 1989. BREITMAN, Karin K.. Web semntica: a internet do futuro. Rio de Janeiro: LTC, 2005. DELEUZE, Gilles. Diferena e repetio. Rio de Janeiro: Graal, 1988. ECO, Umberto. Conceito de texto. So Paulo: Edusp, 1984. GMEZPREZ, Asuncin. Ontological engineering: a state of the art. Expert Update, v. 2, n. 3, p. 3343, 1999. GRUBER, Thomas R. Toward principles for the design of ontologies used for knowledge sharing. International Journal HumanComputer Studies, v. 43, n. 5/6, p. 907928, 1995. Disponvel em: <http://www.itee.uq.edu.au/~infs3101/_Readings/OntoEng.pdf>. Acesso em: 14 ago. 2011. GUARINO, Nicola; GIARETTA, Pierdaniele. Ontologies and knowledge bases: towards a terminological clarification. In: MARS, N. (Ed.) Towards very large knowledge bases: knowledge building and knowledge sharing. Amsterdam: IOS, 1995. p. 2532. Disponvel em: <http://www. loanr.it/Papers/KBKS95.pdf>. Acesso em: 14 ago. 2011 HJORLAND, B. Principia informatica: foundational theory of information and principles of information services. In: INTERNATIONAL CONFERENCE ON CONCEPTIONS OF LIBRARY AND INFORMATION SCIENCE, 4., 2002, Greenwood Village. Proceedings Greenwood Village: Libraries Unlimited, 2002. Disponvel em: <http://www.iva.dk/bh/Core%20Concepts%20 in%20LIS/articles%20a-z/principia_informatica.htm>. Acesso em: 14 ago. 2011. JACOB, Elin K. Ontologies and the semantic web. Bulletin of the American Society for Information Science and Technology, apr./may, p. 1922, 2003. KANT, Immanuel. Crtica da razo pura. So Paulo: Nova Cultural, 1996. (Os Pensadores). LANCASTER, F. W. Indexao e resumos: teoria e prtica. Braslia: Briquet de Lemos, 1993. LARA, Marilda L. G. Lingustica documentria: seleo de conceitos. 2009. 178 f. Tese (Livre docncia) Escola de Comunicaes e Artes, Universidade de So Paulo, So Paulo, 2009.. ______. O unicrnio (o rinoceronte, o ornitorrinco...), a anlise documentria e a linguagem documentria. DataGramaZero, v. 2, n. 6, dez. 2001. Disponvel em <http://www.datagramazero. org.br/dez01/Art_03.htm>. Acesso em: 14 ago. 2011. MAEDCHE, Alexander. Ontology learning for the semantic web. Boston: Kluwer Academic Publisher, 2002. MOREIRA, Walter. A construo de informaes documentrias: aportes da lingustica documentria, da terminologia e das ontologias. 2010. 156 f. Tese (Doutorado em Cincia da Informao) Universidade de So Paulo, Escola de Comunicaes e Artes, So Paulo, 2010. ______. Categorias e conceitos: compreenses fundamentais para a organizao da informao. In: CONGRESSO BRASILEIRO DE BIBLIOTECONOMIA, DOCUMENTAO E CINCIA DA INFORMAO, 24., 2011, Macei-AL. Anais Macei, 2011. OTLET, Paul. El tratado de documentacin: el libro sobre el libro: teora y prctica. Traduo Maria Dolores A. Garca. Murcia: Editum, 1996. POMBO, Olga. Da classificao dos seres classificao dos saberes. Leituras: revista da Biblioteca Nacional de Lisboa, n. 2, p. 1933, primavera, 1998. Disponvel em: <http://www.educ.fc.ul.pt/hyper/ resources/opombo-classificacao.pdf> Acesso em: 14 ago. 2011 RUSSELL, Bertrand. Histria do pensamento ocidental: a aventura dos prsocrticos a Wittgenstein. Rio de Janeiro: Ediouro, 2001. GT2 500

SALATIEL, Jos Renato. Peirce e Kant sobre categorias: parte I: deduo metafsica e reviravolta semitica. CognitioEstudos: Revista Eletrnica de Filosofia, v. 3, n. 1, p. 7988, jan./jun. 2006. Disponvel em: <http://revistas.pucsp.br/index.php/cognitio/article/viewFile/5478/3925>. Acesso em: 14 ago. 2011. SANTOS, Boaventura S. Um discurso sobre as cincias. 13.ed. Porto: Afrontamento, 2002. ______. Introduo a uma cincia psmoderna. 4.ed. Rio de Janeiro: Graal, 2003. SARACEVIC, Tefko. Cincia da informao: origem, evoluo e relaes. Perspectivas em Cincia da Informao, Belo Horizonte, v. 1, n. 1, p .4162, jan./jun. 1996. Disponvel em: <http:// portaldeperiodicos.eci.ufmg.br/index.php/pci/article/viewFile/235/22>. Acesso em: 14 ago. 2011. SCHWARZ, Ulf; SMITH, Barry. Ontological relations. In: MUNN, Karherine; SMITH, Barry (Eds.). Applied ontology: an introduction. Frankfurt: Ontos Verlag, 2008. p. 219-234. SMITH, Barry. Ontologies and information systems. Saarbrcken: European Centre for Ontological Research, [2002?]. Disponvel em: <http://www.ecor.uni-saarland.de/otherpublications.html>. Acesso em: 19 set. 2011. ______. Ontology. In: FLORIDI, Luciano (Ed.). The blackwell guide to the philosophy of computing and information. Malden: Blackwell, 2004. p. 155166. SOWA, John F. Building, sharing and merging ontologies. 2009. Disponvel em: <http://www.jfsowa. com/ontology/ontoshar.htm>. Acesso em: 17 set. 2011. ______. Knowledge representation: logical, philosophical, and computational foundations. Pacific Grove: Brooks/Cole, 2000. TLAMO, Maria de Ftima G. M. et al. Instrumentos de controle terminolgico: limites e funes. In: SIMPSIO LATIONAMERICANO DE TERMINOLOGIA, 2., 1992, Braslia. Anais... Braslia: Unio Latina/ IBICT, 1992. Disponvel em: <http://www.riterm.net/actes/2simposio/talamo.htm> Acesso em: 12 fev. 2010. VICKERY, B. C. Ontologies. Journal of Information Science, v. 23, n. 4, p. 277-286, 1997. VOGT, Carlos. Divulgao e cultura cientfica. ComCincia, n. 100, 10 jul. 2008. Editorial. Disponvel em: <http://www.comciencia.br/comciencia/?section=8&edicao=37&id=436>. Acesso em: 14 ago. 2011

GT2 501

COMUNICAO ORAL

INDEXAO AUTOMTICA E VISUALIZAO DE INFORMAES: UM ESTUDO BASEADO EM LGICA PARACONSISTENTE


Carlos Alberto Correa,Nair Yumiko Kobashi

Resumo: Apresentao dos resultados de pesquisa de utilizao da lgica paraconsistente em procedimentos de indexao automtica. A utilizao dessa lgica e de mtodos dela derivados, por serem flexveis, comportam estados lgicos que vo alm das dicotomias sim e no. Essas caractersticas permitem adiantar a hiptese de que os resultados da indexao podero ser melhores do que os obtidos por mtodos tradicionais. Do ponto de vista metodolgico, optou-se pela utilizao de um algoritmo para tratar incerteza e impreciso, desenvolvido no mbito da lgica paraconsistente, para modificar os valores dos pesos atribudos aos termos de indexao. O experimento foi realizado em corpus disponvel em sistema de indexao e visualizao de informaes com cdigo fonte aberto. Os resultados foram avaliados por meio de critrios e ndices embutidos no prprio sistema de visualizao e demonstram que h ganhos mensurveis de qualidade na construo das visualizaes. Confirma-se, assim, a hiptese de que a lgica paraconsistente tem aplicao promissora em indexao automtica por sua potencialidade para tratar situaes que envolvem incerteza, impreciso e vagueza. Palavras-chave: Indexao automtica. Visualizao de informao. Lgica paraconsistente. 1 INTRODUO O volume crescente dos estoques de registros externos memria humana, aumenta consideravelmente as dificuldades para a manuteno, organizao e manipulao dos dispositivos informacionais. Uma das alternativas para enfrentar esse desafio tem se ancorado na indexao automtica, processo que envolve diversas disciplinas, tais como Lingustica, Estatstica, Terminologia e diversas teorias desenvolvidas no mbito da Matemtica e da Lgica, como as teorias de tratamento de incerteza e impreciso. Cabe acrescentar que, tradicionalmente, os sistemas de recuperao de informao so o ambiente preferido para testes de indexao automtica e de visualizao de informao Neste texto, so apresentados os resultados de uma pesquisa de Indexao automtica e visualizao de informaes baseada em Lgica paraconsistente (CORRA, 2011). Antes da apresentao dos resultados sero discutidos, de forma breve, o modelo do espao vetorial e propostas baseadas em lgicas no clssicas, como tambm as propostas de visualizao grfica. 2 INDEXAO AUTOMTICA E O MODELO DO ESPAO VETORIAL O propsito principal do desenvolvimento de ndices e de resumos construir representaes GT2 502

de documentos publicados numa forma que se preste a sua incluso em algum tipo de base de dados (LANCASTER, 2004, p. 1). As pesquisas para armazenar informao se voltaram, com o tempo, para a busca de solues de indexao automtica. Os primeiros experimentos tiveram incio na dcada de 1950, com Luhn e Baxendale (LANCASTER, 2004), sendo o modelo do espao vetorial (MEV) um dos mais citados na literatura da rea. O MEV tambm utilizado em diferentes tipos de sistemas de visualizao de informaes. O MEV foi desenvolvido por Luhn e popularizado por Salton no mbito do sistema SMART System for the Manipulation and Retrieval of Text (RAGHAVAN, 1997). Ele utiliza a mesma representao tanto para os documentos de uma coleo quanto para as consultas ao sistema. Essa representao baseada no conceito matemtico de vetor. Considere-se, por exemplo, o documento D, com os termos de indexao t1, t2 e t3. No MEV atribui-se um peso para cada termo de indexao, cuja representao do documento um vetor que pode ser visualizado em espao tridimensional. O MEV pode ser representado por meio de uma matriz, conforme descrito por Salton (1989):

t1 D1 D2 D3 ... Dk w1,1 w2,1 w3,1 ... wk,1

t2 W1,2 W2,3 W3,2 ... wk,2

t3 w1,3 w2,3 w3,3 .... wk,3

... ... ... ... ... ...

tn W1,n W2,n W3,n ... wk,n

Figura 2 Matriz documentos X pesos Fonte: Adaptada de Salton (1989)

A abordagem vetorial permite que conceitos desenvolvidos no mbito da teoria matemtica de vetores sejam utilizados. Um deles o de distncia entre dois vetores. Salton e McGill (1983) consideram que o clculo da distncia entre dois vetores, que representam documentos da coleo, indica seu grau de similaridade. O clculo da distncia entre dois vetores x e y efetuado pela frmula (FERNEDA, 2003; SALTON e McGILL,1983):

onde wi,x refere-se ao peso do i-simo termo (ou elemento) do vetor x e wi,y refere-se ao peso do i-simo termo (ou elemento) do vetor y. Uma expresso de busca tambm pode ser representada vetorialmente, atribuindo-se pesos aos termos utilizados. Esse procedimento permite calcular o grau GT2 503

de similaridade entre uma consulta e os documentos da coleo. Uma vez compreendidos os aspectos bsicos do MEV, uma questo continua em aberto: como definir os valores dos pesos para os termos de indexao e para os termos de busca? Vrias critrios podem ser utilizados para definir o clculo dos pesos (SALTON; McGIL, 1983; SALTON; BUCKLEY, 1988). O mtodo mais utilizado baseado na frequncia estatstica de ocorrncia dos termos em duas instncias diferentes: o documento, individualmente e a coleo. No primeiro caso, efetua-se a contagem pura e simples do nmero de vezes em que o termo aparece no documento. Esse valor denominado tf (expresso: term frequency). No segundo, verifica-se a quantidade de documentos da coleo em que o termo ocorre, comparando-o com a quantidade total de documentos da coleo. Esta medida denominada de idf (da expresso: inverse document frequency). Nesse caso, o clculo dado pela frmula idft = N / nt, onde N o numero de documentos da coleo e nt o nmero de documentos da coleo que contm ao menos uma ocorrncia do termo t. Uma variante dessa frmula utiliza o logaritmo de base 10, ou seja: idft = Log (N / nt). Uma vez definidos os valores das instncias locais e globais do termo t, seu peso calculado como: Wt,d = tft,d x idft. 3 INDEXAO AUTOMTICA E LGICAS NO CLSSICAS As solues desenvolvidas em indexao automtica utilizam, muitas vezes, teorias para lidar com situaes imprecisas, vagas e ambguas, tais como as lgicas no clssicas. Trs problemas, ao menos, motivaram o desenvolvimento das lgicas no clssicas: (i) a identificao de certos paradoxos lgico-matemticos que alimentavam dvidas quanto validade dos princpios gerais dessas disciplinas; (ii) o surgimento de matemticas no tradicionais como, por exemplo, as geometrias no euclidianas; (iii) as situaes do mundo real que no se ajustam dicotomia verdadeiro ou falso da lgica clssica A lgica clssica foi desenvolvida com base em trs princpios fundamentais: a) identidade, que estabelece que todo objeto idntico a si mesmo; b) no-contradio que estabelece que uma proposio no pode ser verdadeira e falsa ao mesmo tempo; c) o do terceiro excludo que considera que uma proposio verdadeira ou falsa, no havendo uma terceira possibilidade. Dois exemplos de lgicas no clssicas so a lgica difusa e a lgica paraconsistente. A lgica difusa foi desenvolvida em contraposio lgica clssica, com base na teoria dos conjuntos difusos, proposta por Loft Zadeh (BOJADZIEV; BOJADZIEV, 1995). A lgica paraconsistente, por sua vez, teve seus fundamentos desenvolvidos, independentemente, pelo polons Stanislaw Jaskowiski e pelo brasileiro Newton da Costa. Podem ser citadas duas de suas principais caractersticas: (i) derroga o princpio da no-contradio; (ii) possui variantes de sua formulao original que permitem desenvolver vrios estados lgicos alm dos estados dicotmicos Verdadeiro (V) e Falso (F). 3.1 Indexao automtica e lgica difusa A teoria clssica de conjuntos e a lgica clssica so utilizadas, implcita ou explicitamente, na GT2 504

grande maioria dos sistemas de recuperao de informao (SRI) (FERNEDA, 2003) e, similarmente, nos procedimentos de indexao automtica. Os defensores da lgica difusa, por outro lado, consideram que a teoria dos conjuntos difusos pode ser empregada com sucesso para tratar a impreciso e a subjetividade inerentes aos processos de indexao, bem como para gerenciar a vagueza embutida nas consultas formuladas pelos usurios (HERRERA-VIEDMA; PASI, 2003). Bordogna e Pasi (1995) aplicaram a lgica difusa em um SRI. As autoras partiram do princpio que os documentos so organizados em partes estruturais, tais como ttulo, autor(es), palavras-chave, resumo e referncias. O papel informativo de cada termo depende da parte ou seo em que ele ocorre. Alm disso, as sees de um documento podem ter diferentes graus de importncia para cada usurio e, assim, o clculo do grau de significncia passa a depender da interveno do usurio (BORDOGNA; PASI, 1995). Outra utilizao da abordagem difusa foi efetuada por Molinari e Pasi (1996). Nesse trabalho, as autoras propem que a indexao de documentos HTML seja efetuada utilizando-se a estrutura sinttica dessa linguagem. O documento tambm dividido em sees, de acordo com as regras de construo da linguagem. Similarmente ao trabalho de Bordogna e Pasi (1995), esse modelo atribui um grau de importncia a cada seo. 3.2 Indexao automtica e lgica paraconsistente A utilizao da lgica difusa na indexao automtica estimulou esta pesquisa de uso da lgica paraconsistente. Adotou-se, neste estudo, uma de suas variantes - a Lgica paraconsistente anotada. A anotao feita com dois valores que, de agora em diante, ser referida como LPA2v, conforme utilizado por Da Costa et al. (1999). Nessa lgica, atribuem-se duas variveis a uma proposio: os graus de crena e de descrena, com valores que variam no intervalo [0,1]. Essa abordagem permite estabelecer quatro estados lgicos principais (inconsistente, verdadeiro, falso, indeterminado) e uma quantidade varivel de estados lgicos intermedirios. Os estados lgicos so estabelecidos a partir da anlise efetuada sobre os dois valores da anotao, descritos por um par (m1, m2), que representa os graus de crena e descrena atribudos a uma proposio. Dessa forma, para uma dada proposio, se os valores dos graus de crena e descrena (m1, m2), forem estabelecidos ou calculados com os valores (1.0, 0.0), o significado ser: crena total e ausncia de descrena na proposio ou, seja, seu estado lgico ser verdadeiro. De forma similar podem-se descrever outros trs estados lgicos principais: (1.0,1.0) inconsistente (crena total e descrena total); (0.0,1.0 ) falso (ausncia de crena e descrena total); (0.0,0.0) indeterminado (ausncia de crena e ausncia de descrena). Outros valores pertencentes ao intervalo [0,1] podem ser atribudos aos graus de crena e descrena, de modo a estabelecer estados lgicos intermedirios. Esses estados ls podem ser representados em um grfico, em que os eixos horizontal e vertical indicam os respectivos graus. Esse procedimento permite estabelecer descries de situaes em que os valores extremos no se aplicam, conforme a figura abaixo, chamada por Da Costa et al. (1999) de quadrado unitrio do plano GT2 505

cartesiano QUPC.

Figura 3 - Representao de alguns estados lgicos intermedirios Fonte: Da Costa et al. (1999), p 50 O grfico acima pode ser expandido traado-se alguns segmentos de reta de modo a definir, em vez de pontos intermedirios, regies de ocorrncia dos estados lgicos extremos e intermedirios. Ou seja, alm do ponto que descreve o estado extremo, tem-se uma regio que pode ser considerada a ocorrncia de um estado extremo ou intermedirio. A seguir esto listados os segmentos de reta traados e as figuras que descrevem algumas das regies que os segmentos delimitam: Segmento BD - linha limite de falsidade; Segmento DF - linha limite de inconsistncia; Segmento FH - linha limite de verdade; Segmento HB - linha limite de indeterminao.

Figura 4 - QUPC com linhas de limitao de regies caracterizao da regio do totalmente inconsistente Fonte: Da Costa et al. (1999), p. 65 e 66 Alem das regies associadas aos estados extremos, outras podem ser observadas. Elas GT2 506

descrevem estados intermedirios e tendncias que se situam entre os estados extremos definidos. A figura 5, a seguir, descreve todas as regies do QUPC. Essa configurao chamada por Da Costa et al. (1999) de QUPC de resoluo 12, pois podem ser identificadas, no grfico, 12 regies.

Figura 5 - QUPC de resoluo 12 destacando todas as regies possveis intermedirias e extremas Fonte: Da Costa et al. (1999), p. 89 Para esta ltima figura, as regies representadas so identificadas por diversas abreviaturas, cujos significados so: T Inconsistente; F Falso; ^ Indeterminado; V Verdadeiro; ^ f Indeterminado, tendendo ao Falso; ^ v Indeterminado, tendendo ao Verdadeiro; T f Inconsistente, tendendo ao Falso; T v Inconsistente, tendendo ao Verdadeiro; Qv T Quase Verdadeiro, tendendo ao Inconsistente; Qf T Quase Falso, tendendo ao Inconsistente; Qf ^ Quase Falso, tendendo ao Indeterminado; Qv ^ Quase Verdadeiro, tendendo ao Indeterminado. Da Costa et al. (1999) descrevem variveis que podem ser utilizadas como delimitadores das regies mostradas. So elas: Vscc valor superior de controle de certeza, que limita o grau de certeza prximo ao verdadeiro; Vicc valor inferior de controle de certeza, que limita o grau de certeza prximo ao falso; Vscct valor superior de controle de contradio, que limita o grau de contradio prximo ao estado inconsistente; Vicct valor inferior de controle de contradio, que limita o grau de contradio prximo ao indeterminado. Para todos os grficos anteriores essas variveis assumem os seguintes valores: Vscc = 1/2 ;Vicc = - 1/2;Vscct = 1/2;Vicct = -1/2. Essas variveis no so visveis diretamente nos grficos por serem artifcios matemticos que permitem fazer ajustes no tamanho das regies delimitadas no QUPC, de forma a restringir a sensibilidade do procedimento a certos valores lgicos. Na figura 6, a seguir, vemos variaes da figura 5, em que os valores das variveis Vscc, Vicc, Vscct, Vicct modificado.

GT2 507

Figura 6- QUPC de resoluo 12- destaque para regies com variveis delimitadoras modificadas Fonte: Da Costa et al. (1999), p. 91 e 93 No segmento direita, da figura 6 os valores das variveis delimitadoras so: Vscc = 3/4, Vicc = - 3/4, Vscct = 3/4, Vicct = -3/4. Pode-se observar a reduo no tamanho das regies extremas (verdadeiro, falso, inconsistente e indeterminado). Nesse caso, a anlise efetuada a partir dos valores de crena e descrena (m1 e m2) ser mais exigente para os valores extremos. Ou seja, o nmero de situaes em que o par m1 - m2 ser considerado verdadeiro (ou falso, indeterminado e inconsistente) ser menor do que o nmero de situaes analisadas na figura 5. No grfico esquerda da figura 6, os valores das variveis delimitadoras so: Vscc = 3/4, Vicc = - 3/4, Vscct = 1/2 e Vicct = -1/2. Pode-se ver no grfico a reduo no tamanho das regies extremas para os valores lgicos verdadeiro e falso, quando comparadas com as regies para o indeterminado e o inconsistente. Em ambas as situaes descritas nas figuras 5 e 6, o tamanho das regies intermedirias tambm modificado, significando que pode haver diferentes tolerncias para os valores intermedirios. Apesar de as figuras serem boas para visualizar o estado lgico de uma proposio, elas no so teis para fazer avaliaes de maneira contnua ou repetitiva. Nesse sentido, Da Costa et al. (1999) desenvolveram um algoritmo que permite, a partir dos valores de graus de crena e descrena, determinar o estado lgico da proposio. O algoritmo chamado de para-analisador, que permite calcular o estado lgico de um enunciado a partir dos valores de m1, m2, Vscc,Vicc,Vscct, e Vicct. 4 VISUALIZAO, SIMILARIDADE, DISTNCIA E PROXIMIDADE A Computao Grfica nasceu com o intuito de melhorar a interao humano-computador e a manipulao computacional de imagens de diversos tipos. Esses recursos so potencialmente teis para minimizar as dificuldades com os processos de Recuperao de Informao. Essas solues GT2 508

permitem conhecer melhor o espao de busca, de modo a aumentar a efetividade dos resultados porque procuram retratar a estrutura semntica global de uma coleo de documentos (BORNER; CHEN; BOYACK, 2003). Os sistemas de visualizao de apresentao de colees de documentos, de acordo com a abordagem escolhida, adotam metforas diversas. Assim, por exemplo, o sistema Infosky (ANDREWS et al. 2002) utiliza como metfora a representao de uma viso noturna do cu. Nesse sistema, as ocorrncias individuais dos documentos so apresentadas como estrelas no cu. Os agrupamentos de estrelas indicam agrupamentos de documentos similares. Por outro lado, o VxInsight (BORNER; CHEN; BOYACK, 2003) utiliza uma metfora baseada em mapas geogrficos. A tela principal do sistema exibe um agrupamento de montanhas, de altura varivel para representar agrupamentos de objetos de informao. A altura da montanha proporcional quantidade de documentos similares que formam os agrupamentos. Outro sistema com capacidade para criar visualizaes de colees de documentos o Projection Explorer PEx, desenvolvido no Instituto de Cincias Matemticas e de Computao da USP/So Carlos. O PEx utiliza pequenos crculos coloridos para representar documentos individuais de uma coleo ( PAULOVICH; OLIVEIRA; MINGHIM, 2007; PAULOVICH et al., 2008)1. Independentemente da metfora utilizada, os sistemas de apresentao de colees de documentos realizam procedimentos e clculos voltados a dois objetivos especficos: (i) o agrupamento de documentos considerados similares; (ii) a separao dos grupos de documentos dissimilares entre si. Para isso, os sistemas devem ser capazes de efetuar clculos que indiquem o grau de similaridade entre os documentos. Um dos modelos mais utilizados para este fim o MEV, descrito na seo 2. A figura 7, a seguir, um exemplo de visualizao construda com o sistema PEx. Os crculos de mesma cor indicam documentos de um mesmo assunto, todos pertencentes a uma mesma coleo de teste. Na figura, os retngulos coloridos destacam grupos de documentos que, apesar de serem de assuntos distintos, aparecem prximos na visualizao. Este efeito uma conseqncia dos critrios que o sistema usa para construir a visualizao. Nesse caso, os documentos possuem algum grau de similaridade. Nesse contexto, poder-se-ia perguntar se tal constatao seria facilmente observvel em um sistema de recuperao de informaes.

O sistema Projection Explorer pode ser obtido, gratuitamente, em http://infoserver.lcad.icmc.usp.br/infovis2/PEx.

GT2 509

Figura 7 Visualizao de documentos no Projection Explorer destaque p/ documentos de assuntos diferentes porem com algum grau de similaridade entre si Fonte: Visualizao criada, com o Projection Explorer 5 EXPERIMENTO COMPUTACIONAL DE INDEXAO COM CRITRIOS DA LGICA PARACONSISTENTE. Os testes realizados para verificar os efeitos da utilizao da Lgica paraconsistente nos procedimentos de indexao automtica consistiram na incluso do algoritmo para-analisador no cdigo fonte do sistema PEx. Optou-se por utilizar, nos testes, as colees de documentos disponibilizadas com o PEx, pois seu uso facilitaria a comparao entre as visualizaes originais e as construdas com as alteraes introduzidas no sistema. Os testes efetuados podem ser sintetizados nos seguintes passos: (1) gerar a visualizao de uma coleo de documentos com as facilidades de indexao/clculos de similaridade embutidas originalmente no PEx; (2) utilizar o algoritmo para-analisador para avaliar e redefinir os ndices e/ ou os respectivos pesos estabelecidos para os documentos da coleo; (3) obter uma visualizao da coleo a partir desses novos pesos;(4) comparar a visualizao obtida em (3) com a visualizao obtida em (1). Deve-se observar que existem diferentes mtodos que possibilitam mensurar a qualidade de uma dada visualizao. As prximas sees detalharo esses aspectos bem como os resultados obtidos. GT2 510

5.1 Colees de teste utilizadas A principal coleo de teste, constituda de 675 documentos chamada pelos criadores do PEx de CBR-ILP-IR-SON, composto pelas siglas dos assuntos dos documentos que a compem, ou seja: CBR Case-based reasoning (raciocnio baseado em casos); ILP Inductive logic programing (Programao lgica indutiva); IR Information Retrieval (Recuperao de informao); e SON Sonification (Sonificao). De acordo com Paulovich (2008), os documentos dos assuntos CBR e ILP foram retirados de peridicos dessas reas. Os documentos dos assuntos IR e SON foram obtidos por meio de buscas na Internet, classificados de maneira aproximada, de acordo com a fonte onde foram obtidos (MINGHIM; LEVKOVITS, 2007). Uma anlise preliminar da coleo foi efetuada por Paulovich (2008) e uma das concluses refere-se no homogeneidade do conjunto de documentos de IR (Information retrieval). Segundo este autor, a no homogeneidade decorre do fato de os documentos classificados para este assunto terem sido obtidos por buscas genricas na Internet, utilizando-se as palavras information and retrieval. Nesse caso, elas no so suficientes para identificar precisamente a rea. Em decorrncia, espera-se que os objetos componentes desse conjunto de documentos se apresentem, na visualizao, mais espalhados que os demais, no compondo um grupo separado e nem se misturando muito aos objetos dos outros assuntos. Outras colees foram construdas a partir da coleo original. Foram mantidas as abreviaturas dos assuntos da coleo original e, obtiveram-se as seguintes colees: CBR-ILP-IR, com 574 documentos; CPR-ILP-SON, com 496 documentos; CBR-ILP, com 395 documentos. Todas as colees so construdas a partir dos ttulos, resumos e referncias de cada documento. 5.2 Avaliao de visualizaes O PEx possui funcionalidades que permitem avaliar a qualidade das visualizaes geradas, levando-se em conta diferentes aspectos. Uma dessas tcnicas chamada de neighborhood hit. Ela objetiva analisar se, para uma prclassificao efetuada na coleo, possvel identificar na projeo ou visualizao construda, a separao entre as diferentes classes do conjunto original de dados. Assim, quanto mais separados e agrupados os pontos estiverem na visualizao gerada, de acordo com as classes originais, maior ser a preciso. Este procedimento permite avaliar, numericamente, o quanto esto destacadas, na visualizao final, as classes pr-existentes e a facilidade de encontrar limites bem definidos entre elas. O ndice neighborhood hit materializa-se por meio de um grfico que avalia a preciso de acordo com o nmero de vizinhos analisados. A figura 8, a seguir, um exemplo de como efetuada uma comparao com a utilizao do ndice citado. As curvas de diferentes cores avaliam o ndice para situaes diferentes. Nesse grfico, a situao representada pela curva vermelha considerada a pior GT2 511

de todas, pois apresenta os menores valores de preciso calculados (eixo vertical) para as quantidades de vizinhos especificadas (eixo horizontal). Analogamente, a curva azul a situao com melhor avaliao de neighborhood hit.

Figura 8 Exemplo de curvas de Neighborhood Hit Fonte Produzida com a utilizao do Projection Explorer Outro mtodo de avaliar as visualizaes consiste em utilizar ndices para medir a qualidade dos agrupamentos produzidos pelos diferentes algoritmos. Muitos desses mtodos so baseados em anlises estatsticas, utilizados na Anlise de agrupamentos (Cluster Analysis). Um dos mtodos, conhecido por coeficiente de silhueta (silhouette coefficiente) um ndice obtido numericamente. Descrito, com pequenas variaes, em Kaufman e Rosseeuw (1990) e em, Tan, Steibach e Kumar (2006), o coeficiente de silhueta um valor que se situa entre -1 (pior valor), e 1 (melhor valor). O Projection Explorer utiliza outro mtodo de visualizao, ferramenta estatstica chamada histograma de distncias. Um histograma permite observar as distribuies de frequncia de valores que ocorrem numa classe de variveis observadas. O grfico construdo a partir de dois eixos coordenados. No eixo horizontal so colocados os valores individuais da varivel em estudo, no nosso caso, as distncias. O eixo vertical apresenta a escala onde so lidos os valores relativos aos nmeros de observaes ou, mais comumente, as frequncias de classe (TOLEDO; OVALLE, 1986). Para as visualizaes de colees de documentos possvel observar a distribuio das frequncias de distncias que ocorrem para a coleo. A figura 9 a seguir, um exemplo de histograma de distncia obtido no PEx.

Figura 9 Exemplo de histograma de distancias Fonte: produzido no PEx GT2 512

No exemplo acima, pode-se observar que a maioria das ocorrncias de distncias ocorrem no intervalo [0,9;1,0]. Tambm se pode observar que existe um pico de 25000 ocorrncias para determinado valor de distncia. 5.4 Uso do para-analisador no Projection Explorer O MEV o modelo bsico utilizado para elaborar os clculos de similaridade que iro definir a apresentao final (layout) da visualizao. Nesse modelo, conforme exposto na seo 3.5, montada uma matriz de documentos - termos, que contm os pesos calculados para cada termo, de acordo com a frmula tf * idf. Essa matriz utilizada pelo PEx para efetuar os clculos de similaridade. De acordo com Salton e McGill (1983), os pesos calculados para um termo, em um dado documento, representam o grau de utilidade do termo para este documento. Para a sequncia de testes optou-se por atribuir uma penalizao para o peso do termo (ou seu grau de utilidade), de acordo com a regio do QUPC que a para-anlise efetuada indicar. Para esse procedimento foi escolhido o valor de tf, do termo, para o grau de crena e valor df para o grau de descrena. Os pesos originalmente calculados foram mantidos apenas para os termos cuja anlise indicasse a regio do totalmente verdadeiro. Os fatores de penalizao foram arbitrados considerandose uma diminuio de 0,15 em relao ao valor 1 (atribudo regio do totalmente verdadeiro), medida que a regio se afasta da regio do totalmente verdadeiro. Assim, supondo-se que o clculo do peso de um termo, por meio da frmula tf * idf, igual a 100; por outro lado, se a para-anlise indicar a regio Qv ^ (quase verdadeiro, tendendo ao indeterminado), o peso a ser atribudo ao termo passa a ser 100 * 0,85, ou seja, 85. O objetivo observar os efeitos que a alterao no peso dos termos provocar na construo das visualizaes das colees. Alm da penalizao, os testes foram efetuados modificando-se os tamanhos das regies do QUPC. Essa modificao efetivada pela manipulao das variveis Vscc (valor superior de controle de certeza), Vicc (valor inferior de controle de certeza), Vscct (valor superior de controle de contradio) e Vicct (valor inferior que limita o grau de contradio prximo ao indeterminado), conforme descrito na seo anteriormente. As regies utilizadas nos testes, e seus respectivos valores limite, so: Regio 0 (R0): Vscc = 1/2 ; Vicc = -1/2 ; Vscct = 3/4; Vicct = -3/4 Regio 1 (R1): Vscc = 1/2;Vicc = -3/4; Vscct = 3/4; Vicct = -3/4 Regio 2 (R2): Vscc = 3/4; Vicc = -3/4; Vscct = 3/4; Vicct = -3/4 Regio 3 (R3) :Vscc = 1/2; Vicc = -1/2; Vscct = 1/2; Vicct = -1/2 O procedimento anteriormente descrito, de alterar os pesos e modificar o tamanho das regies do QUPC, produz visualizaes diferentes daquelas produzidas com o clculo tradicional de similaridades. 5.5 Resultados obtidos Os resultados do experimento foram compilados para cada coleo. So apresentados os GT2 513

grficos de neighborhood hit, os histogramas de distncia e os valores dos coeficientes de silhueta obtidos nas visualizaes construdas. As curvas so identificadas pelos nomes da coleo seguidas dos sufixos: orig, para visualizaes construdas com o procedimento original do PEx; e para-Rx, para as visualizaes obtidas com o uso do para-analisador na regio Rx, onde x pode ser 0, 1, 2 ou 3, conforme descrito anteriormente. Tambm so mostradas as figuras geradas, para cada coleo. Foram destacados, em vermelho, os melhores valores obtidos para os coeficientes de silhueta. Devidos as restries de espao para esse trabalho, optamos por mostrar as regies que apresentaram melhores valores de neighborhood hit e de coeficiente de silhueta. Os histogramas de distncias das colees utilizadas indicam uma redistribuio das frequncias. Podem-se observar dois efeitos: (i) uma diminuio da concentrao de distncias, numa mesma classe, quando comparada com as visualizaes criadas com o clculo tradicional de tf-idf, ou seja, o histograma se apresenta mais espalhado e, (ii) uma diminuio no valor dos picos de frequncias. Houve diminuio dos valores mximos de ocorrncias de distncia (ou similaridade) calculados para os documentos. Coleo CBR-ILP-IR-SON Legenda de cores para esta coleo: Azul CBR (Case based reasoning) Vermelho SON (Sonification) Lima IR (Information Retrieval) Verde ILP (Inductive Logic Programing)

Visualizao

Histograma de distancias

Figura 10 Visualizao original Fonte: produzida no PEx

Coeficiente de Silhueta: - 0,058435094

GT2 514

Figura 11 Visualizao da Regio R0 do QUPC Fonte: produzida no PEx

Coeficiente de Silhueta: 0,18285953

Coeficiente de Silhueta: 0,2880726 Figura 12 Visualizao da Regio R1 do QUPC Fonte: produzida no PEx

Legenda de cores para esta coleo:

Coleo CBR-ILP-IR

Azul CBR (Case based reasoning) Vermelho IR (Information Retrieval) Verde ILP (Inductive Logic Programing)

Visualizao

Histograma de distancias

Figura 13 Visualizao original Fonte: produzida no PEx

Coeficiente de Silhueta: 0,19003317

GT2 515

Coeficiente de Silhueta: 0,65129006 Figura 14 Visualizao da Regio R2 do QUPC Fonte: produzida no PEx

Coleo CBR-ILP-SON Legenda de cores para esta coleo: Azul CBR (Case based reasoning) Verde ILP (Inductive Logic Programing) Vermelho SON (Sonification)

Visualizao

Histograma de distancias

Figura 15 Visualizao original Fonte: produzida no PEx

Coeficiente de Silhueta: 0,41561985

GT2 516

Figura 16 Visualizao da Regio R3 do QUPC Fonte: produzida no PEx

Coeficiente de Silhueta: 0,6606122

Coleo CBR-ILP Legenda de cores para esta coleo: Azul CBR (Case based reasoning) Vermelho ILP (Inductive Logic Programing)

Visualizao

Histograma de distancias

Figura 17- Visualizao original Fonte: produzida no PEx

Coeficiente de Silhueta: 0,67798316

Figura 18 - Visualizao da Regio R2 do QUPC Fonte: produzida no PEx

Coeficiente de Silhueta: 0,74633

GT2 517

5.6 Anlise dos resultados Os documentos dos assuntos IR (Information retrieval) e SON (Sonification), conforme dito acima, no apresentam o mesmo grau de pureza quando comparados com os documentos de CBR (Case-Based Reasoning) e ILP (Inductive Logic Programing), pois foram obtidos a partir de consultas na Internet, ao passo que estes ltimos foram selecionados de peridicos das respectivas reas. razovel supor que, para os documentos dos assuntos IR e SON, os termos extrados dos documentos apresentam menor grau de representatividade do que aqueles extrados para os assuntos CBR e ILP. Por outro lado, pode-se considerar que os documentos dos assuntos CBR e ILP, extrados de peridicos especializados, utilizam com maior rigor a terminologia das respectivas reas sendo portanto mais representativos. Pode-se considerar que as colees CBR-ILP-IR-SON, CBR-ILP-IR, CBR-ILP-SON so colees que apresentam em maior ou menor quantidade, certo grau de rudo. Por outro lado, a coleo CBR-ILP pode ser considerada como a que apresenta maior grau de pureza, pois foi criada com documentos de repositrios especializados. Pode-se observar, nos grficos de neighborhood hit obtidos, que o efeito de modificar os pesos dos termos mais forte nas colees que possuem, em maior ou menor grau, algum rudo (documentos classificados sem rigor). Por outro lado, tambm se pode observar que a coleo CBRILP foi aquela em que os grficos ou ficaram muito prximos da curva original (regies R0, R1 e R2), ou muito aqum da mesma (regio R3). Os documentos da coleo CBR-ILP so os documentos bem classificados e, seu quantitativo de 395. Analogamente, pode-se calcular o quantitativo de documentos rudo nas outras colees, verificando-se a diferena entre os dois tipos de documentos. Nesse caso, tm-se os seguintes valores: Coleo CBR-ILP-IR-SON: total de documentos = 675; documentos rudo = 280 Coleo CBR-ILP-IR: total de documentos = 574; documentos rudo = 179 Coleo CBR-ILP-SON: total de documentos = 496; documentos rudo = 101. Nas consideraes anteriores, observa-se que os maiores efeitos sobre o ndice de neighborhood hit foram obtidos nas colees CBR-ILP-IR-SON e CBR-ILP-IR que so, respectivamente, as colees com maior quantidade de documentos rudo. Para a coleo CBR-ILP-SON, a utilizao da para-anlise modificou os valores do neighborhood hit, mas as curvas resultantes se mantiveram, em alguns trechos, prximas da curva original. Por outro lado, para a coleo CBR-ILP, com exceo da regio R3, que se situa muito abaixo da curva original, as curvas resultantes se posicionaram extremamente prximas da curva original, ou seja, os efeitos da alterao de peso so mnimos quando comparados com a visualizao original. Essas consideraes sugerem que o procedimento de modificar os pesos dos termos de indexao est, por meio da curva de neighborhood hit, avaliando a qualidade das colees sob o ponto de vista da classificao de assuntos. Ou seja, a utilizao da para-anlise e do ndice de neighborhood hit fornece uma maneira indireta de avaliar a qualidade com que os documentos de uma coleo foram classificados. GT2 518

Alm disso, pode ser observado, nos testes realizados, uma melhora nos valores do coeficiente de silhueta dos agrupamentos produzidos pois o procedimento produz agrupamentos mais efetivos do que aqueles obtidos com os procedimentos originais do sistema. 6 CONSIDERAES FINAIS O objetivo principal desta pesquisa - verificar o potencial e os efeitos da utilizao da lgica paraconsistente em procedimentos de indexao automtica -, procurou buscar interaes entre diversas disciplinas ou campos de estudo, tais como: recuperao de informao, indexao automtica, lgicas no-clssicas e visualizao de informaes. Tal objetivo foi desenvolvido por meio de dois procedimentos bsicos. O primeiro consistiu em modificar o calculo tradicional de pesos, efetuado pelo modelo do espao vetorial. Nesse contexto, utilizou-se o algoritmo paraanalisador, desenvolvido no mbito da lgica paraconsistente, para modificar os pesos atribudos aos termos de indexao. Dessa forma, aplicou-se um mtodo desenvolvido para tratamento de situaes em que a incerteza e a impreciso so inerentes, a um processo de indexao automtica. O segundo procedimento consistiu em observar e mensurar os efeitos da modificao no clculo dos pesos em um sistema de visualizao de informao o Projection Explorer, uma vez que esse sistema utiliza o modelo do espao vetorial para determinar o grau de similaridade entre os documentos da coleo a ser visualizada. Os resultados demonstram que o uso do para- analisador permitiu ganhos quantificveis tanto nas avaliaes das visualizaes como um todo (por meio do ndice neighborhood hit), quanto na avaliao dos agrupamentos que representam as visualizaes (por meio do coeficiente de silhueta). Tambm se observaram modificaes nas distribuies de frequncia representadas nos histogramas de distncias obtidos. Os efeitos produzidos nos agrupamentos, demonstrados nos valores dos coeficientes de silhueta indicam que o uso do para-analisador, sob as condies do experimento efetuado, tem a capacidade de gerar agrupamentos mais efetivos. Esse um ponto que chama a ateno, uma vez que a formao de bons agrupamentos pode ser utilizada para aperfeioar procedimentos de recuperao de informao quando se consideram os efeitos da hiptese do cluster: de que documentos similares tendem a ser relevantes para uma questo formulada a um sistema de recuperao de informao (VAN RIJSBERGEN, 1979). Os resultados sugerem que a abordagem estatstica deve ser relativizada ou, dito de outra forma, confrontada com informao adicional. Os resultados obtidos com a introduo do algoritmo para-analisador no sistema Projection Explorer permitiram relativizar os valores dos pesos. Assim, a pesquisa indica que a atribuio de pesos aos termos que representam um documento pode ser vista como um procedimento repleto de incertezas e vagueza e, dessa forma, os procedimentos devem se apoiar em ferramentas com capacidade para o tratamento desses aspectos, como o paraanalisador. GT2 519

Para Anderson e Perez-Caballo (2001), a atribuio de pesos aos termos de indexao , muitas vezes, feita atravs de tentativa e erro, sem maiores justificativas tericas. Os resultados desta pesquisa indicam que o uso do para-analisador, como uma ferramenta que avalia a qualidade dos termos de indexao escolhidos, pode ser visto como um modo de justificar e relativizar o valor dos pesos dos termos. Ou seja, abre caminho para o desenvolvimento de uma teoria sobre a atribuio de pesos aos termos de indexao nos moldes definidos pelo modelo do espao vetorial. Alm disso, a relativizao dos pesos encontra apoio nas colocaes de Kaufman e Rousseeuw (1990), que entendem que algumas variveis, escolhidas para representar os objetos a serem agrupados so, intrinsecamente, mais importantes que outras. Pode-se concluir que a utilizao de procedimentos para tratamento de incerteza, impreciso e vagueza tem potencial para produzir ganhos mensurveis nos processos de indexao automtica. O experimento realizado mostrou o potencial positivo de utilizao do para-analisador. Contudo, no foi capaz de explicar o porqu e como ocorreram os efeitos observados. possvel afirmar, porm, que a adoo de parmetros no-dicotmicos (no-excludentes) estabelece novas possibilidades de relacionar informao. De todo modo, necessrio aprofundar os aspectos tericos do modelo do espao vetorial, os critrios de atribuio de pesos aos termos de indexao e, finalmente, a concepo e realizao de novos experimentos que capturem, com a devida preciso, os efeitos individuais do uso do paraanalisador e da lgica paraconsistente em projetos de indexao automtica. Abstract: The aim of this research is to evaluate the use of paraconsistent logic, a nonclassical logic, capable of dealing with situations involving uncertainty, imprecision and vagueness, in the procedures of automatic indexing. The use of this logic, being flexible and containing logical states that go beyond the dichotomies yes and no, permit to advance the hypothesis that the results of indexing could be better than those obtained by traditional methods. From the methodological point of view, was used an algorithm for treatment of uncertainty and imprecision, developed under the paraconsistent logic, to modify the values of the weights assigned to index terms. The tests were performed on a information visualization system, with source code available. The collections used are available in the system. The results were evaluated by criteria and indexes built in the information visualization system itself, and demonstrate measurable gains in the construction, the quality of the displays, thus confirming the hypothesis of this research. Keywords: Automatic indexing. Information visualization. Paraconsitent logic. REFERNCIAS ANDREWS, K; KIENREICH, W.; SABOL, V.; BECKER, J.; DROSHCHL, G.; KAPPE, F.; GRANITZER, M.; AUER, P.; TOCHTERMANN, K. The InfoSky visual explorer: exploiting hierarchical structure and documet similarities. Information Visualization, v. 1, n. 3/4, p. 166-181, 2002. BELKIN, N. Interaction with Texts: Information Retrieval as Information-Seeking Behavior. Proceedings of the Fifth International Symposium for Information Science, 1993. Disponvel em http://citeseer.ist.psu.edu/belkin93interaction.html. GT2 520

BOJADZIEV, G.; BOJADZIEV, M. Fuzzy sets, fuzzy logic, aplications. Singapore: World Scientific Publishing Co Pte Ltd, 1995. BORDOGNA G.; PASI, G. Controlling information retrieval through a user adaptative representation of documentos, International journal of approximate reasoning, 12, p. 317-339, 1995. BORNER, K.; CHEN, C.; BOYACK, K. Visualizing Knowledge Domains. Annual Review of Information Science and Technology(ARIST), v. 37, p. 179255, 2003 CORRA, C. A. Indexao automtica e visualizao de informaes: Um estudo baseado em lgica paraconsistente. 2011. 152p. Tese (Doutorado em Cincia da Informao) Escola de Comunicaes e Artes, Programa de ps graduao em Cincia da Informao, Universidade de So Paulo, So Paulo 2011. DA COSTA N. C.; ABE J. M.; DA SILVA FILHO , J. I; MUROLO A. C.; LEITE C. F. S. Lgica paraconsistente aplicada, So Paulo:Atlas,1999. FERNEDA, E. Recuperao de informao: Anlise sobre a contribuio da Cincia da Computao para Cincia da Informao. 2003. 147p. Tese (Doutorado em Cincia da Informao) Curso de Cincias da Comunicao, Departamento de Biblioteconomia e Documentao, Universidade de So Paulo, So Paulo 2003. HERRERA-VIEDMA, E.; PASI, G. Fuzzy approaches to access information on the web: recent developments and research trends. Proceedings of the Third Conference of the European Society for Fuzzy Logic and Technologies, 2003, p. 25-31. KAUFMAN, L.; ROUSSEEUW, P. J. Finding groups in data An introduction to Cluster Analysis. New York: John Wiley & Sons, Inc., 1990. LANCASTER F. W. Indexao e Resumos: teoria e prtica, Braslia: Briquet de Lemos, 2004. MAI, J. Analysis in indexing: document and domain centered approaches. Information Processing and Management, 41, p. 599-611, 2005. MINGHIM, R.; LEVKOWITZ, H. Visual Mining of Text Collections. Tutorial Notes. In: Proceedings of EUROGRAPHICS 2007 - Computer Graphics Forum, p. 929-1021. 2007. MOLINARI, A.; PASI, G. A fuzzy representation of HTML documents for information retreieval systems. Proceedings of IEEE International Conference on Fuzzy Systems, New Orleans, p. 8-12, 1996. PAULOVICH, F.; OLIVEIRA, M. C. F.; MINGHIM, R. The Projection Explorer: A Flexible tool for projection-based multidimensional visualization, Proc. of XX Braziliam Sumposium on Computer Graphics and Image Processing, p. 27-34, 2007. PAULOVICH, F. V.; NONATO, L. G.; MINGHIM, R.; LEVKOWITZ, H. Least Square Projection: A Fast high-precision multidimensional projection technique and its application do documet mapping. IEE Transactions on Visualization and Computer Graphics, v. 14. n. 2, March/April, p. 1-12, 2008. PAULOVICH, F.V. Mapeamento de dados multidimensionais integrando minerao e visualizao. 2008. 144p. Tese (Doutorado em Cincia da Computao) Instituto de Cincias Matemticas e de Computao, Universidade de So Paulo, So Carlos, 2008. RAGHAVAN, P. Information retrieval algorithms: a survey. Proceedings of the eight annual ACMSIAM - Symposium on Discret algorithms, Society for industrial and applied mathematics, Philadelphia, PA, USA, p. 11-18, 1997. SALTON, G. Automatic Text Processing The Tranformation, Analysis, and Retrieval of Information by Computer. New York: Addinson-Wesley Publishing Company, Inc, 1989. SALTON, G.; McGILL, M. J. Introduction to Modern Information Retrieval. New York: McGrawHill Publishing Company, 1983. SALTON, G.; BUCKLEY, C. J. Term-Weighting approches in automatic text retrieval. Information Processing and Management, v. 24, n. 5, p. 513-523, 1988. GT2 521

SILVA, M. R.; FUJITA, M. S. L. A prtica da indexao: anlise da evoluo de tendncias tericas e metodolgicas. Transinformao, 16(2), p.133-161, mai/ago 2004. TAN, P.; STEINBACH, M.; KUMAR, V. Introduction to Data Mining. Boston: Pearson Education Inc, 2006. TOLEDO, G. L.; OVALLE, I. I. Estatstica Bsica. So Paulo: Editora Atlas S.A., 1986. VAN RIJSBERGEN, C. J. Information retrieval. London: Butterworths, 1979.

GT2 522

COMUNICAO ORAL

A TEORIA CLSSICA DE CATEGORIZAO E OS PRINCPIOS CATEGORIAIS DE RANGANATHAN: UMA ANLISE TERICA


Alessandra Rodrigues da Silva e Gercina Angela Borem Oliveira Lima Resumo: A categorizao constitui-se na biblioteconomia e cincia da informao (BCI) como uma ao intrnseca organizao dos registros do conhecimento e constitui a temtica central deste trabalho. Dada importncia dos enunciados de Ranganathan e a relevncia dos escritos de Aristteles a estruturao do conhecimento no Ocidente, objetiva-se neste trabalho descrever ambas as propostas categoriais e delinear pontos convergentes entre estas que constituem, especialmente a primeira citada, um marco na teoria da classificao da BCI. Para tanto, fez-se uma anlise terica das estruturas categorias de ambos os estudiosos mediante levantamento bibliogrfico. Considera-se que por mais que o propsito de criao destas propostas categoriais seja distinto, j que Aristteles trabalhou com os seres e Ranganathan com os registros do conhecimento, a percepo do que constitui a estrutura ranganathiana visivelmente inspirada nas categorias aristotlicas ainda que se verifiquem alguns embates, sobretudo no delineamento do par substncia/personalidade. Palavras-chave: Categorizao. Categorias. Teoria clssica de categorizao. Classificao facetada. 1 INTRODUO A categorizao o processo cognitivo de compreenso das caractersticas dos objetos por critrios de similitude ou dessemelhana constitui-se na biblioteconomia e cincia da informao (BCI) como uma ao intrnseca organizao dos registros do conhecimento. No mbito terico, a lgica categorial apontada como a mais influente na BCI e a matriz, por quase dois mil anos, para trabalhos em diversas reas do conhecimento a teoria clssica de categorizao, idealizada pelo filsofo grego Aristteles. Vrios estudiosos da BCI a visualizam em consonncia com os trabalhos realizados pelo bibliotecrio indiano Shiyali Ramamrita Ranganathan (1892-1972), em especial as categorias fundamentais por ele propostas, expressas pelo acrnimo PMEST (personalidade, matria, energia, espao e tempo). Ranganathan elencou critrios metodolgicos para a categorizao na BCI, o que o faz ser visto como um dos nomes mais expoentes, no sculo XX, na teoria da classificao. Aps a divulgao de seus trabalhos, ocorreu uma reestruturao nas pesquisas da rea e vrios estudiosos e grupos se debruaram sobre o que constitui os princpios categoriais ranganathianos. Contudo, Ranganathan no formalizou explicitamente1 em nenhum de seus textos a derivao dos princpios categoriais que props.
1 Ranganathan cita Aristteles nos Prolegomena to Library Classification, contudo o faz de maneira genrica, no aborda as categorias do estagirita e nem menciona o embasamento das categorias fundamentais naquelas propostas por Aristteles.

GT2 523

Apresenta-se, mediante as afirmaes mencionadas, a categorizao na BCI como a temtica central deste trabalho e, dada a importncia dos enunciados de Ranganathan, bem como a relevncia de Aristteles a estruturao do conhecimento no Ocidente, objetiva-se descrever ambas as propostas categoriais e delinear pontos convergentes entre estas que constituem, especialmente a primeira citada, um marco na teoria da classificao da BCI. Para tanto e, mediante o nmero restrito de estudos tericos recentes sobre a categorizao na BCI (GUIDO BARITE, 1998), optou-se pela abordagem exploratrio-descritiva viabilizada mediante o levantamento bibliogrfico na BCI2 e reas correlatas. 2 A TEORIA CLSSICA DE CATEGORIZAO A teoria clssica de categorizao foi a que teve maior influncia no Ocidente, em quase dois mil anos. Suas origens remontam Grcia Antiga, nos escritos de Aristteles (ca. 384/383 322 a.C.), filsofo nascido em Estagira, na Macednia. Discpulo de Plato, em Atenas, por cerca de vinte anos, Aristteles escreveu sobre vrias reas do saber, como a metafsica, a filosofia, a poltica, a tica, a psicologia, a zoologia, a botnica, as artes, entre outras. A extensa obra de Aristteles, baseada na de Plato, tanto coincide quanto diverge desta. Aristteles contesta alguns pontos dos escritos de Plato, como a dualidade do mundo em sensvel e inteligvel, prope a unio do mundo em coisas reais de nossa experincia sensvel atravs do hipojimenos, ou seja, a substncia (GARCA MORENTE, 1967). Sua lgica pode ser vista como um instrumento de acesso realidade e tida como o realismo aristotlico. Aristteles foi o filsofo pioneiro no estudo das categorias no sentido em que se conhece na atualidade. Antes de seus trabalhos, no existia uma abordagem filosfica ou tcnica para as categorias (MORA, 2004). As demonstraes do estudioso sobre o assunto serviram como fundamento para basicamente todos os seus trabalhos, em especial aqueles voltados para a ontologia. Em seu tratado Categorias, primeiro da srie dedicada lgica na obra rganon, Aristteles trabalha com as categorias ou predicveis (de predicaere = atribuir). As categorias aristotlicas constituem as dez unidades ditas pelo autor como aquelas que esto fora de toda a combinao; refletem a reunio das expresses sem ligao e, por si s, no podem ser tidas como verdadeiras ou falsas. Para Aristteles, as categorias exprimem diferentes sentidos do ser (ARISTTELES, 2001, p. 83). As categorias consistem em:
Classes gerais em que, segundo ele [Aristteles], [pode-se] situar, ordenadamente, as idias que temos das coisas e que constituem os dez gneros supremos, as dez essncias mais gerais [...] as categorias so fatos que constatamos nas coisas, quando as examinamos. So as principais entidades envolvidas na estrutura da realidade, modos de ser a serem reconhecidos, formas de existncia, que compe a existncia de todas as coisas (PIEDADE, 1977, p. 10-11, grifos no original).

2 Este texto corresponde ao percurso investigativo terico da dissertao de mestrado apresentada em dezembro de 2010 na ECI/ UFMG. A pesquisa mencionada possui ainda uma parte emprica que no retratada neste texto, aos interessados sugere-se a leitura: SILVA, A. R. Estudos dos princpios de categorizao na biblioteconomia e cincia da informao: Ranganathan entre a teoria clssica e a abordagem cognitiva contempornea. 193 f. Dissertao (Mestrado em Cincia da Informao) Escola de Cincia da Informao, Universidade Federal de Minas Gerais, Belo Horizonte, 2010.

GT2 524

Alguns compiladores das obras aristotlicas apresentam variaes na quantidade das categorias, o prprio Aristteles assim o fez em algumas obras (Tpicos listagem de 10 categorias, Physica listagem de oito categorias). Isto parece dar a entender que Aristteles no considerava a lista das categorias como fixada de uma vez por todas e que, em princpio, se podia descobrir que uma categoria era redutvel outra [...] (MORA, 2004, p. 416). Optou-se, por estudar a viso que aborda as dez categorias a seguir indicadas: QUADRO 1 As categorias fundamentais de Aristteles Categorias Substncia Quantidade Qualidade Relao Tempo / Data / Durao Lugar Ao Paixo / Sofrimento Maneira de ser / Estado Posio Exemplos Homem, cavalo, pedra Duas varas, grande, dois quilos Branco, azul, virtuoso Duplo, meio, mais pesado O ano passado, ontem, 1982 Aqui, Brasil, no Liceu Amando, correndo, falando Derrotado, cortado Saudvel, febril, calado Horizontal, sentado, deitado, em p, invertido

Fonte: Adaptao dos textos de PIEDADE, 1977; ARISTTELES, 2001; ARANALDE, 2009.

Garca Morente (1967) expe que Aristteles, ao abordar as categorias, o fez para trabalhar com o problema da estrutura do ser e que esta estrutura est relacionada tanto ordem lgica quanto ao sentido ontolgico. Ambas as perspectivas foram abordadas nos escritos de Aristteles, sendo a primeira retratada no tratado Categorias e a segunda abordada, especialmente, nos quatorze livros da Metafsica3. Assim, apresenta-se as categorias pela obra rganon, mas, na teoria da substncia, apropria-se de algumas consideraes ontolgicas. Garca Morente expe que: Do ponto de vista lgico, [Aristteles] chama-as predicveis ou predicamentos: so os atributos mais gerais que se podem fazer na formao de juzos. Do ponto de vista ontolgico considera-as como as formas elementares de todo ser, como aquelas formas que, impressas na matria, constituem o mnimo de forma necessrio para que o ser seja. (GARCA MORENTE, 1967, p. 105) Para Aristteles, a categoria bsica primria a substncia. O estagirita afirma que o ser tem muitos significados, dos quais a substncia no s o principal, mas at mesmo o fundamento de todos os outros (ARISTTELES, 2001, p. 42, grifos do original). Sem a substncia, no possvel
3 Livro de Aristteles que rene escritos sobre a fsica, meta significa depois e tambm remete ideia de sobre (DAHLBERG, 1992).

GT2 525

existir a qualidade, a maneira de ser ou qualquer outro atributo. Garca Morente, neste sentido, declara que: A substncia a primeira categoria que le [Aristteles] enumera na lista: o ponto de vista no qual nos situamos para dizer que algo : este homem, este cavalo, este peixe. Quando dizemos que algo isto ou aquilo, aquilo que , ento consideramos este algo como uma substncia e o que dele dizemos isto ele. (GARCA MORENTE, 1967, p. 104) Da substncia, enquanto ser a priori, pode-se predicar as outras categorias, o muito e o pouco. Aranalde (2009) intitula essa derivao como uma relao parasitria entre as demais categorias com a substncia. Estas se constituem a partir da substncia, so visualizadas como um acidente desta categoria primordial. Do ser que existe, que real, pode-se afirmar que grande ou pequeno, que possui dois ou setenta quilos, ou seja, pode-se analis-lo sob a tica da quantidade. Um ser pode tambm ser visto sob o olhar daquilo que o qualifica, ou seja, se azul, se feio, se ignbil, se amargo. Dessa forma, determina-se aquilo que Aristteles designou como a qualidade dos seres. Pode-se predicar os seres uns em relao aos outros: aquele que se constitui como mais pesado, menor do que outro, igual. Aristteles assim designou a categoria da relao. Tm-se os pontos de vista do lugar e tempo aplicados aos seres: de um ser que existe, podese afirmar que est aqui ou l, que vive em Atenas ou em Manaus, bem como pode-se afirmar desse ser quando ele , quando deixa de ser, quando foi. Pode-se dizer que agora e continua a ser ou que deixou de ser (GARCA MORENTE, 1967, p. 105). possvel dizer o que esse ser que existe faz, ou seja, qual a ao que este ser executa. Dizse que o homem est amando, que um machado cortante, que uma borboleta voa. Pode-se afirmar, ainda, do que este ser padece, do que ele sofre: a rvore cortada, o homem derrotado. D-se o nome de paixo a esta categoria. Outras duas categorias foram elencadas por Aristteles: a maneira de ser e o estado. A primeira se refere quilo que o ser no momento, e a segunda ao estado como est. Segundo Reale (ARISTTELES, 2001, p. 74-75), Aristteles, aps propor as dez categorias (nmero perfeito), deve ter notado que as duas ltimas no tm relevncia ontolgica a ponto de motivar uma distino, sendo redutveis a outras. Este pensamento ratificado por Garca Morente (1967), que associa isso ao fato de Aristteles as ter omitido em algumas passagens. Moss (1964) prope que cada uma das categorias representa termos gerais ou abstratos derivados de interrogaes simples como: O qu (substncia)? Qual a grandeza (quantidade)? Que tipo de coisa (qualidade)? Relacionado a qu (relao)? Onde (espao)? Quando (tempo)? Em qual posio (estado/posio)? Em que circunstncia (condio)? Qual a ao (ao)? O quo passivo (paixo)? Reale assevera que a noo de ser exposta nas categorias no s se difere no mbito da substncia, mas tambm o ser de cada uma das demais categorias se difere entre si. As figuras das categorias so GT2 526

vistas por Reale (ARISTTELES, 2001) como os significados primeiros e fundamentais do ser: so a distino originria sobre a qual se apia necessariamente a distino dos significados ulteriores. Aristteles afirma que tudo o que h em todo o ser das categorias se deriva do ser da substncia, ou seja, fundamenta-se nesta. Torna-se oportuno descrever o que o estagirita designa como substncia. Logo, as indagaes Quem existe? A substncia. E a substncia, o que ? So trabalhadas no prximo tpico. 2.1 A SUBSTNCIA ARISTOTLICA O ser que possui existncia metafsica plena a substncia primeira, que sempre vista sob a tica individual. Apesar de a listagem de categorias servir de insumo compreenso dos seres, a delimitao da substncia serve ao entendimento individual destes. Aristteles procurou trazer a noo ideacional proposta por Plato ao mundo sensvel e inteligvel, ou seja, a realidade. Esse mundo, para Aristteles, est perfeitamente sistematizado, no deixa nenhum resqucio a nada irracional, a nada incompreensvel, e se constitui por uma magnfica coleo de substncias (GARCA MORENTE, 1967). Assim, a substncia, enquanto elemento fundamental constituio dos seres, passvel de compreenso, mediante sua inteligibilidade. O que constitui a substncia para Aristteles refere-se ao entendimento de que:
O ser tem mltiplos significados, dos quais o de substncia no s o principal, mas at mesmo o fundamento de todos os outros (REALE, [tradutor e comentador de ARISTTELES, 2001], p. 106). [...] o que o ser, equivale a este: o que a substncia (...); por isso tambm ns devemos examinar principalmente, fundamentalmente e, por assim dizer, exclusivamente o que o ser neste significado (ARISTTELES, 2001, p. 42). A substncia para Aristteles aquilo que existe, porm no somente aquilo que existe, mas aquilo que existe em unidade indissolvel com o que , com sua essncia, no somente com sua essncia, mas com seus acidentes (GARCA MORENTE, 1967, p. 106).

Dessa forma, a noo que a substncia adquire se reflete em trs elementos: 1) a substncia em si, 2) a essncia e, tambm, 3) o referente ao acidente. A substncia em si corresponde ao elemento a priori, o quid descrito por So Toms de Aquino (GARCA MORENTE, 1967), isto , ao sujeito da proposio. A essncia se refere soma dos predicados que se pode derivar da substncia. Sob esta tica os predicados podem ser inerentes constituio da substncia, concebidos como a essncia em si, ou ainda podem se configurar como complementares, de maneira que se algum deles faltar substncia, no comprometem que esta seja o que realmente , designados como acidentais. Dessa forma, a substncia se configura como a soma dos atributos essenciais e daqueles acidentais que constituem o ser. Reale (ARISTTELES, 2001, p. 98) expe cinco caractersticas definidoras da substncia: 1) o fato de ser substrato de inerncia e de predicao dos outros modos do ser; 2) ser um ente capaz de subsistir separadamente do resto, de modo autnomo; 3) a necessidade de ser algo determinado; 4) a caracterstica intrnseca da unidade: no pode ser substncia um agregado de partes; e 5) o ato e a atualidade: s ser substncia o que ato ou implica essencialmente ato, e no o que mera GT2 527

potencialidade. As caractersticas citadas por Reale trazem tona um par de conceitos que configuram a substncia aristotlica, a saber: a matria e a forma. A matria, em Aristteles, corresponde quilo de que algo constitudo. Essa afirmao no se restringe ao carter material, mas a quaisquer coisas que venham a constituir um ser. Garca Morente (1967, p. 97) exemplifica a matria assim: uma tragdia uma coisa que fez squilo ou que fez Eurpedes, e essa coisa feita de palavras, de logoi, de razes, de ditos dos homens, de sentimentos humanos; e no feita de matrias no sentido que do palavra matria os fsicos de hoje. J a forma recebe duas acepes: uma voltada noo geomtrica do termo, como a figura dos corpos, entendimento este mais vulgar; e a outra, como aquilo que faz com que a coisa seja o que , tanto no mbito material, quanto no imaterial. Aristteles acredita que cada coisa possua a forma que deva ter, a forma define a coisa (GARCA MORENTE, 1967, p. 98). Na forma, encontra-se o telos do ser, ou seja, a finalidade a que se destina. A matria e a forma constituem um conjunto harmnico e indivisvel, no se podendo afirmar que uma corresponda existncia e a outra essncia. O que se pode considerar, to somente, que a coisa advm a ser aquilo que porque sua matria informada, plasmada, recebe forma, e uma forma a que lhe d sentido e finalidade (GARCA MORENTE, 1967, p. 98). A matria e a forma estabelecem uma relao esttica, contemplada desde a eternidade metafsica dos seres. Aristteles no somente elencou as categorias para o conhecimento das entidades, como tambm, por meio de sua lgica, descreveu critrios para uma teoria de categorizao. A intitulada teoria clssica de categorizao (ou teoria aristotlica) descrita a seguir. 2.2 A noo de categorizao na teoria clssica O modelo clssico de categorizao tambm nomeado como teoria dos atributos definitrios dos conceitos embasa-se na noo de reconhecimento (JACOB, 2004). Assim, um conceito pertence determinada categoria se compartilhar um conjunto de caractersticas essenciais rgidas e bem delimitadas com os demais membros desta categoria. Cada uma dessas caractersticas necessria ao delineamento dos conceitos que a compem, e todas so conjuntamente suficientes para algo ser identificado como um exemplar da categoria (EYSENCK; KEANE, 2007). Os limites entre as categorias so ntidos, um membro ou no o princpio do tudo ou nada- reconhecido como integrante, e no h uma escala de representatividade dos objetos da categoria (tipicidade), j que todos compartilham as mesmas caractersticas. A experincia de mundo dos indivduos, no modelo clssico, se d por categorias predeterminadas, ou seja, no necessria a criao de novas categorias para a classificao dos objetos, h o reconhecimento destes no universo de conhecimentos a priori que os indivduos possuem. Os objetos possuem uma relao de herana que se consolida mediante a estrutura hierrquica, logo, os conceitos mais especficos possuem as caractersticas daqueles que lhes so superiores, e GT2 528

assim sucessivamente. Duas definies so especialmente relevantes na interpretao da teoria clssica: a intenso e a extenso. A primeira definida como o conjunto das caractersticas representadas por um termo geral (LALANDE, 1999, p. 582). Alguns estudiosos a intitulam como compreenso, pois, de certa forma, compreende aquilo que identifica um objeto. J a extenso pode ser apreendida como [...] o conjunto dos objetos (reais ou ideais, concretos ou abstratos) aos quais se aplica um elemento de conhecimento [...] (LALANDE, 1999, p. 373). Dessa forma, a intenso de uma categoria na teoria clssica inversamente proporcional extenso da mesma, pois na medida em que uma aumenta, isso se reflete na outra em sentido contrrio. Conforme Jacob (2004), esta estipulao a fonte do poder explicativo da teoria clssica, o que lhe concede uma explanao simples e elegante tanto para a representao de estruturas cognitivas externas como para o significado semntico dos conceitos. uma abordagem objetiva, que reduz incertezas, trabalha com o que observvel e permite o estabelecimento de padres estveis. Caracterizada a teoria clssica, muitas foram as crticas e falhas a ela atribudas, o processo tpico reserva-se a exposio destas. 2.3 Incoerncias no modelo clssico: omisses na teoria ou mau uso? At aproximadamente a dcada de 1970, a teoria clssica no havia sido submetida a crticas fundamentadas sob uma abordagem sociocognitiva. A partir dos trabalhos de Eleonor Rosch, psicloga cognitivista da University of Berkeley, foram tecidos elementos sobre as omisses do modelo clssico. O olhar aqui posto sobre estas essas omisses delineado sob duas perspectivas: as falhas na teoria em si, como tambm os erros ao utiliz-la. As primeiras so visualizadas sob a abordagem das cincias cognitivas, j o segundo ponto visto sob o amparo dos estudos da BCI, em especial, os de Shera. Dentre as falhas apontadas teoria clssica, um quesito que se sobressai a ausncia de tipicidade dos objetos que compem as categorias. Estudos realizados por Rosch e Mervis (1975) apontam que existe um gradiente de tipicidade inerente a cada categoria, em que existem membros que melhor representam a categoria se comparados com outros pertencentes mesma, que esto em posio mais perifrica. Dessa particularidade, infere-se outra relacionada aprendizagem dos conceitos: os exemplares vistos como mais tpicos de uma categoria so recordados com maior facilidade que os menos tpicos, e a aprendizagem dos primeiros se d de forma mais rpida do que com os segundos. Percebe-se que, por excluir o gradiente de tipicidade dos conceitos, o modelo clssico restringe sua aplicao, j que este elemento facilmente percebido em determinadas categorias, sobretudo, de conceitos naturais. Sobre os limites rgidos e predeterminados das categorias, Eysenck e Keane (2007) apresentam estudos que indicam forte influncia do contexto no delineamento dos conceitos. Como mencionado por Shera,
a habilidade de nosso crebro estabelecer padres em resposta a uma sensao que d realidade ao nosso meio ambiente. Assim, a rede do corpo, [...] engrena com a rede de vida sobre ns, particularmente com a rede da estrutura social. (SHERA, 1957, p. 21, grifou-se).

GT2 529

Desta maneira, pode-se afirmar a inviabilidade de se determinar todos os conceitos que integram uma categoria a priori, j que existem aqueles de carter mais flexvel, com um conjunto alternativo de atributos, que oscilam conforme a realidade de mundo do indivduo. J h algumas dcadas de anlise, se percebem falhas na definio das caractersticas de muitos conceitos, o que remete ao fato de que alguns destes simplesmente no possuem atributos definitrios. O filsofo austraco Ludwig Wittgenstein (1889-1951), na segunda fase de seus estudos, ao tratar de categorias lingusticas como a dos jogos, sugere que existem parecenas entre os membros de uma famlia (vistos aqui como os registros do conhecimento), mas no o compartilhamento obrigatrio de um grupo de caractersticas. Um exemplo clebre de suas crticas o conceito de jogos: qual o atributo necessrio sua definio? Existe uma multiplicidade de elementos que os caracterizam podem ser de mesa, envolver um ou mais jogadores, utilizar bolas, mas quase nenhum atributo consegue abranger a todos os jogos. Logo, no se pode enunciar que todos os tipos de conceitos possuam caractersticas estanques como prope o modelo clssico, visto que isso pode se aplicar a alguns tipos, mas no a todos. Sob a perspectiva das classificaes bibliogrficas, Shera (1957) enuncia que estas foram calcadas na lgica aristotlica, sobretudo no que tange estruturao hierrquica. O pesquisador reflete sobre as falhas no modelo, mediante a afirmativa de Alfred North Whitehead sobre a lgica aristotlica: a matriz frtil das falcias. Contudo, Shera (1957, p. 27) aponta uma perspectiva diferenciada das omisses relacionadas teoria clssica, ao enunciar que o erro no se apresenta, [...], no ato de classificao como um processo mental, mas sim, no seu mau uso. Para Shera (1957), exigiu-se da classificao o que ela no poderia proporcionar: um padro universal de conhecimento, olvidando-se que, apesar de o teor de pensamento existente nos registros do conhecimento se aproximar daquele dos indivduos, inclusive dos usurios de um sistema de recuperao de informao, ainda h uma distncia imensa entre estes, seja pelo quesito temporal, seja pelas nuances sociocognitivas que delineiam cada indivduo. Shera no condena os bibliotecrios por isso, pois acredita que a falcia se assenta, claro, no fato de que uma estrutura hierarquizada apenas um padro de pensamento num universo de padres infinitos, e a semelhana para uma pessoa pode ser a diferena para outra, e o que para algum uma associao lgica ou racional para outro pode ser ilgico e irracional (SHERA, 1957, p. 26). Isso no faz com que Shera (1957) desacredite nos padres e sugira o caos para a organizao documental. Ao contrrio, o estudioso caracteriza a tendncia de sistemas voltados para conceitos, ou seja, que se tratem os registros do conhecimento conforme unidades de conhecimento e mediante a sua categorizao. Em continuidade ao que prope neste texto e devido aceitao quase unnime do marco divisrio na teoria da classificao da BCI estipulado por Ranganathan, apresentam-se, a seguir, os estudos relativos categorizao realizados pelo mesmo.

GT2 530

3 OS PRINCPIOS CATEGORIAIS DE RANGANATHAN Shiyali Ramamrita Ranganathan (1892-1972) um dos nomes mais expoentes da biblioteconomia mundial. Nascido em um distrito de Madras, na ndia, e pertencente casa dos brmanes, Ranganathan estudou matemtica em nvel de graduao e de ps-graduao. Foi aprovado em concurso para bibliotecrio na Universidade de Madras, em 1924, sendo que, no ano seguinte, partiu para Londres, para realizar estudos de ps-graduao em biblioteconomia sob a orientao de W. C. Berwick Sayers (NAVES, 2006). Naves (2006) o aponta como um parttern maker designao dada a pessoas que dedicam suas vidas a estudos e alcanam generalizaes que transcendem limitaes de espao e tempo, isto , tornam-se perenes. Assim, Ranganathan, foi tido como o estudioso que conferiu bases tericas slidas aos estudos da BCI . Sua extensa obra corresponde a cerca de cinquenta livros, com estudos que se direcionam desde o plano epistemolgico, com a noo de conhecimento, s atividades de organizao do conhecimento, mediante proposies inovadoras na teoria da classificao. Ranganathan foi extremamente influenciado pelas culturas brmane, chinesa e pela astrologia (SEPLVEDA, 1996). Alm disso, dado que chegou a especializar-se em lngua inglesa, perceptvel a miscigenao dos costumes orientais com os preceitos vitorianos em algumas de suas obras. Contudo, a influncia mais perceptvel nos escritos de Ranganathan a da lgica aristotlica. Naves (2006, p. 38, grifou-se) aponta que [Ranganathan] influenciado pelos ensinamentos de Sayers, calcados na teoria da classificao com base na lgica aristotlica, partiu para uma revoluo no delineamento de esquemas de classificao. Esta revoluo inquestionvel, vista sobremaneira pela proposio das categorias fundamentais, mas que, como salienta Moss (1964), possui origens longnquas, especificamente na Grcia Antiga, dada a semelhana dos estudos de Ranganathan com as categorias originais propostas por Aristteles. Piedade (1977) corrobora desse entendimento e menciona que a classificao facetada ou analtico-sinttica proposta por Ranganathan absorve as categorias aristotlicas no mbito das variadas relaes que permite entre os assuntos, desencontrando-se das propostas at ento existentes no mbito da BCI, que expunham a dicotomia da rvore de Porfrio. Portanto, na BCI, pode-se ratificar a derivao aristotlica nos escritos de Ranganathan. Os olhares destes estudiosos se deram por motivaes distintas: Aristteles propunha uma anlise ontolgica, voltada aos seres, j Ranganathan debruou-se nos registros do conhecimento as chamadas categorias do classificar, conforme Aranalde (2009), vistas aqui no somente como o classificar, mas sim como as categorias para se entender e representar os registros do conhecimento. 3.1 A noo de conhecimento e o plano das ideias Uma das contribuies fundamentais de Ranganathan refere-se ao questionamento de como o conhecimento humano formado. Para tanto, o estudioso prope que o conhecimento corresponde ao universo de ideias, e que estas so o resultado do pensamento, da reflexo, da imaginao e da intuio (RANGANATHAN, 1967, p. 81). O universo do conhecimento em Ranganathan algo GT2 531

dinmico e contnuo, em crescimento constante. Ao propor que a fonte da atividade classificatria estava no universo do conhecimento, Ranganathan rompe com a viso dominante da rvore dicotmica de Porfrio e apresenta a noo da policotomia ilimitada de conhecimento, representada pela rvore baniana espcie de figueira indiana (NAVES, 2006), que possui vrios troncos secundrios ligados ao tronco original. A rvore baniana representa uma metfora da possibilidade infinita de relacionamentos entre os assuntos e o crescimento contnuo destes, em que a evoluo de um assunto serve de estmulo a outro, em uma espiral infinita No ano de 1933, Ranganathan apresentou a Colon Classification, tambm intitulada de classificao facetada. Esta classificao prope, mediante o mtodo hipottico-dedutivo, que entre dois pontos h um nmero infinito de assuntos e que esses devam ser combinados pelo bibliotecrio quando preciso. Para Dahlberg (1978), a classificao facetada pode ser visualizada como um sistema de conceitos, j que as facetas e seus elementos se refletem nas categorias. Um dos grandes pontos da Colon Classification a proposio de trs planos de trabalho para a classificao:

O plano das idias a mente o local de origem das idias; o plano verbal aps a formulao das idias, vem a capacidade de desenvolver uma linguagem articulada; o plano notacional as palavras so traduzidas para smbolos (letras e nmeros) que formam a notao. (NAVES, 2006, p. 42).

O primeiro, o plano das ideias, tido como superior por Ranganathan, j que se relaciona com o trabalho da mente e possui uma noo at mesmo exotrica, pois o bibliotecrio o afirma ser invisvel, tal como Deus (RANGANATHAN, 1967, p. 335). um plano a priori, em que os conceitos so percebidos antes de quaisquer contatos com os planos verbal e notacional. O plano das ideias aquele em que se encontra a estratgia de classificao cristalizada na elaborao das categorias fundamentais (ARANALDE, 2009, p. 99). Feita esta apresentao, avana-se ao estudo da estrutura PMEST de Ranganathan. 3.2 As categorias fundamentais de Ranganathan Ranganathan, na obra Prolegomena to Library Classification (1967), afirma que no se podem separar as categorias fundamentais (personalidade, matria, energia, espao e tempo) e que elas implicam em cinco (e somente cinco) expresses. Aranalde (2009) aponta que Ranganathan, ao propor as cinco categorias, partiu do entendimento de que a anlise precisa parar em um ponto firme, uma frmula bsica e inicial para se compreender o universo infinito de conhecimentos existentes. E, ao questionar a quantidade de categorias fundamentais, acrescenta:
Ranganathan (1967) afirma que qualquer pessoa tem total liberdade para formular o nmero de categorias que quiser, desde que elas sejam empiricamente testadas. Para tanto, sugere que se classifiquem alguns milhares de artigos: se os resultados forem satisfatrios, o novo postulado pode ser aceito. Ou seja, ressalta o critrio da utilidade [...]. (ARANALDE, 2009, p 100-102)

Cabe recordar que o nmero de categorias proposto para a anlise dos registros do conhecimento, GT2 532

conforme Barit (1998), aumenta em razo inversa ao grau de generalidade de aplicao que se pretenda dar s mesmas. Assim, o princpio da utilidade (um dos cnones do Plano das Ideias) empregado, j que no h uma quantidade de categorias vista como adequada, e sim a referncia utilidade que estas venham a alcanar na proposta classificatria que se prope. Ranganathan restringe o uso dessas categorias ao universo classificatrio, s facetas dos assuntos dos registros do conhecimento, resguardando-se de quaisquer anlises dessas nos quesitos da filosofia (metafsica ou fsica). Informa ainda que o significado de categorias fundamentais, em um dicionrio, no remete ao que elas realmente possam ser. A definio dessas categorias s pode se dar por enumerao. Aranalde (2009) acredita que elas podem ser apenas supostas, e no objetos de definies. Sob essa perspectiva, almeja-se, a seguir, enumerar proposies significativas para as categorias fundamentais de Ranganathan, sabendo-se da impossibilidade de trazer definies precisas, j que o prprio Ranganathan no o fez em seus estudos. Tempo - A categoria tempo vista por Ranganathan como aquela de menor dificuldade em sua identificao. Talvez, por corresponder noo usual que se faa de tempo no cotidiano, vinculada a aspectos cronolgicos. Os seguintes exemplos ilustram esta categoria: dia, noite, milnio, sculo. Espao - O espao, tal como o tempo, corresponde ao conhecimento geral que se tem sobre este conceito, remetendo ao aspecto espacial geogrfico dos assuntos analisados. Ranganathan o exemplifica com conceitos amplos como a superfcie da terra e tambm com outros mais especficos como: continentes, pases, cidades. Tanto o tempo quanto o espao recebem tratamento anlogo pelos estudiosos da teoria da classificao na BCI. Energia - A energia a categoria que remete ao presente nas coisas. Pode tambm indicar reaes, processos, atividades, tratamentos, operaes, problemas, assim como o que Ranganathan identifica como estrutura (morfologia), funo, mau funcionamento, aes do ambiente e outras ideias similares. Para Barit (1998), est relacionada aos aspectos dinmicos dos objetos. Piedade (1977, p. 12) a exemplifica da seguinte forma: na biologia, na botnica e na zoologia representada pela morfologia, pela fisiologia, pela patologia, pela ecologia, pela gentica e pela ontologia e sua manifestao. Matria - J a matria corresponde aos materiais e s propriedades que constituem as coisas. Aranalde (2009) assevera que esta categoria engloba tanto os elementos abstratos quanto os concretos: a madeira que constitui uma mesa, assim como sua forma e cor. A matria corresponde a elementos mais estveis na delineao de um objeto no mundo, se comparada energia. E mesmo sabendo-se que algumas coisas e objetos esto em constante mudana, em cada uma dessas fases possvel observar a acepo de matria que as constituem. Talvez, nos registros do conhecimento, a compreenso do que venha a ser matria seja obscura se tomada ipsis literis, no entanto, se compreendida em uma dimenso maior (inclusive com algumas subcategorias), pode ser elucidativa das caractersticas que a compem. Substncia - A categoria fundamental, apresentada por Ranganathan como a de mais difcil GT2 533

identificao, a personalidade. O estudioso chega a design-la como inefvel. A delineao que se v de personalidade, na literatura da BCI, a de que corresponde a entidades, seus tipos, suas espcies, partes e/ou rgos. Aquilo que se demonstra como bsico e fundamental compreenso de determinado assunto. Segundo Grolier (1962), a personalidade no possui um valor terico, constitui-se como um rtulo atribudo conforme uma ou mais caractersticas selecionadas arbitrariamente que refletem determinado ponto de vista, mas, apesar disso, indispensvel existncia das coisas. Em comprovao do ltimo apontamento, Grolier estuda e averigua que a categoria personalidade se configura essencial na estruturao da Colon Classification. Normalmente, o reconhecimento da categoria personalidade s se d por eliminao. Dessa forma, Ranganathan props a aplicao do mtodo de resduos princpio do hindusmo: no isso, no isso em que, aps se separarem as manifestaes de tempo, espao, energia e matria de um assunto, o que no couber em nenhuma dessas categorias pode vir a ser considerado como personalidade (RANGANATHAN, 1967). Vickery incisivo na crtica que faz a essa noo suspensa que Ranganathan d personalidade:

Ranganathan no tentou uma definio exata de personalidades, embora a tenha na ocasio comparado com todos, afirmando que elas no so analisveis e tm de ser manejadas habilmente e como um todo elas so inefveis. Sua abordagem no pode ser aceita pela situao atual, por causa da falta de clareza da categoria postulada no a definiu claramente, nem analisou suas relaes com outras categorias postuladas. (VICKERY, 1980, p 234)

As dvidas acerca do que venha a ser a personalidade refletem o quo transcendente o conceito associado a esta categoria. Se for considerado que a personalidade a essncia do objeto, aquilo que o torna nico e sem o qual no pode existir, conclui-se que todas as outras categorias dela se originam, ou seja, so dependentes da existncia da personalidade. Caso se julgue que a personalidade uma categoria tal como as outras, os objetos so caracterizados por elementos no essenciais, em que no h uma ordem necessria para que venham a existir. Destaca-se que Ranganathan, por trabalhar com as categorias relacionadas classificao dos registros do conhecimento de uma sbia maneira, vem a se eximir dessa discusso. Ao propor o mtodo de resduos para determinar a personalidade, ele no se posiciona sob nenhuma das abordagens citadas, apenas menciona que a personalidade de difcil determinao e que os assuntos dos registros do conhecimento, presentes no universo documental, so manifestaes de uma das cinco categorias fundamentais. Em um mesmo ciclo categorial, pode ocorrer mais de uma categoria fundamental (FOSKETT, 1973). Isso demonstra a diviso em nveis, ou seja, a noo de facetas permite divises posteriores, que buscam destrinchar os elementos de formao do objeto analisado. Foskett aponta que, se no fosse assim, a anlise dos objetos estaria restrita a apenas trs categorias fundamentais (personalidade, energia e matria), j que as categorias tempo e espao esto presentes em qualquer objeto. Aranalde (2009, p. 102) complementa essa ideia afirmando que as categorias so fundadoras e possibilitadoras do uso de novas categorias delas derivadas. Na realidade, por serem categorias GT2 534

bsicas, as facetas de Ranganathan necessitam de divises em nveis secundrios, uma vez que fornecem uma viso introdutria anlise dos registros, mas no comportam em si todas as manifestaes deles. Piedade (1977, p. 13) enuncia que um mesmo conceito pode pertencer a uma categoria em um contexto e a outra em um contexto diverso. As facetas, assim, permitem a anlise multidimensional dos conceitos presentes nos registros do conhecimento, dado que possibilitam combinaes que no compreendem o carter classificatrio, pois apresentam coeso e aplicao extensiva de cada categoria (o que Piedade menciona como uma classificao flexvel, mas que no abrange inconsistncias como nas classificaes cruzadas). Ranganathan relaciona o entendimento de faceta aplicao de uma caracterstica divisria ao universo considerado de registros do conhecimento, pautado, sobretudo, na utilidade que essa diviso possa oferecer. A seguir, faz-se o cotejamento entre a perspectiva categorial de Ranganathan e de Aristteles no intuito de se explicitarem as interaes existentes nas propostas de ambos os estudiosos. 4 INTERAES TERICAS ENTRE RANGANATHAN E ARISTTELES A noo categorial de Ranganathan pode ser vista como uma releitura das categorias aristotlicas4. Moss (1964) deixa explcita essa derivao e afirma que algumas categorias de Ranganathan so idnticas s de Aristteles, a saber: as categorias de lugar e tempo comungam do mesmo entendimento em ambos os estudiosos; a categoria ao corresponde energia; a posio vista por Moss (1964) como suprflua, j que uma duplicao da categoria espao; e a substncia seria, no sentido lgico, equivalente personalidade de Ranganathan e, no sentido metafsico, equivalente categoria da matria. A seguir, descrevem-se algumas relaes observadas entre as propostas categoriais de Ranganathan e aquelas de Aristteles oriundas do levantamento bibliogrfico realizado e das percepes da autora durante a elaborao deste texto. So observaes que procuram trazer elucidaes ao panorama da categorizao na BCI. a) Tempo e espao Inicialmente, parecem categorias autoevidentes, dada a similitude que possuem com o que delas se compreende no senso comum. Contudo, a noo de tempo, na filosofia, adquire um sentido extremamente metafsico de insero do sujeito no mundo e da prpria existncia. Recorda o raciocnio exposto por Dahlberg referente aos objetos individuais: por tempo e espao, sabe-se que a Universidade Federal de Minas Gerais aquela existente no Estado de mesmo nome, no pas Brasil e, ainda, nos sculos XX e XXI. O tempo e o espao, nesse entendimento, correspondem concepo de quando e onde. Se tomado como referncia o ser no mundo, ambas as categorias possuem uma efemeridade imensa, j
4 Sabe-se que as categorias propostas pelos estudiosos surgiram por motivaes e propsitos distintos Aristteles as props com relao aos seres e Ranganathan ao universo de registros do conhecimento, mas, ainda assim, sabe-se que ambas as propostas se constituem como instrumentos de anlise.

GT2 535

que o ser no mundo passvel de deslocamento, de mudana, o que, conforme Garca Morente (1967), recorda a postura de Aristteles quanto ao tambm filsofo grego Herclito5. Em complemento a isso, Moss (1964) afirma que a categoria posio em Aristteles remete dimenso de espao, j que nos dicionrios de filosofia espao designado como um meio ideal, caracterizado pela exterioridade de suas partes, no qual se localizam nossos perceptos e que contm, por consequncia todas as extenses finitas (LALANDE, 1999, p. 322). J em Ranganathan, tanto o tempo quanto o espao assumem uma dimenso constante, uma vez que os registros do conhecimento, ao que at ento se conhece, por serem formalizados, perenizam determinada ideia. Sabe-se da interdependncia da categorizao e dos registros do conhecimento, bem como da interdisciplinaridade destes, mas, ainda assim, quando os registros do conhecimento so formalizados, um entendimento predominante destas duas categorias atribudo aos objetos. b) Energia A energia, proposta por Ranganathan, frequentemente associada categoria de ao de Aristteles. A categoria energia um acidente (no sentido de efemeridade) no universo do conhecimento registrado e reflete algo mutvel e no definitivo. tambm vista, dentre outras apropriaes, como reaes e mau funcionamento. Da que se sugestione a relao existente entre o que Ranganathan aponta como energia, no sentido de reao, e a paixo (sofrimento) de Aristteles. E, um pouco alm, estendendo-se o mau funcionamento da energia ranganathiana, poder-se-ia associ-la maneira de ser de Aristteles. Isso indica que Ranganathan sintetizou as propostas de Aristteles em categorias mais abrangentes, buscando relacion-las ao universo do conhecimento at ento conhecido. c) Matria Pelo entendimento que se tem de matria, pode-se associ-la, tal como o fez Moss (1964), com a substncia de Aristteles. Pensando-se assim, d-se uma dimenso unvoca substncia do autor grego, e afasta-a das teorias platnicas que este aproveitou. Aranalde (2009) afirma que em Ranganathan a matria possui uma estrutura mais constante se comparada substncia. Sob esse enfoque, pode-se v-la como a substncia, mas no de forma completa, j que, ao se pensar que a matria constituda por elementos abstratos e reais, pode-se resgatar a categoria qualidade em Aristteles e aproxim-la ao entendimento de Ranganathan. Assim, uma escultura feita de mrmore pode ter a colorao bege, que reflete dois sentidos da matria em um objeto no mundo. Ainda sobre a matria, se pensada no mbito da diviso, daquilo que possa abranger, as categorias quantidade e posio lhe seriam prximas. Isso, a princpio, parece um equvoco, entretanto, a quantidade nada mais do que a mensurao daquilo que a matria feita, e a posio corresponde forma como a matria se comporta em uma dada circunstncia. Ilustra-se essas afirmaes com o exemplo do cavalo citado alhures, o fato de estar arreado corresponde posio, manifestao da matria naquela circunstncia. E, se se atribuir o peso X a este animal, est-se descrevendo um dos
5 Herclito de fiso (ca. de 540 a.C. - 470 a.C.) o filsofo pr-socrtico que cultiva o princpio do dinamismo em que tudo flui (Panta rei).

GT2 536

aspectos da matria da qual feito. d) Substncia O tratamento dado substncia diferencia-se em Aristteles e Ranganathan, basicamente, sob dois aspectos: a terminologia usada e a proposta para a compreenso dessas categorias que cada um dos estudiosos determinou. Ranganathan, ao considerar as categorias como fundamentais e indefinveis, se resguardou, sobretudo, de definir o que venha a ser a personalidade. Foi talvez mais alm ao propor, para a delimitao desta, o mtodo de resduos. Este , como exposto por Aranalde (2009), um ponto dissociante entre as perspectivas dos dois filsofos, j que Aristteles vai em direo oposta. Aristteles opta por elencar o que seja a substncia em nvel primordial, para, ento, o que dela surgir ser considerado como acidente, isto , as demais categorias. Isso d substncia uma existncia distinta que talvez no a caracterize como uma categoria, e sim como o objeto em si. Reale (ARISTTELES, 2001) nega este entendimento, pois, para ele, as categorias so derivadas do ser, e no o prprio ser. interessante observar que a noo da substncia aristotlica como essncia corresponde quilo que transcende o mundo das ideias de Plato, estando sincrnica com a realidade, pois, remete ao entendimento teolgico que Aristteles possua. Por isso, d-se substncia um verdadeiro carter inexorvel e supremo, pelas prprias apreenses teolgicas de que Aristteles comungava. E mesmo com vrios sculos de distncia e em regies geogrficas no to prximas, assiste-se, em Ranganthan, acepo quase divina sobre a personalidade, ainda que por um caminho oposto ao de Aristteles. Ranganathan, ao v-la como indizvel, como o produto aps todas as indagaes, como aquilo que est sobrejacente a quaisquer coisas, deixa explcita sua base religiosa com relao proposta da personalidade, isto , um elemento que se julga existente, mas que no passvel de definio. 5 REFLEXES FINAIS Ao se dissertar sobre a derivao dos princpios categoriais de Ranganathan daqueles de Aristteles, deve-se recordar a similitude percebida entre estes princpios, em especial, quanto estrutura PMEST e s categorias fundamentais do estagirita. Ainda que o propsito de criao destas propostas categoriais seja distinto, j que Aristteles trabalhou com os seres e Ranganathan com os registros do conhecimento, a percepo do que constitui a estrutura ranganathiana visivelmente inspirada nas categorias aristotlicas. Aristteles tido por parcela dos estudiosos como o filsofo realista, aquele que compreende o ser na condio de ser que existe, da a noo de substncia como algo primeiro na estruturao ontolgica das coisas. J Ranganathan constri suas categorias em direo oposta, apesar de se valer das categorias aristotlicas, tudo aquilo que no , personalidade, ou seja, apesar de ser constituinte do contedo dos registros do conhecimento (recordando que estes so os seres que Ranganathan retrata, no so categorias ontolgicas), a personalidade adquire um papel de maior complexidade no reconhecimento destes. O mtodo de resduos representa a importncia e o carter inefvel que norteiam o que consiste a personalidade para a BCI. GT2 537

Quanto categoria personalidade, observa-se a associao com a substncia na concepo formativa e na relevncia que lhes so dadas, apesar de nos quesitos metodolgicos assistir-se a uma oposio entre o que cada uma delas constitua. A personalidade descoberta pelo mtodo de resduos tudo o que no , personalidade, j a substncia segue o caminho inverso: o ser por si, a priori, a essncia. Aliado a isso, Ranganathan props um plano ideacional que foge ao realismo aristotlico, em parte, pois implica que h um nvel de existncia das coisas que antecede aquilo que forma explicitamente o plano verbal. O plano ideacional mais se aproxima das noes idealistas de Plato do que da verdade ontolgica que Aristteles busca retratar. Feitas estas reflexes, encerra-se esta anlise ratificando a similitude entre a estrutura PMEST de Ranganathan e as categorias fundamentais de Aristteles e, refora-se a reivindicao de Barit (1998) quanto necessidade das categorias serem revisitadas na BCI. Abstract: In the Librarianship and Information Science (LIS) categorization consists as an intrinsic action into knowledge recording organization, and represents the central subject of this paper. Based on the importance of Ranganathans work and the relevance of Aristotles ideas for structuring knowledge in the Occident, this paper aim describe both categorical propose and point out their convergences points, especially in the first one cited, that have been considered a theoretical landmark on Librarianship and Information Science (LIS). In order to do that, it was made a theory analysis of the categorical structures of both ideas through a bibliographic survey. Although the propose of these categorical ideas has been distinct, because Aristotle worked with human beings and Ranganathan worked with records of knowledge, the perception is that the Ranganathans structuring is clearly inspired in Aristotles categories, despite some clashes, in particular in the categories substance and personality. Keywords: Categorization. Category. Classical theory of categorization. Faceted classification. REFERNCIAS ARANALDE, M. M. Reflexes sobre os sistemas categoriais de Aristteles, Kant e Ranganathan. Cincia da Informao, Braslia, v. 38, n. 1, p. 86-108, jan./abr. 2009. ARISTTELES. Metafsica: ensaio introdutrio, texto grego com traduo e comentrio de Giovanni Reale. Traduo de Marcelo Perine. So Paulo: Loyola, 2001. v. I: ensaio introdutrio. BARITE, M. G. Las categoras: aportes para una revisin conceptual y metodologica. Cadernos da F.F.C., v. 7, n.1/2, p. 77-96, 1998. DAHLBERG, I. Fundamentos terico-conceituais da classificao. Revista de Biblioteconomia de Braslia, Braslia, v. 6, n. 1, jan./jun. 1978. DAHLBERG, I. Knowledge organization and terminology: philosophical and linguistic bases. International Classification, v. 19, n. 2, p. 65-71, 1992. EYSENCK, M. W.; KEANE, M. T. Manual de psicologia cognitiva. 5. ed. Porto Alegre: Artmed, 2007. GT2 538

FOSKETT, A. C. A abordagem temtica da informao. So Paulo: Polgono; Braslia: Ed. Univ. Braslia, 1973. GARCA MORENTE, M. Fundamentos de filosofia I: lies preliminares. 3. ed. Traduo e prlogo de Guillermo de la Cruz Coronado. So Paulo: Mestre Jou, 1967. Lio VII: O realismo aristotlico, p. 91-101; Lio VIII: A metafsica realista, p. 103-113. GROLIER, E. de. A study of general categories applicable to classification and coding in documentation. Paris: Unesco, 1962. JACOB, E. K. Classification and categorization: a difference that makes a difference. Library Trends, v. 52, n. 3, p.515-540, Winter 2004. LALANDE, A. Vocabulrio tcnico e crtico da filosofia. Traduo de Ftima S Correia et al. So Paulo: Martins Fontes, 1999. MORA, J. F. Dicionrio de filosofia. Sao Paulo: Loyola, 2004. tomos I, III. MOSS, R. Categories and relations: origins of two classification theories. American Documentation, p. 296-301, Oct. 1964. NAVES, M. M. L. A importncia de Ranganathan para a organizao do conhecimento. In: NAVES, M. M. L.; KURAMOTO, H. (Org.). Organizao da informao: princpios e tendncias. Braslia: Briquet de Lemos, 2006. p. 36-45. PIEDADE, M. A. Requio. Introduo teoria da classificao. Rio de Janeiro: Intercincia, 1977. PINTO, A. da C. Categorizao de itens verbais: medidas de freqncia de produo de tipicidade. Porto: Relato tcnico de Centro de Psicologia Cognitiva da FPCE da UP, 1992. No paginado. RANGANATHAN, S. R. Prolegomena to library classification. 3. ed. London: 1967. ROSCH, E.; MERVIS, C. B. Family resemblances: studies in the internal structure of categories. Cognitive Psychology, v. 7, n. 4, p. 573-605, Oct. 1975. SEPLVEDA, F. A. M. A gnese do pensar de Ranganathan: um olhar sobre as culturas que o influenciaram. 1996. Dissertao (Mestrado em Cincia da Informao) CNPq/IBICTUFRJ/ECO, Rio de Janeiro, 1996. SHERA, J. H.; EGAN, M. Catlogo sistemtico: princpios bsicos e utilizao. Traduo de Maria Neile Teles Landau. Braslia: Ed. Universidade de Braslia, 1969. SHERA, J. Padro, estrutura e conceitualizao na classificao para recuperao da informao. Traduo de Hagar Espanha Gomes. Publicado originalmente em: Proceedings of the International Study Conference on Classification for Information Retrieval, Beatrice Webb House, Dorking, England, 13th-17th May 1957. London: ASLIB, 1957. Disponvel em: <http://www.conexaorio.com/ biti/shera/index.htm#nota1>. Acesso em: 02. ago. 2009. VICKERY, B. C. Classificao e indexao nas cincias. Traduo de Maria Christina Giro Pirolla. Rio de Janeiro: BNG/BRASILART, 1980.

GT2 539

COMUNICAO ORAL

A APLICAO DA TEORIA DA CLASSIFICAO FACETADA EM BANCO DE DADOS, ATRAVS DA MODELAGEM CONCEITUAL


Mrcio Bezerra da Silva, Dulce Amlia de Brito Neves Resumo: Apresentamos a Teoria da Classificao Facetada (TCF) de Ranganathan como possibilidade de estruturao do conhecimento, atravs da organizao de conceitos e da criao de relacionamentos em ambiente de Banco de Dados (BD). Aqui so elencadas as cinco categorias ou facetas, estabelecidas por Ranganathan, chamadas de PMEST (Personalidade, Material, Energia, Espao e Tempo). Objetiva-se, a partir de uma pesquisa aplicada e exploratria, investigar a possibilidade de aplicao da classificao facetada para organizao do conhecimento, visando recuperao da informao em BD. Tambm se almeja, de maneira mais especfica, investigar a possibilidade da aplicabilidade da classificao facetada com a modelagem de dados em ambientes digitais. Adota-se como etapa de pesquisa o desenvolvimento do prottipo de BD, mais especificamente a fase inicial da modelagem de dados (modelagem conceitual), subsidiados por uma pesquisa bibliogrfica sobre Representao Temtica da Informao. O texto apresenta como resultados da pesquisa a determinao dos termos representativos aos materiais/documentos, por meio da TCF, na modelagem conceitual do prottipo de BD. Visa a organizao e recuperao da informao na Instituio em pesquisa. Conclui-se que possvel adotar a TCF em ambientes digitais por meio da modelagem conceitual, alm de apresentar uma estrutura de classificao facetada ilimitada, flexvel e multidimensional. Palavras-chave: Representao Temtica da Informao. Teoria da Classificao Facetada de Ranganathan. Modelagem de Dados. Modelagem Conceitual. 1 INTRODUO A humanidade, ao longo de sua histria, procura organizar o cotidiano, seja para atitudes correspondentes ao dia-dia, seja para o conhecimento adquirido e desejado. Para realizar esta organizao, o homem procura classificar as coisas que esto sua volta, a exemplo das informaes que circulam por todos os lados, a todo o momento. Mesmo estando elas disponveis em grande quantidade, o ser humano no capta todas as informaes que o cercam; seleciona apenas o que considera necessrio, permitindo assim a criao do que chamamos conhecimento. A importncia de organizar o conhecimento, atravs de formas de classificao, ganha cada vez mais importncia. Alm das classificaes adotadas diariamente, h muito tempo, estudos vm sendo desenvolvidos com o intuito de promover formas e tcnicas de classificao desse conhecimento elaborado pelo homem. Os sistemas de classificao desenvolvidos ao longo da histria humana, passando pelas GT2 540

filosficas, depois bibliogrficas at os esquemas de organizao do conhecimento considerados mais modernos como Tesauros e Ontologias. Os sistemas de classificao dependem destes termos. Como exemplos de sistemas, citemos os mais usados no mundo, que so a Classificao Decimal de Dewey (CDD) e a Classificao Decimal Universal (CDU). Os mtodos tradicionais de organizao do conhecimento carecem de aperfeioamento. As informaes contidas em ambientes digitais, principalmente na Web, encontram-se desorganizadas, dificultando recuperao desejada; isso nos leva ideia de que o problema no est propriamente nos dados recuperados, mas no processo anterior para isso utilizado, ou seja, na organizao. Nesse sentido, em uma determinada Instituio1, mais especificamente no Setor Pedaggico, ocorria a inexistncia, ou m organizao, tanto dos mnimos materiais fsicos, quanto dos criados digitalmente. A partir desta situao, nos foi solicitado, pela Direo da Instituio, a criao de um banco de dados (BD), em ambiente digital, a fim de alcanar o objetivo de organizar e recuperar as informaes do respectivo setor. Partindo da premissa de que o problema se encontrava na organizao, estudos foram realizados para a escolha de um sistema de classificao que fosse incorporado ao prottipo de BD, atravs da modelagem de dados, ou seja, que atendesse s vrias necessidades da organizao do conhecimento, pertinentes tanto Cincia da Informao (CI), quanto Cincia da Computao (CC). Considerando esses aspectos, optamos pelo sistema de classificao facetada do indiano Shialy Rammarita Ranganathan (1897-1972), que foi foco na questo da organizao. Tambm destacamos os estudos continuados, sobre a classificao facetada de Ranganathan, pelo londrino Classification Research Group (CRG), da escola de estudiosos como Campell, Coates, Farradane, Foskett, Milles, Vickery, Walford, entre outros. Conforme as teorias e aplicaes dos antes mencionados, buscamos solucionar os problemas da Instituio X, respondendo a seguinte indagao, que representa a problematizao do presente trabalho: De que modo a classificao facetada pode contribuir para organizao do conhecimento registrado em BD, visando recuperao da informao com maior valor agregado? A busca de respostas para essa questo motivou o presente estudo a investigar a possibilidade de aplicao da classificao facetada para organizao do conhecimento, visando recuperao da informao em banco de dados. Especificamente: queremos investigar a possibilidade de aplicabilidade da classificao facetada com a modelagem de dados em ambientes digitais. Calcado nas informaes apresentadas, este trabalho apresenta a seguinte estrutura: no captulo 1, contextualizamos o trabalho; no captulo 2, abordamos a contribuio da CI, proposta sumarizada neste artigo, especialmente sobre a TCF de Ranganatham; no captulo 3, delineamos o percurso metodolgico que caracteriza a presente pesquisa; no captulo 4, apresentamos as aes de aplicao da TCF na Modelagem Conceitual em BD, e, por fim, no captulo 5, expomos as consideraes finais e expectativas de estudos futuros.
1 Rotularemos, ao longo do trabalho, o campo da pesquisa de Instituio X.

GT2 541

2 A CINCIA DA INFORMAO NO PROTTIPO DE BANCO DE DADOS Nos ltimos tempos, como j enfatizamos, a informao ganha cada vez mais importncia. Essa importncia se reflete diretamente nas tomadas de decises das pessoas, principalmente a partir da globalizao, que recentemente, tem provocado a eliminao de barreiras, quando se trata de acesso ao conhecimento, fato esse nitidamente marcado pelas Tecnologias da Informao (TIs). No prottipo de BD, a informao deve passar por um processo de representao, que objetiva torn-la compreensvel linguagem dos usurios; para tal, so necessrios meios, elementos, ou veculos que possibilitem o acesso a informao. Na CI, constatam-se definies que apresentam a representao como uma ao que visa permitir a recuperao de algo, no caso, a prpria informao, [...] uma vez que ela procura substituir aquilo que representa, algo que mantm informaes sobre um domnio qualquer e de forma semntica (FURGERI, 2006, p.26). Destacamos outra definio, a de Novellino (1996, p.38), porque, para a autora, a principal caracterstica do processo de representao da informao a substituio de uma entidade lingustica longa e complexa o texto do documento por sua descrio abreviada. O ato de representar cria uma estrutura eficiente com fins de recuperao de informaes. A partir do momento que as informaes/documentos entram num sistema de informao, ou unidade de informao, estes passam por um tratamento, aliados a sentimentos: emoes, e razo, que esto relacionados ao cognitivo, visando facilitar a posterior recuperao do documentos. Cada documento possui caractersticas prprias representadas por meio da Representao Descritiva da Informao, e pela Representao Temtica da Informao, que buscam a posterior Recuperao da Informao. Conforme Feitosa (2006), ambas constituem o Tratamento Intelectual da Informao e podem ser executadas em qualquer sistema de informao. As trs aes supracitadas construram os mdulos do prottipo de BD, correspondendo normas e caractersticas de cada elemento. No caso deste trabalho, destacaremos a Representao Temtica da Informao, tambm chamada de anlise da informao, ou simplesmente indexao; ela adota elementos simblicos para a sua realizao. Esta forma de representao se refere ao contedo informacional dos documentos e permite a identificao do tema, ou do assunto a que se refere, atravs das aes de indexao, elaborao de resumos, classificao, disseminao, busca e recuperao. Aliada a indexao, ao consultarmos definies sobre CI, possvel verificar a presena da organizao dentre suas prticas. A organizao do conhecimento tem como objetivo organizar a informao, a fim de que ela seja recuperada. Entretanto, diante da problemtica na quantidade informacional crescente, ocorrem transformaes/adaptaes nas formas de organizao existentes, alm de exigir a criao de novos instrumentos. exatamente esta percepo que foi adotada para a construo do prottipo: visamos a adaptao de uma teoria de classificao, a ser apresentada na subseo 2.1, destinada a organizar o conhecimento, e, consequentemente, permitir a efetiva recuperao. A compreenso do raciocnio aqui exposto fica ainda mais claro, quando retomamos o pensamento GT2 542

de Berners-Lee (2001): ele defende que a organizao a ao mais importante nos processos de que envolvem a representao da informao. Sobre esta questo, Cesarino (1985 p.161-162) afirma que grande parte das falhas [nos sistemas] se deve a erros ou omisses na interpretao do contedo dos documentos e na percepo da demanda das pessoas a que se destina o sistema. Diante da colocao do autor e com ele concordando Berners-Lee (2001), afirma que o problema em questo ocasionado por uma falha no processo de organizao, que consequentemente, afeta o processo de recuperao da informao. Na prxima subseo apresentaremos a TCF de Ranganathan, considerada por estudiosos, como Ingwersen e Wormell (1992), um grande contribuinte do desenvolvimento dos SRIs; antes mesmo de sua construo, os princpios da organizao do conhecimento, e da metodologia sobre anlise facetada podem ser os elementos iniciais do processo de modelagem de uma estrutura cognitiva; isso parece ser relevante no trabalho de anlise de uma determinada rea do conhecimento, assim como realizamos no prottipo. 2.1 A Teoria da Classificao Facetada de Ranganathan At a primeira metade do sculo XX, vrios tericos haviam realizado estudos sobre sistemas de classificao bibliogrfica. Dentre os referidos tericos, destacamos Cutter, Dewey, Brow e Bliss. Eles receberam influncia do sculo passado, e repetiram algumas teorias. Entretanto, um nome se destacou durante aquele perodo, especialmente nos estudos voltados a classificao de assunto. Esse nome foi Shiyali Ramamrita Ranganathan, considerado por muitos, nos crculos internacionais, como o precursor do mtodo cientifico da Biblioteconomia. Por isso, comum ouvir que Ranganathan o pai da Biblioteconomia, e, conforme Dahlberg (1979), o pai da Moderna Teoria da Classificao. Ranganathan nasceu em 1892, numa pequena aldeia no sul da ndia. Morreu em 27 de setembro de 1972. Bacharel e Mestre em Matemtica, dedicou-se a leitura das obras de W. C. Berwick Sayers, que mais tarde tornaria o seu mestre nos estudos biblioteconmicos. Aps muitas leituras, e influncias dos ensinamentos do seu mestre, Ranganathan partiu para uma revoluo no delineamento dos sistemas de classificao da poca, tema sedutor para sua mente matemtica. A partir das leituras de Sayers, Ranganathan iniciou estudos sobre o sistema de classificao que causariam uma revoluo poca. Iniciando sua enorme contribuio para os processos de organizao/classificao da informao, foi influenciado pelas culturas brmane, chinesa, alm da astrologia, a quem creditava ideias abrangentes sobre o universo como um todo.
Em 1925, ao retornar a ndia, assumiu a direo da Biblioteca da Universidade de Madras e iniciou o desenvolvimento do sistema idealizado, sob o aspecto de uma classificao analtico-sinttica: Colon Classification. Alm disso, Ranganathan passou a defender a importncia das bibliotecas em relao educao do seu pas. Ranganathan examinou o mtodo da Decatomia, difundido por Kant, que representa a formao de assuntos em dez divises, e concluiu que, em vista do crescimento prolfico multidimensional, este mtodo no era satisfatrio (LIMA, 2004, p.79).

Como soluo, Ranganathan sugeriu a adoo da Policotomia Ilimitada, isto , formao de assuntos com nmero ilimitado de divises das reas do conhecimento. Na necessidade de explicar como seria a sua formao de assuntos, Ranganathan buscou esclarecimentos na rvore Baniana, que representa uma espcie de figura indiana, constituda de vrios troncos secundrios, formados de GT2 543

tempos em tempos, adicionados ao tronco original, associando, desta forma, a uma rvore de assuntos (RANGANATHAN, 1967). Diante de todas as contribuies apresentadas por Ranganathan, sem dvida, a obra de maior expresso foi a Colon Classification que, inclusive, tem sido objeto de vrios estudos nos ltimos tempos. Destacamos as teses das professoras Maria Luiza de Almeida Campos (2001) e Gercina ngela Borm de O. Lima (2004). A Colon Classification, traduzida para o portugus como Classificao de Dois Pontos, tambm chamada de Classificao em Facetas, TCF, ou Classificao Analtico-Sinttica, foi publicada pela primeira vez em 1933; provem da constatao de Ranganathan, quanto rigidez dos sistemas de classificao do seu perodo, no caso, CDD e CDU. Compreendendo a necessidade de criao de um sistema mais flexvel, Ranganathan fez uso do mtodo hipottico-dedutivo, no plano das ideias, verbal e notacional.
Na TCF, o mapeamento do conhecimento de grande importncia, tanto para um determinado perodo especfico, como para permitir a descoberta de conexes e analogias, entre diferentes campos do conhecimento, porque facilita a recuperao a informao (SPEZIALI, 1973). A noo de facetas tem sido frequentemente apresentada como

a maior contribuio terica da CI (MANIEZ, 1999), nos estudos sobre classificao, e tem inspirado vrios estudos nas ltimas dcadas (MAS et al., 2008, p.3).
O diferencial da TCF a utilizao de uma estrutura dinmica multidimensional, com a introduo do termo faceta, que ficou sendo, nos modernos estudos sobre teoria da classificao, o substituto de caracterstica (BARBOSA, 1969, p.16).

Faceta um termo genrico usado para denotar algum componente, pode ser um assunto bsico ou um isolado, de um assunto composto, tendo, ainda, a funo de formar renques, termos e nmeros (RANGANATHAN, 1967, p.88). Barbosa (1972, p.75) define faceta como uma lista de termos mantendo entre si as mesmas amplas relaes com a classe que lhes deu origem, ou ento, como um conjunto de termos produzidos pela aplicao de um amplo princpio de diviso. Miranda (2005, p.132) contribui para a discusso, ao citar a definio de faceta apresentada por Ranganathan na ltima publicao da Colon Classification: um termo genrico usado para designar qualquer componente de um assunto composto. As facetas subordinam-se a cinco itens, definidos por Ranganathan (1967, p.398) como Categorias Fundamentais, a saber: Personalidade, Matria, Energia, Espao e Tempo (PMEST), Estes itens so usados [...] estritamente no contexto da disciplina de classificao. Nada tm a ver com seu emprego na Metafsica, ou na Fsica. Personalidade [P] pode ser a essncia de um determinado assunto, os objetos de estudo de uma determinada disciplina, tipos, entidades etc. Tipo de biblioteca, por exemplo, pode ser uma Personalidade da Biblioteconomia. Consideremos como manifestao da categoria Personalidade [P], as seguintes facetas: bibliotecas, nmeros, equaes, comprimentos de ondas de irradiao, obras de engenharia, substncias qumicas, organismos e rgos, adubos, religies, estilos de arte, lnguas, grupos sociais, GT2 544

comunidades (VICKERY, 1980, p.212). Matria [M] representa manifestaes, complementos, substncias, que constituem as coisas, os objetos. Esta categoria classificada em material e propriedade. Por exemplo, na Biblioteconomia, temos livros (material) raros (propriedade). Energia [E], ou ao a manifestao de um verbo, de uma ao, como processos, tcnicas, atividades etc. Por exemplo, na Biblioteconomia, servios como catalogao, indexao e classificao representam a categoria Energia. Espao [S] uma diviso geogrfica, uma manifestao de lugar, onde ocorre determinado evento, como cidades, superfcies em geral entre outros. Exemplificando, temos a cidade Rio de Janeiro, para Biblioteconomia. Tempo [T] uma diviso cronolgica, uma manifestao de ideias em determinado tempo comum, como sculos, anos, meses, dias etc. Sculo XXI, para Biblioteconomia, um exemplo da categoria em questo. Dos cinco postulados categricos determinados por Ranganathan (1967), Personalidade [P] definida como uma categoria indefinvel. Para ele, a mais importante categoria. a que contm os termos que atribuem classe a sua identidade no campo do conhecimento. Esta categoria tem causado mais dificuldades e controvrsias do que qualquer outra categoria fundamental (ANJOS, 2008, p.197). Tentando minimizar a problemtica em discusso, Ranganathan (1967) expe que, caso a manifestao no seja determinada como espao, energia ou matria, a mesma pode ser considerada como uma manifestao da categoria fundamental Personalidade [P]. A esta ao, Ranganathan intitula de mtodos de resduos. Silva e Neves (2010), ainda no contexto da Biblioteconomia, complementam as explicaes sobre as categorias fundamentais, apresentando as seguintes facetas, respectivas a cada categoria: [P] representa Personalidade (personality): bibliotecrio; [M] representa Matria (material): livro; [E] representa Energia (energy): classificao; [S] representa Espao (space): biblioteca central; [T] representa Tempo (time): hoje. Das categorias do PMEST surgem as facetas. Segundo Ranganathan (1967), categorias so as classes mais gerais, que podem ser formadas e empregadas para reunir outros conceitos. Cada faceta formada por um nmero mnimo de subdivises, denominadas focos; cada uma acompanhada por algarismos arbicos decimais, constituindo seu smbolo de classificao. Aps a faceta principal, surgem os termos que, segundo Ranganathan (1967), so as representaes verbais dos conceitos em uma linguagem natural. Com base nos termos e na necessidade de ramificaes de seu assunto, termos as subfacetas.
Ranganathan, alm de determinar os elementos que caracterizam a TCF, em especial suas facetas, tambm estipulou cinco caminhos para a formao dos assuntos, e regras utilizadas para ordenar as facetas, e os elementos interiores de uma estrutura de classificao.

A Espiral do Mtodo Cientfico possibilitou a Ranganathan medir o crescimento da Espiral GT2 545

do desenvolvimento de novos assuntos, de maneira cclica, identificando os estgios de Pesquisa Fundamental (fundamental research), Pesquisa Aplicada (applied research), Projeto Piloto (pilot project), Novo Mecanismo (new mechanism), Novo Material (new material), Novo Produto (new product), Utilizao (utilisation) e Novos Problemas (new problems). Diante do Mtodo Cientfico apresentado, Ranganathan determinou cinco modos de representao temtica, considerados preliminares, para a formao de assuntos e isolados, a saber: Dissecao, Laminao, Desnudao, Reunio/Agregao e Superposio (RANGANATHAN, 1967, p.351). A Dissecao (Dissecation) prope dividir o universo em partes coordenadas em um mesmo nvel quantas vezes for necessrio, criando para cada parte o seu prprio universo. Cada uma dessas partes chamada de Lmina, a qual pode representar um assunto bsico, ou um isolado. O modo da Laminao (Lamination) prope-se a superposio de uma faceta com outra, constituindo-se camadas de assuntos bsicos e ideias isoladas. Alm disso, as ideias isoladas quando combinados, formam assuntos compostos. J a Desnudao (Desnudation), tambm chamada de Desfolhamento, provoca uma diminuio progressiva da extenso, e um aumento da profundidade de um assunto bsico, ou de uma ideia isolada, permitindo a formao de cadeias, atravs de resultados sucessivos do caminho/ processo; pode representar o ncleo especfico de um assunto bsico, ou de uma ideia isolada. Esta a forma de representao temtica a ser adotada no prottipo, porque a Instituio tem interesse de especificar, ao mximo, a informao, j que busca a preciso na recuperao da informao. Por sua vez, a Reunio/Agregao (Loose Assemblage) refere-se combinao do assunto bsico, ou composto com ideias isoladas, formando um assunto complexo, isto, uma ideia isolada complexa. Por fim, a Superposio (Superimposition), tambm chamada de Sobreposio, permite a conexo de duas ou mais ideias isoladas, pertencentes ao mesmo universo de ideias isoladas. A ideia isolada resultante desta superposio chamada de ideia isolada superposta, ou ideia isolada composta. Este caminho diferente do adotado pela Laminao, que permite a ligao entre isolados de universos diferentes. Entender esses caminhos, ou seja, o da transformao do assunto em documentos do sistema de classificao, fundamental, pois desta compreenso resultar a sua atuao nos processos de organizao e recuperao de informao (CAMPOS, 2001, p.66). Alm disso, os assuntos podero ser relacionados de maneira ilimitada e multidimensional. A estudiosa Mas et al. (2008, p.3) complementa ao afirmar que:
[...] eficcia da classificao facetada a sua capacidade de integrar diferentes dimenses de anlise sobre os objetos de informao, para caracterizar e tornar mais fcil o acesso a informao fornecendo mltiplos caminhos de navegao para qualquer documento.

GT2 546

Determinados os assuntos, as facetas precisam ser organizadas no sistema de classificao. Neste sentido, Ranganathan criou uma srie de Cnones e Princpios para organizar o conhecimento, e orientar na escolha da sequncia de facetas, apresentados na terceira edio do Prolegomena to Library Classification, que tem como objetivo atingir o que ele mesmo denominou de Cnone da Sequncia til. Os cnones a serem abordados neste trabalho sero os voltados ao plano das ideias, organizados em Caractersticas, Sucesso de Caractersticas, Renque de Classes, Cadeia de Classes e Sequncia de Filiao. Cada um dos cnones apresentados possui subdivises, conforme pode ser observado no quadro 1:

CARACTERSTICA

SUCESSO DE CARACTERSTICAS

RENQUE DE CLASSES

CADEIA DE CLASSES Extenso decrescente Modulao

SEQNCIA DE FILIAO Classes subordinadas Classes coordenadas x

Diferenciao

Concomitncia

Exaustividade

Relevncia

Sucesso relevante

Exclusividade

Verificabilidade

Sucesso consistente

Seqncia til Seqncia consistente

Permanncia

Quadro 1: Cnones para o Trabalho no Plano das Ideias.

Fonte: Gomes, Motta e Campos (2006).

Aps as informaes apresentadas, podemos entender que a classificao facetada um sistema de agrupamento por termos estruturados, por meio da anlise de assunto. Diante desta anlise, ocorre a identificao de facetas, ou seja, dos diferentes aspectos nele contidos, que oferecem as condies necessrias para a construo de uma estrutura organizacional, dispensando a necessidade de outros modelos. Desta forma, apresentaremos o caminho percorrido para realizar a pesquisa e quais foram s contribuies da TCF no desenvolvimento do prottipo de BD. 3 PERCURSO METODOLGICO Esta pesquisa visou aplicar as teorias da classificao da CI, em ambientes digitais, da CC. Trata-se de uma Pesquisa Aplicada, definida por Oliveira (2001, p.123) como um modelo de pesquisa GT2 547

que necessita de [...] teorias ou leis mais amplas como ponto de partida, e tem como objetivo pesquisar, comprovar ou rejeitar hipteses sugeridas pelos modelos tericos e fazer a sua aplicao s diferentes necessidades humanas. Implica-se tambm uma Pesquisa Exploratria, porque, ainda conforme o autor, a nfase [...] dada descoberta de prticas ou diretrizes que precisam modificarse e na elaborao de alternativas que possam ser substitudas (OLIVEIRA, 2001, p.134). A pesquisa postula maior familiaridade com o problema, visado torn-lo explcito, ou a construir hipteses. Envolve levantamento bibliogrfico, entrevistas com pessoas que tiveram experincias prticas com o problema pesquisado e anlise de exemplos que estimulem a compreenso (GIL, 1994). Na Instituio X, o trabalho concentrou-se no Setor Pedaggico, responsvel pela coordenao dos cursos, alm da aquisio e produo dos materiais didticos. Diante da problemtica na organizao desses materiais, muitos foram adquiridos mais de uma vez, como livros e programas de computador. Em vrios momentos, apostilas eram elaboradas tambm mais de uma vez, bastando mudar o professor, de determinado curso, para que uma nova apostila, com o mesmo contedo, diagramao etc., fosse elaborada. Diante da realidade do campo de pesquisa, este trabalho tratar do desenvolvimento de um prottipo de BD, intitulado Sistema Facetado, por meio da modelagem de dados. De acordo com Miranda (2005, p.72), esta tcnica consiste em se estabelecer um modelo de entrada e tratamento de dados a serem armazenados num sistema de informao. Em outras palavras, um modo de estruturar logicamente as informaes (FURTADO; SANTOS, 1980, p.37). A modelagem de dados constituda das etapas conceitual, lgica e fsica, sendo a primeira responsvel pela adoo da TCF no Sistema Facetado. Os estudos sobre a TCF de Ranganathan constituiu um dos objetos privilegiados desta pesquisa por acreditarmos que realizar a distribuio da informao em facetas seria uma ao positiva, j que so inerentes ao assunto ou campo principal. De acordo com as palavras de Silva e Neves (2010, p.14-15), no interior de cada faceta, os termos que as constituem esto aptos a novos agrupamentos pela aplicao de outras caractersticas ou classes divisionais, dando origem s facetas menores, que chamaremos de subfacetas. A maior contribuio da CI para este estudo se deve TCF, apresentando o nome sugestivo ao prottipo de BD. De fato, o que propiciou a escolha da TCF para este trabalho foi exatamente a flexibilidade, ou seja, a possibilidade de criar e recriar novos agrupamentos entre as facetas, sem alterar significativamente a estrutura de programao e relacionamentos das tabelas do BD. Contextualizado os elementos que constituem o Sistema Facetado, apresentaremos o resultado de sua construo, na prxima seo, conforme o nvel inicial da modelagem de dados: modelagem conceitual. 4 APLICANDO A TCF NA MODELAGEM CONCEITUAL EM BANCO DE DADOS GT2 548

O prottipo de BD promulgou a representao da realidade do Setor Pedaggico da Instituio X, que necessitava recuperar informao. Para realiz-la, foi usada a modelagem conceitual, definida como a representao abstrata e simplificada de um sistema real, com a qual se pode explicar, ou testar o seu comportamento, no todo ou em partes (COUGO, 1997, p.7). Na modelagem conceitual no so levadas em considerao atribuies computacionais relacionadas escolha, neste caso, do Sistema Gerenciador de Banco de Dados (SGBD), do Sistema de Banco de Dados (SBD) e do formato de estruturao do sistema. Neste momento, na tentativa de representar a realidade da Instituio X, a tcnica de indexao e os estudos da TCF foram de fundamental importncia, j que, a partir dos subsdios da CI supracitados, os termos representativos da Instituio foram adquiridos conforme a indexao por extrao e, em seguida, organizada no Sistema Facetado. Segundo Machado e Abreu (1996, p.21), na modelagem conceitual, o analista [...] deve se concentrar na observao dos fatos relevantes que ocorrem na realidade, com a finalidade de construir um sistema que possa automatizar as necessidades de informao da mesma. Tomando partido das compreenses dos autores, no prottipo deste trabalho, adaptamos a estrutura conceitual do Mapa Hipertextual (MHTX) criado por Lima (2004), em sua tese, acrescido de algumas aes, a saber: conversar com os possveis usurios do sistema; compreender as atividades realizadas pelos usurios na Instituio; identificao dos materiais pertencentes ao Setor Pedaggico; leitura tcnica dos materiais para a extrao dos termos representativos; anlise facetada; organizao de todos os termos selecionados e suas respectivas relaes. A anlise facetada permitiu incorporar propriedades adicionais s informaes, sejam elas textuais ou multimdia, alm de fornecer dados para a anlise das categorias de dados presentes em ambientes digitais, como o caso do prottipo de BD, afetando, assim, a sintaxe potencial do referido sistema. Porm, para adicionar novas propriedades a tais elementos e alterar a leitura da sintaxe do ambiente digital em discusso, foi necessrio sua anlise, a fim de levantar e definir a terminologia do assunto para que posteriormente os termos presentes no sistema fossem analisados e distribudos em facetas. Na formao dos assuntos, dentre os mtodos Dissecao, Laminao, Desnudao, Reunio/Agregao e Superposio (RANGANATHAN, 1967, p.351), apresentados na subseo 2.1, adotamos a Dissecao e a Desnudao, j que os termos extrados da indexao foram mantidos na linguagem natural, ou seja, conforme so apresentados nos materiais, no passando pela traduo de qualquer vocabulrio controlado. Alm disso, tambm nos baseamos na proposta do MHTX criado por Lima (2004). A Dissecao (Dissecation) permitiu dividir o universo dos materiais, e identificar que Educao Profissionalizante em Informtica era o assunto bsico, tambm rotulado pela Instituio de Capacitao Profissional, ou Capacitao Profissionalizante. O outro mtodo utilizado, a Desnudao (Desnudation), tambm permitiu representar o ncleo GT2 549

especfico de um assunto bsico, ou de uma ideia isolada dos materiais consultados. A Desnudao foi considerada o mtodo mais importante para o sistema, pois a Instituio necessitava que a recuperao de informaes fosse precisa, exigindo maior especificidade dos assuntos, de acordo com a exemplificao do quadro 2: ASSUNTO BSICO Cursos Curso Bsico Curso de Introduo a Microinformtica
Quadro 2: Exemplo de Desnudao no Sistema Facetado.

Fonte: Dados da pesquisa (2011).

Para realizar os mtodos apresentados, foi necessrio executar algumas aes e, baseado nas orientaes apresentadas por Lima (2004) em sua tese, adotamos a leitura minuciosa do documento; identificao dos conceitos representativos ao contedo semntico do documento; seleo dos termos mais relevantes ao assunto bsico; seleo dos termos com um contedo semntico significativo; e representao natural dos conceitos selecionados, ou seja, no utilizando um vocabulrio controlado. Apesar de as orientaes serem construdas por Lima, com olhar nos hiperlinks, verificamos aplicao de ambas na modelagem conceitual no prottipo de BD, constituindo a primeira ao da CI utilizada no sistema: a indexao/anlise facetada. Segundo esta ao de representao da informao, apresentamos uma parcela dos termos (quadro 3) necessrios ao desenvolvimento de uma estrutura, chamada neste trabalho de Mapa Categorial do Sistema Facetado, contendo como classe geral Educao Profissionalizante em Informtica. Administrativo Aluno Apostila Apresentao Artes Cadastro Capacitao Cartes CD-ROM Cursos Documentos Manh Modular Nivelamento Palestras Primeiro Professor Profissionais Propriedade Relatrios Segundo Semestre

GT2 550

Internet Interdisciplinar Microinformtica Laboratrio Livro

Pedaggico Software Tarde Tcnico Turno

Quadro 3: Lista de termos para o Sistema Facetado.

Fonte: Dados da pesquisa (2011).

Determinados os assuntos, estes precisavam ser organizados conforme suas caractersticas. A organizao ocorreu segundo as cinco categorias fundamentais de Ranganathan (1967): Personalidade, Matria, Energia, Espao e Tempo (PMEST). Na figura 1, temos um trecho da organizao estruturada pela categoria fundamental Tempo [T], segundo o plano notacional: 5. Tempo
a. Turno i. Manh ii. Tarde iii. Noite b. Semestre i. Primeiro ii. Segundo

Figura 1: Organizao notacional estruturada pela categoria Tempo [T].

Fonte: Dados da pesquisa (2011).

O plano notacional fez parte da construo do sistema, contribui para a organizao dos assuntos, entretanto, diante do seu acervo ser constitudo em sua maioria por documentos digitais, sendo os impressos digitalizados futuramente, o Setor Pedaggico descartou a utilizao da notao da Colon Classification, CDD ou CDU. A notao ocorrida foi adaptada conforme o citado setor, ou seja, a cada entrada, os documentos recebem um cdigo chamado de ID2. Sendo assim, a notao, criada no mdulo de classificao do sistema, formada pelo smbolo do assunto, neste caso INF, por tratarmos exclusivamente de documentos dos cursos de informtica, adicionado ao nmero de ID do documento cadastrado. Por exemplo, o livro Introduo a Microinformtica foi o primeiro livro cadastrado, recebendo a ID 1. Ao associarmos a ID ao seu respectivo assunto, temos a notao resultante INF1 e assim sucessivamente. Baseado no plano das ideias, complementamos a estrutura de organizao do sistema adotando a proposta do CRG que usa no princpio das categorias fundamentais, categorias baseadas no contexto do prprio assunto. Segundo Lima (2002, p.116), o CRG sugere [...] que nenhuma lista pode ser imposta mecanicamente ao assunto. Alm disso, o CRG acredita que nenhuma lista deva
2 ID: Identidade gerada pela numerao automtica do sistema, conforme a entrada do material no prottipo.

GT2 551

ser necessariamente exaustiva ou aplicada a todos os assuntos. Neste quesito, tal adoo foi muito importante para este trabalho, diante da contribuio dos aspectos que envolvem a passagem de uma organizao estruturada notacional para uma estrutura sistemtica de termos (figura 2). 5. Tempo
c. d. e. f. g. Curso da Manh Curso da Tarde Curso da Noite Primeiro Semestre Segundo Semestre

Figura 2: Organizao sistemtica estruturada pela categoria Tempo [T].

Fonte: Dados da pesquisa (2011).

Entretanto, alguns conceitos receberam outras denominaes para representar, de maneira mais fidedigna, a realidade do Setor Pedaggico. Assim, Personalidade [P] assumiu Tipologia; Matria [M] assumiu Propriedade (qualidade) e Matria (substncia); Energia [E] assumiu Ao; Espao [S] assumiu Lugar; e Tempo [T] manteve sua rotulao. Para a estrutura do sistema, as categorias e suas respectivas facetas precisavam de uma ordem de apresentao, ou seja, de uma Ordem de Citao, que a ordem de aplicao dos princpios de diviso. O exemplo da figura 1, para ser apresentado desta maneira, foi estruturado segundo regras que objetivavam a Ordem de Citao deste trabalho. Ranganathan, para organizar o conhecimento e orientar na escolha da sequncia de facetas, adotou como referncia a Policotomia Ilimitada e a rvore Baniana. Sua ordenao se deu pela criao de uma srie de Cannes e Princpios, cujo objetivo atingir o que ele mesmo denominou de Canne da Sequncia til. Buscando adotar uma Sequncia til para este trabalho, cinco regras, entre cnones e princpios foram seguidas: Cnone Cadeia de Classes: Extenso Decrescente; Princpio da Contiguidade Espacial; Cnone Renque de Classes: Seqncia til e Sequncia Consistente; e Princpio da Seqncia Cannica. No Cnone Cadeia de Classes, aplicamos a regra Extenso Decrescente, que apresenta a classe geral antes das especficas. No sistema, observamos o aprofundamento em uma das sequncias da categoria Personalidade [P], iniciando no mais geral Profissionais, passando por Professor e decrescendo at o mais especfico Professor de Informtica. A segunda regra adotada para organizar a sequncia de facetas foi Princpio do Posterior-naEvoluo, que segue a organizao de conceitos ligados a processos evolutivos. Esta regra pode ser observada em uma sequncia da categoria Matria [M], no foco Nivelamento, ao exigir que o aluno seja aprovado em diferentes mdulos para adquirir conhecimentos aprofundados de determinado curso: Bsico, Intermedirio e Avanado. No Cnone Renque de Classes, adotamos a regra Seqncia til, j que seguimos sequncias GT2 552

de classes consideradas teis aos propsitos da classificao das informaes no sistema. Como exemplo, temos, na categoria Personalidade [P], no foco Documentos, uma sequncia de renques iniciada por Administrativo e na especificao Cadastro de Professor e Cadastro de Aluno. Esta uma sequncia til para o sistema, baseada nas atividades realizadas na Instituio em pesquisa. Ainda no Cnone Renque de Classes, adotamos tambm a regra Sequncia Consistente, porque pode ocorrer de conceitos iguais surgirem em mais de um ponto da estrutura de classificao, exigindo que todos tenham a mesma ordenao. Na categoria Personalidade [P], foco Documentos, temos em Ensino, uma sequncia de facetas formada por Apostila, Livro e CD-ROM. J na categoria Matria [M], foco Por Matria (substncia), temos a mesma sequncia formada por Apostila, Livro e CD-ROM. Na primeira categoria, a sequncia refere-se tipologia de documentos utilizados no Ensino; na segunda categoria, a sequncia est associada substncia que formam os materiais: como papel e plstico. Outra regra seguida foi o Princpio da Seqncia Cannica, que consagra a tradio, ou seja, a ordem mais conhecida comumente por todos os que usam o sistema. Neste caso, na categoria Tempo [T]; para o foco Turno, compreendemos que a sequncia conhecida por todos Manh, Tarde e Noite. Definida a modelagem conceitual, em outro trabalho ser apresentada a representao da modelagem lgica e fsica, em cujas etapas da modelagem de dados, as informaes devero ser organizadas e relacionadas como subsdios para a implementao do Sistema Facetado no Setor Pedaggico. 5 CONSIDERAES FINAIS Ao longo do presente trabalho, foi possvel perceber a importncia da organizao para a efetiva recuperao da informao. Para muitos, o problema dos resultados de busca se refere s ferramentas de busca, ou ao excesso de informaes. Entretanto, buscando autores que defendem outra perspectiva, nos baseamos naqueles que asseveram que o problema se encontra na organizao, ou seja, como as coisas, e os objetos so classificados. Nas aplicaes desenvolvidas pelos profissionais de Cincia da Computao (CC) e reas afins, ntida a no preocupao com os elementos que esto por trs da interface, por trs da mscara do sistema visualizada pelos usurios. Em vrias discusses e fruns, verificamos a preocupao pelo desenvolvimento de ferramentas de busca cada vez melhores, em plataformas que ofeream um visual deslumbrante e amigvel. Baseado nos estudos tericos buscou-se discutir o que se encontra por trs da interface do sistema, ou seja, a organizao/classificao, preocupao esta respalda na Cincia da Informao (CI). O que propormos a fazer o chamado trabalho sujo, isto , um trabalho que exige ter conhecimento sobre representaes e sistemas de classificao. GT2 553

A CI nos ofereceu os elementos necessrios para a construo de um sistema para a catalogao, classificao e, por fim, recuperao dos materiais do Setor Pedaggico da Instituio X. Neste certame, ao longo dos estudos para a definio dos mtodos de organizao do conhecimento a serem usados, identificamos a necessidade de aperfeioamento dos mtodos tradicionais, especialmente quando falamos da Web, onde as informaes encontram-se desorganizadas. Foi exatamente esta constatao que nos levou a crer que o problema no est na recuperao, mas no processo de organizao. Nas prticas da CI, enraizadas na Biblioteconomia, mais especificamente nas bibliotecas tradicionais, encontramos sistemas de classificao chamados bibliogrficos, originalmente criados e usados em colees de livros. Entretanto, caractersticas desses sistemas, como a organicidade de assuntos e as relaes entre eles so plausveis de aplicao em ambientes digitais. Adotamos a Teoria da Classificao Facetada (TCF), do matemtico e indiano Shiyali Ramamrita Ranganathan (18921972), complementada pelo princpio das categorias fundamentais, proposta pelo Classification Research Group (CRG). Aps os devidos estudos, ambos foram inseridos em um ambiente digital, neste caso, um prottipo de Banco de Dados (BD). Ao longo da idealizao do sistema, muitas foram s semelhanas encontradas. Dentre elas, percebemos que, assim como na classificao facetada, os sistemas computacionais por modelagem de dados, em BD, tambm objetivam a estruturao do conhecimento, atravs da organizao de seus conceitos e da criao de relacionamentos entre eles, permitindo o mapeamento de uma rea de assunto e a incluso de novos conceitos, sem alterar a estrutura do sistema. Segundo as semelhanas entre a TCF de Ranganathan e os BDs, foi iniciado o desenvolvimento de um Sistema de Banco de Dados (SBD). Este prottipo de BD, que intitulamos Sistema Facetado, tem como objetivo solucionar problemas, tipo: produo/confeco da mesma apostila vrias vezes, e a no localizao de suportes como fitas VHS, CDs etc., devido inexistncia, ou m organizao ali presente, tanto nos mnimos materiais fsicos, como nos criados digitalmente. Concluda a aplicao da TCF no Sistema Facetado, por meio da modelagem conceitual, constatamos que a anlise de determinado assunto por facetas (PMEST), significou que o mesmo era visualizado pelas manifestaes das caractersticas, ou facetas a ele atribudas, assunto que, no caso deste trabalho, chamamos de conceitos. Estas manifestaes foram muito importantes, pois o Sistema Facetado tornou-se multidimensional e ilimitado, representados pelas facetas e organizadas por categorias, ou seja, uma lista de conceitos, hierarquizados igualmente aos seus respectivos assuntos gerais, refletindo a aplicao de um princpio bsico de diviso. Muitas foram s contribuies da TCF para o Sistema Facetado, o que comprova sua aplicao em ambientes digitais. Com isso, desejamos o surgimento de mais estudos sobre esta temtica, alm de acreditar que o presente trabalho inspire aqueles que decidam enveredar por esse caminho, assim como decidi, graas s leituras encorajadoras das Teses das professoras Maria Luza de Almeida GT2 554

Campos e Gercina ngela Borm de O. Lima. O Sistema Facetado um prottipo. Muito resta ainda a fazer. Este trabalho apresentou parte da modelagem de dados: a modelagem conceitual. Em outro momento apresentaremos a modelagem lgica, e fsica, alm do Sistema Facetado em funcionamento. Ainda faz-se necessrio salientar: expandiremos o uso do sistema para os materiais dos demais cursos oferecidos pela Instituio. Abstract: The present study focalizes Ranganathans Theory of Faceted Classification (TFC) as possibility of knowledge structuring through the organization of concepts and relationships creation in a environment of Database (DB). Contributions of Information Science (IS) for the research by defend the importance of organization for effective information retrieval is discussed: descriptive and thematic representation of information. The five categories established by Ranganathan and facets in this system called PMEST are cited: Person, Material, Energy, Space and Time. From an applied and exploratory research, the object is to investigate the possibility of applying the faceted classification to knowledge organization, looking for information retrieval in the database. More specifically, we also want to check the applicability of faceted classification with data modeling in digital environments. Use as the development stage of the research prototype database, specifically the initial phase of data modeling (conceptual modeling), subsidized by a literature search on Thematic Representation of Information. Presents as search results the determination of the terms representing the materials/ documents, through the TFC in conceptual modeling of the prototype database, searching the organizing and retrieving information in the institution researched. We conclude that it is possible to adopt the TFC in digital environments and that this action may be taken by the conceptual model, featuring a faceted classification structure unlimited, flexible, and multidimensional. Keywords: Thematic Representation. Ranganathans Theory of Faceted Classification. Data Modeling. Conceptual Modeling. REFERNCIAS ANJOS, L. dos. Sistemas de classificao do conhecimento na Filosofia e na Biblioteconomia: uma viso histrico-conceitual crtica com enfoque nos conceitos de classe, de categoria e de faceta. So Paulo, 2008. 290f. Tese (Doutorado em Cincia da Informao) Curso de Ps Graduao em Cincia da Informao Escola de Comunicaes e Artes, Universidade de So Paulo, So Paulo, 2008. BARBOSA, A. P. Classificaes facetadas. Ci. Inf. Rio de Janeiro, v.1, n. 2, p. 73-81, 1972. Disponvel em: <revista.ibict.br/index.php/ciinf/article/download/1665/1271>. Acesso em 11 jan. 2010. _____. Teoria e prtica dos sistemas de classificao bibliogrfica. Rio de Janeiro: Instituto Brasileiro de Bibliografia e Documentao, 1969. BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The semantic WEB. Scientific American, New York, v. 284, n. 5, p.35-43, may 2001. Disponvel em: <http://www.scientifi camerican.com/2001/0501issue/0501bernerslee.html>. Acesso em: 12 jan. 2010. CAMPOS, M. L. A. A organizao de unidades do conhecimento em hiperdocumentos: o modelo conceitual como um espao comunicacional para realizao da autoria. 2001. 190f. Tese (Doutorado em Cincia da Informao) - CNPq/IBICT-URFJ/ECO, Rio de janeiro, 2001. GT2 555

CESARINO, M. A. da N. Sistemas de recuperao da informao. Revista da Escola de Biblioteconomia da UFMG. v. 14, n. 2, p.157-68, set. 1985. Disponvel em: <http://portaldeperiodicos. eci.ufmg.br/reb/>. Acesso em: 29 jan. 2010. COUGO, P. Modelagem conceitual e projeto de banco de dados. Rio de Janeiro: Campus, 1997. DUARTE, E. A.; CERQUEIRA, R. F. P. de. Anlise Facetada: um olhar face a modelagem conceitual. Revista Digital de Biblioteconomia e Cincia da Informao, Campinas, v. 4, n. 2, p. 39-52, jan./ jun. 2007. Disponvel em: <http://www.sbu.unicamp.br/seer/ojs/index.php/ sbu_rci/article/viewFile/339/221>. Acesso em: 02 jan. 2010. FURGERI, S. Representao de informao e conhecimento: estudo das diferentes abordagens entre a cincia da informao e a cincia da computao. Campinas: PUC-Campinas, 2006. FURTADO, A. L.; SANTOS, C. S. dos. Organizao de Banco de Dados. 2. ed. Rio de Janeiro: Campus, 1980. GIL, A, C. Mtodos e tcnicas de pesquisa social. 4. ed. So Paulo: Atlas, 1994. GOMES, H. E.; MOTTA, D. F. da; CAMPOS, M. L. de A. Revisitando Ranganathan: a classificao na rede. 2006. Disponvel em: <http://www.conexaorio.com/biti/revisitando/revi sitando.htm#canones>. Acesso em: 10 jan. 2011. INGWERSEN, P.; WORMELL, I. Ranganathan in the perspective of advance information retrieval. Libri, v. 42, n. 3, p.184-201, jul./set. 1992. LIMA, G. A. B. A anlise facetada na modelagem conceitual de sistemas de hipertexto: uma reviso de literatura. Perspectiva em Cincia da Informao. Belo Horizonte, v. 7, n. 2, p. 189-196, jul./ dez. 2002. Disponvel em: <portaldeperiodicos.eci.ufmg.br/index.php/pci/article /view/407/219>. Acesso em 20 jan. 2010. _____. Mapa Hipertextual (MHTX): um modelo para organizao hipertextual de documentos. 2004, 199f. Tese (doutorado em Cincia da Informao). Curso de Ps Graduao em Cincia da Informao Escola de Cincia da Informao, Universidade Federal de Minas Gerais, Minas Gerais, 2004. MACHADO, F.; ABREU, M. Projeto de Banco de Dados: uma viso prtica. 11. ed. So Paulo: Editora rica, 1996. MANIEZ, J. Des classifications aux thsaurus: du bon usage des facettes. Documentaliste Sciences de linformation, v. 36, n. 4-5, p.249-262, 1999. Disponvel em: <http://www.adbs.fr/desclassifications-aux-thesaurus-du-bon-usage-des-facettes-13338.htm? RH=REVUE>. Acesso em: 12 jan. 2011. MAS, S. [et al.]. Classification facettes et modles base de points de vue: Diffrences et complmentarit. 36e congrs annuel de ACSI: University of British Columbia, Vancouver, 5-7 jun. 2008. Disponvel em: <http://www.caisacsi.ca/proceedings/2008/mas_2008.pdf>. Acesso em: 24 out. 2010. MIRANDA, M. L. C. de. Organizao e Representao do Conhecimento: fundamentos tericometodolgico na busca e recuperao da informao em ambientes virtuais. 2005, 353f. Tese (Doutorado em Cincia da Informao). Curso de Ps Graduao em Cincia da Informao GT2 556

Convnio CNPQ/IBICT UFRJ/ECO, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2005. OLIVEIRA, S. L. de. Tratado de Metodologia Cientfica: Projetos de Pesquisas, TGI, TCC, Monografias, Dissertaes e Teses. So Paulo: Pioneira, 2001. RANGANATHAN, S. R. Prolegomena to library classification. Bombay: Asia Publ. House, 1967. SILVA, M. B. da. NEVES, D. A. de B. Estudo sobre o uso da teoria da classificao facetada em banco de dados. XI Encontro Nacional de Pesquisa em Cincia da Informao (ENANCIB), Rio de Janeiro, 25-28 de outubro de 2010. Anais. Disponvel em: <http://congresso.ibict.br/index.php/ enancib/xienancib>. Acesso em: 05 jan. 2011. SPEZIALI, P. Classifications of the sciences. DICTIONARY of the history of ideas. New York: Scribners, 1973. p. 462-467. VICKERY, B. C. Classificao e indexao nas cincias. Rio de Janeiro: BNG/Brasilart, 1980.

GT2 557

COMUNICAO ORAL

IDENTIFICAO ARQUIVSTICA: SUBSDIOS PARA A CONSTRUO TERICA DA METODOLOGIA NA PERSPECTIVA DA TRADIO BRASILEIRA
Ana Celia Rodrigues Resumo A identificao uma tarefa de pesquisa sobre a gnese do documento de arquivo, desenvolvida no incio do tratamento documental para definir requisitos normalizados de planejamento das funes que sustentam o tratamento tcnico documental, seja no momento da produo ou da acumulao (produo, classificao, avaliao e descrio). Esta pesquisa tem por objetivo lanar bases tericas para caracterizar a identificao como funo independente no mbito da metodologia arquivstica, sistematizando-a na perspectiva da tradio arquivstica brasileira. Nesse sentido, aliar uma dimenso terica a uma dimenso aplicada. Do ponto de vista terico, busca-se especificamente analisar a dimenso conceitual da identificao no contexto das metodologias arquivsticas e sistematizar seus procedimentos, servindo como referencial metodolgico para a realizao de praticas arquivsticas desenvolvidas no Brasil. Na dimenso aplicada, tem por objetivo desenvolver estudos de caso de identificao arquivstica no mbito de programas de gesto de documentos e tratamento de massas documentais acumuladas em arquivos, verificando a aplicabilidade dos princpios tericos e metodolgicos da identificao. Como estudo de caso de identificao vem sendo desenvolvido o projeto de pesquisa Identificao arquivstica: utilizando a diplomtica contempornea como fundamento metodolgico no Programa de Gesto de Documentos do Governo do Rio de Janeiro, projeto financiado pelo Programa Jovem Pesquisador UFF 2009. Neste estudo, so aplicados os parmetros da diplomtica contempornea para a identificao da tipologia documental, objetivando a normalizao de procedimentos para classificar e avaliar os documentos das Secretarias de Fazenda e de Planejamento do Governo do Estado do Rio de Janeiro no mbito do Projeto de Gesto de Documentos (PGD), atravs de parceria institucional estabelecida entre o Arquivo Pblico do Estado / Casa Civil do Governo do Estado do Rio de Janeiro e a Universidade Federal Fluminense. Recortes temticos dessa pesquisa vm sendo abordados no mbito de projetos de TTC em Arquivologia, PIBIC e do Mestrado em Cincia da Informao da UFF, integrando a produo do Grupo de Pesquisas Gnese Documental Arquivstica, UFF/CNPq. Palavras-chave: Arquivstica. Metodologia Arquivstica. Identificao Arquivstica. Tipologia Documental. Diplomtica Contempornea. Abstract Identification is a task of research on the genesis of the record developed at the beginning of the documentary to set standard requirements of the planning functions that support the technical processing of documents, either at the production or accumulation (production, classification, evaluation and description). This research aims to launch a theoretical basis for identifying and characterizing the independent function within the archival methodology, systematizing it in the perspective of the GT2 558

archival tradition in Brazil. In this sense, an allied theoretical dimension to a dimension applied. From the theoretical point of view, we seek to specifically examine the conceptual dimension of identification in the context of archival methodologies and systematize its procedures, serving as a methodological framework for conducting archival practices developed in Brazil. Dimension in applied, aims to develop case studies of identification in the context of archival programs, document management and mass treatment of documents accumulated in files, checking the applicability of the theoretical and methodological principles of identification. As a case study has been developed to identify the research project Archival Identification: Using the contemporary diplomatic and methodological foundation in the Document Management Program of the Government of Rio de Janeiro, a project funded by the Young Investigator 2009 UFF. In this study, we applied the parameters of contemporary diplomatic to identify the document type, aiming at standardization of procedures for classifying and evaluating the documents of the Secretaries of Finance and Planning of the State Government of Rio de Janeiro under the Project Management Documents through an institutional partnership established between the Public Archives of State / Government of the Civil House of the State of Rio de Janeiro and Fluminense Federal University. Scraps theme of this research have been addressed in the context of projects in Archival TTC, PIBIC and the Masters in Information Science from the UFF, integrating the production of the Research Group Genesis Document Archival, UFF / CNPq. Keywords: Archival. Archival methodology. Archival Identification. Typology documentary. Diplomatic contemporary. Introduo A apario do termo identificao na literatura arquivstica remonta aos anos 80, como resultado de experincias metodolgicas desenvolvidas por grupos de arquivistas que se formaram em pases ibero-americanos para solucionar problemas de acumulao de documentos em arquivos, contexto em que se inserem as prticas espanholas e brasileiras, nosso objeto de estudos. Na Espanha, nos anos 90, o conceito foi incorporado pelo Diccionrio de Terminologia Archivstica, resultando na publicao de artigos e manuais especializados. No Brasil, o conceito aparece no Dicionrio Brasileiro de Terminologia Arquivistica, publicado em 2005. Ambos se referem identificao como fase do processamento tcnico, de tipo intelectual, que tem por objeto de estudos o rgo produtor e os documentos gerados no exerccio de suas atividades. O conhecimento produzido nesta fase de pesquisa fica registrado em instrumentos especficos e fundamentam o desenvolvimento das funes de planejamento da produo, classificao, avaliao e descrio de documentos de arquivo. Muitas inovaes nos mtodos de trabalho arquivstico apareceram no perodo como resultado das experincias desenvolvidas. Os processos de identificao, seu objeto e metodologia foram alvo de debates em reunies profissionais e mereceram a ateno de pesquisadores da rea, por praticamente uma dcada. As experincias realizadas no mbito de sistemas de arquivos na Espanha geraram estudos tericos e aplicaes prticas que acabaram destacando o pas no panorama arquivstico internacional. Na Espanha, as discusses sobre a normalizao dos processos de identificao de documentos de arquivo, para o controle da acumulao ou planejamento da gesto, abriram perspectivas que influenciaram a arquivstica ibero-americana e, neste contexto, a do Brasil. GT2 559

Identificao como pesquisa cientfica em arquivstica A identificao uma tarefa de pesquisa sobre a gnese do documento de arquivo, desenvolvida no incio do tratamento documental para definir requisitos normalizados de planejamento das funes que sustentam o tratamento tcnico documental, seja no momento da produo ou da acumulao (planejamento da produo, classificao, avaliao e descrio). No mbito da gesto documental a pesquisa discute especialmente a identificao de documentos desenvolvidos nos parmetros da diplomtica contempornea (ou tipologia documental) como base para a padronizao de tipologias para produo de documentos e funcionamento de sistemas de gerenciamento eletrnico de documentos (GED). Esta pesquisa requer a busca de informaes, em fontes especificas, sobre o rgo produtor (contexto) e os documentos (tipologia documental), seja em fase de produo e/ou acumulao, elementos que caracterizam este contexto, no desempenho de competncias e funes especficas deste rgo produtor e da tipologia documental, que registra os procedimentos administrativos realizados para cumpri-las (CARMONA MENDO, 2004, p. 40). Esta fase da metodologia arquivstica denominada identificao, consiste em estudar analiticamente o documento de arquivo e os vnculos que mantm com o rgo que o produziu, seja em fase de produo ou de acumulao. Neste sentido, um trabalho de pesquisa e de crtica sobre a gnese documental. O documento de arquivo produzido de forma involuntria, criado no decurso de uma atividade. o resduo material da ao que lhe d origem. a prpria ao autodocumentada, como o define Menne-Haritz (1998). Uma ao qualquer exerccio de vontade que objetiva criar, mudar, manter ou extinguir situaes, e constitui o ncleo do documento, ressalta Heather MacNeil (2000, p. 93). Desta caracterstica essencial, inerente a sua gnese, decorre sua natureza probatria. A identidade do documento de arquivo se mostra atravs dos elementos que o integram: sua estrutura e substncia. Esto representadas atravs de regras, que contm elementos intrnsecos e extrnsecos. Estes caracteres so estudados do ponto de vista da diplomtica e tambm da arquivstica, por autores como Luciana Duranti, Schellenberg e Vicenta Corts Alonso, entre outros. Esta capacidade de provar o fato que lhe d origem resultado da especial relao que o documento possui com o rgo que o produz, o vinculo que se revela no contedo pela atividade registrada, que constitui o ncleo de sua identidade. O vnculo arquivstico, to bem discutido por Luciana Duranti (1997), o componente essencial do documento de arquivo, que revela sua verdadeira natureza, que determina sua identidade, pois definido pela sua ligao com o rgo produtor. O procedimento da identificao realizado a partir de um conjunto de atividades integradas, com uma unidade metodolgica e desenvolvidas na seguinte ordem: primeiro identifica-se o organismo produtor (evoluo orgnica e competncias administrativas), elemento funcional (competncias, GT2 560

funes e atividades), tipo documental (procedimento administrativo e trmite) e delimitao da srie documental (TORRE MERINO; MARTN-PALOMINO, 2000, p.14). Assim, a pesquisa realizada em duas etapas e consiste na: 1. Identificao do rgo produtor: contexto onde os documentos de arquivo so produzidos. a) Elemento orgnico: rgo produtor dos documentos. b) Elemento funcional: representado pelas funes e atividades administrativas desempenhada pelo rgo, em virtude da competncia que tem a seu cargo e que compe a serie documental. (MOLINA NORTES; LEYVA PALMA, 1996, p.158) 2. Identificao do tipo e delimitao da srie documental: levantamento de informaes sobre os elementos que caracterizam os documentos de arquivo, o tipo documental. Momento em que se estudam os caracteres internos e externos dos documentos, elementos de identidade que se refere a sua estrutura fsica (gnero, suporte, formato e forma) e ao seu contedo (funo, atividade), para denominar o tipo e a srie documental. A srie documental constitui o objeto de estudo da arquivstica e sobre ela versa toda proposta de tratamento tcnico. Os dados obtidos so registrados em instrumentos prprios de cada etapa que fornecem os parmetros tericos para as anlises que sero realizadas nas outras fases da metodologia arquivstica, ou seja, avaliao, organizao e descrio. A identificao pode ser desenvolvida durante todas as fases do ciclo de vida dos documentos, podendo, portanto, incidir sobre o momento de sua produo, para efeito de implantao de programas de gesto de documentos, ou no momento de sua acumulao, para controlar fundos transferidos ou recolhidos aos arquivos, no mbito dos sistemas de arquivo. No mbito dos processos de identificao interessa verificar como a identificao de tipologias documentais esta relacionada com as atuais discusses em torno da teoria e da metodologia da diplomtica. tambm nestes anos 80, a partir dos modernos estudos arquivsticos que a diplomtica ressurge, reinventada, para alguns, ou adaptada, para outros, com o objetivo de aplicar os princpios tericos e metodolgicos aos documentos de arquivo. A Diplomtica uma metodologia analtica de investigao que no se fixa preliminarmente no conhecimento dos rgos produtores, mas nos procedimentos administrativos de criao dos documentos, sem desconsiderar, entretanto, as estruturas organizacionais e a competncias a elas atribudas. O estudo do documento tomado como referencia, porque ele fala por si mesmo, refletindo as relaes expressas entre a forma documental e o contexto administrativo de sua produo, conhecimento que fundamenta o desenvolvimento das funes arquivsticas em qualquer momento do ciclo de vida documental. Paola Carucci define a diplomtica como a disciplina que estuda o documento singular ou, GT2 561

se preferirmos, a unidade arquivstica elementar, o documento, mas tambm o arquivo, o registro, analisando, sobretudo, os aspectos formais para definir a natureza jurdica dos atos, tanto na sua formao quanto nos seus efeitos. A anlise diplomtica do documento associa-se, portanto ao conhecimento dos modos nos quais se forma a vontade expressa no ato jurdico e o conhecimento da forma na qual o ato se manifesta, isto , das caractersticas prprias do documento em cujo ato representado (CARUCCI, 1987, p. 27). A autora ressalta que os requisitos para os estudos diplomticos que foram identificados na critica os documentos medievais continuam vlidos para a diplomtica dos documentos modernos e contemporneos, sobretudo agora que no ambiente eletrnico exige a identificao do documento arquivstico no interior do sistema de informao (CARUCCI, 1994, p. 65). No Canad, Luciana Duranti examina os princpios e conceitos desenvolvidos pelos tericos diplomatistas para avaliar a autenticidade de documentos medievais, verificando se poderiam ser adaptados para analisar documentos produzidos pela burocracia moderna. O foco de sua preocupao terica a aplicao do mtodo diplomtico para o planejamento da produo dos documentos eletrnicos e a anlise do valor probatrio que eles apresentam. A autora a qualifica como diplomtica arquivstica, disciplina que estuda o que , e o que vem a ser os documentos, a relao estabelecida com o seu produtor e os fatos neles representados, conceituando-a como estudo das formas e dos processos de formao dos documentos de arquivo (DURANTI, 1995, p.1). Nestes anos 80 a Espanha tambm se destaca no movimento de renovao terica da diplomtica, produzindo importantes estudos tericos e de diplomtica especial aplicados aos documentos administrativos, contexto no qual se destacam as contribuies Manuel Romero Tallafigo, Antonia Heredia Herrera, Vicenta Corts e do Grupo de Trabalho dos Arquivistas Municipais de Madri, preocupados por definir o que entendemos por documento de arquivo e em identificar as partes que o integram, elencando seus caracteres internos e externos. Vicenta Corts Alonso coordenou o Grupo de Arquivistas Municipais de Madri, pioneiro em aplicar a metodologia para a identificao de tipologias de documentos pblicos para a realizao de tarefas arquivsticas. O grupo inova ao aplicar a perspectiva gentico-comparativa preconizada pela diplomtica clssica, para identificar as sries acumuladas em arquivos e a partir da comparao com as atuais, normalizar as sries documentais para efeitos de tratamento arquivstico. A partir destes resultados inicia-se um movimento de formao de grupos de trabalhos na rea. Outras iniciativas foram surgindo, adaptando o modelo s circunstancias e especificidades das administraes estudadas. No Brasil os textos publicados por Helosa Liberalli Bellotto (1982 e 1990) so considerados como referencial terico sobre tipologia documental e os conceitos abordados pela autora, foram incorporados literatura arquivstica e prtica desenvolvida nos arquivos do pas. Esta autora traz para os estudos diplomticos, a diferena entre espcie documental e tipo documental, o que no tinha sido abordado antes por outros autores. Esta diferena foi aplicada metodologicamente, nos trabalhos preparatrios de instrumentos de gesto, tais como as tabelas de temporalidade do Sistema GT2 562

de Arquivos da USP, do Governo do Estado de So Paulo, do Arquivo Pblico Municipal de Campo Belo, com xito e atualmente vem sendo aplicada como metodologia bsica para o Programa de Gesto de Documentos do Governo do Estado do Rio de Janeiro, sob nossa orientao. A identificao, enquanto pesquisa realizada sobre os documentos de arquivo efetuada com metodologia preconizada pela diplomtica contempornea, que confere ao trabalho arquivstico a dimenso da qualidade cientfica. A construo do termo e do conceito de identificao Na dcada de 80, o problema comum compartilhado pela arquivstica ibero-americana era a acumulao de documentos em depsitos de arquivos. Produto das experincias desenvolvidas em arquivos dos pases envolvidos, o conceito de identificao e o mtodo analtico que o sustenta foram construdos no interior do Grupo Ibero-Americano de Tratamento de Arquivos Administrativos, do qual participavam Espanha, Portugal, Brasil, Mxico e Colmbia. O grupo estabelece as bases metodolgicas da identificao e formula o conceito, caracterizando-a como fase independente no mbito das metodologias arquivsticas, antecedendo a avaliao e, ambas prvias a descrio no tratamento de fundos (CONDE VILLAVERDE, 1991, p.17-18).
Este enfoque sob a metodologia da identificao vista como funo independente no mbito do processamento tcnico, marcou a arquivstica de pases ibero-americanos. Pode-se verificar a influncia desta corrente nos dicionrios de terminologia arquivstica e nas concepes de manuais de normas e procedimentos para a classificao e avaliao, publicados em 2004 pelos arquivos nacionais do Mxico e Colmbia, para citar alguns exemplos.

Na Espanha, Jos Lus La Torre Merino e Mercedes Martn-Palomino y Benito, no manual Metodologa para la identificacin y valoracin de fondos documentales, publicado em 2000, pela Escuela Iberoamericana de Archivos, em Alcal Henares, sintetizam esta perspectiva ao afirmarem que esta metodologia no significa uma mudana na tradio arquivstica espanhola, seno a individualizao e sistematizao de uma srie de tarefas, entre elas a identificao e avaliao de fundos documentais (p.11, grifo nosso). Em 1992, Maria Luisa Conde Villaverde, lana as bases do conceito, afirmando que se entende por identificao a fase do tratamento arquivstico que consiste na investigao e sistematizao das categorias administrativas e arquivsticas em que se sustenta a estrutura de um fundo (CONDE VILLAVERDE, 1991, p.18) e em 1993, esta definio incorporada pelo Diccionario de Terminologia Arquivstica espanhol (p.37). Entretanto, a apario do termo identificao na literatura arquivstica espanhola, num primeiro momento deu lugar a alguma confuso, j que no se localizava corretamente sua posio no contexto das tarefas arquivsticas. Alguns autores afirmaram que era uma fase de tratamento anterior classificao, como para dicionrio de termos arquivsticos do Servio Regional de Arquivos da Comunidade de Madri (s/d), onde consta a seguinte definio de identificao: Uma operao previa a classificao que conduz ao conhecimento do rgo, GT2 563

das unidades administrativas, que produzem os documentos e suas funes, leis e atos normativos, que o originaram, tipos documentais e sries documentais produzidas no exerccio de suas funes. Ou ainda para Molina Nortes; Leyva Palma (1996, p.72). Dentro desta fase da identificao se esta procedendo classificao intelectual do fundo documental. Ou seja, com todo este material recolhido na fase da identificao, se pode elaborar um quadro de classificao que serve para dotar a documentao de uma estrutura sistemtica que seja reflexo do funcionamento do rgo produtor. Merecem referncia neste sentido os trabalhos de La Torre Merino e Martn-Palomino y Benito (2000), Alberch i Fugueras (2004, p.108) e Carmona Mendo (2004, p.41), grupo de autores espanhis para os quais a identificao considerada a primeira fase da metodologia arquivstica que tem por finalidade o tratamento de fundos (administrativos ou histricos), atravs do conhecimento dos elementos que constituem a srie documental, para estabelecer os critrios de organizao do fundo (elaborao do quadro de classificao e a ordenao de suas sries documentais) propondo as bases para a avaliao e descrio (CONDE VILLAVERDE, 1992, p. 43). Compete ao arquivo central a identificao de fundos, devendo compartilhar com o arquivo intermedirio a avaliao. A identificao se realizar preferencialmente sobre fundos administrativos, ainda que se possa realizla sobre fundos considerados histricos, destacam Torre Merino e Martn-Palomino y Benito (2000, p.13).
No incio a utilizao desta terminologia no implicou numa mudana de propostas arquivsticas, seno que simplesmente era usada pelos autores como sinal de modernidade, como ressalta Lpez Gmez (1998). O tempo foi consolidando esta pratica de trabalho, tornando-a definitiva no meio arquivstico espanhol. Os critrios vo sendo fixados em toda a legislao pertinente sobre sistemas de arquivos implantados no pas, tendo como exemplo mais expressivo o Sistema de Arquivos Andaluz.

No Decreto 97/2000, que estabelece o Regulamento do Sistema Andaluz de Arquivos, a identificao reconhecida como a primeira fase do tratamento arquivstico, que consiste na anlise da organizao e das funes das pessoas fsicas ou jurdicas, publicas ou privadas e das sries documentais que produzem como base para a avaliao documental e para a organizao e descrio arquivsticas. A identificao obrigatria para qualquer fundo documental e dever se feita, preferencialmente, nas reas de produo documental (art. 27). Define ainda os objetivos da identificao e avaliao na gesto documental, que permitir estabelecer as propostas de normalizao, realizadas pelo arquivista em colaborao com os organismos gestores que afetaro as nomenclaturas das sries acumuladas, examinando seus procedimentos administrativos, a sua descrio e seu tratamento informtico (art. 30). Os formulrios que foram utilizados para os estudos de identificao e avaliao aprovados pela Comisso Andaluza Qualificadora de Documentos Administrativos. A Espanha registra numerosas iniciativas de criao de grupos de trabalho para identificar e avaliar documentos de arquivo. No mbito municipal outras propostas se destacam, com forte personalidade, apresentando resultados que somados se traduzem numa verdadeira teoria da gesto de documentos em mbito local, como afirma Pedro Lpez Gmez (1998). GT2 564

O Brasil participou do movimento internacional iniciado na dcada de 80, contribuindo com suas experincias e reflexes para construo de parmetros metodolgicos da identificao. Os projetos desenvolvidos pelo Arquivo Nacional, no perodo, dentro do Programa de Modernizao InstitucionalAdministrativa, registram a mesma preocupao com a soluo do problema da acumulao de fundos e da implantao de programas de gesto documental no mbito da administrao pblica federal. Por outro lado, a situao de catica de documentos acumulados nos depsitos do Arquivo Nacional, e nos rgos que compe a estrutura do governo federal, justificou a criao de grupos de trabalho voltados para a soluo dos problemas detectados. Em 1981, criado o Grupo de Identificao de Fundos Internos (GIFI), com a finalidade de encaminhar uma soluo para identificar os documentos acumulados na sede do Rio de Janeiro, pois dos dois bilhes de documentos que compunham o acervo, 50% no estava identificado e nem era conhecido de seus usurios e dos funcionrios, como afirma Celina Moreira Franco, ento Diretora Geral do Arquivo Nacional (AN. Identificao de Documentos, 1985, p.5). O maior problema enfrentado pelo grupo, ao iniciar suas atividades, foi a ausncia de padres metodolgicos capazes de fazer frente ao desafio.

Os manuais arquivsticos internacionais no apresentavam solues para o problema colocado o de identificar grandes volumes documentais em arquivos pblicos -, pois nos pases que os elaboraram, detentores quase exclusivo da produo de conhecimento na rea de arquivologia, o desenvolvimento dos arquivos impediu que tal situao se configurasse (AN. Identificao de Documentos, 1985, p.5).
Ainda no mesmo ano, criado outro grupo de trabalho, o Grupo de Identificao de Fundos Externos (GIFE), como objetivo de fornecer ao Arquivo Nacional m quadro global da documentao para possibilitar a criao de uma poltica de recolhimento, o planejamento de uma poltica de transferncias, bem como a implantao de um arquivo intermedirio. A experincia do grupo foi apresentada no V Congresso Brasileiro de Arquivologia, realizado em 1982, no Rio de Janeiro. O carter inovador desta metodologia proposta para o levantamento e identificao dos acervos repercutiu no meio arquivstico brasileiro, servindo posteriormente como referencial para os trabalhos desenvolvidos pelos arquivos estaduais e municipais. (AN. Manual de Identificao, 1985, p. 7-9). Atravs da Diviso de Pr-Arquivo, o Arquivo Nacional, elaborou o Projeto de Gesto de Documentos, com o objetivo de estabelecer uma organizao sistmica dos arquivos dos rgos pblicos federais. Entre 1984 e 1986, realizou-se uma experincia-piloto, no mbito do Ministrio da Agricultura, cujos objetivos especficos previam as etapas do programa de gesto, ou seja, o controle da produo, a avaliao e o controle sistmico dos arquivos correntes e intermedirios, e por fim assegurar as condies adequadas para implantao de recursos automatizados. (AN. Manual de Levantamento da Produo, 1986, p.7). Usando o termo levantamento da produo documental, os procedimentos e os instrumentos propostos revelam a importncia deste estudo prvio sobre o rgo produtor e seus documentos para efeitos de avaliao, perspectiva que caracteriza a metodologia da identificao, preconizada pela arquivstica espanhola. As propostas metodolgicas decorrentes do trabalho destes grupos se transformaram em manuais, denominados publicaes tcnicas: Manual para identificao de acervos documentais para a transferncia e/ou recolhimento aos arquivos pblicos (1985) do GIFE; Identificao de documentos em arquivos pblicos (1985) do GIFI e o Manual de levantamento da produo documental (1986), resultado do projeto de gesto. Nos objetivos das referidas publicaes, o termo identificao aparece como fundamento do mtodo de analise proposto para se iniciar o futuro tratamento dos fundos acumulados - cujo texto se destina aos arquivos pblicos do Brasil que desejam dispor de uma metodologia para identificao e registro de acervos documentais produzidos e acumulados pela administrao pblica. (AN. Manual de Identificao, 1985, p.5) ou para se enfrentar o desafiante trabalho de controlar

GT2 565

os documentos no momento de sua produo, para efeito de avaliao dos conjuntos - auxiliar aqueles que pretendem identificar os mecanismos de produo e trmites documentais, tarefa essencial aplicao de princpios da gesto documental (AN. Manual de Levantamento da Produo, 1986, p. 9). A utilizao do termo, a definio dos mtodos de trabalhos e a elaborao de instrumentos para se atingir as metas propostas, indicam que no Brasil esta fase de pesquisa estava sendo tratada como etapa independente e necessria ante as demais para o desenvolvimento das prticas profissionais.

Quando a documentao no sofreu nenhum tipo de tratamento, possvel que tambm no estejam fisicamente arranjadas (...). Deve-se ficar claro, no entanto, que isto no implica nenhuma organizao documental; na etapa da identificao, os documentos no sofrem qualquer arranjo fsico. Esta uma etapa importante, pois atravs da analise dos seus resultados pode-se retirar subsdios para a elaborao do modelo de arranjo (AN. Identificao de Documentos, 1985, p.8, grifo nosso).
Ao se referirem especificamente identificao como fase do trabalho arquivstico, os integrantes do GIFI, no Arquivo Nacional, dizem que uma etapa necessria organizao de acervos que no tenham recebido tratamento arquivstico algum. Visa no s estabelecer maior controle sobre esta documentao, como fornecer indicadores que possam nortear a elaborao de um modelo de arranjo. Assim preciso reconhecer a documentao antes de organiz-la (AN. Identificao de Documentos, 1985, p. 7). As metodologias formuladas se somaram s discusses internacionais e foram divulgadas atravs de manuais, que passaram a servir de modelos para as prticas desenvolvidas nos arquivos brasileiros. Este processo culminou com a formulao do conceito incorporado pelo Dicionrio Brasileiro de Terminologia Arquivstica (2005), onde a identificao vista como uma fase do processamento tcnico dos arquivos e definida como processo de reconhecimento, sistematizao e registro de informaes sobre arquivos, com vistas ao seu controle fsico e/ou intelectual. O controle intelectual se refere s metodologias arquivsticas usadas para tratar tecnicamente documentos acumulados em arquivos. Trata-se de um levantamento de dados sobre as caractersticas dos documentos arquivsticos para efeitos de classificao e descrio. O controle fsico, se refere dados sobre documentos acumulados em depsitos de arquivos, para fins de formulao de polticas de programas e sistemas de gesto e arquivos.

A partir dos anos 80 e durante toda a dcada dos 90, enquanto os arquivistas brasileiros iniciavam suas reflexes tericas e metodolgicas e o processo de sensibilizao para formulao de polticas de sistemas de arquivos, foi comum o uso dos diagnsticos de arquivo. No interior destas propostas, constavam tarefas especificas de identificao de documentos. O objetivo destes processos de identificao de documentos em fase de acumulao, preliminares a elaborao de projetos, deu origem a uma tradio no Brasil. Ana Maria de Almeida Camargo (1996, p. 11), se refere a este processo de identificao de depsitos de arquivos, como um mapeamento necessrio, que est presente na justificativa das propostas registradas pela literatura arquivstica brasileira. No Arquivo do Estado de SP, para a elaborao do diagnstico da situao dos arquivos das Secretarias de Estado, tarefa preliminar a implantao do sistema, o levantamento de dados, considerado tarefa imprescindvel realizao do diagnstico. O GIFE se referia ao processo como identificao de acervos, com a finalidade de levantamento e cadastramento de acervos documentais, para o estabelecimento de uma poltica nacional e uniforme de arquivos. (AN. Manual de Identificao, 1985, p.31) e o GIFI, como GT2 566

identificao, etapa necessria organizao de acervos que no tenha recebido tratamento arquivstico algum (AN. Identificao de Documentos, 1985, p.7). Heloisa Liberalli Belloto (2004, p.134) tambm contribui para a discusso sobre a identificao, abordando procedimentos para o tratamento de massas acumuladas em arquivos, formulando requisitos para a identificao de fundos, tarefa que considera preliminar e que deve ser realizada antes de qualquer outro processamento tcnico, na organizao no arquivo permanente. A partir dos textos publicados por Bellotto em 1982, e com novas abordagens em 1990, so divulgados no Brasil os estudos de anlise documental desenvolvidos pelo Grupo de Arquivistas Municipais de Madrid e apresentados com originalidade os aspectos tericos que fundamentam a tipologia documental. Na Espanha, entre os anos 80 e 90, a identificao foi amplamente discutida, sistematizada e reconhecida como funo autnoma por um grupo de autores, aplicada s tarefas de classificao e avaliao. O conceito foi incorporado definitivamente, resultando na publicao de artigos e manuais, que apresentam os objetivos e resultados, mtodo de anlise e instrumentos prprios desta fase da metodologia arquivstica. No mbito da arquivstica espanhola, o tema da identificao vem sendo objeto de reflexo para normalizao.
No Brasil, a metodologia da identificao divulgada nas publicaes tcnicas do Arquivo Nacional e as propostas metodolgicas de identificao aplicada fundos e tipologias documentais, presentes nos textos de Helosa Bellotto, demonstram a efetiva participao do pas neste movimento de inovao metodolgica que caracterizou o perodo. um momento em que os arquivistas buscam parmetros metodolgicos para solucionar os problemas prticos encontrados nos arquivos. Luciana Duranti abre uma nova perspectiva para a arquivstica, introduzindo o uso da metodologia diplomtica na reflexo sobre o momento da produo do documento. Os arquivistas espanhis, como Vicenta Corts Alonso, Maria Luiza Conde Villaverde e Antonia Heredia Herrera, esto aplicando os mesmos princpios, primeiramente, nas tarefas da classificao e depois, na avaliao de documentos.

O termo identificao comea a ser usado indistintamente pela rea, ora associado a funes especficas, ora designando uma funo independente no tratamento documental. Celina Moreira Franco, na apresentao do Manual de Identificao de Documentos (1985, p.6), chama a ateno para a importncia da aplicabilidade do modelo e da reflexo terica sobre seus resultados, no sentido de construir uma tradio arquivstica, onde, somente a diversidade das experincias desenvolvidas em outros arquivos permitir consagrar uma metodologia brasileira para uma realidade brasileira.
Embora, o tema tenha sido inicialmente amplamente discutido pela rea e em nvel internacional este debate tenha avanado, aqui no Brasil, o assunto no foi suficientemente discutido e permanece uma longa lacuna de produo terica sobre o assunto.

Neste contexto, algumas questes inditas se colocam para discusso e merecem aprofundamento em suas anlises:
possvel reconhecer a identificao como funo independente, e neste sentido utilizar os padres estabelecidos no ensino da arquivologia? Podemos falar de uma metodologia de identificao, especificamente brasileira, que merea uma sistematizao dos mtodos e instrumentos elaborados, a exemplo do que vem fazendo a Espanha?

GT2 567

A necessidade da pesquisa sobre a gnese do fundo, sobre o estudo dos caracteres internos e externos do documento e de sua correta insero no contexto de produo, como fundamento para trat-lo tecnicamente, no novidade terica e a literatura registra um sculo de discusses sobre o tema. O aspecto relevante desta proposta reside no fato da identificao ser, atualmente, reconhecida como uma funo autnoma por uma corrente de tericos espanhis, os quais apresentam os objetivos e resultados, o mtodo de anlise e instrumentos prprios e expressam, sobretudo, preocupaes quanto normalizao. Entretanto, esta concepo no aceita de forma consensual na rea, merecendo uma anlise mais detalhada quanto utilizao do termo e abrangncia do conceito proposto nas tradies arquivsticas dos pases que a formularam e dos autores que os referenciam em suas obras. Esta pesquisa tem por objetivo lanar bases tericas para caracterizar a identificao como funo independente no mbito da metodologia arquivstica, sistematizando-a na perspectiva da tradio arquivstica brasileira. Nesta perspectiva, aliar uma dimenso terica a uma dimenso aplicada. Do ponto de vista terico, busca-se especificamente analisar a dimenso conceitual da identificao no contexto das metodologias arquivsticas e sistematizar os procedimentos tpicos destas fases, servindo como referencial metodolgico para a realizao de praticas arquivsticas desenvolvidas no Brasil. Na dimenso aplicada, tem por objetivo desenvolver estudos de caso de identificao arquivstica no mbito de programas de gesto de documentos e tratamento de massas documentais acumuladas em arquivos, verificando a aplicabilidade dos princpios tericos e metodolgicos da identificao. Como estudo de caso vem sendo desenvolvido o projeto de pesquisa Identificao arquivstica: utilizando a diplomtica contempornea como fundamento metodolgico no Programa de Gesto de Documentos do Governo do Rio de Janeiro. Neste estudo, sero aplicados os parmetros da diplomtica contempornea para a identificao da tipologia documental objetivando a normalizao de procedimentos para classificar e avaliar os documentos das Secretarias de Fazenda e de Planejamento do Governo do Estado do Rio de Janeiro no mbito do Projeto de Gesto de Documentos (PGD), atravs de parceria institucional estabelecida entre o Arquivo Pblico do Estado / Casa Civil do Governo do Estado do Rio de Janeiro e a Universidade Federal Fluminense. Recortes temticos dessa pesquisa vm sendo abordados no mbito de projetos de TTC em Arquivologia, PIBIC e do Mestrado em Cincia da Informao da UFF, integrando a produo do Grupo de Pesquisas Gnese Documental Arquivstica, UFF/CNPq. Integram o grupo, pesquisadores e alunos do Programa de Ps Graduao em Cincia da Informao (Mestrado) e do Curso de Graduao em Arquivologia da UFF, que desenvolvem pesquisa de TTC e Iniciao Cientfica (PIBIC), alm de tcnicos da rea de Gesto de Documentos do Arquivo Pblico do Estado do Rio de Janeiro e da Casa Civil do Governo do Rio de Janeiro, que atuam no PGD RJ.

Consideraes finais Na construo terica do conceito de identificao, observa-se que na Espanha, o processo GT2 568

pressupe duas fases de levantamento de dados que se complementam para a realizao da pesquisa, o rgo produtor e as tipologias documentais produzidas. No Brasil, as metodologias formuladas apontam mais um elemento a ser contemplado na identificao, muito presente na preocupao dos autores brasileiros, mas que no se encontra na tradio arquivstica espanhola: o depsito de documentos como objeto de identificao para fins de implantao de sistemas de arquivos, aspecto tpico da tradio construda no pas. Na Espanha, um pas de arquivstica notadamente influenciada pela diplomtica, o termo tipo documental vem sendo tradicionalmente usado na rea para designar o documento de arquivo, embora seu uso seja tpico da diplomtica, No Brasil nem todos os processos de identificao chegaram o nvel da identificao do documento e nas propostas que expressam esta preocupao, se comparadas entre si, observa-se uma disparidade de critrios usados para identific-los. Este aspecto pode ser constatado na diversidade de modelos e de parmetros usados nos modelos de identificao desenvolvidos no pas. No Brasil a profuso de modelo e parmetros conceituais usados para identificar documentos de arquivos, se explica pela ausncia de preocupaes quanto padronizao, questo que no vem sendo priorizada pela rea. Esta situao se agrava diante da confuso terminolgica e conceitual gerada pelo uso inadequado do termo assunto pelos arquivistas brasileiros e, sobretudo, da compreenso que se tem sobre ele, para identificar e denominar o documento de arquivo. Diferente da Espanha, que expressando preocupao com a normalizao de parmetros para compreender e tratar os documentos de arquivo, atravs da tipologia documental, alcanou significativos resultados tericos e prticos no campo da identificao que destacaram o pas no cenrio arquivstico internacional. O tema da identificao de tipos documentais vem sendo discutido no pas no mbito de vrios grupos profissionais. na reflexo conjunta de dados identificados na tipologia documental de sistemas administrativos que os unem, que os arquivistas espanhis encontraram a frmula para a definio de requisitos normativos de gesto documental, seja em ambiente eletrnico ou convencional.

Nessa perspectiva, espera-se que os resultados de padronizao de procedimentos arquivsticos alcanados no Programa de Gesto de Documentos do Governo do Estado do Rio de Janeiro (PGD-Rio), passem a servir de referencial para outras administraes pblicas brasileiras, ressaltando a cooperao institucional como estratgia para o desenvolvimento da arquivologia brasileira.
Como docente na graduao de Arquivologia e ps-graduao do Departamento de Cincia da Informao espera-se ainda despertar o interesse cientfico dos alunos para recortes temticos desta pesquisa, desenvolvidos em nvel de TCC, Iniciao Cientfica e Mestrado, cujos resultados obtidos como produto destas reflexes possam trazer novos elementos para sistematizao das tarefas arquivsticas realizadas nos parmetros do rigor cientfico.

Referencias ALBERCH i FUGUERAS, Ramn. Los archivos, entre la memria histrica y la sociedad GT2 569

del conocimiento. Barcelona: Editorial UOC, 2004. ARQUIVO NACIONAL. Identificao de documentos em arquivos pblicos. Rio de Janeiro, 1985. (Publicaes Tcnicas, 37) ARQUIVO NACIONAL. Manual de identificao de acervos documentais para transferncia e/ou recolhimento aos arquivos pblicos. Rio de Janeiro, Ministrio de Justia / Arquivo Nacional, 1985. (Publicaes Tcnicas, 40) ARQUIVO NACIONAL. Manual de levantamento da produo documental. Rio de Janeiro, 1986. (Publicaes Tcnicas, 44) BELLOTTO, Heloisa Liberalli. Identificao de fundos. In: Arquivos permanentes; tratamento documental. 2 ed. Rio de Janeiro: FGV Editora, 2004. p.127-134. BELLOTTO, Heloisa Liberalli. Tipologia documental em arquivstica. Revista do Arquivo Municipal. So Paulo, n. 195, p. 9-17, 1982.

BELLOTTO, Heloisa Liberalli. Tipologia documental em arquivos: novas abordagens. Arquivo de Rio Claro. Revista do Arquivo do Municpio de Rio Claro. Rio Claro: Arquivo do Municpio de Rio Claro, v.0, n.1, p.4-15, 1990. CAMARGO, Ana Maria de Almeida (coord). Diagnstico dos arquivos da Faculdade de Filosofia, Letras e Cincias Humanas da Universidade de So Paulo. So Paulo: Centro de Apoio a Pesquisa em Histria / Departamento de Histria / FFLCH-USP, 1996. (Instrumentos de Pesquisa) CARMONA MENDO, Concepcin. Consideraciones sobre el metodo en archivistica. In: Documenta & Instrumenta. Madrid, Universidad Complutense de Madrid, v. I, 2004, p. 3546. Disponvel em http://www.ucm.es/info/documen/htm/default.htm, acesso em 31 de agosto de 2005. CARUCCI, Paola. Gnesis del documento: redaccin, clasificacin y valor Jurdico. In: ____________ et al. Documento y archivo de gestin: diplomtica de ahora mismo. Carmona: S&C Ediciones / Universidad International Menndez Pelayo, 1994. p. 61-78. CARUCCI, Paola. Il documento contemporaneo: diplomatica e criteri di edizione. Roma: La nuova Italia Scientifica, 1987. CONDE VILLAVERDE, Maria Luisa. et al. La identificacin y valoracin de los fondos documentales de la administracin estatal: problemas y metodologa. Iberoamerica: identico tratamiento para una misma realidad. Primeras Jornadas sobre Metodologa para la Identificacin y Valoracin de Fondos Documentales de las Administraciones Publicas, 1991. In: Actas Madrid: Direccin de Archivos Estatales, 1992. p. 15-19. CONDE VILLAVERDE, Maria Luisa. Manual de tratamiento de archivos administrativos. Madrid: Direccin de Archivos Estatales / Ministrio de Cultura, 1992. DICCIONARIO de Terminologia Archivstica. Madrid: Ministerio de Cultura / Direccin de Archivos Estatales, 1993. GT2 570

DICIONRIO Brasileiro de Terminologia Arquivstica. Rio de Janeiro: Arquivo Nacional, 2005. DUPL DEL MORAL, Ana. Conceptos bsicos. Subdireccin General de Archivos de la Comunidad de Madrid. Disponvel em: http://www.madrid.org/clasartes/archivos/conceptos/ conceptos.html. Acesso em: 16 set 2005. DURANTI, Luciana. Diplomatica: nuevos usos para una antigua ciencia. Trad. Manuel Vazquez. Carmona: Asociacin de Archiveros de Andalucia, 1995. DURANTI, Luciana. The archival bond. Archives and Museum Informatics. Vancouver (Canad): Kluwer Academic Publishers, v.11, p. 213218, 1997. HEREDIA HERRERA, Antonia. El principio de procedncia y los otros princpios de la archivistica. So Paulo: Associao de Arquivistas de So Paulo, 2003. (Scripta, 5) LA TORRE MERINO, Jos Luis & MARTN-PALOMINO y BENITO, Mercedes. Metodologa para la identificacin y valoracin de fondos documentales. Madrid: Ministerio de Educacin, Cultura y Deportes. S.G. de Informacin y Publicaciones, 2000. (Escuela Iberoamericana de Archivos: experiencias y materiales) LPEZ GMEZ, Pedro. Identificacin y valoracin de documentos en Espaa a partir de 1975. In: Anales de Documentacin. Revista de Biblioteconomia y Documentacin. Murcia: Servicio de Publicaciones / Universidad de Murcia, v. 1, 1998, p. 75-97. Disponvel em : http://www.um.es/fccd/anales/ad01/ad0106.html. Acesso em: 19 abr 2005. LPEZ GMEZ, Pedro. Los archiveros y sus investigaciones. Mtodos de Informacin. v. 5, n. 22-23, 1998, p.37-43. Disponvel em http://eprints.rclis.org/archive/00001743/, acesso em 20 de setembro de 2005. MACNEIL, Heather. Trusting records: legal, historical and diplomatic perspectives. Vancouver (Canad): Kluwer Academic Publishers, 2000. MENNEHARITZ, Angelika. What can be achieved with archives? In: The concept of record: report from the Second Stockholm Conference on Archival Science and the Concept of Record, 3031 May 1996. Stockholm: Riksarkivet, 1998. p.1124. MOLINA NORTES, Juana y LEYVA PALMA, Victoria. Tcnicas de archivo y tratamiento de la documentacin administrativa. Guadalajara: ANABAD Castilla La Mancha, 1996. (Textos de ANABAD Castilla La Mancha, 2) RODRIGUES, Ana Clia. Tipologia documental como parmetro de classificao e avaliao em arquivos municipais. Cadernos de Estudos Municipais. Universidade do Minho (Portugal): v.17/18, n. jun a dez, 2005. RODRIGUES, Ana Clia. Diplomtica contempornea como fundamento metodolgico da identificao de tipologia documental em arquivos. So Paulo: Universidade de So Paulo, 2008. Tese (Doutorado em Histria Social). (Mestrado em Histria Social). Faculdade de Filosofia, Letras e Cincias Humanas, Universidade de So Paulo, So Paulo, SP. Disponvel em: www. teses.usp.br/teses/.../8/.../TESE_ANA_CELIA_RODRIGUES.pdf. Acesso em: 26 set. 2010. GT2 571

COMUNICAO ORAL

MTODO DE COMPATIBILIZAO DE LINGUAGENS APLICADO A IMAGENS FOTOGRFICAS: UMA PROPOSTA DE AVALIAO


Joice Cleide Cardoso Ennes de Souza Resumo: A avaliao de um sistema de recuperao de informao pressupe a anlise de seus diferentes subsistemas: seleo de documentos, indexao, linguagem documentria, busca e interface usurio-sistema, e o subsistema que compara as representaes dos documentos com as representaes das perguntas. Adotando as questions dos usurios de um banco de imagens como amostra, propese a aplicao dos princpios de compatibilizao como mtodo para avaliar a linguagem de entrada com as solicitaes dos usurios (sada). A partir da classificao das solicitaes de busca, pde-se identificar as categorias mais pesquisadas, de modo a avaliar, em uma segunda etapa, a indexao. Palavras-chave: Compatibilizao de linguagens. Imagem fotogrfica. Avaliao de indexao. 1 INTRODUO

O principal papel de um servio de informao agir como uma interface entre uma populao de usurios e o universo de recursos informacionais (LANCASTER, 1979, p. 4). Para cumprir essa funo, um conjunto documental que contempla um dado conhecimento registrado representado com o objetivo de atingir as necessidades de sua comunidade usuria. Para empreender a avaliao de um sistema de recuperao de informao, deve-se analisar os diferentes subsistemas que o compem: seleo de documentos que faro parte da coleo, indexao a ser adotada, vocabulrio ou linguagem documentria, busca e interface usurio e sistema, e o subsistema que compara as representaes dos documentos com as representaes das perguntas (LANCASTER, 1979, p. 13). O conhecimento formado por uma rede de relaes sociais, polticas e econmicas cujas metas prioritrias de desenvolvimento so a sociedade da informao e a sociedade do conhecimento. Atualmente, as mudanas das mediaes informacionais com a introduo de novas tecnologias de informao e comunicao inovam as formas de produo e comunicao do conhecimento. As formas de recuperao refletem a dinamicidade deste conhecimento; e, para que seja levada a efeito a comunicao entre os estoques informacionais e o usurio, importante uma avaliao contnua do processo de indexao, incluindo as etapas de anlise conceitual e traduo, e os instrumentos de representao do sistema de informao. GT2 572

Este trabalho amplia o escopo da dissertao de Mestrado em Cincia da Informao1, quando foi realizada a avaliao da linguagem documentria adotada na representao e recuperao da informao jornalstica textual produzida pelo jornal O Globo, no site do Arquivo Premium. A avaliao ento empreendida destacou vrios aspectos a serem observados durante a elaborao de uma linguagem documentria para um sistema de informao. Mas tal avaliao no inclua outros gneros documentais, como fotografias. Atualmente, a disseminao da produo fotogrfica, com a popularizao de mecanismos fotogrficos, e a facilidade de divulgao, com a proliferao de sites que oferecem hospedagem e visualizao de fotografias, levam-nos a refletir sobre como representar as imagens e se essa representao atinge as necessidades de informao do usurio. O objetivo desse trabalho propor um mtodo de avaliao da indexao de imagens fotogrficas em um sistema de informao, mediante aplicao do mtodo de compatibilizao de linguagens. 2 IMAGEM FOTOGRFICA: CRIAO E RECEPO Desde sua criao, a imagem fotogrfica considerada fonte de informao, sendo necessrio tratamento documental diferenciado para sua representao e recuperao. A sociedade atual est ambientada com a linguagem visual, estimulada com o advento da fotografia digital, o que permitiu a ampla disseminao da produo da fotografia e de seu acesso pela Internet. Rudolf Arnheim, citado por Aumont (2008, p. 78), prope trs aspectos a serem considerados em uma reflexo sobre a imagem e sua relao com o real: a imagem detentora de um valor de representao (representao de coisas concretas); detentora de um valor simblico (representao de coisas abstratas) e detentora um valor de signo (representao de contedo no visvel na imagem). Aumont esclarece que os trs aspectos esto sempre presentes nas imagens, mas se manifestam com graus variados. Entendemos que, dependendo de nossos modelos mentais e culturais e do uso a ser feito da imagem fotogrfica, cada aspecto em especial predominar. Kossoy (2002, p. 36) estuda a imagem a partir de dois conceitos: realidade interior e realidade exterior. O autor expe que a fotografia possui dois tempos: de criao e de representao, o efmero e o perptuo. O primeiro fixa o acontecimento e a ao, a primeira realidade ou realidade interior, que vai alm do documento, expondo o oculto da imagem, registro do momento fugidio captado pelo olhar do fotgrafo. J a representao o assunto registrado, a segunda realidade ou realidade exterior, o nvel aparente do documento (KOSSOY, 2002, p. 39). A perpetuao dos registros e a construo de nossa memria so possveis pelo tempo de representao, enquanto que a primeira realidade permite a construo de diferentes interpretaes e formao de conceitos pelos indexadores e receptores. Logo, a realidade da fotografia reside nas mltiplas interpretaes, nas diferentes leituras que cada
1 Dissertao defendida em 2007, sob a orientao da Prof Dra. Maria Luiza de Almeida Campos, convnio IBICT/UFF.

GT2 573

receptor dela faz num dado momento (...) (KOSSOY, 2002, p. 38).
A fotografia tem uma realidade prpria que no corresponde necessariamente realidade que envolveu o assunto, objeto do registro, no contexto da vida passada. Trata-se da realidade do documento, da representao: uma segunda realidade, construda, codificada, sedutora em sua montagem, em sua esttica, de forma alguma ingnua, inocente, mas que , todavia, o elo material do tempo e espao representado, pista decisiva para desvendarmos o passado. (KOSSOY, 2002, p. 22).

A pluralidade de interpretaes da imagem fotogrfica apontada por Kossoy (2007, p. 55), reforando a sua natureza polissmica, estando sua recepo dependente dos modelos mentais do receptor e dos seus objetivos ou usos em relao fotografia. Schaeffer (1996, p. 66) discorre sobre os diferentes modos de recepo de uma imagem. Quando a fotografia observada como trao/protocolo de experincia, sua principal funo ser prova do fato registrado, ressaltando-se a dimenso indicial da imagem, ou seja, remete a informao imagtica diretamente ao referente, diminuindo ao mximo a dimenso icnica. Ao ser vista como recordao/ rememorao, a imagem fotogrfica apresenta nfase no potencial identificador do receptor, ou seja, o fator determinante para valorao da imagem o conhecimento do observador, ou seja, seus modelos mentais e sua bagagem cultural. No caso da apresentao/mostrao, ressalta-se a mensagem que a imagem pretender transmitir ao observador, como, por exemplo, nas fotografias publicitrias. Por fim, quando a imagem observada enquanto descrio/testemunho, a informao a ela associada se reveste de relevncia, como nas fotografias de carter tcnico e jornalstico. Paralelamente ao exposto acima, Gastaminza (1999, p. 121) arrola as seguintes competncias a serem exigidas do observador de uma imagem: competncia iconogrfica (identificao de informaes visuais); competncia narrativa (compreenso do tema retratado a partir de uma narrativa); competncia esttica (identificao das tcnicas e estilos fotogrficos); competncia enciclopdica (bagagem cultural); competncia lingustica (verificao da relao entre textos, legendas e o que foi retratado); e competncia modal (identificao do tempo e do espao da fotografia). No nosso entendimento, essas competncias permitiro ao profissional de informao ter embasamento para a indexao de imagens fotogrficas. 3 INDEXAO DE IMAGENS Sendo a funo de um sistema de recuperao da informao possibilitar a transferncia de informao entre as fontes de informao (documentos) e os seus destinatrios (usurios), o processo de indexao consiste em um subsistema de grande importncia no processo de comunicao. Indexao o conjunto de aes para atribuir termos de indexao, ou descritores, a documentos, para que posteriormente estes possam ser recuperados, de acordo com os conceitos selecionados designados por termos de indexao. composto pelas etapas de anlise conceitual (de GT2 574

que trata o documento) e traduo (converso dos termos obtidos a partir da anlise conceitual, para a linguagem usada no sistema) (LANCASTER, 2004b, p. 8). Segundo Campos (2006), a seleo dos pontos de acesso de um documento influencia tanto na representao como na recuperao da informao. Para a autora, o documento apresenta dois tipos de pontos de acesso: os aspectos objetivos/fsicos e os aspectos subjetivos/intelectuais. Os primeiros so aqueles relacionados autoria; data; local entre outros que no necessitem de um processo de interpretao; j os aspectos intelectuais, evidenciam a necessidade de uma anlise interpretativa de seu contedo informativo (CAMPOS, 2006, p. 19). Sob o ponto de vista biblioteconmico, os aspectos objetivos dizem respeito catalogao, enquanto os subjetivos se referem indexao. No mbito da Arquivologia, a descrio arquivstica engloba os dois aspectos. Uma das propriedades mais importantes de uma representao de contedo temtico sua extenso. Quanto mais informaes so apresentadas, mais claramente a representao revela o alcance do documento, e o usurio tem condies de avaliar se o mesmo satisfaz ou no sua necessidade informacional. A propriedade de extenso de uma indexao est relacionada com o nvel de recuperabilidade do sistema. A indexao apresenta dois parmetros: exaustividade e especificidade. Exaustividade consiste na medida da extenso em que os diferentes tpicos tratados em um documento so reconhecidos e representados na indexao. O conceito oposto seletividade, ou seja, o uso de poucos termos de indexao. J a especificidade significa representar o contedo no mesmo nvel de documento. Quando o indexador faz uso de termos genricos, dizemos que a indexao apresenta generalidade. 3.1 Anlise de imagens A literatura vasta no tocante anlise de imagens. Destacamos Shatford (1986, p. 48), que prope o desenvolvimento de uma classificao facetada para imagem, adotando as facetas Quem, O que, Onde e Quando. A autora faz um paralelo das facetas com as categorias de Ranganathan: Personalidade, Matria, Energia, Espao e Tempo. Shatford (1986, p. 45) apresenta uma nova metodologia para anlise da imagem, amparada em dois aspectos: DE (OF) e SOBRE (ABOUT). Com base nas perguntas a imagem De que? e a imagem SOBRE o que?, a autora prope categorizar o assunto da imagem segundo seu significado factual (genrico e/ou especfico) e sua tematicidade, respectivamente. No panorama nacional, Smit, em 1987, publica artigo a respeito do assunto, onde elucida que a descrio de uma imagem nunca completa, exigindo orientaes para nortear sua anlise. Destaca tambm o uso da imagem fora do seu contexto de produo, fato observado nas peas publicitrias, com exceo da produo fotogrfica feita para esse fim especfico. Segundo Smit, analisar uma imagem significa, quer queiramos quer no, traduzir certos elementos dessa imagem de um cdigo icnico para um cdigo verbal (SMIT, 1987, p. 103). Para a autora, mesmo adotando uma linguagem GT2 575

documentria para padronizar a linguagem adotada no sistema, a transcodificao no garante unanimidade na interpretao. Smit (1987, p. 107) assinala que o usurio no exige uma indexao especfica, uma vez que almeja obter como resultado de sua pesquisa um grupo de imagens que atenda sua solicitao e que lhe oferea diferentes alternativas sua escolha. Diante desse desafio, a autora prope que a descrio de imagens atenda s perguntas: QUEM (seres vivos), ONDE (ambiente), QUANDO (tempo), ONDE (espao), O QUE (ao) e COMO (tcnica) (SMIT, 1987, p. 109). Apesar das categorias relacionadas por Smit se aproximarem das relatadas por Shatford (1986), em artigo publicado na revista Informare, Smit (1996, p. 32) aponta Ginette Blry como a desenvolvedora dessa proposta de anlise. No mesmo artigo, Smit prope que a representao de imagem seja composta pelo seu contedo informacional (aquilo que a imagem mostra) e pela expresso fotogrfica (forma usada para expressar o que se quer transmitir pela imagem) (SMIT, 1996, p.34). Em seus trabalhos sobre anlise documentria da fotografia, Manini (2004) adota o conceito de dimenso expressiva em vez de expresso fotogrfica, e ressalta que, apesar do contedo informacional ser decisivo para a recuperao da informao em uma busca por imagens, o que define a escolha por parte do usurio a dimenso expressiva da imagem. Smit, citada por Manini (2004), esclarece que a descrio de uma imagem nunca completa, uma vez que a imagem sempre oferece um aspecto que passou despercebido por ocasio da primeira anlise. O mesmo profissional de informao pode identificar diferentes significaes em uma mesma imagem, em momentos diferentes. A partir dessa afirmao, fazemos o seguinte questionamento: como minimizar o rudo que ocorre na comunicao entre a imagem fotogrfica e o usurio em um sistema de informao, se cada analista indexador possui experincias de vida e modelos mentais diferenciados, o que se reflete na indexao do documento imagtico? Alm de analisar a imagem fotogrfica em si, compreendemos como tratado por Cordeiro (2000, p. 199) que preciso contextualizar a fotografia, investigando seu processo produtivo, sua insero dentro de um conjunto documental, o propsito de sua indexao e se a forma como a organizao olha para aquele acervo compartilhada com os potenciais usurios. No nosso entendimento, o mtodo de compatibilizao de linguagens, usado no mbito do sistema de informao, permitir avaliar a indexao de um dado acervo fotogrfico a partir da verificao do nvel de compatibilizao existente entre a linguagem adotada na entrada (linguagem de indexao) com a linguagem usada na sada (estratgias de busca dos usurios). 4 AVALIAO DE LINGUAGENS Os estudos de avaliao de servios de informao apresentam diferentes enfoques na literatura da Cincia da Informao. Esta comunicao se deter nos estudos de avaliao de linguagens e de indexao, com enfoque nos trabalhos de Keen sobre anlise das linguagens no projeto Aberystwyth; GT2 576

e em Lancaster, pelo respaldo terico e metodolgico para avaliao de servios de recuperao. No que diz respeito avaliao de linguagens de indexao, a viso global da prtica avaliativa desenvolvida por Lancaster (2004a) de suma importncia na gesto de um servio de informao. No livro Avaliao de Servios de Biblioteca, o autor discorre sobre como fazer um estudo avaliativo detalhado dos servios de uma biblioteca a partir dos servios sob demanda e de notificao (ou prativos), inter-relacionando as diversas atividades da instituio. Entre as dcadas de 1950 e 1970 se concentra um grande nmero de estudos avaliativos das linguagens de indexao em relao ao sistema, estando entre eles os projetos experimentais ASTIA, Cranfield I e II e Aberystwyth. Para efeito desse trabalho, destacamos o experimento entre linguagens de indexao empreendido por Michael Keen e J. A. Digger (PIEDADE, 1976, p. 15), no College of Libranship Wales, tambm conhecido como teste de Aberystwyth, alm de pontuar autores que identificaram critrios que mesclam a prtica da indexao com a avaliao de linguagens de indexao. O teste de Aberystwyth submeteu cinco diferentes linguagens selecionadas a partir dos critrios de controle de vocabulrio e do esforo requerido para a utilizao das linguagens (KEEN, 1973, p. 3). Foram analisados 800 documentos sobre Biblioteconomia e Cincia da Informao, nos oito testes comparativos realizados para avaliar a especificidade das linguagens de indexao e relaes, exaustividade e especificidade da indexao, mtodo de coordenao, preciso dos instrumentos de partio e operadores relacionais, alm da proviso de contexto nas buscas nos arquivos. O estudo apresentou as seguintes concluses (KEEN, 1973, p. 24 e 25): 1. Apesar da linguagem com menor especificidade apresentar o maior ndice de revocao, o mesmo desempenho foi observado na linguagem no-controlada com alta especificidade e sem relaes entre os termos; 2. As linguagens com grande especificidade tiveram desempenho similar s que apresentam pouca especificidade; 3. As linguagens mais extensas exigiram mais tempo de busca para obter uma alta revocao; 4. Um aumento na exaustividade auxilia na recuperao dos documentos parcialmente relevantes, resultando em alta revocao. Mas a indexao exaustiva ou redundante no apresentou qualquer vantagem ou desvantagem sobre a indexao especfica; 5. O uso de instrumentos de preciso no influenciou na recuperao. A principal concluso do projeto foi que no h diferenas significativas entre as linguagens de indexao no que diz respeito eficincia e eficcia na recuperao. Keen (1973, p. 34) esclarece que os progressos nos estudos de avaliao de linguagens s sero possveis quando pudermos relacionar revocao e preciso com os parmetros de especificidade e relaes das linguagens de indexao, o que no foi permitido no teste realizado em Aberystwyth. Com base na norma americana ANSI/NISO Guidelines for the construction, format and GT2 577

management of monolingual thesauri, Owens e Cochrane (2004) definem como avaliao de tesauro o processo para determinar se um dado instrumento atinge seus principais objetivos, a saber: traduo (fornecer meios de traduzir a linguagem natural dos autores, indexadores e usurios num vocabulrio controlado usado para indexao e recuperao), consistncia (promover consistncia na atribuio de termos de indexao), indicao de relacionamentos (indicar os relacionamentos semnticos entre os termos) e recuperao (servir como meio de busca na recuperao de documentos). As autoras propem os seguintes mtodos de avaliao de tesauro: comparativo (com outros modelos de tesauros nacionais ou internacionais), formativo (testar o tesauro analisando sua performance na indexao e recuperao), de observao (acompanhamento do desempenho do tesauro) e estrutural (observao dos termos genricos, especficos e associados). A partir dos estudos sobre avaliao da consistncia da indexao em uma biblioteca de artes, Strehl (1998, p. 331) consolida em sua metodologia os seguintes critrios para analisar um instrumento de representao apurados na literatura da rea e na sua atividade profissional: nmero de palavras por descritor, uso do singular e plural, sinnimos, descritores compostos (analisa o termo mais frequente, a perda de significado devido fatorao, combinaes ambguas, se um dos termos nome prprio ou adjetivo), termos homgrafos ou inconsistentes, rotao de descritores, relao entre assuntos redundantes, relao de um assunto com sua subcategoria, descritores que indicam perodo histrico, identificadores geogrficos e assuntos compostos por identificadores geogrficos e cronolgicos. Uma vez que no existe uma poltica de indexao e vocabulrio controlado para a rea de artes visuais, a autora objetiva identificar os termos usados pelos indexadores e que no correspondam aos critrios definidos. Lopes (1985, p. 243) destaca que os estudos de avaliao esto associados ao desempenho do servio de indexao, qualidade do produto oferecido pelo sistema e se ele atende s solicitaes dos usurios. A autora prope critrios para avaliar eficcia, custo/benefcio e custo/eficcia de sistemas de indexao e resumo. Para a autora (LOPES, 1985, p. 254), custo/eficcia compreende o custo de uma biblioteca para manter o servio. Lancaster (1979) aponta que um servio de informao ser eficiente se atender o usurio. J custo/benefcio, Lopes afirma que a relao entre os custos e os benefcios de se possuir o sistema. Eficcia definida por Lopes como sendo a habilidade do SIR [servio de indexao e resumo] em satisfazer as necessidades de informao do usurio, e inclui critrios e medidas relativos qualidade do produto e o tempo despendido para obt-lo (LOPES, 1985, p. 246). Para tanto, devese tambm analisar: autoridade (aspecto relacionado ao responsvel pelo tratamento informacional), cobertura (abrangncia de um assunto em um dado acervo), revocao (capacidade de oferecer todas as referncias existentes na base de dados em relao a uma pergunta), preciso (capacidade de oferecer referncias relevantes), novidade (referncias relevantes obtidas pelo usurio e que ele no conhecia anteriormente), esforo do usurio (o trabalho que o usurio tem para obter uma informao precisa no sistema), tempo de resposta (tempo gasto nas buscas pelo usurio), produtos GT2 578

oferecidos (os servios oferecidos pelo sistema) e linguagem de indexao (interfere diretamente na satisfao do usurio uma vez que atua como mediadora no processo comunicativo entre a base de dados e o usurio). Lopes (1985, p. 254) contempla em linguagem de indexao os seguintes aspectos: linguagem usada, nvel de exaustividade, nvel de especificidade, e qualidade e correo na indexao. Lancaster define a boa indexao como a indexao que permite que se recuperem itens de uma base de dados durante buscas para as quais sejam respostas teis, e que impede que sejam recuperados quando no sejam respostas teis (LANCASTER, 2004, p. 83). Evidentemente, no sistema de informao, os vrios subsistemas interagem para que haja um bom desempenho. O autor destaca que o sistema deve oferecer o mximo de revocao, fato observado nas buscas em bancos de imagens, conforme exposto na seo anterior. Lancaster (2004, p. 85), ao analisar a qualidade da indexao, aponta que a falha na indexao pode acontecer nas etapas de anlise conceitual e de traduo. O primeiro caso ocorre quando o profissional responsvel no reconhece um assunto que tem potencial para a comunidade usuria do sistema, e quando h a interpretao inadequada de termos ao documento analisado. As falhas na traduo ocorrem quando se usa um termo geral para o assunto especfico tratado no documento, em vez do termo especfico, e quando se atribuem termos imprprios ao contedo temtico. Problemas na anlise conceitual e na traduo implicaro em falhas na revocao. Para avaliar o trabalho dos indexadores, Lancaster prope um mtodo com cinco pontos a serem seguidos, em que destacamos o item em que recomenda a comparao entre a indexao com as estratgias de busca, a fim de determinar se os itens relevantes so recuperveis ou no com os termos atribudos (LANCASTER, 2004, p. 87). No nosso entendimento, tal recomendao permite avaliar tanto a indexao quanto a linguagem de indexao adotada pelo sistema, alm das estratgias de busca indicarem quais so as demandas de informao dos usurios. Lancaster (2004, p. 89) sistematiza em um quadro os fatores que podem influenciar na qualidade de indexao. Destacamos os fatores relacionados ao vocabulrio (especificidade/ sintaxe, ambiguidade ou impreciso, qualidade do vocabulrio de entradas, qualidade da estrutura, disponibilidade de instrumentos auxiliares afins) e os fatores relacionados ao processo (tipo de indexao, regras e instrues, produtividade exigida, exaustividade da indexao). Tanto Lopes (1985) quanto Lancaster (2004) colocam em questo o conceito de preciso na indexao: quanto mais especfica a indexao, mais precisa ser a recuperao e o esforo do usurio em obter as informaes desejadas. Contudo, ao buscar imagens fotogrficas, o usurio objetiva uma grande revocao, para que, a partir do conjunto obtido, selecione a imagem que apresenta a dimenso expressiva que o atenda. Entendemos que a partir dos aspectos apontados pelos autores, poderemos avaliar a indexao aplicada s imagens fotogrficas fixas, aplicando o mtodo de compatibilizao entre as questions dos usurios e a linguagem de indexao adotada pelo sistema de informao. GT2 579

5 COMPATIBILIZAO DE LINGUAGENS Esta pesquisa apresenta como referencial terico os estudos de compatibilizao e reconciliao de linguagens empreendidos por Neville (1970) e Dahlberg (1981). Considera-se ainda linguagens documentrias como linguagens artificiais, controladas, criadas dentro dos objetivos de uma organizao/setor, a partir de um conjunto de documentos e domnio, para serem utilizadas na indexao e recuperao da informao em um determinado sistema de recuperao da informao. Para Neville (1972, p. 620), reconciliao a possibilidade de integrao e aproximao de sistemas que contemplam o mesmo tipo de literatura, mas que adotam diferentes tesauros. Neville (1972) parte do pressuposto de que na representao de um contedo os conceitos que so indexados, sendo as palavras-chaves ou descritores rtulos ou etiquetas lingusticas que identificam os conceitos. O autor adota um tesauro como base e segue onze nveis de correspondncia entre os termos dos dois vocabulrios, onde so analisados: correspondncia exata entre palavras-chave, se o tesauro faz distino entre homnimos, se usa palavras-chave sinnimas, entre outros. Dahlberg (1981), ao adotar a expresso compatibilizao de linguagens de indexao, restringe os estudos de compatibilidade aos sistemas ordenados, definidos como sendo qualquer instrumento usado na organizao, descrio e recuperao do conhecimento, composto por expresses verbais ou notacionais para conceitos e suas relaes, dispostos de uma forma ordenada. A compatibilizao entre sistemas ordenados um dos mtodos que permite avaliar o nvel de compatibilidade conceitual entre os elementos, de forma a serem utilizados em conjunto (DAHLBERG, 1983, p. 5). A compatibilidade conceitual proposta por Dahlberg (1983, p. 6) compreende trs fases: coincidncia conceitual: quando dois conceitos so equivalentes; correspondncia conceitual: quando a maior parte das caractersticas de dois conceitos combina; e correlao conceitual: quando a correlao entre dois conceitos pode ser indicada. Ao usar a expresso sistemas ordenados, Dahlberg amplia no s o conceito mas o universo de aplicao da metodologia de compatibilizao, uma vez que flexibiliza a definio do instrumento a ser compatibilizado, podendo a incluir as perguntas feitas pelos usurios, analisadas dentro de um contexto e que apresentam uma organizao interna oferecida pelo sistema de recuperao. Segundo a autora (DAHLBERG, 1983, p. 5), compatibilidade a qualidade de um sistema ordenado que permite que seus elementos possam ser usados juntos ou intercambiados com elementos de outro sistema ordenado. 6 RESULTADOS ESPERADOS E DISCUSSO GT2 580

Como observado na seo anterior, Dahlberg (1981) descreve mtodos para o estabelecimento de comparaes verbais e conceituais entre linguagens de indexao. Caso a linguagem de indexao no apresente notas de aplicao ou definies dos conceitos, no ser possvel a construo da matriz conceitual, pedra de toque nos estudos da autora. Recomenda-se a compatibilizao semntica com aplicao da metodologia de comparao verbal proposta por Dahlberg. J os passos metodolgicos propostos por Neville (1972) nos permitem integrar duas ou mais linguagens de indexao a partir das anlises lingustica e semntica. A correspondncia lingustica entre os termos de duas ou mais linguagens compreende a associao exata entre termos, estando as palavras no plural ou no singular. H de se analisar os termos sinnimos e homnimos evidenciando a existncia de palavras com mesma significao que outras e/ou com a mesma denominao. Ao identificarmos que as solicitaes dos usurios so linguisticamente diferentes dos termos constantes da linguagem de indexao, apesar de apresentarem o mesmo significado, estamos analisando a correspondncia semntica entre as palavras. Para a avaliao da linguagem de indexao, recomenda-se a aplicao dos critrios identificados por Souza (2007, p. 99) na literatura da rea: estrutura dos termos, forma de apresentao, campo de abrangncia, forma das palavras, estrutura semntica, relaes de equivalncia, software adotado pelo sistema de informao. Aplicamos a metodologia proposta em uma amostra de solicitaes de busca de um banco de imagens de empresa de mdia, oferecido na Internet. O relatrio totaliza 57.262 questions dos usurios com resultado igual a zero, no perodo de 2002 a 2010, organizadas alfabeticamente. Para a amostra, isolamos 2.251 expresses de busca iniciadas com a letra D, sendo 1.500 classificadas seguindo as categorias fundamentais de Ranganathan (PMEST). Contrapondo as categorias propostas por Smit (1987, p. 109), seria QUEM (seres vivos), O QUE (ao), COMO (tcnica), ONDE (ambiente), ONDE (espao), QUANDO (tempo). Obtivemos o seguinte resultado: Personalidade (916 solicitaes), Matria (1 solicitao), Energia (511 solicitaes), Espao (29 solicitaes), Tempo (94 solicitaes). Em Personalidade identificamos nomes de pessoas, novelas, instituies (organizaes), documento iconogrfico (desenhos diversos), entre outros. Tal nmero revela que as buscas por conceitos individuais (nomes prprios) so relevantes para o usurio que demanda imagens fotogrficas. Outra categoria em destaque Energia, que abrange todo tipo de ao ou situao que denota movimento. Particularmente, a estratgia de busca que descreve ao nos indica que o usurio, ao fazer a solicitao, j tem em mente a imagem que deseja. O prximo passo a ser realizado compatibilizar a linguagem de indexao com a linguagem do usurio (questions) para poder avaliar tanto a linguagem como a indexao efetuada. 7 CONCLUSO A informao assume cada vez mais um papel relevante nas tomadas de deciso dentro das GT2 581

organizaes. Para que a plena recuperao seja atingida, faz-se necessria uma linguagem que satisfaa tanto as necessidades dos usurios quanto as da instituio, com a consequente localizao e aquisio da informao pesquisada. O sistema de informao deve oferecer ao usurio mecanismos que lhe possibilite o acesso informao desejada de maneira eficaz e eficiente. O questionamento de como representar a informao textual foi ampliado para a informao imagtica, sendo o desafio identificar como os usurios procedem para recuperar as imagens que atendam suas necessidades informacionais. Esta pesquisa prope que a partir das questions dos usurios possvel mapear as facetas usadas na representao da imagem fotogrfica, para fins de recuperao, para posterior avaliao da linguagem de indexao e da indexao propriamente dita, mediante aplicao do mtodo de compatibilizao de linguagens. Com a compatibilizao h a aproximao de dois tipos de linguagem: do sistema e do usurio, oportunidade para que a comunicao seja efetivamente realizada. A polissemia da imagem fotogrfica consiste no desafio a ser enfrentado pelo profissional de informao. Apesar disso, os rudos no processo comunicativo devem ser minimizados, o que possvel com um acompanhamento e atualizao tanto dos instrumentos de representao como dos aspectos subjetivos e objetivos a serem descritos na imagem. Abstract: Information retrieval system evaluation requires the analysis of its various subsystems: selection of documents, indexing, documentary language, seach and user interface subsystem, and the comparison of the representations of documents with the users questions. It is proposed to apply the principles of compatibility as a method to evaluate the input language with the users requests (output). From the ranking of search requests, we could identify the most searched informational categories in order to evaluate the indexing. Keywords: Language compatitilization. Image. Indexing evaluation REFERNCIAS AUMONT, J. A imagem. Campinas, SP: Papirus, 2008. CAMPOS, M. L. A. Indexao e descrio em arquivos: a questo da representao e recuperao de informaes, in Arquivo e Administrao, v. 5, p. 17-31, 2006. CORDEIRO, R. I. N. A narrao da obra flmica revelada por sua rvore genealgica: princpios para a anlise flmica como processo comunicacional para a representao documentria. In: PINHEIRO, L. V. R.; GONZLEZ DE GOMEZ, M. N. (Orgs.). Interdiscursos da cincia da informao: arte, museu e imagem. Rio de Janeiro; Braslia: IBICT/DEP/DDI, 2000. DAHLBERG, I. Conceptual compatibility of ordering systems, in International Classification, v. 10, n. 1, p. 5-8, 1983. ______. Towards establishment of compatibility between indexing languages, in International GT2 582

Classification, v. 8, n. 2, p. 86-91, 1981. GASTAMINZA, F. V. Manual de documentacin fotogrfica. Madrid: Sintesis, 1999. KEEN, E. M. The aberystwyth index languages test, in Journal of Documentation, v. 29, n. 1, March 1973. KOSSOY, B. Os tempos da fotografia; o efmero e o perptuo. So Paulo: Ateli Editorial, 2007. _______. Realidades e fices na trama fotogrfica. So Paulo: Ateli Editorial, 2002. LANCASTER, F. W. Avaliao de servios de bibliotecas. Braslia: Briquet de Lemos, 2004a. ______. Indexao e resumos: teoria e prtica. Braslia: Briquet de Lemos, 2004b. ______.Information retrieval systems: characteristics, testing and evaluation. 2 ed. New York: J. Wiley, 1979. LOPES, E. F. Avaliao de servios de indexao e resumo: critrios, medidas e metodologia, in Revista da Escola de Biblioteconomia, Belo Horizonte, v. 14, n. 2, p. 242-256, set. 1985. MANINI, M. P. Anlise documentria de fotografias: leitura de imagens incluindo sua dimenso expressiva, in Cenrio Arquivstico, Braslia, v. 3, n. 1, jan.-jun. 2004. NEVILLE, H. H. Feasibility study of a scheme for reconciling thesauri covering a commom subject, in Journal Documentation, v. 26, n. 4, p. 313-336, December, 1970. ______. Thesaurus reconciliation, in Aslib Proceedings, v. 24. n. 11, p. 620-626, November 1972. OWENS, L. A.; COCHRANE, P. A. Thesarurus evaluation, in Cataloguing and Classification Quartely, v. 37, n. 3/4, p. 87-102, 2004. PIEDADE, M. A. R. Estudo comparativo de algumas linguagens de indexao: eficcia e tempo e pesquisa. Rio de Janeiro, 1976. Dissertao (Mestrado) Biblioteconomia e Documentao Instituto Brasileiro de Bibliografia e Documentao; Universidade Federal do Rio de Janeiro, 1976. SCHAEFFER, J. M. A imagem precria. Campinas, SP: Ed. Papirus, 1996. SHATFORD, S. Analyzing the subject of a picture: a theoretical approach, in Cataloging and Classification Quartely, v. 6, n. 3, p. 39-62, 1986. SOUZA, J. C. C. E. Avaliao de linguagem de indexao aplicada informao jornalstica: estudo de caso. 2007. Dissertao (Mestrado em Cincia da Informao) - UFF/IBICT, Rio de Janeiro, 2007. SMIT, J. W. A anlise da imagem: um primeiro plano. In: ______.(Coord.) Anlise documentria. 2 ed. Braslia: IBICT, 1987, p. 99-112. GT2 583

______. A representao da imagem, in Informare Cadernos do Programa de Ps-Graduao em Cincia da Informao, Rio de Janeiro, v. 2, n. 2, p. 28-36, jul./dez. 1996. STREHL, L. Avaliao da consistncia da indexao realizada em uma biblioteca universitria de artes, in Cincia da Informao, v. 27, n. 3, p. 329-355, set./dez. 1998.

GT2 584

COMUNICAO ORAL

ORGANIZAO DOS CONTEDOS DE CONHECIMENTO PARA SITES: REPRESENTAO DAS ATIVIDADES DE PESQUISA EM LABORATRIO CIENTFICO DE BIOLOGIA MOLECULAR
Laura de Lira e Oliveira, Maria Luiza de Almeida Campos, Hagar Espanha Gomes (CNPq) Resumo: O objetivo deste estudo investigar as possibilidades metodolgicas para representar os recursos de informao produzidos e utilizados em um ambiente especfico de domnio interdisciplinar atravs da elaborao de um modelo de representao de uma atividade de pesquisa. A abordagem emprica est voltada para o domnio da Biologia Molecular que se desenvolve no cotidiano da atividade cientfica de um Laboratrio de ponta. O trabalho no Laboratrio inclui a pesquisa cientfica vinculada principalmente para a genmica dos Tripanosomatdeos e para as Doenas Tropicais Negligenciadas tais como a Doena de Chagas (T. cruzi) e outras tripanosomoses, leishmanioses (Leishmania spp), gerando informao e conhecimento cientficos. A pesquisa focou a organizao dos contedos desse conhecimento gerado no Laboratrio com nfase na atividade da anotao genmica. Para que a organizao do conhecimento se faa de forma eficaz, a Teoria da Classificao foi aplicada, destacando-se como ferramenta da Cincia da Informao que auxilia na estruturao sistemtica da informao gerada pela equipe de pesquisadores, mas as relaes funcionais-sintagmticas se revelaram importantes na organizao de objetos heterogneos. As metodologias utilizadas para a elaborao de um modelo de representao se pautaram na Anlise de Domnio e na Etnometodologia para a identificao dos elementos presentes naquela atividade e no mtodo facetado para a classificao desses elementos e foram definidas diretrizes voltadas para a representao de um modelo de uma atividade.
Palavras-chave: Organizao do Conhecimento. Representao da Informao. Anlise de Domnio. Etnometodologia.

1 INTRODUO As doenas tropicais negligenciadas (DTNs), como a Doena de Chagas (T. cruzi) e outras tripanosomoses, leishmanioses (Leishmania spp), fazem um grande nmero de vtimas, sobretudo em pases subdesenvolvidos. As diversas pesquisas sobre o tema geram significativo volume de informaes, o que faz da busca pela contnua sistematizao de instrumentos/ferramentas no mbito de um laboratrio de pesquisa cientfica em genmica, um mecanismo facilitador do acesso aos conhecimentos j produzidos, acarretando a reduo do impacto dessas enfermidades. Isso porque permite a disseminao das informaes existentes entre os diversos laboratrios de pesquisa genmica no mundo assim como a elaborao de uma proposta de cooperao internacional das pesquisas genmicas. Percebe-se, assim, a necessidade de se apoiar questes concernentes ao mapeamento de um GT2 585

modelo de representao para organizar os componentes de uma atividade cientfica, no caso, a atividade de anotao genmica em sites cientficos, devido necessidade de se organizar as informaes geradas em um laboratrio de Biologia Molecular. O laboratrio estudado um local de produo de conhecimento relativo quela atividade genmica e por se tratar de uma atividade complexa foram utilizados alguns itens de Hjrland (2002) para identificao do domnio. Para entender a atividade e identificar o que deveria ser alvo da representao foi feita a observao das aes no ambiente por meio da Etnometodologia. E para organizar os elementos identificados foi utilizado o mtodo de faceta que funcionou na identificao das categorias, mas que pode se mostrar insuficiente para organizar objetos heterogneos que naturalmente surgem em uma atividade dentro de um laboratrio de ponta. Desta forma, as relaes nticas1 ou funcionais-sintagmticas (DAHLBERG, 1978; 1993) foram utilizadas. No mbito deste trabalho, o conhecimento no Laboratrio compreende tanto as aes especficas dos recursos para anlise de DNA quanto a incluso de outros elementos para a realizao desta atividade tais como: pesquisadores que compem determinado projeto, suas atividades propriamente ditas de anotao genmica de organismos de interesse para as pesquisas do Laboratrio, textos cientficos, instituies que esto vinculados, parcerias com outros laboratrios, bancos de dados genmicos, entre outros. O avano tecnolgico nos meios comunicacionais e informacionais tem propiciado uma rapidez na representao e recuperao do conhecimento e da informao. Verifica-se, assim, a importncia da Cincia da Informao que utiliza bases tericas e metodolgicas para lidar com questes voltadas representao do conhecimento e da informao. (KUMAR, 1981) Optou-se por trabalhar com a utilizao de sites, uma vez que estes trazem a possibilidade de acesso a informaes produzidas em unidades geograficamente separadas e sua dinmica tem propiciado agilizao nos processos internos dos laboratrios, tornando o trabalho mais produtivo, j que, simultaneamente, agregam e disseminam informaes na Internet, confirmando-se como uma forma importante de compartilhamento da informao biomdica e processamento de contedo. (GILCHRIST, 2003; CHAU et al, 2006; STEWART, 2008; BLATECKY et al.,sd) O modelo a ser representado tem como objetivo fazer parte de um site e ir interferir na arquitetura e funcionalidade deste site. A informao estruturada pelo modelo de representao guiar a busca e recuperao da informao biomdica no mbito da Biologia Molecular (GIBAS e JAMBECK, 2001;NUNES, 2002) e dos recursos por meio da navegao pelos pesquisadores.

1 A relao ntica no tem a finalidade de estabelecer uma hierarquia entre os conceitos, mas a de determinar a natureza da relao entre esses conceitos. No caso da pesquisa realizada, estas relaes apresentam de forma clara uma atividade natural entre os objetos que ocorrem no mundo real, onde os objetos existem. (OLIVEIRA, 2011)

GT2 586

2 A ORGANIZAO DA INFORMAO EM SITES As primeiras manifestaes relacionadas ao uso de taxonomias em sites surgem no mbito das arquiteturas de informao e gesto de contedo. Nesse contexto, algumas das questes que se apresentam no desenvolvimento de taxonomias em sites so as seguintes: Como os elementos sero usados para navegar ou realizar a busca da informao? E qual o processo pelo qual eles sero adicionados ao sistema para a melhor recuperao da informao? Sabendo que gesto implica organizao e organizao implica classificao, os atuais desafios a fim de se gerir o conhecimento esto relacionados ao enorme e crescente volume de informao e constante mudana em seu contedo. No mbito de um domnio interdisciplinar como a Biologia Molecular - rea analisada - o processo de classificar bastante complexo e demanda uma estrutura normativa e prescritiva para organizar o conhecimento cientfico (GNOLI, BOSCH e MAZZOCCHI, 2007). A organizao do conhecimento em categorias nesse campo interdisciplinar deve resultar em uma anlise e interpretao acuradas dos fenmenos e argumentos do discurso dos especialistas que esto inseridos no Laboratrio. Foram, ento, sugeridas diretrizes metodolgicas que corroboram o modelo de representao elaborado, mas que s foi possvel sua elaborao aps o percurso de busca das informaes relevantes no ambiente do Laboratrio, observao das aes dos pesquisadores e um processo de mapeamento e estruturao. Isto norteou aspectos metodolgicos desta pesquisa em dois focos. O primeiro foi a forma de obteno dos dados por meio da Identificao dos elementos a qual compreendeu: a) a anlise de domnio, para entender o ambiente e levantar dados que, segundo Hjrland (2002) a identificao dos elementos passveis de serem observados no escopo da pesquisa e b) a Etnometodologia, para apreender a complexidade da atividade da anotao genmica, que a forma de observar esses elementos. O segundo foco foi a Organizao dos elementos por meio do mtodo facetado (CAMPOS e GOMES, 2008),a fim de sistematizar os resultados e apresent-los em um site. 2.1 Identificao dos elementos a)Anlise de domnio: A anlise de domnio proposta por Hjrland (2002) envolve as seguintes questes: produo de guias de literatura ou portais especializados construo de classificaes especializadas e tesauros indexao e recuperao nas especialidades estudos empricos de usurios estudos bibliomtricos estudos histricos estudos documentais e de gnero estudos epistemolgicos e crticos estudos terminolgicos, linguagens especializadas, bases de dados GT2 587

semnticas e estudos de discurso estruturas e instituies na comunicao cientfica cognio cientfica, conhecimento especializado e inteligncia artificial Entretanto, nessa anlise, deu-se destaque aos estudos empricos de usurios, uma vez que em diferentes comunidades h diferentes necessidades de informao como anlise de protenas ou nucleotdeos, druggability, sequncia gentica. Alm disso, estudos histricos foram analisados com a finalidade de se compreender documentos gerados pelas diversas comunidades antes da descoberta da estrutura do ADN. A partir do surgimento das micas houve uma mudana na identificao do cenrio da Biologia (juno de vrias reas para um estudo mais particularizado, como a Bioinformtica, por exemplo) o que revolucionou sua histria. Conseqentemente os estudos documentais e do gnero tambm foram analisados, j que os recursos diferenciados da Bioinformtica geraram diferentes tipos de documentos alm dos tradicionais livros, cadernos de campo e mesmo artigos impressos. Estes recursos deram lugar a bancos de dados genmicos, ontologias, softwares especficos voltados para a atividade de anotao genmica. Isto tem relao com a organizao de contedos em sites porque estes so itens (objetos) indispensveis para se obter as informaes / recursos necessrios para os profissionais realizarem suas pesquisas. Nestes novos recursos esto contidas as informaes e no mais nos pesquisados anteriormente ao surgimento das novas tecnologias b) Etnometodologia Como Macedo (2006) sinaliza, Mais do que uma sociologia da vida cotidiana, a Etnometodologia uma tentativa de anlise dos aspectos fundamentais da ao e da significao implicada. Dessa forma, por oferecer uma metodologia qualitativa, a pesquisa etnolgica apropriada para descrever a atividade dentro do laboratrio, a qual se baseia justamente na ao dos pesquisadores a fim de fazer descobertas relativas a novas drogas para cura das DTNs, por exemplo. Embora Jules-Rosette (2007) apresente oito itens voltados para a Etnometodologia conferir lista abaixo -, nem todos puderam ser levados em considerao no desenvolvimento da tese. Indexalidade reflexibilidade descritibilidade conceito de membro da sociedade prticas das aes socializadas contextualidade competncia nica abordagem da ao na cena social Apenas dois deles se mostraram relevantes de imediato: a descritibilidade e o conceito de membro da sociedade. O primeiro por ser importante descrever as aes dos pesquisadores e os GT2 588

documentos por eles elaborados, a fim de tornar a ambincia cientfica (onde o conhecimento gerado) descritvel, inteligvel e analisvel. O segundo por sinalizar que o pesquisador-observador (no caso o Cientista da Informao) precisa de certa forma, pertencer comunidade na qual realiza o estudo, filiando-se como membro do grupo. 2.2 Organizao dos elementos O segundo aspecto metodolgico adotado o mtodo facetado (RANGANATHAN, 1967; AITCHISON, 1970 CAMPOS, 2001; BROUGHTON, 2002), o qual apresenta cnones e princpios para a formao de estruturas hierrquicas que esto organizadas em facetas, reunidas em Categorias Fundamentais. Esse mtodo possui hospitalidade, permite escalabilidade e possibilita mltiplos acessos. ideal, portanto, para uso em sites, uma vez que permite a maior possibilidade de relao entre assuntos, bem como a incorporao de novos. Com a adoo do mtodo de faceta, o que se verificou no levantamento dos dados (os elementos que integrariam o modelo) foi a necessidade de incluir no apenas os princpios de classificao (hierarquizao), mas de associao entre eles. O mtodo prev a escolha de uma primeira faceta que determina o principal atributo pelo qual o modelo foi estabelecido e seguida pelas demais facetas. Isso no significa que a ordem seja prescritiva, uma vez que o usurio pode fazer a busca por onde deseja, mas geralmente a maioria usar a disposio bsica disposta na tela (DENTON, 2009). No caso do Laboratrio, a tarefa est voltada para estudos genmicos de organismos causadores de doenas tropicais negligenciadas e, ento, tornou-se primordial a escolha de ORGANISMOS como a primeira faceta a ser considerada. Isso no diminui a importncia das demais facetas estabelecidas, mas tudo o que feito em torno das pesquisas est voltado para aqueles estudos. A partir dos organismos (que so o objeto de pesquisa) ento como um ponto de acesso, foram identificados os demais objetos: software para anotao genmica (recursos), pesquisadores envolvidos (recursos humanos) e os objetos a estes relacionados (projetos, publicaes) Aps a aplicao da metodologia acima apresentada, foram identificados os seguintes elementos para compor o modelo de representao. So eles: ORGANISMOS ONTOLOGIAS ETAPAS NA ATIVIDADE DA ANOTAO GENMICA EQUIPE DE ANOTAO GENMICA PROJETOS PROGRAMAS BANCOS GENMICOS BANCOS DE PUBLICAES INSTITUIES Esses elementos identificados resultaram nas seguintes facetas pontos de acesso -:

GT2 589

ORGANISMOS, RECURSOS DE ANOTAO (in silico), EQUIPE DE ANOTAO GENMICA, PROJETOS e INSTITUIES e que so apresentados abaixo:

Alm das relaes lgicas em que os elementos das facetas esto distribudos de forma hierrquica (mostrado com clareza na faceta: ORGANISMOS) o modelo evidenciou um grau maior das relaes associativas, no caso as relaes funcionais-sintagmticas por se tratar, provavelmente, neste modelo, de objetos individuais.

GT2 590

2.2.1 Discusso do modelo A metodologia adotada tornou possvel que se desenhasse um modelo de sistema de informao que permite acesso tanto a informaes ligadas diretamente s pesquisas quanto gesto das atividades realizadas no Laboratrio. As categorias foram teis para organizar o primeiro nvel e, em seu interior, foram identificadas relaes lgicas (tipos de organismos, tipos de pesquisadores) e tambm as relaes funcionaissintagmticas, permitindo assim que um objeto possa ser encontrado a partir de mais de um ponto de acesso, como mostram os exemplos a seguir no modelo: Organismo A -> recursos associados -> Ontologias Recursos de anotao genmica -> Bancos de informao > Ontologias Organismo A ->Pesquisadores associados - Coordenador Equipe de anotao -> Cordenador -> Organismo A Um recurso especfico associado seria, por exemplo, um banco genmico de um dado organismo. GT2 591

Como o objeto de representao uma atividade, ela demanda a utilizao de programas especficos para cada etapa em que esta atividade se realiza. Assim, temos, para a Etapa: Avaliao de qualidade, o programa Phred, para a Etapa: Anlise de similaridade, os programas BLAST/FASTA/Interpro, e assim por diante. A tecnologia permite que um mesmo programa possa estar associado a mais de uma etapa. Por exemplo, a etapa de predio in silico de genes pode ocorrer em paralelo com a etapa de similaridade (WAGNER, 2006). As novas tecnologias da informao permitem maior flexibilidade de navegao. Assim, um mesmo objeto pode ser recuperado atravs de mais de um ponto de acesso: a partir de um pesquisador pode-se identificar seus diversos relacionamentos na atividade de anotao genmica e tambm no prprio Laboratrio, isto , o Organismo com o qual est envolvido, Projetos associados, sua Produo cientfica A elaborao do modelo viabilizou traar diretrizes metodolgicas para a construo de estruturas sistemticas. 3 DIRETRIZES METODOLGICAS As diretrizes so generalizveis e podem ser aplicveis em outros campos do conhecimento em que se necessite organizar e representar atividades/tarefas. Elas foram elaboradas de acordo com o caminho percorrido pelas metodologias adotadas na pesquisa e so: Para captura do conhecimento 1 Filiar-se como membro da comunidade 2 - Descrever as aes dos pesquisadores 3 - Identificar os temas do domnio 4 - Estabelecer um recorte do domnio 5 - Levantar a literatura relacionada com o recorte escolhido 6 - Identificar e anotar as informaes relevantes Para organizao/estruturao 7 - Descrever a funcionalidade de cada objeto 8 - Identificar as relaes hierrquicas 9 - Identificar as relaes partitivas 10 - Identificar as relaes funcionais-sintagmticas 11 - Determinar as Categorias Para apresentao do modelo 12 - Identificar a faceta inicial 13 - Observar o princpio da frmula PMEST

GT2 592

4 CONSIDERAES FINAIS

A comunidade cientfica em genmica transita em diferentes reas do conhecimento e lida com o surgimento de novas reas. Sendo assim, o Cientista da Informao, devido dinmica do conhecimento, possui importante papel na busca permanente de novos recursos, na sua sistematizao e na disponibilizao em servios de informao. Para isso, pode valer-se dos princpios de classificao, como os adotados nesta pesquisa, uma vez que so fundamentais em qualquer atividade que requeira organizao de dados, de informao, de conhecimento. Em um Laboratrio cientfico, torna-se evidente a importncia de bancos de informao para verificar a validade, evitar repetio de pesquisas, com evidente desperdcio de recursos e conseqente frustrao do pesquisador quando descobre que chegou tarde. O caminho de anlise de domnio preconizada por Hjrland foi iniciado com nfase na reviso da literatura gerada pelos pesquisadores que ali atuavam. Artigos, dissertaes, teses e curriculum vitae tornaram-se documentos importantes e mesmo cruciais para a compreenso da atividade cientfica exercida pelos profissionais com especificidade na anotao genmica. Da mesma forma, foi feita consulta bibliografia fora do mbito do Laboratrio, o que contribuiu na abordagem a que esta pesquisa se propunha. O percurso realizado indicava o que devia ser analisado, mas o como realizar esta anlise s foi possvel ao se postular a adoo da etnometodologia como mtodo para capturar o conhecimento. Com isso, compreenderam-se melhor as atividades, complementando o que se obteve por meio do proposto pelo mtodo da anlise do domnio. Na coleta dos dados, verificou-se que no h um consenso na literatura quanto aos termos usados para designar os objetos das aes. Por exemplo, h alternncia entre os termos programas/ ferramentas/software; bancos de dados/ontologia; sistemas de anotao/ferramenta de anotao. Isso evidencia a relevncia de que no se deve pautar pelos nomes dos objetos conforme referenciados nas diversas fontes, mas na necessidade de caracteriz-los para melhor situ-los no modelo de representao. Assim, a padronizao torna-se imprescindvel para se estruturar um modelo, evitando, dessa forma, a sinonmia, por exemplo, (que poderia ser um complicador). No caso da atividade de anotao genmica, estabelece um controle sobre os procedimentos desta atividade. Ao iniciar o desenvolvimento do modelo de representao, partiu-se do pressuposto de que o mtodo de faceta seria adequado, considerando que os sistemas de classificao existentes e utilizados em pesquisas de organizao do conhecimento mostravam-se inadequados, em especial por serem hierrquico-enumerativos, portanto estticos, voltados para bases de conhecimento. No caso da atividade de anotao genmica, o que se representa, de fato, so as atividades, as aes envolvidas no processo de anotao e, em uma viso sistmica, os elementos associados. O que se manifesta so GT2 593

objetos heterogneos na realidade do Laboratrio cuja relaes funcionais-sintagmticas se fizerem fortemente presentes. Acredita-se que um sistema de informao no modelo aqui proposto seja de grande utilidade e possa ser includo em um site cientfico ou em outro contexto, no qual haja necessidade de recuperao de informao que apie os cientistas envolvidos nas solues de problemas. Entretanto, no se pode dizer que tal modelo, seja hermtico e definitivo. Dada a dinamicidade das informaes, tudo est sempre em desenvolvimento, acompanhando a modernidade das tecnologias e este modelo de representao no est imune a tais modificaes.

Abstract: This study aims at investigating methodological possibilities to represent information resources produced and utilized in a specific environment of interdisciplinary domain through the elaboration of a model of representation of a research activity. The empiric approach is related to the Molecular Biology domain developed in the scientific activity of a modern Laboratory. The work in the Lab comprises scientific research related mainly to the genome of Trypanosomatids and Negleted Ttropical Diseases such as Chagas disease (T. cruzi) and other trypanosomosis, leishmaniosis (Leishmania sp.), generating information and scientific knowledge. The research focus the organization of content of this knowledge generated in the Lab emphasizing the activity of genome annotation. In order to achieve efficient knowledge organization, the Theory of Classification was applied, emphasizing it as tool of the Information Science that helps the systematic structuring of information developed by the research crew but the study demonstrated the importance of the functional-sintagmatic relations in the organization of heterogeneous objects. The methodology used for the elaboration of a model of representation is based on the analysis of domain and in the etnomethodology to the identification of the elements present in that activity and in the method used for the classification of these elements. Also, guidelines were defined to the representation of the model of an activity. Keywords: Theory of Classification-1. Knowledge Organization-2. Information Representation-3. Domain Analysis-4. Etnomethodology-5. REFERNCIAS AITCHISON. J. The thesaurofacet: a multipurpose retrieval language tool. Journal of Documentation, 26 (3) p. 187-203, 1970. BLATECKY A., GAMIEL K., RAMAKRISHNAN L., REED, D., REED, M. Building the bioscience gateway. (North Carolina Biosite. Disponvel em: <http://www.ncbiosite.org>. Acesso em 13 fev, 2009. BROUGHTON, Vanda. Faceted classification as a basis for knowledge organization in a digital environment; the Bliss bibliographic classification as a model for vocabulary management and the creation of multidimensional knowledge structures. New Review of Hypermedia and Multimedia. v. 7, issue 1, 2002. p. 67 102. CAMPOS, Maria Luiza de Almeida. Linguagem documentria: teorias que fundamentam sua elaborao. Niteri: EdUFF, 2001. 133p. GT2 594

CAMPOS, Maria Luiza de Almeida e GOMES, Hagar Espanha. Taxonomia e Classificao: o princpio de categorizao. Data GramaZero Revista de Cincia da Informao, v. 9, n. 4, agosto, 2008. CHAU, Michael et al Building a scientific knowledge web site: The NanoPort experience. Decision Support Systems, (42) 1216-1238, Nov 2006.

DAHLBERG, Ingetraut. Ontical Structures and Universal Classification. Bangalore: Sarada Ranganathan Endowment for Library Sciences Series II, Sarada Ranganathan Lectures II, 1978. ____________________. Knowledge organization: its scope and possibilities. Knowledge Organization, v. 20, n.4, 1993. p. 211-222. DENTON, William. How to make a faceted classification and put it on the web. Disponvel em: < http://www.miskatonic.org/library/facet-web-howto.html>. Acesso em 12 dez 2010. GIBAS, C., JAMBECK, P. Desenvolvendo Bioinformtica. Traduo de Cristina de Amorim Machado. Rio de Janeiro: Campus, 1st ed., 2001. GIL, Henrique Urbano. El enfoque etnometodolgico en la investigacin cientfica. In: Liberabit: Lima (Peru) Revista de Psicologia, nmero 13:89-91, 2007. GILCHRIST, Alan. Thesauri, taxonomies and Ontologies an etymological note. Journal of Documentation, v. 59, n. 1, 7-18, 2003. GOMES, H. E; MOTTA, D.F. e CAMPOS, M.L.A. Revisitando Ranganathan: A Classificao na rede. 2006. Disponvel em: < www.conexaorio.com/biti/ >.Acesso em: 13 abr 2008. HJRLAND, Birger. Domain analysis in information science. Eleven approaches traditional as well as innovative. Journal of Documentation, vol. 58, no. 4, pp. 422-462, 2002. JULES-ROSETTE, Benetta. Huit aspects principaux de lEthnomethodologie. In: Pratiques de formation (analyses), Ethnomthodologies, ( Universit de Paris VIII),. numro spcial de la revue Pratiques de formation, numro double 11-12, 1985 KUMAR, Krishan. Theory of Classification. 2nd. Revised. New Dehli: Vikas Publishing House, 1981. 539p. MACEDO, Roberto Sidnei. Etnopesquisa crtica, etnopesquisa formao. Braslia: Lber Livro Editora, 2006. NUNES, Everardo Duarte. Interdisciplinaridade: conjugar saberes. in: Sade em debate, v. 26, n.62, p.249-258, set/dez, Rio de Janeiro, 2002. OLIVEIRA, Laura de Lira e. Organizao dos contedos de conhecimento para sites cientficos: a representao da atividade de pesquisa em laboratrio de Biologia Molecular de Tripanosomatdeos e Flebotomneos. Tese (Doutorado), Universidade Federal Fluminense. Niteri, GT2 595

RJ, 2011. RANGANATHAN, S. R. Prolegomena to Library Classification. Bombay: Asia Publishing House, 1967.

STEWART, Darin L. Building Enterprise Taxonomies. USA: Mokita Press, 2008. 229 p. WAGNER, Glauber. Gerao e anlise comparative de sequncias genmicas de Trypanosoma rangeli. Dissertao (Mestrado) Instituto Oswaldo Cruz. Rio de Janeiro, 2006.

GT2 596

COMUNICAO ORAL

O CORDEL E AS LINGUAGENS DOCUMENTRIAS


Maria Elizabeth Baltar Carneiro de Albuquerque

Resumo O estudo residiu na anlise dos temas tratados na literatura popular de cordel, visando expanso da classe de literatura nas classificaes bibliogrficas, partindo da hiptese de que as classificaes propostas por vrios estudiosos da rea, denominadas de ciclos temticos, possibilitariam esta expanso. O corpus, constitudo de mil duzentos e cinquenta folhetos foi selecionado, aleatoriamente, do acervo composto por 5.000 cordis do Centro de Documentao do Programa de Pesquisa em Literatura Popular da Universidade Federal da Paraba. Deste corpus, foram analisadas obras de trezentos e quarenta e cinco poetas, entre os mil e setenta e trs autores que figuram no acervo. No trabalho, discorreu-se sobre a literatura popular, considerando o conceito, a origem e as classificaes propostas por diferentes estudiosos deste tipo de literatura. A semitica greimasiana constituiu a teoria bsica, priorizando os investimentos semnticos de tematizao e figurativizao para anlise dos discursos dos folhetos de cordel, complementando com as classificaes bibliogrficas, linguagens utilizadas na organizao de acervos com o objetivo de agrupar documentos de um mesmo tema. A anlise dos folhetos de cordel possibilitou a identificao e extrao das figuras que conduziram aos temas, gerando 27 classes temticas que iro compor a classe de Literatura Popular nas classificaes bibliogrficas. Palavras-chave: Literatura Popular Cordel. Classificao Bibliogrfica. Representao do conhecimento. Semitica. Cincia da Informao. Resumo O estudo residiu na anlise dos temas tratados na literatura popular de cordel, visando expanso da classe de literatura nas classificaes bibliogrficas, partindo da hiptese de que as classificaes propostas por vrios estudiosos da rea, denominadas de ciclos temticos, possibilitariam esta expanso. O corpus, constitudo de mil duzentos e cinquenta folhetos foi selecionado, aleatoriamente, do acervo composto por 5.000 cordis do Centro de Documentao do Programa de Pesquisa em Literatura Popular da Universidade Federal da Paraba. Deste corpus, foram analisadas obras de trezentos e quarenta e cinco poetas, entre os mil e setenta e trs autores que figuram no acervo. No trabalho, discorreu-se sobre a literatura popular, considerando o conceito, a origem e as classificaes propostas por diferentes estudiosos deste tipo de literatura. A semitica greimasiana constituiu a teoria bsica, priorizando os investimentos semnticos de tematizao e figurativizao para anlise dos discursos dos folhetos de cordel, complementando com as classificaes bibliogrficas, linguagens utilizadas na organizao de acervos com o objetivo de agrupar documentos de um mesmo tema. A anlise dos folhetos de cordel possibilitou a identificao e extrao das figuras que conduziram aos temas, gerando 27 classes temticas que iro compor a classe de Literatura Popular nas classificaes bibliogrficas. Palavras-chave: Literatura Popular Cordel. Classificao Bibliogrfica. Representao do conhecimento. Semitica. Cincia da Informao. GT2 597

1 Introduo A Ps-Graduao em Biblioteconomia (1977-1996) e, posteriormente, em Cincia da Informao (1997-2001), na UFPB tem uma tradio histrica que deve ser considerada e foi reestruturada, tendo como rea de concentrao Informao, Conhecimento e Sociedade. Essa rea se desdobra em duas linhas de pesquisa, na qual destacamos Memria, organizao, acesso e uso da informao que tem a seguinte ementa: envolver questes tericas, conceituais, reflexivas e metodolgicas voltadas produo, apropriao, democratizao, representao, usos e impactos da informao, e proteo das memrias, do patrimnio cultural e identitrio, associadas ou no s tecnologias de suporte. Nesse sentido, apresentamos um projeto de pesquisa cujo objeto de estudo contribui para esta linha de pesquisa. Por outro lado, o Departamento de Letras Clssicas e Vernculas da UFPB, atravs do Programa de Pesquisa em Literatura Popular PPLP criou um Centro de Documentao na Biblioteca Central, com o objetivo de difundir a literatura popular em suas mais variadas formas: literatura de Cordel, Poesia Oral Tradicional e Conto Popular. No entanto, falta-lhe o devido tratamento tcnico para sua recuperao. Todo processo de recuperao da informao comea com o tratamento tcnico dos itens para, em seguida, disponibiliz-los para a circulao (emprstimo e/ou consulta). Para recuperar um determinado material informacional, no caso o folheto de cordel, o usurio necessita que o folheto esteja descrito, conforme os padres de organizao, de forma a permitir sua localizao. Em um Sistema de Recuperao da Informao (SRI), destacamos trs etapas principais: a indexao, o armazenamento e a recuperao propriamente dita. No entanto, a indexao a etapa primordial, em que o tema principal do documento identificado, para a efetividade e eficcia do sistema, pois permite reunir todos os documentos de um mesmo assunto sob um nico tema, tornando maximizada a chance de o usurio recuperar todos os itens de um mesmo assunto. Ao conhecermos o Centro de Documentao do Programa de Pesquisa em Literatura Popular (PPLP) da Universidade Federal da Paraba, durante a pesquisa do doutorado, observamos que, em seu acervo, a coleo de folhetos de cordel no atende aos padres de organizao, armazenagem e recuperao. Os folhetos de cordel esto, em sua maioria, armazenados e organizados em ordem alfabtica de ttulo, o que dificulta sua precisa recuperao. Diferentemente em outras bibliotecas esto organizados por autor (poeta). Para organizar tecnicamente a informao em acervos especializados, como o caso da literatura popular de cordel, necessrio criar formas de representao e recuperao eficazes. 2 Literatura popular escrita: o cordel O texto popular pode se apresentar nas modalidades oral ou escrito, cujos gneros se destacam: GT2 598

o romance, o conto, a cantiga, entre outros, como tipicamente orais e o cordel, escrito. O que no significa dizer que no se possa passar de uma modalidade para outra, como afirma Batista (2005, p. 3) Mesmo os de origem oral partiram um dia de uma escritura e o escrito (o cordel) tem por finalidade ser lido, cantado, representado. O folheto de cordel no se constitui apenas de histrias passadas e tradicionais, , sobretudo, uma produo dinmica e esta produo escrita, porm no transmitida somente por meio de leitura silenciosa e individual. Ocorre atravs da oralidade, que se materializa nas leituras comunitrias, fato comum nas regies rurais do Nordeste do Brasil, graas aos aspectos da musicalidade dos versos presentes nos folhetos. A literatura de cordel uma forma de poesia popular impressa. Sofreu influncia dos povos espanhis, franceses e principalmente, portugueses, cujo termo est relacionado forma de apresentao dos folhetos, presos em barbantes (cordis) nas feiras, praas e mercados populares. Sua origem est ligada divulgao de histrias tradicionais, narrativas orais presentes na memria popular, chamados romances. Para Menezes (2006, p. 10) a histria da literatura de cordel pode ser identificada por pelo menos trs perodos bem caractersticos: no primeiro perodo boa parte dos textos concentrava-se em torno dos romances de cavalaria; no segundo a insero do heri popular nordestino, tipicamente rural e no perodo mais recente o predomnio de folhetos considerados de acontecimentos. Cascudo (1939), em seu livro Vaqueiros e Cantadores considerou que os folhetos foram introduzidos no Brasil por cantadores que improvisavam versos, viajantes pelas fazendas, vilarejos e cidades pequenas do serto. O texto e a forma eram caracterizados pela oralidade, em todo o mundo, desde tempos imemoriais, a grande tradio da literatura escrita culta correspondeu sempre, em todas as culturas, a pequena tradio oral de contar (MEYER, 1980, p. 3). O costume de contar histrias nas fazendas ou engenhos sempre foi muito presente. O Nordeste a regio brasileira em que os valores trazidos pelos colonizadores portugueses, nos sculos XVI e XVII, foram mais aceitos, absorvendo, consequentemente, este tipo de literatura, de manifestaes culturais. Historicamente, a produo literria, sobretudo a escrita, foi privilgio de poucos, entretanto, as criaes dos poetas clssicos passaram a ser cantadas atravs dos tempos:
No final do sculo XIX e comeo do sculo XX, os cantadores de viola percorriam as fazendas, fazendo pelejas, cantando faanhas dos heris da poca, noticiando acontecimentos, criando um mundo fantstico de seres, com histrias mirabolantes e contos de fadas: divertiam e instruam. Mas a cantoria tinha regras claras, tanto para composio do verso quanto para o procedimento do desafio, da peleja. Da herdou o cordel o formato, trazendo da oralidade, da sonoridade do versos rimado, as regras para a palavra escrita. Alm do formato, o cordel herda tambm as temticas. Sempre juntas caminharam a cantoria e a literatura de cordel (SOUSA, 2007, p. 72).

importante assinalar que os folhetos de cordel tratavam e tratam de uma grande diversidade de temas e de maneira geral, o poeta nordestino conservador e os demonstra em seus escritos, GT2 599

mantendo em seus versos uma postura ratificadora dos valores tradicionais, o que no significa afirmar que eles no escrevem fatos novos. Assim, com histrias fabulosas e alguns ttulos descomunais, os cordelistas conquistaram os eruditos e espalharam pelo Brasil sua irreverente arte potica nordestina [...] (ALMEIDA, 2009, p. 10). 3 Semitica e linguagem A semitica de origem francesa, tambm conhecida como semitica greimasiana, procura dar sentido ao discurso, atravs do percurso gerativo da significao, modelo terico-metodolgico, cujo escopo estudar a produo e a interpretao de textos. Tal percurso apresenta trs nveis fundamental, narrativo e discursivo que vo dos mais simples e abstratos aos mais complexos e concretos. Para Pais (1984, p. 49), o conjunto de discursos manifestados pertencentes a um universo de discurso, apresenta certas caractersticas comuns e constantes coeres configuradas de uma norma discursiva e processos de produo de ideologia, entendida como sistema de valores, de relaes intertextuais e interdiscursivas. Os critrios de classificao e dos universos dos discursos, como os discursos literrios e no-literrios permitem delimitar muitos aspectos da tipologia do discurso. Entretanto, quando se trata de discursos etnoliterrios, particularmente da literatura popular, estes no se submetem a critrios que tipificam os discursos acima mencionados, pela complexidade e diversidade com que caracterizam uma identidade cultural. Greimas (2008) entende que o exerccio da linguagem produz a manifestao semitica sob a forma de encadeamento de signos. Porm, propor metodologia de anlise para explicar fenmenos lingusticos leva a crer que a anlise dos signos produzidos pela articulao da forma da expresso e do contedo s possvel quando os dois planos da linguagem so antes dissociados para serem estudados e descritos, cada um separadamente. O autor citado acima no parte do signo para montar sua metodologia, mas daquilo que posteriormente denominar figuras (de acordo com a proposta de signo para Hjelmslev (1975, p. 51)), ou seja, unidades narrativas que produzem um bloco de significao. Sua semitica est mais preocupada em descrever os processos de construo de sentido do que em entender os mecanismos de representao da realidade. Discorrendo sobre o percurso gerativo da significao, em que emergem as estruturas fundamental, narrativa e discursiva, cada uma com uma sintaxe e uma semntica, o presente estudo prioriza, nas anlises dos discursos dos folhetos de cordel, a semntica discursiva, privilegiando os processos de tematizao e figurativizao com o fim especfico de chegar elaborao mais adequada de classes temticas representativas da literatura popular. A semntica discursiva tem como componente a tematizao elementos abstratos presentes no texto e a figurativizao elementos concretos presentes no texto que do concretude ao tema. As figuras do texto formam uma rede, uma trama e, para entend-las, necessrio conhecer o primeiro nvel temtico que, como o nvel figurativo, so palavras e expresses, que apresentam GT2 600

traos comuns de significao e que podem ser agrupados. Esses traos comuns podem ser reduzidos a uma oposio semntica. a partir desta oposio que se constri a estrutura fundamental. A tematizao e a figurativizao so procedimentos semnticos da discursivizao, estando ambas interligadas. Enquanto na tematizao os traos semnticos so disseminados no discurso de forma abstrata, na figurativizao so revestidos por traos semnticos sensoriais. Os elementos concretos que representam coisas, aes e qualidades encontradas no mundo natural, chamam de figuras e os elementos abstratos de temas. A relao existente entre as figuras apresentadas que daro sentido para que se descubra o tema subjacente a elas, o que chamamos de encadeamento de figuras. por intermdio dessas retomadas, encadeamento de referentes do mundo concreto que vo construir os encadeamentos figurativos, com o objetivo de tornar o texto coerente, seja com ideias do mundo real ou com a estrutura textual. Cada texto tem, pois, uma funo diferente: os temticos, explicam o mundo e os figurativos, criam simulacros do mundo. As sequncias das figuras, ao serem organizadas em grupos, traduzem os temas subentendidos nos textos. Isto significa dizer que os temas e figuras esto interligados e criam seus respectivos percursos, por meio dos quais, podemos reconhecer de que trata um texto, auxiliando-nos, consequentemente, no desvelamento da sua significao. Fiorin (1990, p. 72) confirma essa relao entre o temtico e o figurativo quando afirma que
[...] os temas so palavras ou expresses que no correspondem a algo existente no mundo natural, mas a elementos que categorizam, ordenam a realidade percebida pelos sentidos. As figuras, como elementos concretos so elementos ou expresses do mundo natural: substantivos concretos, verbos que indicam atividades fsicas, adjetivos que expressam qualidades fsicas.

Evidencia-se, portanto, que os temas so depreendidos pelo que subjaz s figuras subordinadas, ou sob controle de um contexto, tornando viveis as possibilidades significativas. Dessa forma, emergem segundo um cotejo minucioso das figuras que unem e se ordenam no interior do texto. 4 Linguagens documentrias

A Cincia da Informao uma disciplina voltada para o estudo da produo, circulao e uso da informao. Em uma cultura existem vrios tipos de conhecimentos e podemos distingui-los por seus usos e pelos diferentes grupos sociais que os produzem. No mbito da Cincia da Informao, a organizao do conhecimento diz respeito ao desenvolvimento de teorias em determinadas reas de assunto com o objetivo de elaborar instrumentos para representarem essas informaes. As principais caractersticas da representao da informao residem na substituio do texto do documento por sua descrio abreviada, utilizada GT2 601

como um artifcio para recuperar o que essencial no documento, isto , o tema. A representao da informao envolve dois processos: a anlise do assunto do documento, cujo resultado deve ser colocado numa expresso lingustica, semanticamente relacionada e a atribuio de conceitos na utilizao de um instrumento de padronizao, aqui denominada de linguagem documentria, que garanta aos indexadores o uso dos mesmos conceitos para representar documentos semelhantes, possibilitando assim a comunicao entre usurios e os sistemas de informao. As linguagens documentrias so constitudas de sistemas de classificao bibliogrficos, artificialmente construdos, a partir de uma linguagem natural presente nos documentos, com o objetivo de controlar o vocabulrio de um determinado campo do saber. Estes vocabulrios, por sua vez, so cdigos artificiais, de signos normalizados que permitem uma representao mais efetiva e eficaz do contedo documental com a funo de recuperar a informao nele contido, no momento em que o usurio necessitar. Os sistemas de classificao decimais, como a Classificao Decimal de Dewey e a Classificao Decimal Universal, dentre outros, so tipos de linguagens documentrias, quando permitem agrupar documentos segundo o seu contedo, visando ao armazenamento e recuperao da informao. No presente trabalho, buscou-se compor um conjunto de saberes da Literatura Popular, relacionando-os entre si com aspectos hierrquicos, atravs do estabelecimento de relaes entre temas e figuras extrados dos folhetos de cordel, de acordo com o conceito ou conceitos que cada lxico representa. O reconhecimento da importncia da Literatura de Cordel, enquanto patrimnio histrico e cultural do povo, principalmente, da populao brasileira nordestina, levou-nos ao estudo deste tipo de literatura e o seu tratamento para recuperao nos acervos das bibliotecas. O estudo reside, essencialmente, em analisar os temas tratados na literatura popular, especificamente, nos folhetos de cordel, visando expanso da classe de Literatura nas Classificaes Bibliogrficas, considerando que a esta classe no atendem os parmetros terico-conceituais da Literatura Popular. Investigar os diversos temas da Literatura Popular de Cordel, a partir do conhecimento produzido foi um desafio, pois tudo nos leva a crer que linguagens em estilos diferentes podem transmitir o mesmo contedo e uma classificao precisa para a descrio cientfica, como assevera Menezes (2006, p. 2):
Da exatido da classificao depende a exatido do estudo ulterior. Todavia, posto que a classificao tenha o seu lugar na base de todo o estudo, ela prpria deve ser o resultado de um exame preliminar aprofundado. Ora, justamente o universo que podemos observar: a maioria dos pesquisadores comea pela classificao, introduzindo-a de fora no corpus quando, de fato, deveriam deduzi-la a partir deste.

A sociedade contempornea tem enfrentado constantes mudanas culturais que possibilitam uma nova forma de pensar, e a anlise scio-histrica de uma sociedade pode ser elaborada de acordo GT2 602

com a percepo da linguagem adotada por ela. Linguagem no enquanto cdigo, mas como produto de sua prpria cultura.
[...] uma maneira de identificar o cordel [...] atravs da anlise da ideologia que ele reflete. O poeta popular nordestino conservador, por excelncia. H que examinar detidamente cada contedo dos folhetos, atravs da linguagem e das idias que ali transparecem com espontaneidade (O QUE..., 2006, p. 1).

As transformaes sociais, culturais, polticas e tcnicas e o surgimento de redes mundiais de informao impem a necessidade de se tratar o contedo dos documentos, de maneira racional e analtica, com o fim de obter uma melhor representao da informao produzida. A classificao por assuntos ou bibliogrfica utilizada com o objetivo de se agruparem os documentos sob o mesmo tema. Como forma de tornar mais gil sua recuperao. O documento considerado como qualquer unidade, impressa ou no, passvel de catalogao e indexao, que compreende a possibilidade de representar o seu contedo informacional. E isto ocorre quando so criados cdigos de classificao bibliogrficos. As classificaes bibliogrficas so consideradas como instrumentos na organizao de acervos. A sua organizao lgico-hierrquica faz com que os documentos sejam armazenados, obedecendo a reas de assuntos existentes e classificveis do conhecimento. A Classificao Bibliogrfica Universal, como a Dewey Decimal Classification CDD e a Classificao Decimal Universal CDU so consideradas como parmetros para organizar o universo bibliogrfico. Entretanto, a representao do conhecimento passa pela compreenso de princpios, fundamentos tericos e elementos constitutivos de um determinado campo do saber. As classificaes bibliogrficas, at o presente momento, inserem a literatura de cordel no mbito do folclore. Tal tratamento inconsistente quando se trata de um instrumento de controle de vocabulrio, que representa a expresso da cultura popular. Nesse sentido, pretendemos contribuir para a expanso da classe de literatura nas classificaes bibliogrficas, atravs da anlise do folheto de cordel, objeto deste estudo, que passar a ser tratado nos acervos das bibliotecas por princpios terminolgicos com uma estrutura sistematizada de conceitos, o que permitir a sua organizao, recuperao e disseminao da informao dentro da classe de Literatura e no na classe de Folclore. E a explicitao desses conceitos e princpios passa pela discusso sobre os modelos de organizao do conhecimento segundo Pereira e Bufrem (2005, p. 29). A organizao do conhecimento, enquanto rea de estudo, se diferencia em duas concepes de conhecimento: uma, enquanto processo cognitivo individual constitui-se em uma certeza subjetiva ou objetivamente conclusiva da existncia de um fato ou do estado de um caso adquirido por meio de reflexo; e a outra, enquanto algo sobre o qual existe certo consenso social. Os sistemas de organizao do conhecimento existem desde os tempos remotos e esto presentes em todas as reas do conhecimento humano, de modo mais simples aos mais complexos. GT2 603

Desde a Antiguidade, existe a preocupao em classificar e organizar todo e qualquer material e deu ao homem a importncia em registrar a histria, preservando assim a memria e a cultura de qualquer povo. Enquanto fenmeno social, a classificao, devido a seu formato e ao seu tratamento, torna-se a representao temtica do conhecimento, visto que as diversas sociedades existentes so agrupadas para atenderem s necessidades de organizao e de comunicao, como afirma Costa (1998, p. 66):
Encontramos inmeros exemplos de classificao inscrita e actuantes no mais variados domnios das relaes sociais, tal como se nos apresentam no quotidiano. Basta pensar na maneira como as pessoas tratam umas as outras, ou se referem a terceiras, atribuindo estatutos de superioridade ou inferioridade social, considerando uma distintas e outras vulgares, uma srias e outras desonestas, uma competentes e outras incapazes, umas merecedoras de mais respeito e outras de menos, e por a afora.

Nesse sentido, entende-se que a classificao bibliogrfica responde, simultaneamente, a uma necessidade de organizao interna das unidades de informao quanto recuperao, visando comunicao dos contedos armazenados e aos seus usurios. Reconhecendo os diferentes objetos que permeiam o mundo em que vivemos, o homem tambm colecionou os modos de conhecimento e as cosmologias que elaborava na forma de mitos (MENEGAT, 2005, p. 5), fatos e narrativas que passadas adiante o homem construiu um determinado modo de pensar o mundo, assim como as coisas que o constituem. Deste modo, o homem tentou dar uma ordem s suas colees, para representar seu pensamento ou desejo, contribuindo dessa maneira, para a determinao e desenvolvimento de classificaes do conhecimento. Instituies como museus, arquivos e bibliotecas, respeitando cada uma, sua organizao, origem e a funo que dada aos documentos, tm caractersticas comuns at hoje, por preservarem a memria coletiva. Coletar, organizar, identificar, catalogar e classificar qualquer tipo de suporte informacional constituem atividades que norteiam o tratamento de seus acervos e que fazem dessas instituies, depositrias de colees, que constituem parte da histria de diferentes culturas. Nesse sentido, os sistemas de classificao no so permanentes, com formas e sentidos definidos, porque a Histria, como assevera Vickery (1980, p. 187),
[...] apresenta uma srie de pocas culturais. Cada uma corresponde a um certo perodo de anos nos quais o conhecimento apresenta uma estrutura mais ou menos unificada que pode ser expressa numa classificao, mas cada nova poca exige uma nova classificao.

Cabe, contudo, inicialmente conceituar o termo em questo. Classificao um processo definido, segundo Piedade (1983, p. 9) com a finalidade de dividir em grupos ou classes, segundo as
diferenas e semelhana. dispor os conceitos, segundo suas semelhanas e diferenas, em certo nmero de grupos metodicamente distribudos.

GT2 604

Definido o termo classificao, este se caracteriza pelo processo de agrupar as informaes de forma que suas relaes de analogia se sobressaiam, para que as cincias, o saber ou os documentos possam ser compreendidos de forma precisa. Assim sendo, o processo de conhecimento se realiza, fundamentalmente, atravs da analogia. Ao classificar, segmentamos o contedo a partir de referncias que j possumos, formando agrupamentos em funo de suas propriedades comuns. Processo similar ocorre na rea da Cincia da Informao, ao se construirem representaes de contedo operadas por analogia e generalizaes, procurando a partir de traos comuns, reunir conceitos, numa tentativa de organizar a informao e de garantir sua recuperao.

6 CLASSIFICAES DA LITERATURA DE CORDEL Na tentativa de propor a expanso da classe de Literatura Popular nas Classificaes Bibliogrficas, objetivo da tese intitulada Literatura popular de cordel: dos ciclos temticos s classificaes bibliogrficas, deparamos inicialmente com a questo das propostas de alguns estudiosos, que ora as classificam por temas, ora por tipologias e ora por ciclos temticos e, ainda, por gneros. neste universo de mltiplos temas, como o romance, a valentia, o gracejo, o desafio, o encantamento, o herosmo, a religio, a moral, a stira, a histria e muitos outros que o cordel estudado, pesquisado e debatido em ciclos literrios como manifestao da cultura popular. A literatura de cordel revela a luta de classes, o fosso que as separa e o imaginrio popular, que fortifica o dia-a-dia de algumas pessoas. Assim, refletir acerca da natureza e da funo da literatura popular atravs dos folhetos de cordel estudar o processo de evoluo cultural do homem, estudar a arte por ele mesmo produzida. Cndido (1989, p. 53) fala da presena da linguagem, fator determinante para a classificao de uma obra ser ou no literria, quando assevera:
A arte, e, portanto a literatura uma transposio do real para o ilusrio por meio de uma estilizao formal de linguagem que prope um tipo arbitrrio de ordem para as coisas, os seres, os sentimentos. Nela se combinam um elemento de vinculao realidade natural ou social, e um elemento de manipulao tcnica, indispensvel sua configurao, e implicando em uma atitude de gratuidade.

Da, iniciaram-se as inquietaes, aguando a curiosidade de conhecer estas classificaes realizadas por folcloristas, socilogos, antroplogos, que apresentam propostas as mais diversas e, supostamente, contraditrias. Necessrio se fez, inicialmente, definirem-se alguns aspectos preliminares de tais denominaes, para verificar se poderamos consider-las como ponto de partida para a proposta daquele estudo. Entretanto, apresentamos neste artigo apenas a definio de ciclos temticos. Para se entender esta classificao, buscamos em Houaiss (2001) a definio de ciclo e temtica: GT2 605

a primeira compreende uma srie de fatos que ocorrem periodicamente e a segunda corresponde a um conjunto dos temas que caracterizam uma obra literria ou artstica. Ao aglutinarmos os dois termos, ainda, no nvel de tentativas, teramos: conjunto dos temas que caracterizam uma obra literria ou artstica, com ocorrncias peridicas, ou conjunto de obras, de uma poca, sobre um determinado tema, conceitos estes, tambm, equivocados, devido fluidez, a versatilidade dos poetas e diversidade de temas conservados e transmitidos por narrativas inspiradas, criadas ou recriadas do imaginrio tradicional que nos chegaram atravs da Pennsula Ibrica. Dos estudiosos pesquisados, encontramos trs estrangeiros que propem uma classificao por tipos e categorias, mas que no atendem s variaes e diversidades temticas do cordel brasileiro. No Brasil, muitos estudiosos se aventuraram no caminho da classificao temtica da literatura de cordel. Identificamos doze classificaes, que para alguns consideravam Tipologia e para outros Ciclos Temticos. A maneira como o cordel est sendo classificado nas bibliotecas e as tentativas de classificlo exige o estabelecimento de classes temticas que permitam e possibilitem, de maneira uniforme, a armazenagem, a organizao e a recuperao dos folhetos de cordel pelo tema tratado por eles. Conhecer as classificaes j existentes foifundamental. Observamos que estes estudiosos criaram suas prprias classificaes, rejeitaram as de outros, fizeram acrscimos e arranjos; outras extensas, inconsistentes, redundantes, confusas, com misturas de gneros, tipologias e temas, entretanto, no conseguiram fugir das classificaes por ciclos temticos, que outro equvoco que salta aos olhos, porque os temas so recorrentes e independentes do seu tempo na histria e no imaginrio. Diante da anlise das classificaes apresentadas, corroboramos com Propp (1973, p. 12), quando nos mostra a necessidade de iniciar um trabalho mais analtico para se ter uma classificao correta da literatura de cordel.
Uma classificao exata um dos primeiros passos da descrio cientfica. Da exatido da classificao depende a exatido do estudo ulterior. Todavia, posto que a classificao tenha o seu lugar na base de todo estudo, ela prpria deve ser o resultado de um exame preliminar aprofundado. Ora, justamente o inverso que podemos observar: a maioria dos pesquisadores comea pela classificao, introduzindo-a de fora no corpus quando, de fato, deveriam deduzi-la a partir deste.

Assim, considerando as teorias apresentadas, iniciamos nossa pesquisa pela leitura e anlise dos folhetos de cordel, o que possibilitou a identificao e extrao das figuras que conduziram aos temas, gerando assim vinte e sete classes temticas, que iro compor a classe de Literatura Popular nas classificaes bibliogrficas. Os resultados das anlises, primeiramente, foram apresentados em forma de quadros e em seguida por um quadro resumo dos folhetos de cordel analisados por classe. Descrevemos os percursos temticos e seus revestimentos figurativos, graficamente representados por mapas conceituais, como ferramenta para demonstrar as relaes semnticas GT2 606

existentes entre os temas e figuras na composio das classes temticas. O uso destes mapas possibilitou a visualizao dos temas e figuras destacados em caixa de textos e palavras de ligao, figurativizam e tematizam, representadas por linhas e setas, que explicitam as relaes entre eles. Aqui, vale ressaltar que no existe mapa conceitual correto. O mapa construdo a partir da maneira de ver, sentir e agir do pesquisador, por ser uma ferramenta muito flexvel e que pode ser usada em uma variedade de situaes com diferentes finalidades.

A descrio das classes temticas elaboradas, ao final, permitir ao bibliotecrio, indexar os folhetos de cordel de forma precisa, alm de garantir que um mesmo sistema ou sistemas afins usem os mesmos conceitos para representarem documentos semelhantes, bem como facilitar a comunicao entre o indexador, o usurio e o sistema com a utilizao de um mesmo vocabulrio.
7 CLASSES TEMTICAS DA LITERATURA DE CORDEL Das 27 classes temticas propostas, apresentamos, neste artigo, apenas a classe temtica Bravura e Valentia, como amostra dos resultados obtidos da anlise de 60 folhetos de cordel.
TTULOS DOS FOLHETOS Encontro de Z lapada com Chico topa tudo Encontro de Kung Fu e Lampio O crente e o cachaceiro As aventuras de Joo desmantelado O encontro de Rodolfo Cavalcante com Lampio Virgulino FIGURAS Violento Meteu-lhe a faca Meteu Venceu Cangaceiros CONTEXTO Cada qual mais violento Depressa meteu-lhe a faca O crente meteu a biblia Na cara do cachaceiro Foi quem venceu na [estria Mais de 30 cangaceiros Vitria Cangao TEMAS Violncia

Quadro CLASSE TEMTICA: BRAVURA E VALENTIA


TTULOS DOS FOLHETOS O ataque de Mossor ao bando de Lampio Lampio heri nacional Jararaca arrependido porque matou um menino Lampio... era o cavalo do tempo atrs da besta vida Dirio de Cho Brilhante FIGURAS Cangaceiros Cangaceiro CONTEXTO J prestou pra cangaceiros A vida de cangaceiro Vou falar num cangaceiro Que com Lampio andou Fez Lampio cangaceiro Um cangaceiro gigante Fiel aos seus Camaradas TEMAS Cangao

GT2 607

Biografia de Lampio Beija Flr e Teodoro Lampio vai ao inferno buscar Maria Bonita Jesuno Brilhante o cangaceiro-gentil Lampio: heri ou bandido? Eis um pouco de histria de Jesuino Brilhante Lampio o capito do cangao Volta seca um menino no cangao Histria completa de Lampio e Maria Bonita Jos Colatino, o cabra que levou 99 surras Sombras do cangao ou a verso de Maria Bonita Duelo de gigantes Cangao Cangaceiro Cangao Bandoleiros Cruel Cangaceiro Cangaceiro Coragem Lampio Cangao

O famoso cangaceiro E cada um cangaceiro Transformou-se em [cangaceiro Revirando o seu destino A entrar para o cangao Uma marca que o [cangao conheceu Para o mundo do cangao Do grande rei do cangao Do cangao nas entranhas Do cangao o soberano O Carranca arrependeu-se De se meter no cangao Pois te sigo qual cangao Pra no cangao Ingressar [...] Este a o cangaceiro Apareceu o cangao Com bandoleiros locais Foi talvez o mais cruel Cangaceiro do Nordeste Cangaceiro tem coragem Sete vidas como gato Saiba que sou Lampio Lampio, homem viril Chegou aqui na cidade A famosa cabroeira Desse bravo Lampio Quem planta espinho no [pode Colher flor, s colhe [espinho, Foi isso que Lampio Bandido Bandoleiro Um bandido desumano Respeitava a servio do [cangao Do regime bandoleiro

Jararaca o cangaceiro militar O sucessor de Lampio Corisco O cangao, sua origem e os bravos cangaceiros A chegada de Lampio no inferno A candidatura de Lampio para presidente da repblica Visita de Lampio a Juazeiro

Lampio heri de meia tigela

Nascimento, vida e morte do cangaceiro Z Baiano Asa Branca a inteligncia a servio do cangao

GT2 608

Maria Bonita A eleita do rei

Para seguir Lampio O temido bandoleiro

Quadro CLASSE TEMTICA: BRAVURA E VALENTIA

TTULOS DOS FOLHETOS Labareda o capador de covardes Antonio Silvino A justia acima da lei O homem que no sabia que se chamava Jos Os coronis do Nordeste O grande debate de Lampio com S.Pedro As bravuras de Justino pelo amor de Terezinha Nascimento Grande um gigante da capoeira Briga de Chico Torto com Salustrino Pancada A briga do rapa com o camel O coronel Mangag e o seringueiro do Norte O vaqueiro valente apaixonado A pega do boi bargado no serto jaguaribano A briga de Chico trovo com Oswaldo Ventana Virginio o juiz do grupo de Lampio Epopia do boi Corisco ou a morte do vaqueiro desconhecido Jernimo e Paulina o prmio da bravura India Necy Histria do valente Vilela Histrias do heri vaqueiro Z Romo na pega de bois barbatos

FIGURAS Bandoleiros

CONTEXTO Os audazes Bandoleiros Receberam os bandoleiros O desumano assassino Na vida do banditismo Cumpriu o seu destino No sabes que sois bandido Roubados de vida humana Nunca assumi [compromisso Com covardia ou com medo Sempre foi desafiado Se gostar mesmo de briga Ta com o diabo de lado Os dois ali se agarraram Com o maior desatino O Mangag avanou Deram comeo a brigada Alonso com uma pernada Derrubou logo uns dez O boi se fez a brigar Do meu pai morrer [brigando Demonstrando valentia Para julgar suas vtimas Transformava-se em algoz Para lhe encurralar Nunca apareceu ningum Jernimo por ser valente Foi quem venceu a questo mais valente que os ndios Tem fora e valorosa De um homem muitovalente Pegou muito barbato

TEMAS Cangao

Assassino Banditismo Bandido

Banditismo

Medo Desafiado Briga Agarraram Brigada Derrubou Brigar Brigando Algoz Encurralar Valente Venceu Valente Fora Valente Pegou Barbato

Hesitao Luta

Crueldade Priso Valentia

Valentia

GT2 609

Anita Garibaldi A herona dos dois mundos As aventuras do filho de Antonio Cobra Choca Morreu o valente Tenrio Histria do valente sertanejo Z Garcia do seu navio A vida de peo de rodeio Histria de Mariquinha e Jos de Sousa Leo O covarde marinheiro que salvou a tripulao

Guerreira Coragem

Como guerreira, atacava, Dava apoio com preciso O gigante da coragem Foi um homem de coragem Se o Garcia tem coragem De pegar o barbato Por isso precisa ter A coragem pra montar

Valento Salvou

Estou muito satisfeito Temos um genro valento Neste momento o marinheiro [...] Junto do que afundava E tripulao salvou

Valentia Salvao

Quadro CLASSE TEMTICA: BRAVURA E VALENTIA


TTULOS DOS FOLHETOS Os amores de Chiquinha e as bravuras de Apolinrio Biografia de Sebastio Pereira e Silva de Serra Talhada FIGURAS Bravo CONTEXTO Dum homem bravo que [brigue De vinte e seis qualidades Comandava cangaceiros Na lama e na poeira TEMAS Bravura

Comandava

Liderana

Quadro CLASSE TEMTICA: BRAVURA E VALENTIA

Dos cordis que constituem a classe temtica bravura e valentia, emergiram os temas violncia, vitria, cangao, banditismo, hesitao, luta, crueldade, priso, valentia, salvao, bravura e liderana. Os vocbulos violento, meteu e a expresso meteu-lhe a faca figurativizam o tema violncia, caracterizando a ao exercida com mpeto, fora contra a vida. O vocbulo venceu figurativiza o tema vitria, abordado como forma de superao de obstculos que conduziu o heri a conquistar o seu valor. Os vocbulos cangaceiros, cangaceiro, cangao, banditismo, cruel, coragem, Lampio, bandido e bandoleiro figurativizam o tema cangao, representando os malfeitores que andavam em bandos pelos sertes do Nordeste, sob a liderana de Lampio. Os vocbulos assassino, banditismo e bandido figurativizam o tema banditismo, marcado pela violncia rural exercida pelos chefes polticos locais, para o estabelecimento e manuteno da ordem, formada pela interrelao de valores patrimoniais e paternalsticos responsveis pela submisso da populao rural. O vocbulo medo figurativiza o tema hesitao, sentimento demonstrado pelo receio de fazer GT2 610

algo por se sentir ameaado fisicamente. Os vocbulos desafiado, briga, agarraram, brigada, derrubou, brigar e brigando figurativizam o tema luta, cuja intencionalidade estabelecida pelo domnio sobre o oponente, o indivduo. O vocbulo algoz figurativiza o tema crueldade, representando o sofrimento causado pelo bando liderado por Lampio. O vocbulo encurralar figurativiza o tema priso, caracterizando a perseguio a animais at encerrar a caa. Os vocbulos valente, fora, pegou, barbato, guerreira, coragem, valento figurativizam o tema valentia, ao que mostra vigor, proeza, faanha e fora diante de algumas adversidades ou necessidades da vida. O vocbulo salvou figurativiza o tema salvao, que se refere libertao de um estado indesejvel, de escapar de uma situao em que o indivduo se encontra em perigo. O vocbulo bravo figurativiza o tema bravura, caracterizando o indivduo corajoso, capaz de enfrentar perigos que colocam sua vida em risco. O vocbulo comandava figurativiza o tema liderana, representando o comando de tropas de cangaceiros, tendo como lder Sebastio Pereira e seu sucessor Lampio. Observemos a seguir o mapa conceitual da classe temtica bravura e valentia com a relao hierrquica de temas e figuras.
Figura 1 Mapa conceitual bravura e violncia

GT2 611

BRAVURA E VALENTIA

Tematizam

VIOLNCIA VITRIA

CANGAO

HESITAO BANDITISMO LUTA

CRUELDADE PRISO

VALENTIA

BRAVURA LIDERANA

SALVAO

Figurativizam

VENCEU

MEDO DESAFIADO

ALGOZ BRIGA BRIGADA BRIGAR ENCURRALAR

SALVOU

COMANDAVA BRAVO

VIOLENTO METEU-LHE A FACA METEU

ASSASSINO AGARRARAM BANDITISMO DERRUBOU BANDIDO BRIGANDO

CANGACEIROS CANGAO CRUEL LAMPIO

CANGACEIRO BANDITISMO CORAGEM BANDIDO VALENTE FORA PEGOU GUERREIRA CORAGEM VALENTO

BANDOLEIRO

Classe

Temas

Figuras

7.1 Descrio da classe temtica Bravura e Valentia


Contam as bravuras dos cangaceiros e dos amarelinhos que ningum d nada por eles, mas que so capazes de lutar e vencer homens fortes. Valentia, coronelismo, banditismo e jagunagem, Lampio, Antnio Silvino, Corisco. 8 Concluso O folheto de cordel tem caractersticas prprias que o diferenciam das peas populares

GT2 612

orais, mas a elas est vinculado na poesia ritmada, na rima, na sonoridade que corroboram para a assimilao do texto, permitindo que o ouvinte perpetue a estria em muitas outras. Com ilimitados temas, retratando a realidade e o imaginrio popular brasileiro, numa linguagem potica e de fcil memorizao que contribui grandemente para incentivar os relacionamentos sociais, esta literatura popular vem atraindo a ateno de estudiosos do mundo inteiro como fonte pesquisa. No entanto, as bibliotecas tm enfrentado grandes desafios na tentativa de criar instrumentos eficazes para armazenagem, organizao e recuperao deste suporte. Nas classificaes bibliogrficas, a literatura popular de cordel encontra-se inserida na classe folclore, uma vez que a ela vem sendo atribudo o mesmo status da literatura oral que no possui autor conhecido e que se encontra vinculada a pocas e locais os mais remotos. Entretanto, o cordel tem autoria conhecida, sobretudo no Brasil onde, a partir dos finais do sculo XIX, quando Leandro Gomes de Barros inicia a publicao em srie de folhetos que versava sobre mltiplos temas. Observamos tambm que vrios estudiosos da rea apresentaram classificaes para a Literatura Popular de Cordel, denominadas de Ciclos Temticos, o que nos levou a considerar, como hiptese, a possibilidade de utiliz-las para expandir a classe de Literatura Popular nas classificaes bibliogrficas. Entretanto, as anlises apresentadas nesta tese levaram-nos a negar a hiptese levantada em princpio, fazendo com que nosso foco, em relao aos ciclos temticos, fosse direcionado aos temas tratados nos cordis. Este procedimento culminou na elaborao de 27 classes temticas: Agricultura, Biografias e Personalidades, Bravura e Valentia, Cidade e Vida Urbana, Cincia, Contos, Crime, Cultura, Educao, Esporte, Erotismo, Feitiaria, Fenmeno Sobrenatural, Histria, Homossexualismo, Humor, Intempries, Justia, Meio Ambiente, Moralidade, Morte, Peleja, Poder, Poltico e Social, Religio, Romance, Sade. Doena. Considerando a criatividade dos nossos poetas e o corpus analisado, estas classes no se esgotam em si mesmas, como tantas outras classificaes propostas. Porm, temos a convico de que estamos mais prximos de atender aos parmetros terico-conceituais da literatura popular e aos padres de organizao, armazenagem e recuperao dos folhetos de cordel nas bibliotecas, atravs da anlise dos temas e figuras que a semitica greimasiana possibilitou. Portanto, esta classificao temtica responde, simultaneamente, pela expanso da classe de Literatura Popular nas classificaes bibliogrficas e pela necessidade de organizao interna das bibliotecas quanto recuperao, visando comunicao dos contedos armazenados nos folhetos de cordel e a seus usurios. This study is an analysis of the themes covered by the Cordel Literature, which seeks to expand the topic of literature in bibliographic classifications, assuming that the classifications proposed by various scholars in the field, called thematic cycles, would enable this expansion. The corpus, consisting of one thousand two hundred and fifty booklets was selected randomly and the collection consists of 5,000 cordels of the Documentation Center of Research in Folk Literature of
Abstract:

GT2 613

the Federal University of Paraiba. In this corpus, we analyzed the works of three hundred fortyfive poets, among one thousand and seventy-three authors listed in the inventory. At this work, we spoke out about the Folk literature, considering its concept, origins and classifications proposed by different scholars. The basic theory used was the Greimasean Semiotics, prioritizing semantic investments of figurativization and thematization for reflection and discourse analysis of the cordel booklets, complemented with the bibliographic classifications, languages used in the organization of collections aiming to gather the documents of a same theme. The analysis of the cordel booklets enabled the identification and extraction of the figures that led to the themes, therefore creating 27 thematic groups that will compose the Folk literature topic in bibliographic classifications.
Keywords:

Folk Literature Cordel. Bibliographic Classification. Knowledge Representation. Semiotics. Information Science.

Referncias ALBUQUERQUE, Maria Elizabeth B.C de. Literatura popular de cordel: dos ciclos temticos classificao bibliogrfica. 2011. 311 f. Tese (Programa de Ps-graduao em Letras) Universidade Federal da Paraba, Joo Pessoa, 2011. ALMEIDA, Sandemburg Oliveira de. A oralidade da literatura de cordel na obra do escritor Nei Leandro de Castro As pelejas de Ojuara. Disponvel em: <http://www.cchla.ufrn.br/humanidades/ ARTIGOS/GT15/ENSAIO_DAS_PELEJAS_COM_RESUMO%5B1%5D.pdf> Acesso em: 10 dez. 2009 BATISTA, Maria de Ftima B. de Mesquita. Do oral ao escrito: limites entre o romance oral e o folheto de cordel. Santa Barbara Portuguese Studies, Santa Barbara, v. 9, p. 1-10, 2005 CNDIDO, Antonio. Direitos humanos e literatura. In: FESTER, A.C. Ribeiro et al. Direitos humanos e... So Paulo: Brasiliense, 1989. CASCUDO, Luis da Cmara. Vaqueiros e cantadores. Porto Alegre: Globo, 1939. COSTA, A.F. Classificaes sociais. Leitura, Lisboa, v. 3, n. 2, p. 65-75, out. 1977/ abr. 1998. FIORIN, Jos Luiz; SAVIOLI, Francisco Plato. Para entender o texto: leitura e redao. So Paulo: tica, 1990. GREIMAS, A. J. ; COURTS, J. Dicionrio de semitica. So Paulo: Contexto, 2008. HJELMSLEV, Louis. Prolegmenos a uma teoria da linguagem. So Paulo: Perspectiva, 1975. HOUAISS, Antonio. Dicionrio da lngua portuguesa. Rio de Janeiro: Objetiva, 2003. MENEGAT, Rualdo. A epistemologia e o esprito do colecionismo. Episteme, Porto Alegre, n. 20, p. 5-12, jan./jun. 2005 GT2 614

MENEZES, Eduardo Diatahy B. de. Das classificaes temticas da literatura de cordel: uma querela intil. [S.l.: S.n.], 200?. Disponvel em: <http://www.secrel.com.br/jpoe sia/ediatahy01c. html>. Acesso em: 18 jan. 2006. MEYER, Marlyse. Autores de cordel. So Paulo: Abril Cultural, 1980. PAIS, Cidmar Teodoro. Aspectos de uma tipologia dos universos de discurso. Revista Brasileira de Lingstica, So Paulo, v. 7, n.1, p. 43-65, 1984. O QUE cordel. Disponvel em: <http://www.cordelon.hpg.ig.com.br>. Acesso em: 25 jan. 2006. PEREIRA, Edmeire Cristina; BUFREM, Leilah Santiago. Princpios de organizao e representao de conceitos em linguagens documentrias. Enc. BIBLI: R. eletrnica de Bibl. Ci. Inform., Florianpolis, n. 20, 2 semestre de 2005. PIEDADE, Maria Antonieta Requio. Introduo teoria da classificao. 2. ed. rev. e aum. Rio de Janeiro: Intercincia, 1983. PROPP, V.I. Morphologie du conte. Paris: Btique. 1973. SOUSA, Joo Bosco Alves de. Contando histrias fazendo Histria. So Paulo: EDUC, 2007. VICKERY, Brian C. Classificao e indexao nas cincias. Rio de Janeiro: Brasilart, 1980.

GT2 615

COMUNICAO ORAL

BIASES NA REPRESENTAO DO CONHECIMENTO: UMA ANLISE DA QUESTO FEMININA EM LINGUAGENS DOCUMENTAIS BRASILEIRAS
Suellen Oliveira Milani, Jos Augusto Chaves Guimares

Resumo: A representao do conhecimento, enquanto processo, assim como os instrumentos que a permeiam e os produtos que dela decorrem, no so neutros, estando imbudos de valores morais. Nesse cenrio, emergem problemas de biases na representao do conhecimento, tais como questes de gnero, categorizaes dicotmicas e falta de garantia e hospitalidade cultural. No tocante questo da mulher, h uma carncia de literatura relativa representao e ao delineamento de seu quadro epistemolgico, tornando-se necessrio verificar em que medida os termos relativos questo feminina esto eventualmente inseridos sob bias nos instrumentos da rea. Para tanto, verificou-se a presena dos termos: feminilidade; feminina(s); feminino(s); feminismo(s); feminista(s); materna(o); maternal; mulher(es), e os respectivos termos em ingls: female; femininity; feminism; feminist; maternal; motherly; woman(en), nas linguagens documentais brasileiras: Terminologia de Assuntos da Fundao Biblioteca Nacional, Vocabulrio Controlado Bsico, Vocabulrio Controlado USP e Classificao Decimal de Direito. Cada termo identificado nas linguagens documentais alfabticas teve seu descritor e no-descritores registrados, bem como notas de escopo, remissivas, termos relacionados e relaes hierrquicas, enquanto as incidncias relativas linguagem documental hierrquica foram sistematizadas de acordo com as diretrizes propostas por Olson (1998). Os resultados apresentam ocorrncias de biases e tambm sugestes para atenu-las, possibilitando, assim, subsdios para discusses posteriores. Em concluso, recomenda-se que reflexes continuem sendo realizadas, a fim de constatar e prevenir biases na representao do conhecimento e, se os profissionais da informao no forem capazes de preveni-las ou solucion-las, a mera possibilidade da existncia das mesmas deve ser informada aos usurios. Palavras-chave: Representao do conhecimento. Linguagens documentais. Bias.

1 INTRODUO A Cincia da Informao (CI) vem ampliando seu universo de pesquisas para alm das tradicionais questes de recuperao, acesso e disseminao da informao e, atualmente, as investigaes tm dado nfase ao estudo dos aspectos epistemolgicos com o objetivo de sedimentar cientificamente a rea. Assim sendo, observa-se uma crescente reflexo sobre seus processos (anlise documental, por exemplo), auxiliados por instrumentos (classificaes, listas de cabealhos de assunto, tesauros etc.), a fim de gerar produtos autorizados e defensveis (por exemplo: ndices, GT2 616

resumos e notaes de classificao). Nesse contexto, o estudo dos aspectos ticos em organizao do conhecimento (OC) responde a preocupaes que vm pautando a rea por quase trs dcadas (DAHLBERG, 1992, LPEZHUERTAS, 2008b). Entretanto, essa temtica ainda necessita de um aprofundamento, pois, como destacam Fernndez-Molina e Guimares (2002), a mesma tem sido abordada tradicionalmente em termos de prtica profissional relacionada produo e uso da informao, muitas vezes mesclada com medidas de recuperao da informao ou, ainda, entendida como inerente a um conceito genrico e fluido de bom senso e bem fazer da rea. De acordo com Milani e Guimares (2011b), os estudos ticos evidenciam um grande interesse de natureza deontolgica voltado especificamente para os cdigos de tica profissional, como bem demonstra a coletnea internacional organizada por Vaagan (2002). Por outro lado, procurando abordar o assunto sob um ponto de vista mais axiolgico, os autores Froehlich (1994), Gorman (2000), Koehler e Pembertom (2000), entre outros, tm abordado o fazer profissional como um todo e de forma mais verticalizada. No entanto, essa preocupao tem sido mais evidente em atividades profissionais de produo e uso da informao, e tambm na gesto de unidades e sistemas de informao, ficando a descoberto a questo intermediria fundamental: os processos de organizao. Especificamente no contexto da organizao do conhecimento, tm-se as reflexes iniciais de Berman (1993), Hudon (1997), Beghtol (2002, 2005), Fernndez-Molina e Guimares (2002), Garca Gutirrez (2002), Olson (2002, 2003), Guimares e Fernndez-Molina (2003), Van der Walt (2004), Bair (2005), Fernndez-Molina et al. (2005), Guimares et al. (2005, 2008), Pinho (2006), Guimares (2006b) e Milani e Guimares (2010, 2011a). Nessa abordagem axiolgica, distintas temticas tm encontrado abrigo (aspectos polticos, religiosos, raciais etc.), dentre os quais se destaca a questo da mulher como um domnio do conhecimento interdisciplinar, em cujo mbito delimita-se o problema especfico desta pesquisa: em que medida os termos relativos questo feminina esto inseridos sob biases1 nos instrumentos de representao do conhecimento? Considerando que a representao do conhecimento se desenvolve no contexto de uma cultura e visa a disponibilizar informaes aos usurios, torna-se fundamental garantir que estes possam sentir-se refletidos nas representaes dos contedos documentais. Por conseguinte, a existncia de biases nesses produtos, os quais devem atuar como substitutos do conhecimento (surrogates of
1 Cumpre destacar a opo por manter o termo original bias(es) em ingls - correspondente a sesgo(s), em espanhol - por abranger, em lngua portuguesa, os termos: vis, tendncia, inclinao, desvio (entendido aqui na sua dimenso metafrica de information detour, ou seja, a busca por um caminho alternativo), pelos seguintes motivos: a) a origem e consolidao dessa discusso terica ocorreu na literatura de lngua inglesa, seguindo-se uma discusso na literatura em lngua espanhola do termo sesgo; b) a inexistncia dessa discusso no mbito da literatura em lngua portuguesa na rea de OC; c) a percepo, aps anlise mais aprofundada da questo, que o termo ingls bias polissmico e traduzi-lo apenas por desvio, por exemplo, configurar-se-ia inadequado por ser restritivo, pois bias abrange no apenas desvio, entendido como uma rota alternativa tomada face rota original, mas tambm vis, tendncia ou inclinao, conforme mencionado acima. Desse modo, optou-se pela utilizao do termo em ingls a exemplo do que ocorre igualmente na rea de OC com o termo aboutness que, na literatura em lngua portuguesa, j foi traduzido por tematicidade, atinncia ou sobrecidade sem que, no entanto, se conseguisse atingir toda a abrangncia semntica do termo em ingls.

GT2 617

knowledge, conforme Olson, 2002), poderia afastar os usurios do sistema de informao como um todo, por nele no se verem refletidos ou includos. Desse modo, e em continuidade a estudos anteriores (GUIMARES, 2003, 2006a), tem-se como objetivo analisar a ocorrncia de biases nas linguagens documentais brasileiras no que se refere questo da mulher comparando-as com a realidade internacional a partir da literatura. Ressalta-se que os resultados ora apresentados so fruto de uma dissertao de mestrado (MILANI, 2010), os quais foram, por sua vez, apresentados no mbito da International Society for Knowledge Organization: Chapter for Canada and United States (MILANI; GUIMARES, 2011a). 2 A QUESTO FEMININA EM REPRESENTAO DO CONHECIMENTO

Tomando como ponto de partida o valor tico garantia cultural (proposto por Beghtol, 2002) como sntese dos valores identificados por Guimares et al. (2008)2 e o problema biased representation, abrangendo os problemas ticos misrepresentation, racismo, marginalizao, imparcialidade ou crena na neutralidade, viu-se a necessidade de investigar como as mulheres tm sido representadas nas linguagens documentais brasileiras e se alguma bias seria percebida nesse contexto. Para tanto, fez-se uma primeira incurso terica acerca das biases no tocante mulher na representao do conhecimento. Assim, de acordo com Milani e Guimares (2010), essa questo est relacionada a problemas como preconceito e discriminao (BERMAN, 1993), gnero (OLSON, 2002, LPEZ-HUERTAS; TORRES, 2005), categorizaes dicotmicas em sistemas de classificao ou tesauros (GUIMARES, 2006b) e falta de garantia cultural (BEGHTOL, 2002). Esclarece-se que um substituto do conhecimento - um rtulo - construdo sob biases [...] quando deixa de incluir diversos aspectos, desprivilegia grupos e temas fora de uma norma aceita (OLSON, 2002, p. 15, traduo nossa). Na representao do conhecimento, observam-se exemplos de biases principalmente relacionados a [...] gnero, sexualidade, raa, idade, habilidade, etnicidade, linguagem e religio, [as quais] tm sido descritas como limites para a representao da diversidade e para os efetivos servios
2 Tm-se como valores ticos: a) Aqueles valores maiores (ou supravalores) que permeiam toda a atividade informacional: respeito Privacidade, Autoria (direito autoral), Acessibilidade, Liberdade, Segurana, Equidade, Diversidade e Minimizao de riscos; b) Aqueles antes havidos como requisitos profissionais, na medida em que integram a essncia do fazer profissional na rea: Competncia, Eficincia, Flexibilidade, Confiabilidade, Reconhecimento profissional, Atualidade, Autonomia, Conscincia de poder e Cooperao; e c) Aqueles antes havidos como meras medidas de OC, mas que hoje se integram ao universo axiolgico da rea: Preciso, Garantia cultural, Exaustividade, Consistncia, Facilidade de uso e Hospitalidade do sistema. Decorrendo da negativa dos valores, surgem os problemas que podem ser categorizados em dois contextos: a) Problemas que permeiam o mundo atual : Diviso digital, Pornografia, Envio de lixo eletrnico, Substituio do profissional pela tecnologia e Violncia; b) Problemas que afetam diretamente as atividades de OC, quando do exerccio profissional : Vigilncia, Censura, Falta de garantia cultural, Negligncia, Direcionamento informacional, Ineficincia profissional, M representao, Racismo, Falta de clareza, Marginalizao, Crena na neutralidade, Difamao, Idiossincrasia, Inacessibilidade informacional, Terminologia preconceituosa e Tradues inadequadas.

GT2 618

biblioteconmicos a populaes diversas (OLSON, 2002, p. 7, traduo nossa). No contexto especfico da OC, destacam-se alguns estudos sobre questes de gnero e suas possveis biases, sendo eles: perspectivas de gnero e discriminao de minorias na CDU (SANTOS; MADINA; SERRA, 1999); a excluso social presente nas linguagens documentais (CARO CASTRO; SAN SEGUNDO MANUEL, 1999); a forma pela qual a mulher representada e nomeada na CDU (MORN SUREZ; RODRIGUZ BRAVO, 2001); a organizao e representao do conhecimento na Internet sobre questes de gnero (LPEZ-HUERTAS; BARIT, ROQUETA, 2002); a anlise da representao terminolgica em quatro tesauros direcionados s questes da mulher - Europa, Espanha, Itlia e Brasil (LPEZ-HUERTAS; TORRES; BARIT, 2004); abordagem terica na qual constatou-se que, em relao aos domnios que envolvem grupos marginalizados, os especialistas compensam a falta de linguagem acrescentando uma expresso inequvoca da interdisciplina, como gnero, mulheres etc. (LPEZ-HUERTAS, 2006); a comparao entre as culturas diferentes de dois pases, Espanha e Uruguai, as quais podem influenciar o desenvolvimento de um campo de contedo como os Gender Studies, bem como afetar a OC em sistemas de informao (LPEZ-HUERTAS, 2008a); e a questo da mulher nas listas de cabealho de assunto e nos tesauros (RODRIGUZ BRAVO, 2007). Os referidos estudos salientam e exemplificam discriminaes de gnero, afirmando que [...] h a necessidade de um modelo de organizao do conhecimento ideal para cada domnio (LPEZHUERTAS; TORRES; BARIT, 2004, p. 38, traduo nossa). Outro problema citado pelos autores a falta de uniformidade da representao do contedo documental e a nfase na representao de aspectos de gnero ligados apenas sexualidade (especialmente com a homossexualidade), vida familiar ou relacionamentos pessoais. A partir dos estudos de Rodrguez Bravo (2006) referentes ao Thesaurus UNESCO, European Womens Thesaurus e Library of Congress Subject Headings, destaca-se que nestes ltimos, por exemplo, os cabealhos refletem as tradicionais discriminaes sociais em relao mulher, enfatizando aspectos como situao conjugal, sexualidade e procedimentos relacionados maternidade. Assim, ao referir-se s linguagens documentais, seria recomendvel incluir as comunidades discursivas marginalizadas [...] segundo sua condio tnica, lingustica, poltica, religiosa, nacional, ideolgica, social, econmica [...] (CARO CASTRO; SAN SEGUNDO MANUEL, 1999, p. 105, traduo nossa). As autoras citam ainda a falta de atualizao, adequao e concretizao dos critrios de elaborao, ou seja, a falta de polticas de gesto das linguagens documentais. Nas linguagens documentais tradicionais,
[...] a presena feminina escassa porque a linguagem institui o masculino como universal, como genrico [buscando, talvez, uma economia de linguagem], e tambm inadequada porque seu discurso de representao do conhecimento mantm os esteretipos femininos, oferecendo uma imagem anacrnica da mulher e apresentando mostras de sexismo (RODRGUEZ BRAVO, 2007, traduo nossa).

GT2 619

Especificamente nas questes femininas, Olson (2002, p. 9, traduo nossa) constata que, em temas que envolvem a representao da mulher e para a mulher, as padronizaes tm trs problemas comuns: Tratam as mulheres como excees s normas masculinas; Isolam as questes da mulher para separ-las do resto do conhecimento; ou Omitem essas questes inteiramente. Lpez-Huertas e Torres (2005) enfatizam mais concretamente essas biases, ou seja: Considerar generalidade como masculinidade; Considerar que o sujeito da anticoncepo a mulher; Termos masculinos usados no plural com o contedo semntico de homens e mulheres; Nas expresses formadas por substantivo + adjetivo, observa-se a tendncia de criar descritores femininos e omitir seus correspondentes masculinos. Embora esses termos e estruturas se justifiquem do ponto de vista histrico e gramatical, eles geram prejuzos a determinadas comunidades discursivas no tocante ao acesso e recuperao da informao. Sendo assim, os mecanismos disponibilizados pela Documentao para as linguagens documentais podem oferecer elementos para uma maior democratizao das mesmas. Em geral, todos os contedos documentais referentes s mulheres so rotulados a partir da entrada Mulheres. Nos tesauros produz-se
[...] uma maior simetria no tratamento do feminino e do masculino. As listas de cabealhos reservam mulher um espao especfico e apresentam um abundante nmero de cabealhos para permitir representar a temtica feminina oculta no grosso do vocabulrio da lista (RODRGUEZ BRAVO, 2007, traduo nossa).

Tm-se, ento, muitos vazios terminolgicos, frequentemente motivados por vazios culturais no caso de tradues e verses. Assim, O grau de preciso da terminologia pode chegar a ser um fiel indicador do nvel de desenvolvimento dessa temtica em culturas diferentes (LPEZ-HUERTAS; TORRES, 2005, traduo nossa). Ao desenvolver uma linguagem documental para amparar os estudos das mulheres, deve-se refletir primeiramente sobre como o masculino ser representado. Lpez-Huertas e Torres (2005, traduo nossa), afirmam que uma questo importante, porque a forma de faz-lo pode estar marcada por uma ideologia que incida negativamente sobre a objetividade desejvel. H uma tendncia lgica que orienta evitar descritores que incluam os termos Mulher ou Mulheres como elemento nuclear. Considerando que as atitudes sociais devem ser modificadas em respeito aos marginalizados e excludos, nesse sentido a linguagem documental constitui um excelente meio para aplicar-se essa reflexo. Para tanto, possveis auxlios so apresentados por Rodrguez Bravo (2007), sendo eles: GT2 620

Insero da mulher sem que ocorra a ocultao do masculino, ou seja, esforos em busca da [...] eliminao de esteretipos sexistas das linguagens documentais, busca do equilbrio entre a presena do homem e da mulher e eliminao de masculinos como falsos genricos (RODRGUEZ BRAVO, 2007, traduo nossa). Insero de notas que autorizem a utilizao do feminino e/ ou o emprego de cabealhos/ descritores sintagmticos para distinguir o masculino do genrico quando no houver outra opo; Insero de qualificadores de gnero junto aos cabealhos/ descritores, sendo eles (M) e (H) quando a temtica no representar a humanidade em geral. Uma vez detectado o problema no cenrio internacional e constatada a carncia de literatura referente representao do conhecimento, mais especificamente em temas ligados mulher, procedeuse anlise da forma pela qual as mulheres so representadas nas quatro linguagens documentais

brasileiras de maior utilizao no pas. 3 METODOLOGIA Para a identificao dos termos relacionados questo feminina, utilizou-se um domnio conceitual composto pelos termos: feminilidade; feminina(s); feminino(s); feminismo(s); feminista(s); materna(o); maternal; mulher(es), bem como seus correspondentes em ingls: female; femininity; feminism; feminist; maternal; motherly; woman(en). O domnio estabelecido, no qual procurou-se englobar a mulher, a teoria feminista e a situao feminina, foi objeto de busca nas seguintes linguagens documentais brasileiras: Terminologia de Assuntos da Fundao Biblioteca Nacional (TAFBN), Vocabulrio Controlado Bsico (VCB), Vocabulrio Controlado USP (VCUSP) e Classificao Decimal de Direito (CDDireito). Com relao s linguagens documentais alfabticas, cada termo identificado gerou uma ficha de registro contendo seu descritor, nota de escopo, relao de equivalncia (UP/ USE), relao associativa (TR) e relao hierrquica (TG/ TE). J para a anlise da linguagem documental hierrquica, a ficha de registro foi preenchida respondendo s categorias baseadas em Olson (1998): notao, conceito classificatrio, contexto hierrquico e nota. A TAFBN, realizada e gerenciada pela Fundao Biblioteca Nacional (Rio de Janeiro RJ), consiste em uma adaptao dos Library of Congress Subject Headings para as necessidades informacionais do Brasil. Essa linguagem contm aproximadamente 37.949 descritores somados a 128.077-assunto tpico, 20.360-geogrfico, 2.819-subdivises de assunto. O VCB (com aproximadamente 9.500 descritores) e o VCUSP (com cerca de 30.796 descritores de assunto somados a 11.432-geogrfico e histrico, 43-gnero e forma, 1.070-profisses e ocupaes, e 575-qualificadores) so as duas linguagens documentais de maior alcance no pas. O primeiro atende a uma rede cooperativa de bibliotecas sediadas em Braslia e integrantes dos Poderes GT2 621

Legislativo, Judicirio e Executivo da Administrao Federal e do Governo do Distrito Federal. O segundo, o mais abrangente sistema brasileiro de bibliotecas universitrias, serve s reas do conhecimento inerentes s atividades de ensino, pesquisa e extenso da maior universidade do pas, a Universidade de So Paulo (So Paulo - SP). A CDDireito foi concebida originalmente por Carvalho (2002) como uma expanso da classe 340 (referente ao Direito) da Classificao Decimal de Dewey. Trata-se de um sistema especfico e amplamente utilizado por essa rea, uma vez que possibilita a adaptao da classificao de Dewey, cujo sistema jurdico baseia-se no Common Law, realidade jurdica do Civil Law, que prepondera nos pases da Amrica Latina e da Europa Continental. Finalizada a fase de coleta e sistematizao de todos os termos encontrados, realizou-se a anlise de cada contexto a partir de uma grade baseada nos estudos de Olson (2002) e Lpez-Huertas e Torres (2005). Cabe destacar que os dados foram analisados do ponto de vista da percepo da questo feminina e amparados na literatura sobre a mulher e a organizao do conhecimento, no sob a perspectiva da teoria feminista. 4 ANLISE DOS RESULTADOS Os resultados revelaram um conjunto de 360 descritores (68,33% na TAFBN, 11,67% no VCB, 16,39% no VCUSP e 3,61% na CDDireito) e, desse corpus, foi possvel extrair as seguintes dimenses temticas: Criminalidade, Cultura, Direito, Educao, Feminismo, Histria, Indivduo, Maternidade, Religio, Sade e Esporte, Sexualidade, Sociologia, Trabalho. Nesse universo, observou-se que 108 descritores (30% do total) apresentaram mais de uma incidncia nas linguagens documentais. A anlise desses resultados evidenciou aspectos especficos relativos s biases, os quais so comentados a seguir. 4.1 Terminologia de Assuntos da Fundao Biblioteca Nacional (TAFBN) Na TAFBN, observa-se um conjunto mais amplo e variado de biases, como: a) O descritor especfico Peridicos para mulheres, sem que haja o correspondente Peridicos para homens, o que remete a uma ideia de tratamento excepcional dado ao feminino; b) Educao sanitria figura como termo especfico do descritor Educao feminina, sendo que os aspectos ligados educao sanitria no necessitam incluir qualificadores de gnero; c) Utiliza-se o descritor Lesbianismo no mbito do comportamento sexual das mulheres, o que denota dois tipos de biases: a utilizao do sufixo -ismo (revelador de vcio) em vez de Mulheres lsbicas, e a relao dessa questo unicamente com o aspecto sexual, deixando de lado a dimenso GT2 622

afetiva, legal etc.; d) Refora-se um esteretipo social a partir da previso da remissiva Mulheres fatais usado para Mulheres sedutoras; e) As especificidades ligadas a aspectos religiosos levam ideia de que as mulheres sejam excees s normas masculinas, como revela a nota de escopo do descritor Mulher (Teologia crist): Usado para obras que tratam da teologia crist do sexo feminino. Obras sobre a teologia do gnero humano e de pessoas do sexo masculino, do ponto de vista de duas ou mais religies, entram em Homem (Teologia crist). Obras sobre a teologia crist do gnero humano entram em Homem (Teologia); f) Em relao ao esporte e educao fsica, destaca-se a tentativa da TAFBN de incluir a mulher em algumas especificidades, como futebol, ginstica, modelagem fsica, treinamento com peso e voo livre deixando de incluir outros esportes, o que revela uma tendncia em tratar as mulheres como excees s normas masculinas e considerar generalidade como masculinidade; g) No mbito da atuao profissional, algumas profisses aparecem diretamente no feminino (arquitetas, advogadas, compositoras, filsofas etc.), ao passo que em outras atividades utiliza-se o termo mulher em.... (mulheres na aeronutica, em vez de aeronautas, mulheres no servio pblico, em vez de servidoras pblicas, mulheres jornalistas, em vez de jornalistas etc.), revelando que a atuao profissional da mulher ocorre tradicionalmente em algumas reas privilegiadas.

4.2 Vocabulrio Controlado Bsico (VCB) No mbito do VCB, tem-se: a) O adjetivo masculino aparece em apenas um descritor em toda a linguagem relacionado a Homossexualismo, o que revela ser a questo masculina considerada o gnero ou a regra e a feminina, a exceo; b) Sade da Mulher revela uma tendncia em salientar aspectos relacionados educao sanitria, sexualidade e maternidade. Nesse sentido, observa-se uma relao associativa com descritores como Anticoncepcional e Planejamento familiar, levando falsa ideia de que o sujeito nico da anticoncepo a mulher. Comparativamente s demais linguagens analisadas, o VCB revelou uma concepo mais equnime entre homem e mulher. 4.3 Vocabulrio Controlado da USP (VCUSP) Com relao ao VCUSP, observam-se particularmente as seguintes biases: a) Mulheres espancadas e Mulheres maltratadas relacionados Violncia na Famlia, o que denota que a violncia contra a mulher s ocorre no mbito familiar e geralmente ligada a mulheres GT2 623

casadas, excluindo, portanto, as demais situaes femininas. Alm disso, tem-se um descritor genrico (famlia) para representar agresses a um indivduo especfico (mulher); b) Mulher delinquente previsto ao lado de descritores como Deliquente juvenil, Deliquente habitual, Deliquente Passional, Delinquente poltico, Delinquente sexual, levando ideia de que o fato de o autor ser mulher representa uma modalidade especfica de crime; c) Feminismo hierarquicamente subordinado a Mulheres, sendo que, atualmente, caracteriza um movimento que ampara tanto mulheres como homens em suas lutas e reflexes. 4.4 Classificao Decimal de Direito (CDDireito) Na CDDireito, por sua vez, observam-se mais nitidamente as seguintes biases: a) Mulheres delinquentes (Alcolatras, alienadas, prostitutas etc.), no mbito do Direito

Penal e subordinado a Delinquentes ou criminosos e suas espcies, revela a considerao da mulher em uma situao especfica ou excepcional, ficando a questo masculina abrigada pelo descritor genrico. Destaca-se ainda o fato de que Alcolatras e Alienadas deveria estar amparado em classes relacionadas sade e apenas Prostitutas poderia estar inserido sob criminalidade; b) Direitos da mulher em geral aparece apenas no mbito do Direito de famlia, subordinado a Mulher casada, Autoridade marital, Autorizao marital, o que cria uma noo falsa de dependncia das temticas; c) A notao Sexo. Condio da mulher no Direito Civil apresenta-se subordinada notao Circunstncias que influem sobre o estado e a capacidade Jurdica, o que confere mulher uma situao de inferioridade; d) No mbito penitencirio, Instituies penitencirias para mulheres e para meninas est subordinado a Outros estabelecimentos penitencirios, o que caracteriza uma situao de explcita excepcionalidade e marginalizao, pois, em um contexto de equidade, poder-se-ia pensar em Instituies penitencirias para homens e para meninos ao lado de Instituies penitencirias para mulheres e para meninas. Outra bias j salientada por Santos, Madina e Serra (1999) d-se pelo fato de no haver um critrio para determinar mulheres e meninas, nem um critrio de idade para pertencer a cada instituio. 5 DISCUSSO A TAFBN, por ser uma lista de cabealhos de assunto, mantm todos os termos referentes mulher sob os cabealhos de assunto mulher e mulheres. Essa linguagem documental busca ser igualitria; entretanto, ao mesmo tempo em quedesigna diversos termos para amparar a questo feminina, observa-seuma quantidade significativamente menor de termosinserida sob os cabealhos de assunto homem e homens.Alm disso,ao introduziros contedos relativos questo femininaabaixo GT2 624

dos cabealhos de assunto mulher e mulheres, a linguagem documental est reproduzindo biases inerentes prpria linguagem natural, ou seja,tratar os assuntos femininos como excees e considerar o masculino como genrico. Uma vez que visa abranger todas as reas do conhecimento, a TAFBN apresentou maiores indcios de biases, sendo eles relacionados a peridicos para mulheres, educao sanitria, lesbianismo, femme fatale, mulher (teologia crist), esporte e educao fsica, e atuao profissional. Quanto s biases, o VCB deveria rever a escassez da presena do adjetivo masculino em seus descritores, bem como os relacionamentos do descritor Sade da mulher. Apesar das biases ora destacadas, percebe-se um cuidado dos gerenciadores do VCB em amparar a questo feminina, alm de valer-se dos mecanismos que a linguagem disponibiliza para faz-lo, revelando uma concepo mais equitativa das relaes entre mulheres e homens. No VCUSP, destinado primeiramente a dar suporte s atividades de ensino, pesquisa e extenso da Universidade de So Paulo mas tambm utilizado por outras instituies de ensino superior do pas, foram detectadas biases referentes a mulheres espancadas, mulher delinqente e feminismo. A CDDireito, enquanto uma expanso da classe 340 da Classificao Decimal de Dewey, tem como objetivo inserir as especificidades do Direito brasileiro nesse contexto classificatrio, mas as biases encontradas nessa linguagem foram as de maior impacto negativo no que diz respeito questo feminina, sendo elas: mulheres delinquentes, direitos da mulher em geral, sexo - condio da mulher, e instituies penitencirias para mulheres e para meninas. Comparativamente, apenas a bias referente a mulheres delinquentes se repetiu no VCUSP e na CDDireito, sendo que no primeiro caso aparece como uma biotipologia criminal, e no segundo, vinculada a alcolatras, alienadas e prostitutas, enquanto espcies de delinquentes ou criminosos. Deve-se enfatizar a necessidade de mais reflexes e aplicaes dos mecanismos disponibilizados pelas linguagens documentais, os quais poderiam aprimorar os contextos, como demonstram os dois exemplos a seguir: Terminologia de Assuntos da Fundao Biblioteca Nacional (TAFBN) Descritor: Esterilizao das mulheres UP Esterilizao feminina UP Female sterilization UP Mulheres - Esterilizao UP Women - Sterilization UP Sterilization, Female TR Infecundidade feminina TE Esterilizao tubria TE Histerectomia Vocabulrio Controlado Bsico (VCB) Descritor: Esterilizao (controle de natalidade) GT2 625

UP Esterilizao da mulher UP Esterilizao feminina TR Controle de natalidade TR Planejamento familiar TG Anticoncepcional Em ambos os exemplos utilizaram-se mecanismos disponveis na linguagem documental, mas percebe-se no primeiro uma abordagem voltada exclusivamente para o procedimento mdico da esterilizao e relacionado ao fator infecundidade. J no segundo, a esterilizao inserida como uma possibilidade anticoncepcional e remetida a questes de planejamento. Nos dois casos as relaes sintagmticas poderiam ter sido mais exploradas, incluindo-se, por exemplo, os seguintes termos relacionados (TR): Esterilizao do homem e/ ou Vasectomia. Ressalta-se que no VCB, Vasectomia aparece como termo especfico (TE) de Anticoncepcional e como termo relacionado (TR) de Controle de Natalidade. Por outro lado, na TAFBN, Vasectomia e Anticoncepo aparecem como termos especficos (TE) do descritor Esterilizao (controle de natalidade). 6 CONCLUSES vista do corpus analisado, confirmam-se as seguintes biases apresentadas pela literatura: as principais linguagens documentais brasileiras tratam as mulheres como excees s normas masculinas ou omitem essas questes inteiramente (OLSON, 2002); utilizam termos masculinos usados no plural com o contedo semntico de homens e mulheres, bem como h uma tendncia de criar descritores femininos e omitir seus correspondentes masculinos (LPEZ-HUERTAS; TORRES, 2005). Essas biases, apresentadas por Lpez-Huertas e Torres (2005) e confirmadas pela presente pesquisa, so reflexos do sexismo inerente prpria linguagem natural. Por outro lado, as seguintes possibilidades de biases apresentadas pela literatura no foram confirmadas nesta investigao: as linguagens documentais brasileiras no isolam as questes da mulher para separ-las do resto do conhecimento (OLSON, 2002) e tambm no consideram que o sujeito da anticoncepo apenas a mulher (LPEZ-HUERTAS; TORRES, 2005). Assim, reitera-se que, no tocante gesto das linguagens documentais, a reflexo e aplicao de mecanismos, tais como relaes associativas ou sintagmticas, relaes de equivalncias, relaes hierrquicas ou paradigmticas e notas de escopo, notas explicativas ou definies, explorados em todas as suas potencialidades, criariam e aperfeioariam contextos, deixando-os mais inclusivos e equitativos. Muitos autores e a prpria International Society for Knowledge Organization vm enfatizando a necessidade de realizar e estimular reflexes acerca da responsabilidade social do profissional GT2 626

da informao. Cabe a este a responsabilidade no apenas de tornar o conhecimento registrado e socializado acessvel aos usurios, mas tambm permitir que os mesmos compreendam os mecanismos que perpassam as linguagens documentais e, consequentemente o processo de representao do conhecimento como um todo, bem como os princpios e a misso subjacentes unidade ou sistema de informao. Conclui-se que, embora no seja possvel evitar as biases, os mecanismos citados acima podem elucidar ou revelar sua ocorrncia e, se os profissionais da informao no forem capazes de faz-lo, a mera possibilidade da existncia das mesmas deve ser informada aos usurios. Desse modo, os profissionais da informao se tornariam mais responsveis face a biases, que passariam de um contexto de hidden biases para o de responsible biases. Finalmente, sugere-se que os primeiros passos nesse sentido podem ser sintetizados em dois pontos: a) a publicao de reflexes sobre esse tema e afins; e b) a discusso da no existncia de neutralidade e a existncia das biases na representao do conhecimento com alunos de Biblioteconomia, Arquivologia, Cincias da Informao e de reas correlatas e, ainda, com profissionais dessas reas em cursos de atualizao e especializao. Abstract: The process of knowledge representation, as well as its tools and resulting products are not neutral but permeated by moral values. This scenario gives rise to problems of biases in representation, such as gender issues, dichotomy categorizations and lack of cultural warrant and hospitality. References on womens issues are still scarce in the literature, which makes it necessary to analyze to what extent the terms related to these particular issues are inserted in the tools in a biased way. This study aimed to verify the presence of the terms female, femininity, feminism, feminist, maternal, motherly, woman/women within the following Brazilian indexing languages: Subject Terminology of the National Library, University of Sao Paulo Subject Headings, Brazilian Senate Subject Headings and Law Decimal Classification. Each term identified in the first three alphabetical documentary languages generated a registration card containing both its descriptors and non-descriptors, as well as scope notes, USE/UF, RT, and BT/NT relationships. As for the analysis of LDC, a hierarchical language, the registration card was filled out by following the categories proposed by Olson (1998). The results showed signs of biases, which enabled the proposition of guidelines that may contribute to minimize them and to open the way for further discussions. In conclusion, reflections on these issues should continue to be carried out, in order to identify and prevent biases in knowledge representation, and if information professionals cannot do so, they should warn users that biases are likely to occur. Keywords: Knowledge representation. Indexing languages. Bias. REFERNCIAS BAIR, S. C. Toward a code of ethics. Technical Services Quarterly, New York, v. 23, n. 1, p. 13-26, 2005. BEGHTOL, C. A proposed ethical warrant for global knowledge representation and organization systems. Journal of Documentation, London, v. 58, n. 5, p. 507-532, 2002. GT2 627

BEGHTOL, C. Ethical decision-making for knowledge representation and organization systems for global use. Journal of the American Society for Information Science and Technology, New York, v. 56, n. 9, p. 903-912, 2005. BERMAN, S. Prejudices and antipathies: A Tract on the LC Subject Heads Concerning People. 2. ed. Jeffersin; North Carolina; London: McFarland & Company, Inc., 1993. CARO CASTRO, C.; SAN SEGUNDO MANUEL, R. Lenguajes documentales y exclusin social. In: LPEZ-HUERTAS, M. J.; FERNNDEZ-MOLINA, J. C. (Ed.). La representacin y la organizacin del conocimiento en sus distintas perspectivas: su influencia en la recuperacin de la informacin. Granada: Universidad de Granada, 1999. p. 101-108. CARVALHO, D. de Q. Classificao Decimal de Direito. 4 ed. rev. e atual. Braslia: Presidncia da Repblica, 2002. Disponvel em: <www.planalto.gov.br>. Acesso em: 06 junho 2009. DAHLBERG, I. Ethics and knowledge organization: in memory of Dr. S. R. Ranganathan in his centenary year. International Classification, Frankfurt, v. 19, n. 1, p. 1-2, 1992. FERNNDEZ-MOLINA, J. C. et al. Aspectos ticos de las nuevas tecnologas de la informacin y la comunicacin y su reflejo en la organizacin del conocimiento. In: GASCN, J.; BURGUILLOS, F.; PONS, A. (Org.). La dimensin humana de la organizacin del conocimiento. Barcelona: Universitat de Barcelona, 2005. p. 177-186. FERNNDEZ-MOLINA, J. C.; GUIMARES, J. A. C. Ethical aspects of knowledge organization and representation in the digital environment: their articulation in professional codes of ethics. In: LPEZ-HUERTAS, M. J. (Ed.). Challenges in knowledge representation and organization for the 21st century: integration of knowledge across boundaries. Wrzburg: ERGON Verlag, 2002. p. 487-492. (Advances in Knowledge Organization, 8). FROEHLICH, T. J. Ethical concerns of information professionals in an international context. In: ALVAREZ-OSSORIO, J. R.; GOEDGEBUURE, B. G. (Ed.). New worlds in information and documentation. Amsterdan: Elsevier; FID, 1994. p. 459-470. GARCA GUTIRREZ, A. Knowledge organization from a culture of the border towards a transcultural ethics of mediation. In: LPEZ-HUERTAS, M. J. (Ed.). Challenges in knowledge representation and organization for the 21st century: integration of knowledge across boundaries. Wrzburg: ERGON Verlag, 2002. p. 516-522. (Advances in Knowledge Organization, 8). GORMAN, M. Our enduring values: librarianship in the 21st century. Chicago; London: ALA, 2000. GUIMARES, J. A. C. A dimenso terica do tratamento temtico da informao (TTI) no universo cientfico da International Society for Knowledge Organization - ISKO. Marlia: UNESP, 2006a. Projeto de Produtividade em Pesquisa apresentado ao CNPq referente ao perodo: mar. 2007-fev. 2010. GUIMARES, J. A. C. Aspectos ticos do tratamento temtico da informao (TTI): elementos para sua caracterizao a partir da interface das dimenses profissional, pedaggica e investigativa na rea da Biblioteconomia no Mercosul. Marlia: UNESP, 2003. Projeto Integrado de Pesquisa apresentado ao CNPq referente ao perodo: 2003-2006. GUIMARES, J. A. C. Aspectos ticos em organizao e representao do conhecimento (ORC): uma reflexo preliminar. In: GONZLEZ DE GMEZ, M. N.; ORRICO, E. G. D. (Org.). Polticas de memria e informao: reflexos na organizao do conhecimento. Natal: EDUFRN, 2006b. p. 237-264. GUIMARES, J. A. C. et al. Aspectos ticos en organizacin y representacin del conocimiento: un anlisis de la bibliografia cientfica en busca de una categorizacin preliminar de valores. In: GASCN, J.; BURGUILLOS, F.; PONS, A. (Org.). La dimensin humana de la organizacin del conocimiento. Barcelona: Universitat de Barcelona, 2005. p. 278-285. GUIMARES, J. A. C. et al. Ethics in the Knowledge Organization Environment: an overview of GT2 628

values and problems in the LIS literature. In: ARSENAULT, C.; TENNIS, J. T. (Ed.). Cultural and Identity in Knowledge Organization. Wrzburg: ERGON Verlag, 2008. p. 340-346. (Advances in Knowledge Organization, 11). GUIMARES, J. A. C.; FERNNDEZ-MOLINA, J. C. Los aspectos ticos de la organizacin y representacin del conocimiento en la revista Knowledge Organization. In: FRAS, J. A.; TRAVIESO, C. (Org.). Tendencias de investigacin en organizacin del conocimiento. Salamanca: Universidad de Salamanca, 2003. p. 809-816. HUDON, M. Multilingual thesaurus construction: integrating the views of different cultures in one gateway to knowledge and concepts. Knowledge Organization, Wrzburg, v. 24, n. 2, p. 84-91, 1997. KOEHLER, W.; PEMBERTON, J. M. A search for core values: towards a model code of ethics for information professionals. Journal of Information Ethics, Jefferson, v. 9, n. 1, p. 26-54, 2000. LIBRARY of Congress Subject Headings. Disponvel em: <http://www.loc.gov/cds/lcsh. html#lcsh20>. Acesso em: 08 jan. 2009. LPEZ-HUERTAS, M. J. Anlisis del dominio interdisciplinar para la representacin y organizacin del conocimiento. In: GONZLEZ DE GMEZ, M. N.; ORRICO, E. G. D. (Org.). Polticas de memria e informao: reflexos na organizao do conhecimento. Natal: EDUFRN, 2006. p. 209235. LPEZ-HUERTAS, M. J.; BARIT ROQUETA, M. -G. Knowledge representation and organization of gender studies on the Internet: towards integration. In: LPEZ-HUERTAS, M. J. (Ed.). Challenges in knowledge representation and organization for the 21st century: integration of knowledge across boundaries. Wrzburg: ERGON Verlag, 2002. p. 393-403. (Advances in Knowledge Organization, 8). LPEZ-HUERTAS, M. J. Cultural impact on Knowledge Representation and Organization in a Subject Domain. In: ARSENAULT, C.; TENNIS, J. T. (Ed.). Cultural and Identity in Knowledge Organization. Wrzburg: ERGON Verlag, 2008a. p. 340-346. (Advances in Knowledge Organization, 11). LPEZ-HUERTAS, M. J. Some current research questions in the field of knowledge organization. Knowledge Organization, Wrzburg, v. 35, n. 2/3, p. 113-136, 2008b. LPEZ-HUERTAS, M. J.; TORRES, I.; BARIT, M. Terminological representation of specialized areas in conceptual structures: the case of gender studies. In: MCILWAINE, I. (Ed.). Knowledge organization and the global information society. Wrzburg: ERGON Verlag, 2004. p. 35-39. (Advances in Knowledge Organization, 9). LPEZ-HUERTAS, M. J.; TORRES, I. de. Terminologa de gnero. Sesgos, interrogantes, posibles respuestas. Datagramazero: Revista de Cincia da Informao, Rio de Janeiro, v. 6, n. 5, 2005. MILANI, S. O. Estudos ticos em representao do conhecimento: uma anlise da questo feminina em linguagens documentais brasileiras. 2010. 141 f. Dissertao (Mestrado em Cincia da Informao) - Faculdade de Filosofia e Cincias, Universidade Estadual Paulista, Marlia, 2010. MILANI, S. O.; GUIMARES, J. A. C. Biases in Knowledge Representation: an Analysis of the Feminine Domain in Brazilian Indexing Languages. In: NORTH AMERICAN SYMPOSIUM ON KNOWLEDGE ORGANIZATION, 3., 2011a, Toronto. Proceedings... 2011. MILANI, S. O.; GUIMARES, J. A. C. Bias in the indexing languages: theorethical approaches about feminine issues. In: GNOLI, C.; MAZZOCCHI, F. (Ed.). Paradigms and conceptual systems in Knowledge Organization: Proceedings of the Eleventh International ISKO Conference, Rome, 23-26 February 2010. Wrzburg: ERGON VERLAG, 2010. (Advances in Knowledge Organization, 12). p. 424-429. GT2 629

MILANI, S. O.; GUIMARES, J. A. C. Problemas ticos em representao do conhecimento: uma abordagem terica. DataGramaZero - Revista de Cincia da Informao, Rio de Janeiro, v. 12, n. 1, fev. 2011b. MORN SUREZ, M. A.; RODRGUEZ BRAVO, B. La imagen de la mujer en la clasificacin decimal universal (CDU). In: EXTREMEO PLACER, A. (Ed.). La representacin y Organizacin del Conocimiento: metodologas, modelos e aplicaciones. Alcal de Henares: Universidad de Alcal, 2001. 1 CD-ROM. OLSON, H. A. Mapping beyond Deweys boundaries: constructing classificatory space for marginalized knowledge domains (Dewey Decimal Classification excludes some groups). Library Trends, Champaign, v. 47, n. 2, p. 233-254, 1998. OLSON, H. A. The power to name: locating the limits of subject representation in libraries. Dordrecht: Kluwer Academic Publisher, 2002. OLSON, H. A. Transgressive deconstructions: feminist/ postcolonial methodology for research in Knowledge Organization. In: FRAS, J. A.; TRAVIESO, C. (Org.). Tendencias de investigacin en organizacin del conocimiento. Salamanca: Universidad de Salamanca, 2003. p. 731-740. PINHO, F. A. Aspectos ticos em representao do conhecimento: em busca do dilogo entre Antonio Garca Gutirrez, Michle Hudon e Clare Beghtol. 2006. 123 f. Dissertao (Mestrado em Cincia da Informao) - Faculdade de Filosofia e Cincias, Universidade Estadual Paulista, Marlia, 2006. RODRGUEZ BRAVO, B. La integracin de la dona en els llenguatges documentals: una utopia necessria. BiD: textos universitaris de biblioteconomia i documentaci, Barcelona, n. 18, 2007. Disponvel em: <http://www2.ub.edu/bid/consulta_articulos.php?fichero=18rodri1.htm>. Acesso em: 24 jun. 2009. RODRGUEZ BRAVO, B. The Visibility of Women in Indexing Languages. In: BUDIN, G.; SWERTZ, C.; MITGUTSCH, K. (Ed.). Knowledge Organization for a Global Learning Society. Wrzburg: ERGON Verlag, 2006. (Advances in Knowledge Organization, 10). p. 413-422. SANTOS, T. M.; MADINA, A. M.; SERRA, R. S. CDU: perspectiva de gnero y discriminacin de minoras. In: GARCA MARCO, F. J. (Ed.). Organizacin del conocimiento en sistemas de informacin: actas del III Encuentro de ISKO - Espaa. Zaragoza: Universidad de Zaragoza, 1999. p. 103-118. TAFBN - Terminologia de Assuntos da Fundao Biblioteca Nacional. Disponvel em: <http://www. bn.br/portal/?plugin=Isbn&url=http://catalogos.bn.br/scripts/odwp012k.dll?INDEXLIST=assuntos_ pr:assuntos&tit=Terminologia%20de%20Assuntos>. Acesso em: 07 jan. 2008. VAAGAN, R. A. The ethics of librarianship: an international survey. Munchen: K. G. Saur, 2002. VAN DER WALT, M. S. Round-table: Ethics in knowledge representation and organization. In: LPEZ-HUERTAS, M. J. (Ed.). Challenges in knowledge representation and organization for the 21st century: integration of knowledge across boundaries. Wrzburg: ERGON Verlag, 2002. (Advances in Knowledge Organization, 8). VCB - Vocabulrio Controlado Bsico. Braslia: Biblioteca Acadmico Luiz Viana Filho, 2007. (Edies da Biblioteca do Senado Federal, 2). 1 CD-ROM. Disponvel em: <http://www.senado.gov. br/sf/biblioteca/RVBI/publicacoes.asp>. Acesso em: 09 jan. 2008. VCUSP - Vocabulrio Controlado da Universidade de So Paulo. Disponvel em: <http://143.107.73.99/ Vocab/Sibix652.dll>. Acesso em: 06 jan. 2008.

XII ENANCIB 2011 GT2 630

COMUNICAO ORAL

SEMIOSE E ANLISE DE ASSUNTO EM CONES COMEMORATIVOS DA GOOGLE: IMPLICAES DA EXPERINCIA COLATERAL NA REPRESENTAO DA INFORMAO ICONOGRFICA EM AMBIENTES DIGITAIS
Maria Aparecida Moura Resumo: Este estudo teve por objetivo compreender o processo de anlise de assunto de iconografias entre estudantes da disciplina de indexao do curso de Biblioteconomia em uma universidade pblica brasileira. A partir da identificao, anlise e representao informacional dos cones comemorativos apresentados na interface de pesquisa do motor de busca Google, analisaramse os gestos de representao da informao iconogrfica. Tomaram-se por referncia os conceitos de signo, semiose, cone, ndice, smbolo, experincia colateral, interpretao s e paranica. O estudo evidenciou a importncia do alargamento da experincia esttica e scio-cultural do analista como base para representao e recuperao da informao em contextos digitais em rede. Palavras-chave: analise de assunto, informao iconogrfica, semitica,

1 INTRODUO Os cones comemorativos Google (doodles) so alteraes imagticas inseridas na logomarca da empresa adotada na interface de pesquisa do buscador com o propsito de ressaltar fatos histricos, culturais e cientficos locais ou globais vinculados s datas selecionadas. Os doodles so desenhos livres, mais ou menos automticos, que as pessoas realizam em situaes corriqueiras, tais como durante uma reunio, fixao de contedos, situaes tediosas, dentre outras. Em geral os elementos icnicos presentes nos doodles remetem ao universo semitico de referncia no qual o sujeito encontrava-se inserido ou fazem aluso ao tema que envolveu a conversao ou reflexo, por exemplo. Ressalta-se que at os anos 1920 os doodles foram pouco percebidos, mas com o surgimento do surrealismo evidenciou-se fortemente as suas marcas psicanalticas por destacar o papel do inconsciente na representao verbal e imagtica. Essa centralidade proposta pelo movimento artstico- literrio surtiu efeitos na ao criativa.

GT2 631

Figura 1 - Galateia de esferas - Salvador Dali 1952

No caso da Google, a estratgia teve inicio em 1998 e vinculavam-se cones de eventos comemorativos globais ao smbolo da empresa como formar de ampliar o potencial informacional e de expandir as representaes sociais da marca e do evento destacado. No ano 2000, foi criado um doodle para o evento comemorativo da Queda da Bastilha consolidando assim a estratgia info-comunicacional da empresa em relao aos eventos sciohistricos. Ao longo do perodo de estabilizao e expanso do projeto, a Google constituiu uma equipe de designers que se ocupa da gesto e adequao do smbolo da empresa aos elementos icnicos memorveis do evento comemorativo escolhido. Assim, a empresa j produziu cerca de 1000 doodles, sendo 300 com base nos eventos especficos do calendrio americano e 700 associados aos demais pases do mundo. Nos ltimos anos, os doodles ganharam um apelo transmiditico ao introduzir novas estratgias de recuperao seletiva da informao associada ao evento, incorporar msica, vdeo e elementos interativos. Em vista dessa estratgia da empresa e considerando a importncia do motor de busca nas atividades de recuperao da informao em contexto mundial, indagou-se nesse trabalho sobre a percepo de alunos de Biblioteconomia acerca dos eventos scio-histricos destacados nos referidos doodles. De que modo os alunos de Biblioteconomia percebem, identificam e interagem com os referidos cones? Como a experincia colateral desses sujeitos afeta a anlise de assuntos que os mesmos so capazes de realizar acerca dos eventos sugeridos pelos cones? Qual a natureza da interpretao realizada e quais as repercusses na representao da informao iconogrfica em ambientes digitais? Nesse trabalho abordaremos a anlise de assunto em interface com alguns conceitos semiticos relacionados semiose e interpretao, apresentar-se- o corpus e a metodologia de anlise dos dados e as consideraes finais do trabalho. GT2 632

2 ANLISE DE ASSUNTO, SEMIOSE E ICONOGRAFIAS DIGITAIS Ns ltimos anos aumentou expressivamente a sobreposio de contedos informacionais suportados por elementos iconogrficos. Tais alteraes exigem que os mediadores da informao transitem de forma proficiente entre as mltiplas formas de reproduo da informao garantindo a representao do contedo informacional de modo coerente. No contexto de representao da informao, a anlise de assunto se refere etapa de apreciao do contedo informacional de um documento com propsito de representao em sistemas de informao. Essa etapa precedida pela leitura tcnica. Segundo Naves apud Fujita (2003), a anlise de assunto envolve grande complexidade, pois, alm do problema da terminologia, existe a influncia direta das pessoas que a executam, conhecida como subjetividade, pela qual o indexador interpe seus prprios valores em sua atuao de intermedirio entre autores e usurios, ainda que a tarefa do indexador seja determinar, de forma precisa, o contedo. Fujita (2003: p. 10) destaca o papel de trs variveis que atuam no processo de anlise de assunto: o leitor, o texto e o contexto,
o processo de anlise de assunto reveste-se de uma subjetividade caracterstica, dadas s circunstncias e elementos envolvidos, pois, a partir da leitura do documento pelo indexador, realizado um processo de comunicao interativo entre trs variveis: leitor, texto e contexto.

A evoluo na elaborao de produtos multimdia ampliou a necessidade de compreendermos o papel das imagens na estruturao dos contedos informacionais e o sua funo na recuperao da informao. Historicamente a organizao da informao tem dedicado ateno s manifestaes da informao ora com foco no contedo textual e em outras circunstncias no contedo iconogrfico. Todavia, o processo de aprendizagem da atividade de anlise de assunto tem se concentrado na representao dos contedos textuais em detrimento do papel da imagem na composio da mensagem. Buscando compreender a articulao desses elementos na composio dos contedos informacionais enfatiza-se que para Santaella e Nth (1998) a imagem como signo icnico pertence classe dos cones e remete a prpria ideia de signo. Para a autora a hegemonia do cdigo encontra-se nas interfaces, sobreposies e intercursos entre imagem e palavra.
o signo de imagem se constitui de um significante visual (representamen para Peirce), que remete a um objeto referncia ausente e evoca no observador um significado (interpretante) ou uma idias do objeto. J que o princpio de semelhana possibilita ao observador unir trs elementos constitutivos do signo, no de estranha que o conceito de imagem seja reencontrado nas denominaes de cada um dos trs constituintes. (Santaella e Nth, 1998: p. 38)

De acordo com Pinto (1995), o cone um signo que se refere ao objeto que denota apenas em virtude de seus caracteres prprios, caracteres que ele igualmente possui quer tal objeto realmente exista ou no. A funo signica do cone , assim, a de exibir em si traos de seu objeto para uma mente. algo que esgara e fora nosso sentido. Ex: pintura figurativa (era possibilidade / relaes GT2 633

de comparao). O smbolo dirige-se para o futuro em termos de regularidade ou lei, pois aquele signo que ser representado em seu interpretante como signo de seu objeto. Em outras palavras, o interpretante de um smbolo previsvel porque seu objeto j conhecido. J o ndice, em contraposio ao cone, em vez de exibir em si traos do objeto (caracterstica do cone) aponta para fora de si na direo do objeto. Nesse sentido,

Fica bem fcil presumir que o que presenciamos um comrcio de sentidos distribudos socialmente por dispositivos miditicos que, conquanto tendo sempre existido, adquirem agora um peso que cresce exponencialmente e quase oblitera a espontaneidade do psiquismo intersubjetivo para carregar nas tintas de uma interobjetividade simblica. Alm do mais, foroso reconhecer que esse item do nosso lbum de memria de imagens j convencionais, sempre retroalimentado pelas nossas relaes interobjetivas, espraia-se para alm dos limites de uma arte para se disseminar e alcanar outros domnios da experincia. (PINTO, 2009: p. 46)

Enfrentar tais questes requer que retomemos o sentido dado por Peirce ao conceito de semiose, que definida nos seguintes termos:
A ao dinmica, ou ao de fora bruta, fsica ou psquica, ou tem lugar entre dois sujeitos (tanto se reagem igualmente um sobre o outro, ou um paciente e o outro o agente, inteira ou parcialmente) ou de uma forma qualquer resultante de aes similares entre pares. Mas por semiose entendo, pelo contrrio, uma ao ou influncia que consiste em ou envolve a cooperao de trs sujeitos, o signo, o objeto e o interpretante, influncia trirrelativa essa que no pode, de forma alguma, ser resolvida em aes entre pares. Semeieosis, no perodo grego ou romano, poca de Ccero j, se bem me recordo, significava a ao de praticamente qualquer espcie de signos; e a minha definio confere a tudo o que assim se comporta a denominao de signo. (PEIRCE, CP 5484) (grifos nossos).

Conforme possvel notar, nessa passagem de Peirce, a semiose , pois, um produto resultante do processo natural do signo, ou seja, a gerao ad infinitum dos interpretantes. Tais interpretantes remetem, sempre, para frente o destino e a completude da cadeia sgnica, apresentando um tipo de opacidade que no nos permite captur-lo de modo definitivo. Ao delimitar a semiose nestes termos, Peirce deu ao conceito um carter mais amplo, desvinculando-o de um possvel estreitamento que poderia torn-lo um produto objetivo circunscrito apenas s aes humanas. Tal observao parece do nosso ponto de vista, fundamental, sobretudo porque, conforme salienta Eco, Peirce no se interessou ostensivamente pelos objetos enquanto propriedades, mas como ocasies e experincias ativas. Contudo, ressalte-se que esse ponto de vista nada tem de idealismo, conforme aponta Eco:
O crculo da semiose se fecha a todo instante e jamais se fecha. O sistema de sistemas semiticos, que poderia parecer um universo cultural idealisticamente separado da realidade, de fato leva a agir sobre o mundo e a modific-lo; mas cada ao modificadora se converte, por sua vez, num signo e d origem a um novo processo semisico. (ECO, 1979:30).

Eco estabelece em sua anlise uma distino fundamental entre interpretao e semiose, destacando que, sob a primeira, repousam as possibilidades mais concretas de interveno humana, GT2 634

enquanto que, sob a segunda, o poder de determinao fica mais vinculado ao natural do signo. Neste caso, o interpretante, produto objetivo da relao entre objeto e signo, no impe, necessariamente, restries quanto ao sentido correto a ser apreendido. A semiose sempre vai gerar algum interpretante, quer seja ele convergente ou divergente quele presente na relao sgnica, pois,

O signo capaz de determinar o interpretante porque dispe do poder de ger-lo, ou seja, o interpretante uma propriedade objetiva que o signo possui em si mesmo, haja um ato interpretativo particular que o atualize ou no. O interpretante uma criatura do signo que no depende estritamente do modo como uma mente subjetiva, singular, possa vir a compreend-lo. (SANTAELLA, 1995:85).

A interpretao, por seu turno, mais restritiva na direo da compreenso correta do objeto. Sendo assim, exige a delimitao dos rumos a serem tomados na direo da interpretao. Em funo disso, possvel estabelecer critrios definidores da qualidade interpretativa de um dado produto comunicativo. Todavia, no caso da semiose, esse juzo de valores no se coloca de forma to definitiva, visto que o signo, compreendido ou no, tem o poder de gerar alguma semiose possvel, inaugurando, assim, uma cadeia sgnica que ocorre ad infinitum. Derivando essas reflexes para o universo da criao com recursos digitais, possvel compreender que: - A cooperao exigida do receptor em processos interpretativos ficou mais instrumentalizada pelas possibilidades concretas de mobilizao dos sentidos (viso, audio, tato). - O criador possui, hoje, instrumentos expressivos que o possibilitam fornecer ao receptor estoques de prenoes que o permitem agir interpretativamente de maneira mais harmoniosa em relao ao modo como o autor agiu gerativamente. Conforme demarca Eco (1979):

Dissemos que o texto postula a cooperao do leitor como condio prpria de atualizao. Podemos dizer melhor que o texto um produto cujo destino interpretativo deve fazer parte do prprio mecanismo gerativo. Gerar um texto significa executar uma estratgia de que fazem parte previses dos movimentos de outros como, alis, em qualquer estratgia. Na estratgia militar (xadrezstica digamos em toda estratgia de jogo), o estrategista projeta um modelo de adversrio. Se efetuo este movimento- aventurava Napoleo , Wellington deveria reagir assim. Se executo este movimento argumentava Wellington , Napoleo deveria reagir assim. (...) A analogia s pode ser invalidada pelo fato de que, num texto, o autor costumeiramente quer levar o adversrio a vencer, ao invs de perder. (ECO, 1979:39).

Se essa estratgia ocorre de modo evidente no universo do signo lingustico, o que dizer ento do mundo hipermiditico? Acredita-se que nesses contextos os recursos para acossar a sensibilidade do receptor ocorrem de forma mais intensa e integrada. Do nosso ponto de vista, parece que a to propalada abertura das obras contemporneas interveno criativa por parte do receptor esbarra, ainda hoje, no projeto semisico concebido na gnese. Lembrando as palavras do prprio Eco (1997:27), que podem ser estendidas tambm aos contextos de criao e recepo digital, parece que no decorrer das ltimas dcadas os diretos dos intrpretes foram exagerados. Assim o autor ressalta:
Dizer que a interpretao (enquanto caracterstica bsica da semitica) potencialmente ilimitada no significa que a interpretao no tenha objeto e que corra por conta prpria.

GT2 635

Dizer que um texto potencialmente no tem fim no significa que todo ato de interpretao possa ter um final feliz. (ECO, 1997:28).

No caso especfico das relaes que o receptor estabelece no interior da obra, cabe ao mesmo definir se adota uma conduta de exerccio ilimitado da semiose ou se interpreta o texto com base numa perspectiva definida de boa interpretao. Porm, trata-se de um processo altamente subjetivo, no qual o receptor nem sempre tem clareza do curso de suas aes e das variveis envolvidas. Contudo, a cooperao na direo de boa interpretao no deve confundir-se como a atualizao das intenes do autor, mas como atualizao do que se encontrava subjacente ao prprio objeto comunicativo. Assim, Eco (1979) enfatiza que a cooperao textual refere-se articulao de estratgias discursivas empreendidas pelos leitores e autores no texto e no possui relao direta e necessria com as intenes extratextuais empreendidas pelos receptores. Eco (1997) chega mesmo a tipificar a interpretao. Com relao ao processo interpretativo, ele o subdivide em dois tipos de interpretao: s e paranica. A interpretao s a capacidade de reconhecer os limites das estruturas textuais, compreendendo que de uma relao mnima no se pode querer extrair o mximo, sob o risco de provocar deformaes ao pensamento do autor. Por outro lado, a interpretao paranica caracteriza-se pela excessiva ateno dada as pistas deixadas pelo autor. Neste caso, o leitor se perde na indagao dos motivos secretos que o levaram a escolher determinada estrutura em detrimento de outras. A superestimao da importncia das pistas (dados analgicos) deve-se muitas vezes tendncia a se considerar, no processo interpretativo, os elementos mais imediatamente aparentes como significativos. Entretanto, esta atitude de leitura suspeita desloca o olhar do leitor, impedindo-o de interpretar o texto em sua complexidade. Parece, ento, que na relao entre receptor e autor, que ocorre por intermdio do objeto comunicativo, a possibilidade de interpelar a semiose gerada pelo leitor ocorre, objetivamente, atravs e na ampliao da experincia colateral do sujeito. Pois ela que tem o poder de reger as inexplicveis conexes estabelecidas pelos sujeitos na composio dos interpretantes. O contexto digital horizontalizou de certo modo os fluxos de produo e trocas de informaes. Nesse sentido, reduziu as marcas contextuais que permitiam aos mediadores da informao apreendla em contexto. Alm disso, h nos dias de hoje as evidncias dos cenrios semiticos. Tais cenrios referem-se a representaes de uma estrutura genrica ou modelo controlado para a especificao e modelagem de um produto de informao que forma verses ou realizaes concretas. Visam garantir o reconhecimento e a legitimao de documentos no espao e no tempo e contam com uma composio estrutural que revela as representaes e o projeto semisico e funcional no qual se explicita o pacto de leitura proposto. (Stockinger, 1999. p. 146). Nesse contexto, a experincia colateral se refere familiaridade que o interprete e tem com aquilo que o signo denota. GT2 636

Acredita-se que no caso especfico da anlise e descrio de informaes iconogrficas requerido que o analista, conforme ressalta Eco, possua competncia variadamente circunstancial; tenha capacidade de desencadear pressuposies e reprimir idiossincrasias alm de recuperar com mxima aproximao possvel os cdigos do emitente. As referidas categorias permitem compreender de anlise e traduo da informao em contextos de representao informacional. 3 A METODOLOGIA E ANLISE DOS RESULTADOS DO ESTUDO Para o desenvolvimento do estudo proposto, identificou-se um conjunto de doodles produzidos e divulgados na interface do motor de busca Google nos ltimos anos com propsito de compreender como os alunos de Biblioteconomia analisam os assuntos subjacentes aos cones comemorativos em contextos digitais. Para tanto, foram selecionadas duas turmas de graduao que cursavam a disciplina indexao no segundo semestre de 2010 e no primeiro semestre de 2011 no curso de Biblioteconomia em uma universidade pblica brasileira. A amostra foi composta por 65 estudantes que na ocasio cursavam o terceiro perodo da graduao. Foi inserido no experimento um conjunto formado por quinze doodles e solicitado aos sujeitos da pesquisa que identificassem o referente do cone comemorativo e as razes para a identificao encontrada. Cabe ressaltar que, embora a prtica de insero dos doodles comemorativos seja relativamente comum e naturalizada na interface do buscador h mais de 10 anos, causou admirao entre os sujeitos da pesquisa a sua regularidade e diversidade temtica.

GT2 637

Figura 2 Doodles sonorizados e/ou animados para remeter ao universo semitico dos homenageados Les Paul, Marta Graham, Charles Chaplin, Freddie Mercury e o jogo Pac Mans, respectivamente.

Figura 3- Doodle em homenagem ao paisagista Burle Marx

Dentre os quinze doodles selecionados para a amostra, apresentamos nesse trabalho um conjunto composto por onze cones associados aos seus referentes imagticos encontrados na Web. Todavia, na proposta do experimento no foram inseridos os referentes, pois a sua identificao integrava o propsito da anlise. Na composio da amostra incorporaram-se dois cineastas: Akira Kurosawa, Alfred Hitchcock; um msico brasileiro: Tom Jobim; um fenmeno natural: Eclipse; um cientista: Einstein; um escritor: Arthur Conan Doyle, um pop star: Michael Jackson e quatro artistas plsticos: Diego Velsquez, Frida Kahlo, Leonardo da Vinci, Michelangelo. Foi pedido aos sujeitos da pesquisa que descrevessem o contexto semitico do cone a partir de sua experincia colateral em relao imagem apresentada. A atividade teve uma durao de cerca de 90 minutos e despertou bastante discusso sobre os elementos icnogrficos representados. As anlises de assunto dos cones foram representadas por frases ou palavras-chave que remetiam ao contexto semitico da imagem do ponto de vista do analista.

GT2 638

REFERNCIA

DOODLE

GT2 639

REFERNCIA

DOODLE

Figura 4 Imagens selecionadas para o experimento

GT2 640

Tabela 1 - Anlise de assunto de cones Google

Os doodles que geraram o maior ndice de reconhecimento do referente da imagem foram: Leonardo da Vinci (13%), Michael Jackson (13%), e o fenmeno natural do eclipse (11%). O nico cone com referncias brasileiras (Tom Jobim) teve um reconhecimento de 11%. Os cones que obtiveram os mais baixos ndices de reconhecimento do referente foram: Akira Kurosawa (26%) e Diego Velsquez (26%). No quadro abaixo, sistematizamos alguns elementos das representaes seguidas pelos termos atravs dos quais os analistas assinalaram o universo semitico dos cones propostos para anlise. Adotaram-se as categorias de interpretao s e paranica de Eco (1997) para identificar os elementos que compuseram as anlises realizadas. As palavras grifadas em vermelho assinalam elementos do contexto semitico do referente dos cones, mas que em virtude da composio proposta pelo analista inserem discrepncias na representao informacional. Notou-se forte deslizamento de referncias semiticas entre o evento comemorativo e os elementos que compem a produo criativa do homenageado como, por exemplo: Conan Doyle e Sherlock Holmes, Einstein e Fsica, Leonardo da Vinci e Mona Lisa, Hitchcock e Pssaros (filme), Michael Jackson e moonwalk (dana), Michelangelo e Davi. INTERPRETAO S AKIRA KUROSAWA Imagem do homenageado, cenrio, cmera, cinema, diretor de cinema famoso. INTERPRETAO PARANICA Inventor da cmera, importante japons, famoso de Hollywood, aniversrio do cinema, fotografia.

GT2 641

ALFRED HITCHCOCK

Suspense, cinema, foto, Psicose (filme), pssaros (filme). Indcios, investigao, Holmes, literatura, romance policial, mistrio. Obra, artista, roupas de poca. Sol coberto, lua, sol. Cincia, teoria da relatividade, energia, fsica, cientista. Imagem do homenageado, obra Obra, invenes, imagens renascentistas, homem, Mona Lisa. Sapato, meias, dana. Obra, escultura, Davi, arte italiana, Renascimento. Piano, chapu, Rio de Janeiro, culos, bossa nova. Aniversrio da Grcia, Dia do escultor, Dia da filosofia, dia do renascimento. Frias Dia do fsico, centenrio da fsica, dia do cientista, data importante. Tarsila do Amaral, primavera, dia da indiana, Dia do espio, dia do detetive. Marc Chagall, famlia real brasileira, Revoluo francesa, teatro, trs mosqueteiros, burguesia.

ARTHUR CONAN DOYLE

DIEGO VELSQUEZ ECLIPSE EINSTEIN

FRIDA KAHLO

LEONARDO DA VINCI MICHAEL JACKSON MICHELANGELO

TOM JOBIM

Tabela 2 - Analise das representaes dos sujeitos da amostra

Percebeu-se no contexto analisado que, conforme assinala Pinto (2009: p. 48),

A imagem funciona duplamente como ndice de seu objeto e ndice de seu signo, isto , ela se refere quilo que ela gera e quilo que a gerou de forma simultnea. Esse ethos imagtico ndice de um conjunto de dispositivos argumentos a que a narrativa dos seres vivos obedece.

Acredita-se que a dificuldade na anlise e representao informaes iconogrficas reside exatamente na ambivalncia da imagem nesse contexto, no qual as diferentes tcnicas de congelamento da significao para fins de representao so, por vezes suplantada pela forte carga semitica oriunda da experincia colateral do analista.

GT2 642

4 CONSIDERAES FINAIS O experimento realizado nos permitiu compreender a dinmica e os processos semisicos que presidem a anlise de assunto de iconografias e a ampliao de sua complexidade em contextos no qual a imagem est associada a elementos textuais e que exigem um olhar ampliado para articulao da expresso do discurso em seus elementos constitutivos. Foi possvel tambm constatar a necessidade de ampliao de experincias de formao acadmica voltadas anlise e representao da informao iconogrfica em virtude de sua intensa adoo em ambientes digitais em rede. Os fundamentos tericos de base semitica se mostraram essenciais para a explicao do fenmeno de representao informacional em contexto e evidenciou o carter subjetivo do gesto de representao da informao. Assim, percebeu-se a necessidade de valorizar e ampliar as experincias estticas e scio-culturais no processo de formao como elementos centrais para o alargamento da experincia colateral do analista da informao em contexto. Acredita-se que em ambientes digitais no mais suficiente reter as regras e normas de representao e mediao da informao. Assim, considerando-se o carter essencialmente intelectual da atividade de representao da informao, preciso ampliar o repertrio semitico do analista da informao desde a sua formao acadmica. Sobretudo, porque o texto, conforme salienta Eco (1978), um mecanismo econmico que depende de um movimento cooperativo, consciente e ativo por parte do leitor. Reconhecer os repertrios semiticos e suas funes na composio do discurso pode representar um diferencial na formao do indexador requerido no contexto de economia da ateno em rede. Essa nova dinmica informacional realiza-se pela interposio de infinitas manifestaes imagticas compostas por uma vasta iconografia de sntese e/ou historicamente constitudas e reconhecidas. Abstract: This study aimed to understand the process of subject analyses of the iconographies among students of the discipline of indexing practices in library science course in a Brazilian public university. From the identification, analysis and representation of commemorative icons presented on the interface of search Google search engine, it was analyzed the representation gesture of iconographic information. It was adopted as reference the concepts of sign, semiosis, icon, collateral experience, interpretation sane and paranoid. The study highlighted the importance of the extension of aesthetic experience and socio-cultural in the academic formation as the basis to knowledge organization and information retrieval in digital environments. Keywords: subject analyses, iconographic information, semiotics

5 REFERNCIAS ECO, Umberto. O leitormodelo. In: ___. Lector in fabula. So Paulo: Perspectiva, 1979. p. 35-49. GT2 643

ECO, Umberto. Entre autor e texto. In: ______. Interpretao e superinterpretao. So Paulo: Martins Fontes, 1997. p.79 -104. FUJITA, Maringela Spotti Lopes. A identificao de conceitos no processo de anlise de assunto para indexao. Revista Digital de Biblioteconomia e Cincia da Informao, Campinas, v.1, n.1, p. 60-90, jul./dez.2003. FOSKET, A.C. A abordagem temtica da informao. So Paulo: polgono, 1973. GOOGLE. Holiday and events. Disponvel em: http://www.google.com/logos/ Acesso em 05. ago. 2011.
GRIBOULLAGE. Disponvel em: http://www.gribouillage.net/ Acesso em 05. ago. 2011.

MOURA, Maria Aparecida. Semitica e mediaes digitais: criao e recepo de hipermdias. Orientador: Arlindo Machado. 2002. 208f. Tese (Doutorado em Comunicao e Semitica) Pontifcia Universidade Catlica de So Paulo, So Paulo, 2002. MOURA, Maria Aparecida, SILVA, Ana Paula, AMORIM, Valria Ramos de. A concepo e o uso das linguagens de indexao face s contribuies da semitica e da semiologia. Revista informao e sociedade. v. 12 n.1. 2002. Disponvel em: http://www.informacaoesociedade.ufpb.br. Acesso em: 12. mar. 2010. MOURA, Maria Aparecida. Informao, ferramentas ontolgicas e redes sociais AD HOC: a interoperabilidade na construo de tesauros e ontologias. Revista informao e sociedade, v. 19, n.1, p. 59-73, 2009. NAVES, Madalena Martins Lopes, KURAMOTO, Hlio (orgs). princpios e tendncias. Braslia: Briquet de Lemos, 2006. PINTO, Julio. 1, 2, 3 da Semitica. Belo Horizonte: UFMG. 1995. PINTO, Julio. Um ethos imagtico? Revista Galxia, So Paulo, n. 17, p. 41-48, jun. 2009. SANTAELLA, Lcia, NTH, Winfried. Imagem: cognio, semitica, mdia. So Paulo: Iluminuras, 1998. STOCKINGER, P. Les nouveaux produits d information: conception et smiotique du document. Paris: Hermes,1999. Organizao da informao:

PEIRCE, C. S. Collected papers: verso eletrnica. Bloomington: Past Masters, 1995.

GT2 644

COMUNICAO ORAL

PROTTIPO DE UM SISTEMA DE SUBMISSO DE ARTIGO CIENTFICO PARA PERIDICO ELETRNICO SEMNTICO EM CINCIAS BIOMDICAS
Leonardo Cruz da Costa Resumo: Problema: publicaes eletrnicas, apesar dos avanos das TIs, so ainda apoiadas no modelo impresso. O formato textual dificulta que programas possam ser usados para o processamento semntico do contedo do artigo cientfico. Objetivos: descreve a implementao de um prottipo de um sistema de submisso de artigo cientfico para peridico eletrnico, em cincias biomdicas, capaz de extrair o conhecimento do texto do artigo e represent-lo em formato inteligvel por programas, tornado possvel, futuramente, a recuperao semntica. Fundamentao terico metodolgica: o prottipo a implementao parcial da proposta de OCCA (MARCONDES, 2005) um modelo para representar os elementos semnticos que constituem o conhecimento contido em um artigo cientfico, baseado em elementos do Mtodo Cientfico (hipottico-dedutivo). O objetivo desse modelo servir de base para publicaes semnticas. Resultados: resultados dos testes com o prottipo envolvendo pesquisadores-autores so relatados. Palavras-chave: publicaes eletrnicas, representao do conhecimento, comunicao cientfica. 1 INTRODUO Segundo Shera e Cleveland (1977), aps a Segunda Guerra, uma enorme quantidade de informaes foram produzidas devido ao aumento do nmero de cientistas, de pesquisas e do desenvolvimento de tecnologia, gerando expresses como, exploso bibliogrfica ou caos documentrio (BRADFORD, 1961). Esse fenmeno conduziu a uma grande preocupao quanto ao registro, acesso, recuperao e divulgao da informao e de documentos. Uso das tecnologias de informao, no sentido de intervir neste processo, procurando aperfeioar o acesso aos pesquisadores informao relevante, no novo. As We May Think, texto publicado em 1945 por Vannevar Bush, por exemplo, argumentava que o esforo cientfico deveria ser concentrado em deixar o conhecimento humano mais acessvel e propunha uma mquina denominada Memex. Porm, se, antes, para a obteno de informaes, era necessrio se dirigir a uma biblioteca, atualmente tais informes podem estar armazenados em um pen drive. Contudo, o conhecimento continua sendo codificado em um formato textual, para ser lido por pessoas, e no em um formato legvel por programas, permitindo que inferncias, decises e argumentaes automticas pudessem ser realizadas sobre o contedo do texto. Vislumbra-se, ento, investir na web semntica, GT2 645

como forma de contribuir positivamente na recuperao de documento relevantes para cincia. A web semntica uma extenso da web atual, onde a informao possui um significado bem definido (BERNERS-LEE, 2001). Os documentos na web passam a ser representados atravs de metadados semnticos que descrevem o que significa a informao contida no documento. O significado expresso de acordo com um conjunto de conceitos e relaes de um domnio especfico e expresso atravs de uma ontologia. A ontologia representa um sistema conceitual que normaliza o discurso em um dado domnio. Assim, as descries sobre o documento esto, portanto, de acordo com um sistema conceitual, estabelecendo um significado claro e no ambguo para aquilo que se descreve. Podemos proceder a uma analogia das descries baseadas em uma ontologia com a indexao por meio de um vocabulrio controlado. Ambas apoiam a recuperao de documentos, porm as descries com base em ontologias passam a contar com recursos semnticos que ultrapassam os limites das palavras chaves e dos operadores lgicos comumente usados nas mquinas de buscas. Passa, em consequncia, a ser possvel a construo de agentes de software aptos a compreender e a processar de forma inteligente (inferir) o contedo descrito pelo metadados semnticos. Desta maneira, podemos entender que as metas da web semntica mostram-se mais ambiciosas do que simplesmente permitir indexar melhor a informao. O documento digital, dentro do contexto da web semntica, processado por agentes inteligentes pode-se constituir em nova e poderosa ferramenta cognitiva. Esse cenrio do documento cientfico digital - com seu contedo representado em formato legvel por programas - trar novas perspectivas para a validao, registro, recuperao, disseminao e aprendizagem de novos conhecimentos: a publicao de artigos cientficos na web, com essa caracterstica, pode vir a ser uma ferramenta cognitiva onde suas potencialidades esto longe de serem avaliadas (MARCONDES, 2005). A publicao de resultados, na web mesmo apoiada em uma infraestrutura como a que projetada para a web semntica, torna-se um desafio. Entretanto, definir como a comunidade cientfica publicar os resultados em um formato apropriado, para que a sua recuperao ultrapasse os limites impostos pelo modelo impresso, configura um problema ainda sem soluo. A construo de um prottipo de um sistema de submisso, objetivo desse trabalho, encontrase no mbito desse contexto, permitindo criar condies para a descrio da semntica, e a futura recuperao e validao do novo conhecimento e de seu processamento por agentes de software, apoiando, de forma muito mais significativa, o trabalho do pesquisador. As tarefas a serem realizadas pelos autores, no sistema, so similares quelas que eles j desempenham quando do envio de seu trabalho, para publicao, em um peridico cientfico, repositrios ou bibliotecas digitais.

GT2 646

2 REFENCIAL TERICO Os artigos cientficos eletrnicos so para serem lidos, discutidos, debatidos e validados por pessoas. Porm, so meras cpias digitais de sua verso em papel, eles no incorporam as potencialidades previstas na web semntica (MARCONDES, 2005), uma extenso da web atual, onde a informao possui um significado bem definido permitindo melhor interao entre os computadores e as pessoas (BERNERS-LEE, 2001); em outras palavras, os metadados no incorporam descries que permitam um processamento mais inteligente dos documentos pelos sistemas de recuperao de informao. Segundo Passin (2004) a literatura sobre web semntica apresenta diversas e diferentes vises, entre elas, a de que deve permitir que os dados disponveis e ligados na internet possam ser usados por mquinas no s para propsitos de exibio, mas para automatizao, integrao e uso por vrias aplicaes. E ainda, ela deve ter como funo, a criao de uma web que possibilite o uso de agentes inteligentes para que se possa recuperar e manipular a informao de maneira automtica e precisa utilizando o contexto no qual ela est inserida ao invs unicamente de palavras-chave. O princpio bsico da web semntica tornar possvel expressar e representar a semntica dos dados atravs de outros esquemas descritivos, objetivando a preciso dos significados, ou seja: um esquema que descreva quais os conceitos existentes em certo domnio e como eles se relacionam. Como um modelo conceitual, que serve como uma representao abstrata dos elementos de informao. Esse esquema representado numa ontologia. A ontologia similar a um dicionrio, taxonomia ou glossrio, porm com estrutura e formalismo que possibilita computadores processar seu contedo. Ela consiste de um conjunto de conceitos, axiomas e relaes, e representa uma rea de conhecimento. Diferente da taxonomia ou glossrio permite estabelecer relaes arbitrrias entre conceitos, propriedades lgicas e semnticas de relaes tais como: transitividade, simetria e inferncia lgica sobre as relaes. Do ponto de vista da informao a ser distribuda a respeito de um documento, metadados podem ser utilizados de maneira melhorar descries do contedo do mesmo (PASQUINELLI, 1997) sem a limitao da descrio como um produto da catalogao. Assim, neste ponto, cabe uma questo: poderiam os campos dos metadados, responsveis pela representao do contedo, incorporar relaes, permitindo ligaes entre eles e atribuindo um maior sentido descrio? Na busca pela resposta para a questo acima Marcondes et al. (2005) prope uma ontologia (OCCA) como um modelo para representar os elementos semnticos que constituem o conhecimento contido em um artigo cientfico, baseado em elementos do Mtodo Cientfico (mtodo hipotticodedutivo) e na forma como eles aparecem em artigos cientficos. O objetivo desse modelo servir de base para publicaes semnticas, uma nova forma de publicar artigos cientficos. A publicao semntica fornece uma maneira dos computadores compreenderem a estrutura e at mesmo o significado das informaes publicadas, tornando a pesquisa de informaes ea integrao de dadosmais eficiente. Desta forma, os metadados que descrevem o contedo do artigo so representados como uma instncia GT2 647

de OCCA, de modo a tornar seu contedo processvel por programas. Por meio de OCCA possvel representar quatro diferentes tipos de artigos (Tericos, Experimentais-exploratrios, Experimentais-indutivo e Experimentais-dedutivos), cada um baseia-se em diferentes raciocnios, estratgias de argumentao e pressupostos observados em diferentes tipos de artigo cientfico (MARCONDES et al., 2009). A proposta de OCCA se baseia na concepo de que o conhecimento cientfico consiste em propor e provar a existncia de relaes entre fenmenos e relaes entre fenmenos e a suas caractersticas (BUNGE, 1998), (MILLER, 1947), at ento desconhecidas. OCCA constitudo de elementos semnticos como a questo de pesquisa, a hiptese e a concluso. Enquanto a questo de pesquisa se caracteriza como uma pergunta de carter geral e no como relao, as hipteses, ao propor uma relao entre fenmenos, tm importncia decisiva quanto manifestao do conhecimento novo em cincia. Uma RELAO, para OCCA, tem a forma de um antecedente, uma relao e um consequente, como uma 3-tupla (antecedente, relao, consequente). A relao pode ser um tipo de relao especfica como causa, afeta, indica, ou um tipo de relao tem_caracterstica que define uma caracterstica do antecedente, enquanto o antecedente e o consequente referem-se aos fenmenos estudados pelo autor. Por conveno utiliza-se a palavra relao em maiscula para referenciar a 3-tupla e em minscula quando se referir relao especfica contida na 3-tupla. Outro aspecto apontado por OCCA que a RELAO pode, tambm, ser mapeada para ontologias pblicas, estabelecendo uma ligao entre o artigo e o conhecimento pblico disponvel e validado. A falta de mapeamento entre os elementos da RELAO e a ontologia pode indicar evidncias de novas descobertas por causa da falta de representao de tais elementos na ontologia (MALHEIROS, 2010). 3 O PROTTIPO DE UM PROCESSO DE SUBMISSO Como o processo de submisso tem por objetivo que os prprios autores, no momento de submeterem seus trabalhos, forneam informaes sobre os resultados de sua pesquisa, assume-se que o autor o mais capaz de identificar os pontos importantes do seu trabalho e a sua principal contribuio. Para apoiar o autor na tarefa de expressar por meio de uma RELAO sua principal contribuio, optou-se por direcionar o foco de ateno para a concluso do artigo tornando-a o elemento chave para o processo de submisso. Enquanto as hipteses so declaraes sobre caractersticas de objetos, relaes, associaes e, at mesmo, declaraes negativas (hiptese nula), as concluses so as que expressam as afirmaes resultantes do trabalho; alm disso, elas comumente fazem parte dos resumos estruturados e os autores, possivelmente, esto mais acostumados a informar do que as hipteses. Assim, assume-se que a principal afirmao cientfica contida no artigo cientfico se manifesta atravs da concluso do autor. GT2 648

Ao propor aqui um processo de submisso, implementado atravs de um prottipo de um sistema web, necessrio criar condies para que o autor atravs de um dilogo (com o sistema) consiga informar de maneira adequada a RELAO que melhor representa sua principal contribuio, isto , a concluso do trabalho sob a forma de uma RELAO. Porm, espera-se um nvel de dificuldade elevado na construo dessa interface com o usurio, isso explicado pelo fato de se exigir do autor o domnio de vrios conhecimentos que impactam diretamente na usabilidade do sistema. Expressar a RELAO possui alta exigncia cognitiva do autor, pois vrios fatores dependem de sua compreenso, como por exemplo: O que o antecedente, consequente e a prpria relao? O que uma RELAO? Como mapear essa RELAO com uma ontologia pblica? O que uma ontologia pblica? Todos esses aspectos devem ser compreendidos, identificados e indicados em um momento crtico que o envio da verso final do artigo para um peridico. Na tentativa de aliviar a presso desses fatores sobre os autores, toma-se como princpio, que o sistema de submisso contar com uma tarefa de extrao da RELAO de forma automtica. Sua funo propor (sugerir) a RELAO ao autor, que poder aceit-la ou no. Acredita-se que a apresentao de uma RELAO ao autor, mesmo que imprecisa, facilite a conduo do dilogo, criando meios de diminuir as exigncias cognitivas e facilitando a compreenso daquilo que o sistema necessita para registrar. A tarefa de extrao da RELAO apoiada em tcnicas de processamento de linguagem natural (PLN) como as implementadas pelo programa MMTx - http://mmtx.nlm.nih.gov/, programa esse que identifica os termos controlados do UMLS Unified Medical Language System. A escolha do UMLS como suporte ao trabalho est apoiada no fato dele possuir uma infraestrutura pronta e disponvel livremente para o processamento de texto, alm disso, conhecimento organizado como uma rede semntica, em que termos esto estruturados em grandes categorias como organismos, estruturas anatmicas, funes biolgicas e qumicas, eventos, objetos fsicos e descritos em um metatesauro. Outro aspecto que apoia essa escolha que o UMLS possui um conjunto de relaes, que coincide com a proposta de representao do conhecimento de OCCA, sendo, portanto, de especial interesse para esta pesquisa. O foco em artigos cientficos da rea biomdica motivado pelo fato de que os mesmos seguem um rgido padro formal em seus textos. Esse padro comumente chamado de IMRAD (Introduction, Method, Results Abstract and Discussion), isso torna mais fcil o processamento automtico do texto por contar com sees bem definidas e vocabulrios mdicos consagrados. Assim, a tarefa de extrao da RELAO desenvolvida como parte da estratgia do processo de submisso de artigos. A RELAO obtida automaticamente, por meio do processamento do texto e servir para iniciar o dilogo com o autor para que ele possa interagir com o sistema e representar a concluso do trabalho como uma RELAO. O processamento do texto, para a extrao da RELAO, apoia-se em uma abordagem hbrida GT2 649

que utiliza tanto tcnicas oriundas do PLN e tcnicas estatsticas. As tcnicas do PLN utilizadas se desenvolvem de acordo com a perspectiva da terica da gramtica gerativa de Chomsky (1957) e as estatsticas sob a perspectiva da representao do texto atravs de seus termos, que so valorados atravs de sua frequncia e peso, mais especificamente sob a inspirao do trabalho de Edmundson (1969) que prope modificaes no mtodo de Luhn (1958), ao estabelecer que as palavras, alm de sua frequncia, passassem a ter pesos de acordo com o local e caractersticas dentro do texto. 3.1 O Processo de submisso Uma viso geral do processo de submisso representada por meio da figura 1. A seguir so descritas cada atividade que compe o processo de submisso. Atividade 1: envio do artigo cientfico (upload do artigo) A tarefa de envio do arquivo assemelha-se a outras j conhecidas em sistema computacionais, como anexar um arquivo em uma mensagem eletrnica. Atividade 2: obteno de dados gerais do artigo Essa tarefa tem por objetivo obter informaes do autor, com relao ao contexto do trabalho, a importncia do estudo e como o artigo pode ser classificado (experimental, terico, etc.).

Figura 1- Viso geral processo de submisso

GT2 650

Atividade 3: extrao do objetivo A extrao do objetivo baseia-se na identificao de frases indicativas (por ex. The aim of our study is...) em pontos especficos do texto, por causa de sua alta concentrao nessas partes (abstract e introduo) (SWALES, 1990). A partir de uma anlise realizada e a identificao de vrios tipos de frases indicativas (COSTA, 2008) foi possvel elaborar um modelo de regras para a extrao automtica. O objetivo do autor posteriormente utilizado na tarefa de extrao da RELAO. Atividade 4: validao do objetivo O conjunto de frases selecionadas como indicativas do objetivo apresentado ao autor para que ele tome a deciso e informe qual representa melhor o objetivo do seu trabalho, j que o texto pode conter vrias frases indicando o objetivo (COSTA, 2008). Atividade 5: descrio da concluso Cabe ao autor descrever a principal concluso do trabalho. O texto da concluso ser processado com o intuito de sintetiz-lo por meio de uma RELAO. Atividade 6: extrao automtica da RELAO Essa atividade tem por objetivo transformar a concluso de sua forma textual para RELAO (antecedente, relao, consequente). Com este fim, duas hipteses so estabelecidas: 1) As relaes so expressas por tpicos marcadores lxicos, restringindo-se, aos verbos, verbos substantivados (nominalizao) e termos ou conceitos mdicos especficos; e 2) As relaes interessantes acontecero entre as macroproposies mais relevantes. Dois passos so empregados: a) Identificao das Macroproposies Relevantes e b) Identificao da Relao Propriamente Dita. Subatividade 6.1: identificao das macroproposies relevantes Tem por finalidade limitar o espao de pesquisa na busca da relao, restringindo a quantidade de termos a serem verificados. A identificao das macroproposies se baseia em trs etapas: prprocessamento da frase da concluso, determinao dos sintagmas da frase e o clculo da importncia do sintagma. - pr-processamento da frase de concluso A concluso submetida a um pr-processamento automtico que tem por objetivo eliminar apostos, vrgulas e textos entre parnteses. - determinao dos sintagmas da frase Aps o pr-processamento realizada a identificao dos sintagmas que formam a orao. Utiliza-se o programa MMTx, que alm de fornecer os sintagmas, apresenta, tambm, as unidades em sua forma condensada, isto , o programa retira os artigos, preposies que iniciam os sintagmas. GT2 651

- clculo da importncia do sintagma pesagem do sintagma A estratgia usada identificar os dois principais sintagmas da frase de concluso, usando-os como limites (inferior e superior) (figura 2) e estabelecendo um intervalo para a busca da relao. Os sintagmas mais importantes so aqueles que possuem os termos mais importantes. A atribuio da relevncia baseada na pontuao obtida por meio de uma funo linear, utilizando a frequncia dos termos que compe a concluso e os pesos estabelecidos de acordo com cada local no artigo. Se o termo da orao da concluso ocorre, tambm, no objetivo - obtido na atividade de extrao do objetivo - no ttulo e nas palavras-chave, a frequncia multiplicada por pesos atribuindo uma maior importncia.

Figura 2 - Identificando os sintagmas mais importantes

Subatividade 6.2: identificao da relao propriamente dita A identificao da relao se baseia na hiptese de que elas so expressas por tpicos marcadores lxicos, aqui restritos, aos verbos, aos verbos substantivados (nominalizao) e aos termos ou conceitos mdicos especficos. No exemplo anterior, entre congenital toxoplasmosis e pregnancy (os limites) ocorrem dois sintagmas, um nominal (the occurrence) e outro verbal (prevent) tomado imediatamente como candidato relao (figura 3).

Figura 3 - Um candidato a RELAO

O nominal (the occurrence) submetido a um processo de verificao de nominalizao. Esta verificao toma como base uma consulta ao Wordnet, obtendo as possveis nominalizao do termo. Caso o substantivo esteja relacionado diretamente a um verbo, esse passa a ser candidato relao. Para identificar os conceitos e termos mdicos utiliza-se o programa MMTx. Na frase a seguir o conceito antibiotics definido no vocabulrio MeSH como substances produced by microorganisms that can inhibit or suppress the growth of other microorganism.A ideia bsica utilizar os verbos (produce, inhibit, suppress), contidos na definio do conceito como marcadores (candidato) de uma possvel relao (figura 4).

GT2 652

Figura 4 - Identificando um conceito mdico associado aos verbos produce, inhibit, suppress

Atividade 7: validao da RELAO Essa atividade tem por finalidade a confirmao, ou no, da RELAO produzida automaticamente. O autor exposto s informaes geradas (antecedente, relao, consequente) sendo possvel a alterao de todos os elementos se necessrio (figura 5).

Figura 5 - Validao da RELAO

Atividade 8: mapeamento da RELAO para a ontologia pblica A funo do mapeamento prover um sentido (semntico) para os elementos da RELAO por meio de ligaes deles com uma ontologia pblica, neste caso o UMLS. Assim, essa atividade objetiva identificar se os elementos que compem a RELAO podem ser mapeados ou no para uma base de conhecimento pblico, isto , se cada elemento j est conceitualmente descrito na ontologia. Para o mapeamento do antecedente e do consequente utilizado o programa MMTx que relaciona termos a conceitos do metatesauro do UMLS e para tipos semnticos da rede semntica. A tabela 1 apresenta os seguintes mapeamentos para o antecedente systematic serological screening during pregnancy. Tabela 1 - Candidatos Para Mapeamento do Antecedente

GT2 653

Antecedente systematic serological screening during pregnancy

Cd. Conceito C0205473 C0220909 C0220908 C1409616 C0032961

Nome Serologic Aspects of disease screening Screening procedure Special screening finding Pregnancy

Tipo Semntico Functional Concept Functional Concept Health Care Activity Finding Organism Function

Embora o MMTx seja um instrumento valiosssimo, ele no possui suporte ao mapeamento de relaes, no sentido desejado aqui. Para buscar esse mapeamento foi criado um dicionrio que relaciona as 54 relaes do UMLS a um conjunto de verbos. A construo do dicionrio foi guiada pela anlise manual da definio de cada uma das relaes do UMLS, utilizando-se de dois critrios: 1) Interpretao do texto da definio de acordo com o nome atribudo a relao; e 2) Observao dos verbos utilizados na definio. Para cada verbo contido na definio foram obtidos verbos sinnimos, atravs de consultas ao Wordnet (um dicionrio semntico para a lngua inglesa, desenvolvido na Universidade de Princeton), que mantinham o mesmo sentido obtido pela interpretao da definio. Os verbos sinnimos, juntamente com os verbos contidos na definio, passam a compor o dicionrio e so associados relao. Uma vez construdo o dicionrio, a tarefa de mapeamento da relao passa a ser uma simples consulta ao dicionrio, que busca identificar as relaes do UMLS s quais o verbo est associado. Atividade 9: validao dos mapeamentos

GT2 654

Figura 6 - Validando os mapeamentos para a UMLS

A etapa anterior descreveu a gerao de possveis mapeamentos da RELAO para conceitos do UMLS. Contudo, na busca de tais mapeamentos vrios conceitos, vrios tipos semnticos (como apresentado na tabela 1) e relaes podem ser gerados. O autor necessita escolher, ou no, os mapeamentos mais adequados, para estabelecer o sentido desejado para a RELAO. A etapa de validao dos mapeamentos se d por meio da interface do sistema de submisso no qual o usurio exposto a esse conjunto de informao e opta, atribuindo o sentido desejado (figura 6). Atividade 10: gerao da instncia da ontologia OCCA Na ltima atividade os elementos da RELAO so representados como instncias de OCCA e um arquivo no formato XML gerado (figura 7).
<Relation> <Antecedent> systematic serological screening programs during pregnancy</Ante