Você está na página 1de 20
Linguistica textual e elaboragao de informagées documentarias: Algumas reflexdes! Nair Yumiko Kobashi 1 Introdugdo Um sistema de recuperagao de informagio, de fato uma forma de expressio da meméria coletiva, é construfdo para responder, de maneira duradoura, a necessidades especificas de informagao. A selecio dos objetos informacionais para integrar tais dispositivos deve ser sistemdtica, fandamentada simultanea- mente no conhecimento dos organismos que os produzem e nos interesses dos usuarios. O tratamento, por sua vez, deve ser regido por parimetros claros, sistematizados em uma politica explicita e em procedimentos metédicos. A difusio, finalmente, deve pautar-se por um principio basico: os produtos servigos devem ser planejados e executados de modo a responder as especifi- cidades da demanda. Assim, cada etapa da cadeia documentiria é refrataria 4 improvisagio. Infere-se, a partir dai, que o tratamento documentirio adequado dos objetos informacionais, aqui considerados de forma ampla como quaisquer tipos de textos, ¢ findamental para constituir sistemas de armazenamento e recuperagio de informagio. Portanto, entre a produ¢io de informacio docu- mentiria e sua recuperagio existe uma relacéo de pressuposicao nao recfproca: a recupera¢io nfo é factivel sem uma agio anterior de tratamento. No tratamento da informagio deve-se estabelecer distin¢o entre dois aspectos inerentes aos objetos informacionais: seu suporte material € seu 1_Este texto & uma sintese da tese: A claborado de informagdes docimentérias, em busca de uma metodologia, defendida em 1994. Algumas idéias novas, surgidas ap6s a defesa, foram aqui incorporadas. 2 Professora doutora livre-docente no curso de Biblioteconomia e Documentacio da Universidade de Sio Paulo (USP/SP). E-mail: . contefido. Cada aspecto supde processos de tratamento diferenciados. Ser4 realizada, a seguir, uma breve caracterizacio dos dois aspectos do tratamento, enfatizando que este texto limita-se 4 abordagem do tratamento de contetido, © tratamento do suporte material — a catalogagio — visa descrever, de forma normalizada, os aspectos fisicos do documento (nome da obra e do autor, local ¢ ano de publicacio, editora, entre outros). No contexto da difusio cletrOnica de informages, denominam-se metadados as estruturas de organi- zacio desses tipos de dados. © tatamento do contetido, por sua vez, visa elaborar representacdes condensadas daquilo que é dito em um dado texto. As representagdes docu mentdrias tipicas so © resumo ¢ o indice. A primeira ~ 9 resumo ~ responde pela funcao de condensagao da informacio, individualizando os textos, ¢ a segunda — a indexagio ~ generaliza 0 contetido, de modo a integrar os textos em classes de assuntos 2 Andlise documentaria: teoria e metodologia de producdo de informacao documentaria A anilise documentiria é no interior da Ciéncia da Informagio, a 4rea que tesponde pelo tratamento do contetido de textos; é 0 “conjunto de proce- dimentos utilizados para exprimir 0 contetido dos documentos cientificos sob formas destinadas a facilitar a sua localiza¢o ou consulta” (GaRDmy, 1987, P. 48-49). Essas operagSes ndo sao neutras porque as coergdes imanentes aos sistemas documentirios afetam cada operagio realizada, desde aquelas rela~ cionadas 4 selegdo de documentos até as que se referem aos produtos a serem gerados (Konasn, 1994). Desse modo, a anilise documentiria nfo se reduz 4 proposicio de um Conjunto de regras perenes, utilizaveis em todas as circunstincias, Para avangar teoricamente ¢ praticamente, ela critica de forma permanente scus pressupos- tos, procedimentos ¢ instrumentos; a0 mesmo tempo, com base na reflexio e no trabalho empirico, elabora novas hipéteses de trabalho que possam con- tribuir para aperfeigoar processos e sistemas. A anilise documentiria apresenta, Portanto, trés aspectos indissocifveis, pertencentes a diferentes esferas: * aesfera teérica, na qual se determina o proprio objeto da anilise docu- mentiria, suas fangdes, seus métodos e procedimentos metodelogicos; * a esfera da producio, em que sio engendradas as regras de geracao das diversas modalidades de informagio documentiria; * a esfera pragmatica, na qual se identifica as condig&es de aderéncia entre usuarios e sistema documentirio, Discurso ¢ texto: multipicidade de sentidos na cléncia da informagGo Do ponto de vista metodolégico, a andlise documentiria define-se como uma opera¢io com textos. Primeiramente, eles sio desestruturados, isto € anali- sados ¢ sintetizados, operacao findada na distingo entre informagio essencial ¢ acess6ria. A selegio € uma tarefa complexa, na medida em que implica atribuir valor is informages do texto, Em seguida, as informacdes selecionadas sio estru- turadas, isto é submetidas a processos de combinagio, de modo a converté-los em novos textos, ditos resumos, ou em simbolos de uma linguagem especifica, dita linguagem documentiria. Em ambos os casos, os produtos sio obtides por meio de operacdes sucessivas de anilise e sintese, devendo os produtos resuiltantes manter, necessariamente, relagdes de semelhanga contigitidade com o objeto submetido a anillise. No caso do resumo, tais relagdes poderio ser garantidas caso sejam man- tidos os valores referenciais € a estrutura do texto original (Lz Roux, 1990) Uma cadeia de termos de indexagio &, por outro lado, uma representagio na qual subsiste apenas 0 t6pico (assunto) do texto, representado por meio da palavra, de um sintagma ou uma unidade polilexical mais complexa. Nesse s0, 0 produto da analise € uma represeintagio do texto formulada em uma linguagem que no se confunde com a linguagem do texto, mesmo que os termos tenham aparentemente a mesma forma” (GaRDIN, 1987, p. 49)- A informagio documentiria, assim produzida, tem, por defini¢io, fiun— cdo de relevancia. Ela deve, de um lado, promover a identificagio de itens informacionais que respondam de modo pertinente a determinada questio do usuario e, de outro, embasar a tomada de decisio sobre a consulta ou nao do documento original. Para cumprir adequadamente tais fungdes, a informagio documentiria deve ser elaborada por meio de metodologias que garantam a equivaléncia de sentido entre 0 texto-fonte e sua representacio. E esse o objetivo central da andlise documentiria, que tem procurado res~ ponder as tarefas conceituais, metodolégicas pragmiticas, aqui enunciadas, pela apropriacio e adaptagio de conceitos e métodos das Areas que, como ela, lidam com a linguagem e 0s textos. 2.1 Caracterizagao do objeto e das operagdes documentarias A claboracdo de informacdes documentérias compreende um conjunto de ‘operacdes esquematiziveis em trés fases: a) ler um texto; b) selecionar dele © contetido informacional considerado pertinente para usos determinados; e, Gnalmente, c) representi-lo, ou seja, dar forma documentiria as informagdes, “selecionadas. : No senso comum,a elaboragdo de resumos é vista como mero ato técnico de reduzir textos; a indexacdo, como 0 ato de estabelecer equivaléncias entre No terreno da informag&o e do texto 49 palavras do texto € palavras de uma linguagem documentiria. No entanto, para serem eficazes, essas operacdes requerem uma visio clara dos parametros especificos no interior dos quais se instaura a situagio comunicativa, sendo 0s mais importantes os objetivos institucionais, os tipos de usuarios e suas demandas informacionais. Os parimetros situacionais sio a base sobre a qual so formuladas as politicas que orientam o conjunto de operagdes a serem realizadas. O ato docu- mentirio requer, por fim, metodologias que permitam construir os objetos que dario materialidade 4 comunicagao entre usuario e sistema de informacio. Portanto, uma anilise mais acurada dos processos documentirios indicara que suas operagGes centrais — ler, selecionar ¢ representar — apresentam problemas cuja complexidade nao podera ser explicada segundo visdes ingénuas. A analise documentiria, em sua dimensio operat6ria, manipula ¢ trans- fornia textos em dois tipos bisicos de representacdes: 0 resumo e 0 indice. No resumo, o texto-base € desestruturado de modo a permitir que certos fiagmentos, organizados sob a forma de um novo texto, reconstruam poten- cialmente o sentido do original. Na indexacio, procura-se obter um grau ainda maior de compactacio do texto-base: do processo de anilise resultam palavras ou sintagmas indicadores do contetido. Se o resumo mantém, de fato, relagio de contigitidade e semelhanga com © texto que Ihe da origem, porque procura reter a estrutura informacional do original, o mesmo no pode ser afirmado em relagao a indexagio. Neste diltimo caso, instaura-se uma nova ordem de sentido, mediada por um instrumento comutador — a linguagem documentéria —, que generaliza as informacées do texto, integrando-as as “classes” previstas no referido instrumento. Nessa medida, as representagdes documentirias mediadas por linguagens documen- tarias “so de carter generalizante”, porque a indexacio nio particulariza as informagdes do texto (Lara, 1993). Jé se afirmou que a palavra é neutra porque ela assume todos ¢ nenhum significado. Ao discutir as palavras e seu significado, Ullmann (1967, p. 133) observa qué: © cariter genérico de nossas palavras € uma das principais fontes de sua imprecisio. Com excecio dos nomes proprios e de um pequeno mimero de nomes comuns que se referem a objetos tinicos, as palavras denotam, no entidades singulares, mas classes de coisas ou de acontecimentos ligados por algum elemento comum. ‘A natureza genérica das palavras € um fendmeno geral da linguagem, “um elemento de abstracio” (ULLMANN, 1967, p. 134). Desse modo, as unidades da linguagem documentéria, embota sejam fixadas semanticamente, pelo fato 50 Discurso e texto: multipicidade de sentidos na ciéncia de informagae de designarem “classes”, e nao informacdes particulares, tendem a veicular informaco com certo grau de imprecisio, 4 semelhanga das palavras da Enguagem natural, Por essa razio, no ambito pragmatico da recuperagio da informagio, que opera com a palavra, a indexagio ¢ o resumo atuam de forma mplementar. A primeira etapa de busca de informagio é feita por meio dos mos de uma linguagem documentéria. Em geral, obtém-se respostas com. nGimero significativo de documentos. Dessa forma, a busca requer opera~ es sucessivas de filtragem, até que se obtenha um conjunto manipulivel de cumentos. Para verificar a pertinéncia dos itens informacionais recuperados, itil recorrer aos resumos. O processo global de anilise documentéria defronta-se, portanto, com is objetos, ao menos: a) 0 texto, como sua unidade de anilise; e b) a lin agem documentiria, como instrumento comutador. Sobre isso, algumas estes: Como abordar tais objetos? Qual é a teoria necessiria para discutir ticamente a anilise documentiria? Quais sio os procedimentos necessirios fa analisar os objetos informacionais? Que tipos de técnicas poderiam oti- izar a fabricagao de representacdes de objetos informacionais? Granger (1989) propde a condnta global a ser adotada ao afirmar que a ra- cal descontinuidade dos paradigmas é um mito, porque um modelo sempre se ibelece “a partir de um momento anterior do pensamento”, pela “ressonancia pasado no presente” (GRANGER, op. cit., p.25). Para 0 autor, “mesmo quando pretende fazer tabula rasa dos sistemas que o precederam, este nio pode ituir-se sem levé-lo em conta, mais ou menos explicitamente e de modo is ou menos rigoroso” (Idem, p. 25). Granger indica, igualmente, a necessidade delimitar os fatos especificos que se deseja observar ao afirmar que: Nao se poderia, com certeza, exigir das ciéncias uma definiggo uni- versal do fato: 0 conhecimento cientifico, por sua natureza, repousa numa determinagio especifica e, por assim dizer, regional do fato e, em constante evolugio, porque a cada momento de sua histéria, cada ramo do pensamento cientifico delimita a classe de fatos que se quer explicar com os meios materiais ¢ conceituais dos quais se pode dispor (GRaNcER, op.cit.,p. 13). Diante dos miltiplos marcos tedricos e metodolégicos a serem exa~ inados, duas tentagdes precisam ser evitadas: a) amalgamar perspectivas cconcilidveis entre si; b) estabelecer equivaléncias indevidas entre conceitos mesmo assimilé-los de forma precipitada ao campo expecifico de trabalho. im, serao definidos primeiramente alguns termos para garantir a clareza das estdes a serem abordadas. O primeiro deles é 0 conceito de representagio informagio. No terreno da informagéo e do texto 51 2.2 A representaco da informacdo A palavra reptesenta¢o evoca intimeras nogées. Para evitar equivocos, ja que ela € utilizada em contextos variados, sera determinado, neste trabalho, seu sentido especifico. Na Ciéncia da Informacio, 0 termo “representagio” é um conceito pré-tedrico, associado, de um lado, a descrigéo dos aspectos que identificam materialmente os objetos informacionais (catalogagio) ¢, de outro, ao processo € 20 produto da condensagio de contetidos de textos, ou seja, 3 indexacio ¢ a elaboragao de resumos (processo) e aos préprios indices e resumos (produtos) Ao descrever os aspectos materiais dos objetos,a identificacio ocorre por apreensio instantanea. Na anilise documentitia, a representagio resulta de procedimentos inferenciais mais complexos. Gardin, por exemplo, assimila a operago de construir essas representacdes aos processos realizados no interior das ciéncias que analisam ¢ interpretam textos: A passagem do texto original para esse género de “representago” — em- Pregaremos doravante este termo para designar o produto da anilise documentéria — é sem diivida uma operagio semintica, mesmo que ela nfo obedeca, na maioria das vezes,a nenhuma espécie de regra precisa, € que cada organismo de documentagio, e mesmo cada analista, se limite a buscar no documento a ocorréncia de uma certa regularidade interna, fundada muito mais na experiéncia ou no hibito, do que em algum tipo de procedimento explicito (GarDIN, 1974, p. 81-82). A informacio documentiria, a0 ser abordada como algo resultante de operagdes de natureza semantica, permite que ela seja observada como uma forma de representagao simbélica. Ela é contudo, uma representagio particu lar porque, sob suas diversas formas de manifestacao, deve responder de modo inequivoco 4s exigéncias da recuperagio da informagio, mantendo, com 0 texto original, relacio de similaridade. Embora a informagio documentaria seja obtida, de um lado, pela neutralizacio do poder expressivo do texto e, de outro, moldada de acordo com formas previamente determinadas, prevalece a idéia de algo que, apesar de set formalmente diferente do original, portanto “representacao”, € equivalente a ele, do ponto de vista do contetido informa- cional. Nesse sentido, a informacio documentiria é representacio construida a partir de um objeto efetivamente presente, que o substitui para certas fina- lidades. Aceitando a idéia de que o texto uma forma de representacao simbélica, deve-se aceitar igualmente que a anilise documentéria, ao operar com textos dos varios dominios da atividade humana, opera com objetos que trazem as 52. Discurso @ texto: multipicidade de sentidos na ciéncia da informacéo marcas das varias fung6es da consciéncia: de representagio (mito), da fangio expressiva (linguagem) e da fungio significativa (ciéncia) (CassiRER, 2001). Além disso, se for aceito o principio segundo o qual o homem no entra em contato direto com as coisas, mas se apropria da realidade por meio da mediacao de estruturas conceptuais e légicas, parece adequado afirmar que a geracio dos produtos da anilise documentéria — as representagdes documen- as — nao escapa, também, a essa mediacio. A significagdo nos processos documentarios P reconhecimento da natureza semintica da andlise documentiria aproxi- mou-a das Ciéncias da Linguagem. Nesse didlogo, a anilise documentiria m se apropriado dos conceitos e metodologias propostos pela Lingiiistica, a Anilise do Discurso, pela Lingitistica Textual e, mais recentemente, pela minologia. A semintica do cédigo permite discutir as relacdes de significacio entre unidades constitutivas das linguagens documentérias; a semAntica textual enta, por sua vez, conceitos fundamentais para realizar as apropriacdes Asticas que caracterizam as operacées de condensacio. As dificuldades da fa sio previsiveis, pois se trata de aproximar ciéncias conceituais, como a ngitistica, de uma drea na qual os modelos devem ser operacionalizaveis. A linguagem documentiria, cédigo comutador— conhecido também por as denominagdes: linguagem de indexagio, sistema de classificacio, lingua- de informagao, listas de cabecalhos de assuntos —, via de regra composto € um conjunto limitado de termos, estabelece interfaces entre as formas de a e de busca a serem utilizadas pelo indexador ou pelo usuario em um a de informagio. As unidades constitutivas da linguagem documentéria © selecionadas de diversas fontes: linguagens de especialidade, linguagem de © corrente terminologias de 4rea. Esse fato revela questdes seminticas complexas para a estruturagio das geagens documentirias, porque elas tém como ponto de partida sistemas de ica¢do em que as relagdes entre significado e significante sio de natureza a. Na linguagem natural, por exemplo, o fenémeno da plurissignificagio Tegra, enquanto, nas linguagens de especialidade, predomina a busca de biliza¢do semintica dos termos. As linguagens documentérias operam, por vez, em campos do conhecimento especializado para descrever e tornar uperiveis os textos produzidos. Desse modo, a operagio de construgio de agens documentérias supde, necessariamente, os instrumentos termino- 03 como fontes de referéncia (TALAMO et al., 1992, 1992a, 1992b; CINTRA » 1993). No terreno da informacdo e do texto 54 Discurso e texto: multipicidade de sentidos na ciéncia da intormagao ‘As terminologias no se confundem, portanto, com as linguagens docu- mentirias, antes, instauram-se como 0 universo referencial destas tiltimas. Nesse quadro, as linguagens documentérias operam como classificagdes intermedié- ras! construidas na interseccio de trés paradigmas designacionais, ao menos: a linguagem de especialidade (nticleo de idéias); as classificagdes cientificas € suas definig6es (terminologias de 4reas); e a linguagem natural (TALAMO et al. 199b; Cintra et al., op. cit.) 2.4 AnGlise de textos: algumas abordagens Ao definir a anilise documentéria como uma disciplina que se preocupa com © tratamento do contetido de textos, torna-se inevitivel sua comparagio com outros campos que também operam com 0 texto. Embora todas elas obser- vem um mesmo objeto empiric, denominado discurso ou texto, as nodes recobertas pelos termos utilizados variam de 4rea para area, sendo igualmente diversos os objetivos, modos e instrumentos utilizados para analisi-lo, como sera exposto a seguir. Os estudos do discurso ¢ do texto remontam aos anos 1950, periodo em que Harris (1962) realizava os trabalhos pioiteiros da area. Seu desenvolvimento mais amplo, contudo, ocorreu a partir dos anos 1980 (Van D1yx, 1992). Até entio, as pesquisas lingiifsticas observavam, de forma dominante, a palavra ea frase. Aqueles que estudam o discurso reconhecem que sua abordagem nio se esgota dentro de uma tinica disciplina. Textos ¢ discursos sio objetos pluridis— ciplinares cuja apreensio impde a formulagdo de um quadro teérico para 0 qual concorrem o lingiiistico, o literirio eo filoséfico (BaxiTIN, 1992), além do sociolégico (PECHEUX, 1969) ou mesmo 0 psicolégico (KiNTSCH & VAN Dux, 1978). Na Anilise do Discurso de Pécheux, os discursos, por serem articulados no interior de condigdes de produgio determinadas, sio objetos que exibem certos tragos estiveis de manifestagio da ideologia. Para o autor, a Anilise do Discurso é, de fato, a teoria que procura “aprender como no lingiifstico inscrevem-se as condi¢es s6cio-histéricas de produgio” (BRANDAO, 1991, p. 83). Dito de outro modo, o modelo proposto por Pécheux inscreve-se no conjunto de trabalhos interdisciplinares sobre o discurso e as relagdes de confronto entre as classes sociais. Essa perspectiva revela uma caracteristica central da Andlise do Discurso: operar em dois niveis, de modo a: Dentro de uma perspectiva semelhante, Gardin discute as relages entre linguagem natural, a linguagem cspecializada e a linguagem documentiria, caracterizando esta fileima como ama lingnagem intermediatia| (Garin, 1989, p. 52). Integrar, por meio da enuncia¢io, uma abordagem interna do texto, indispensivel para que se reconhecam os mecanismos ¢ regras de engen- dramento do discurso, com a anilise externa do contexto sécio-histérico, €m que © texto se insere ¢ de que, em altima instincia, cobra sentido (Barros, 1988, p. s). Também Adam (1989), embora sob uma ética distinta, afirma nio ser avel analisar o discurso de um ponto de vista puramente lingiiistico: A lingiiistica ¢ a pragmatica textuais devem, portanto, definir um campo de pesquisa especifico dentro do dominio mais vasto do discurso porque Sutras disciplinas (como a historia, a sociologia, a psico-sociologia, a Psicanilise, etc.) tém, provavelmente, mais condicdes para descrevé-lo (Apam, 1089, p. ror). ‘Tem centralidade, nos modelos citados, a idéia de que o discurso deve abordado em sua dimensio social. No entanto, Adam (op. cit.) distingue ‘0 de texto: este Giltimo no é um objeto empirico; ao contrario, é um ‘0 tedrico depurado dos tragos que caracterizam o discurso:“O texto é objeto abstrato, resultante da subtragio do contexto sobre o objeto empi- (Discurso)” (ApaM, op. cit., p. 191). Um modo esquemitico de distinguir élise do Discurso da Teoria do Texto, ou Lingiistica do Texto, pode partir ‘igdo das tarefas que a cada uma delas se atribui. No caso da Lingiiistica to, elas podem ser resumidas em dois pontos: a) determinar o que faz texto ser um texto; b) diferenciar as virias espécies de textos (FAVERO & + 1988, p. 14). J4 a Andlise do Discurso, segundo Diana Barros (1988), deve derar: Tis questdes bisicas para a concepgio de discurso e sua anilise: a) a telagio do discurso com a enunciacdo e as condigdes de producao ¢ de recepcio; b) o discurso como o lugar, 0 mesmo tempo do social e do individual; c) a articulagdo entre narrativa e discurso, isto é, 0 discurso Constituido sobre estruturas narrativas que o sustentam (BARROS, 1988, P.3). Por mais sedutores que sejam as propostas da Anilise do Discurso, deve-se tir que as diversas tentativas de incorporar seus procedimentos 4 Andlise entaria, realizadas até 0 momento, nio foram bem-sucedidas. Duas s, a0 menos, explicam os percalcos: No terreno da informagée e do texto 1) Os dois niveis de anilise (externo e interno), por serem destinados a desvendar a “telagio do falante com 0 processo de producio de frases (enunciacao) ow a relagio do discurso com o grupo social a que ele se destina (sociolingiiistica)” (Dusors et al., 1973, p. $0-s1), sio de dificil operacionalizagio no ambito da Andlise Documentiria, cujo objetivo fundamental € condensar textos e representa-los documentariamente. para que circulem como informagio. 2) Em segundo lugar, é preciso considerar que a nocio de informagio relevante de um texto varia de acordo com os objetivos perseguidos. Os procedimentos para seleciond-la sio regidos, necessariamente, por essa conceitualizagio inicial. Desse modo, seria contraditério supor que 0s mecanismos utilizados no ambito da Anilise do Discurso pos- sam ser transferidos diretamente para a Andlise Documentiria. Considerando a possibilidade de isolar do objeto empirico “discurso” 0 objeto tedrico “texto”, tal como propde Adam (1989), serio apresentados, a seguir, os conceitos essenciais relacionados ao objeto “texto”, discutindo, ao mesmo tempo, sua operacionalidade para os fins documentirios. O texto, em uma primeira aproximagio, define-se por sua “autonomia e seu fechamento” (Ducror & Toporoy, 1972, p. 375). © quadro conceitual, no interior do qual se discute 0 texto, pode ser, grosso modo, classificado em duas vertentes: de um lado, as de natureza estritamente lingiifstica, centradas em fenémenos fristicos; e, de outro, a pragmatica textual, que procura dar conta da dimensio global da textualidade, definindo 0 texto como um todo, e nio como a reuniio de proposigdes. E essa segunda vertente que sera discutida agora. Segundo Ducrot (1972, p. 87), todo texto apresenta simultaneamente: a)a condigao de progressio, jé que a auséncia de informagio nova impli ca pardfrases perpétuas; b)a condigio de coesio e coeréncia, expressa pela reiteragio e repeticao de certos contetidos que reaparecem regularmente ao longo do texto. Em perspectiva semelhante, Adam (1989, p. 209) afirma que: “A textua~ lidade pode ser definida como um equilibrio delicado entre continuidade- repeti¢ao, de um lado, e progressio de informagio, de outro”. A coeréncia € a coesio, ao se referirem 4 permanéncia de categorias semanticas no texto, podem ser assimiladas 1 no¢&o de isotopia,* proposta 4 “O termo isotopia designa, segundo A. J. Greimas (1976), a propriedade caracteristica de uma unidade semiintica que permite aprender um discurso como um todo de significagio” (Dupors et al., 1973, p. 353). AA isotopia equivale a um plano homogénco de significacio que o leitor deve construir para compreender © texto como um todo (LosaNo et al., 1989, p. 30). 56 Discurso ¢ texto: mutiplicidade de sentices na ciéncia da informagdo Greimas. E importante observar que os conceitos de coesio, coeréncia & ppia se articulam a idéia de sentido global do texto, ou topico do discurso zndo Adam (1989, p. 194-195),"[...] © t6pico ou tema do texto instaura-se © uma relagio nio linear de coesio-coeréncia”. Ou, ainda, segundo a ago de Eco (1979, p. 97). “[-..] a isotopia pode ser vista como um meno de coesio semintico-referencial, enquanto 0 tépico do discurso fendmeno pragmitico relacionado com a coeréncia ¢ a pertinéncia”. noges caracterizam 0 texto como uma unidade de sentido que apre- redundincias, reiteragdes e repeticdes. Infere-se, dai, a possibilidade de asar 0 texto, suprimindo as redundancias, sem que se descaracterize sua sao central. © conceito de tipologia textual esta intimamente associado 4 idéia de todo texto apresenta uma sintaxe que organiza suas varias partes. E essa @ global de organizagio do texto que Van Dijk & Kintsch (1983) cha~ superestrutura, a qual é um elemento considerado fundamental para a 0 do significado do texto, porque o dominio desses esquemas globais ao leitor monitorar sua leitura, de modo a integrar as varias informa— ilo que € central. superestrutura designa uma estrutura convencional. Enquanto para~ de organizacao textual, o esquema, ou superestrutura, fornece a base interpretagio do texto. No modelo em discussio, a compreensio é 2 como um processo que supée a transferéncia das unidades seminticas SFicadas no texto para um esqueleto conceitual derivado do esquema de jento, O texto-base resultante é, em suma, 0 produto do casamento conhecimento do esquema (superestrutura) e informagio textual (VAN Kuvtscx, 1983, p. 48). os mesmios autores, a compreensio do discurso é de natureza estra~ estratégias so, por sua vez, parte do conhecimento geral e, como tal, reaprendidas, antes de serem automatizadas. Nessa perspectiva, novos discursos formas de conhecimento requerem o desenvolvimento de tégias (VAN Diy & KnvtscH, 1983, p. 11). Desse modo, o bom leitor de explorar de forma mais direta o texto, nio se preocupando com a ficacio bottom-up. Em suma, bons leitores utilizam melhor os processos nos quais a superestrutura assume papel preponderante (Idem, p. 23). modelo de Van Dijk permite hipotetizar um esquema de anilise docu- fundamentado no reconhecimento da superestrutura textual, a qual {ser o elemento capaz de imprimir agilidade e consisténcia 4 coleta ¢ 4 sa¢ao de informagdes para a elaboragio de resumos e indices. Afirma-se, que a claboragio de resumos e de indices requer paradigmas de dados motivados, de um lado, pelo que sio as representacdes docu- S ¢, de outro, pelo que sio 0 texto e sua estrutura, No terreno dainfomagacedotexio 57 58 Discurso e texto: multipicidade de sentides na ciéncic da informagaio 3 CondensagGo de textos A condensagio de textos, sem a presenga de um esquema que parametrize a coleta de dados, resulta, via de regra, em produtos que ndo exibem as proprie~ dades necessarias para as finalidades da recuperacio da informagio. A auséncia de regras e procedimentos metédicos pode causar sele¢io incompleta ou equivocada de dados, motivada pela utilizagao de estratégias de leitura inade- quadas para os objetivos documentirios. Os resumos e indices elaborados sem. rigor metodol6gico sio, dessa forma, “o produto de um impulso, nio de uma intengao” (Barrirs, 1971, p. 20). A metodologia aqui proposta pretende ser uma ferramenta de trabalho apta a promover a produgao de informagées documentirias pertinentes, por contemplar, simultaneamente, a coleta de dados textuais, sua organizacio ¢ sua combinagio por meio de procedimentos objetivados e sistemsticos 3.1 Indexacao e elaboracao de resumos: semelhangas e diferencas operatérias A indexagio ¢ a elaboragio de resumos, como visto, sio operagdes que com- preendem: a) andlise ¢ compreensio do texto; b) scle¢io das informacSes principais; ¢ c) representacio das informaSes segundo padrdes estabelecidos por politicas de informagio. Os indices e os resumos sio representacdes que, embora possam ser reu- nidas sob a denominagio genérica de informagio documentiria, apresentam caracteristicas distintas: a) 0 resumo representa 0 original sob a forma de um novo texto condensado; « b) a indexagao caracteriza o tema do texto por meio de palavras ou sintagmas de uma linguagem documentéria. A linguagem documentiria, por ser um instrumento constituido por Iéxico reduzido e sintaxe precaria, ndo permite a producio de mensagens com a mesma riqueza informacional dos resumos. Desse modo, para a indexacdo, interessa analisar 0 texto para determinar sua macroestrutura,$ que serd, em seguida, representada por palavras ou expresses sintéticas, os descritores, No caso do resumo, a compreensio e a selecio assumem carter mais complexo em relagio 4 indexago, ao menos por duas razdes: 1) a mensagem veiculada pelo resumo é, em principio, mais completa do que a mensagem veiculada pelo descritor; enquanto 0 resumo mantém $, A macroestrutura ¢ definida como uma rede de proposig5es associadas hierarquicamente (VaN Dijk & KINTSCH, 1983) relagio de semelhanga (no plano da mensagem) e contigiiidade (no plano da organizago textual) com o texto de partida, 0 indice opera basicamente no eixo da semelhanga (mensagem); 2)a elaboracdo de resumos implica responder aos requisitos basicos da textualidade por meio de operacdes comprometidas com a construgio formal de uma mensagem dotada de coesio e coeréncia, enquanto 0 indice implica elaborar representagdes por meio de descritores justa~ postos. Em sintese, tanto a elaboracio de resumos quanto a indexagio requerem mpreensio global de um texto. O grau de reduc&o a que se deve submeté- para obter um ou outro tipo de representagao documentria sugere que, caso da indexagio, pode-se operar com a nogio de tema’ e de estrutura tica; no caso do resumo, a nogio de superestrutura poder nortear a ope- do de seleo de informacées textuais. Tema e estrutura tematica ise € a compreensio do texto, para fins documentirios, requerem estraté- adequadas de leitura.A leitura documentéria é orientada para uma missio. € leitura de fruigao, sendo, antes, atividade comprometida com a inten¢gao sa de comunicagao: elaborar produtos que permitam recuperar informa~ Os produtos documentirios destinam-se a0 menos a: auxiliar a tomada de #80es sobre a leitura ou no do documento original; dar ao leitor uma quan- ie suficiente de informagoes, a fim de que ele, em certas circunstincias, nio. 1a necessidade de ler integralmente o original. Nessa perspectiva, a leitura entiria é, fandamentalmente, uma operagio de hierarquizagio e selegio informagdes presentes no texto.A selecio das informagdes é factivel, apenas, base na distingo entre informacao essencial e informagio acesséria, Na leitura documentiria, a compreensio global de um texto requer a tificacio de seu tema, Os temas sio as idéias principais discutidas ou tra- em um documento. Definem-se, portanto, como o foco principal de trabalho, ¢ nio como um aspecto periférico. A abordagem de um tema lica, normalmente, a referéncia a conhecimentos anteriores ou requer a dugio de outros conceitos; algumas idéias podem, por outro lado, ser para ilustrar certos fatos. Tais itens sio dados que cumprem no texto fancées, tais como auxiliar a compreender o texto ou dar credibilidade a FO tema (on t6pico) de um ato de enunciaglo & aquilo sobre © qual 0 locutor fala, & o objeto do 10 [...]" (Ducnor & Toponoy, 1972, p. 345). No terreno da informac&o € do texto 8 60 uma afirmagio, mas no sio temas centrais. O “tema” é o elemento em torno do qual se estrutura a mensagem, é seu nticleo informativo. A identificagao do tema central resulta de um processo de condensagio seméntica. Garcia Gutiérrez & Lucas (1987, p. 47-49) propéem a utilizacio das perguntas conceituais de Lasswell (Who, What, When, Where, Why) como método de abordagem analitica do texto de atualidade, para fins de indexacio. Lasswell (1971) observou que um ato de comunicagio pode ser descrito por meio de respostas fornecidas a cinco perguntas, a saber: quem, diz o qué, em que canal, para quem, com que efeito? Essa formulacio de Lasswell, expressa pelos “5 W”, determina a estruturagao da informagio jornalistica. Considerando, portanto, a indexagio como uma operagio que implica: a) anilise © compreensio do texto; b) selegdo das informagées principais; e ©) representagio das informacdes na linguagem utilizada no sistema, as duas primeiras operacées (anilise e selecio de informacées) poderao ser realizadas por meio dos mecanismos de resposta as categorias da estrutura temética 3.3 Superestrutura e classificacao de textos Hi diversas tentativas de classificar os textos segundo tipologias. Os textos po- dem ser classificados, entre outros enfoques, pela estrutura interna (descritivo, narrativo, dissertativo) ou pela finalidade a que se propdem (técnico, cientifico, didatico, jornalistico, juridico, politico, etc.). Os primeiros estudos sisteméticos sobre os “géneros” textuais ¢ as “partes do discurso” sio atribuidos a Aristételes. Suas idéias, apresentadas no ambito da retrica, fundamentam ainda hoje as modernas teorias discursivas relacionadas 4 persuasio (CIrExut, 1989; OKasaBe, 1979). A ret6rica, para Aristételes, no se reduz a um conjunto de normas ou a oratéria, mas ao esforgo de “descobrir especulativamente, em qualquer dado, 0 persuasivo” (ARISTOTELES apud OKASABE, 1979, p. 142). E nessa perspectiva que Aristételes afirma: “No hd sendio duas partes no discurso, pois é necessério dizer qual é 0 tema e demonstré-lo [...] Dessas duas partes, uma é a proposi- 40; a outra, a confirmacdo. Como se tratasse, de um lado, do problema e, do outro, da demonstragio” (Idem, p. 156) Os textos argumentativos nfo escapam a essa caracterizaco. Contudo, a esse esquema genérico — problema/demonstra¢io — podem ser agregados outros constituintes, de modo a caracterizar variantes de um tipo. O texto técnico é, via de regra, de natureza argumentativa, elaborado com 0 intuito de expor metodicamente os resultados da observagio de um fendmeno. Para Gardin (1987, p. 4): Discurso e texto: multipicidade de sentidos na ciéncia da intormagco a expresso concreta de um raciocinio cientifico € 0 texto cientifico, no qual 0 autor expde as operagdes do espirito que 0 conduziram da observagio de certos fatos empiricos a0 enunciado de proposicdes de- nominadas de forma diversa:teses, hipéteses, interpretagdes, comentarios, conclusdes, explicagdes, etc... E no interior da atividade de conhecer, portanto, que se define o texto tifico canénico: uma unidade de comunicacio do saber, dotada de certos entos estruturais. No ambito das pesquisas experimentais, esses elementos turais so 0 tema, o problema, a hipétese, a metodologia, os resultados e a iclusio (Ast1-Vera, 1979; BUNGE, 1973). 0 Tipo 1 Problema Indagagio. Hipétese (Conjetura Metodologia Observacio Resultado Interpretacio Conclusio Comentirio final O texto argumentativo pode apresentar outros constituintes: a tese, que caracteriza como apresentagio de um ponto de vista; os argumentos, que io as provas apresentadas para qualificar positivamente 0 ponto de vista e, nultaneamente, desqualificar um ponto de vista contrario; a conclusio, por , que confirma o ponto de vista inicialmente apresentado. O quadro apre- ntado a seguir sintetiza a superestrutura desse tipo de texto: fexto Tipo 2 [Tese Ponto de vista Argumentos [Provas [Conclusio [Confirmacio O trabalho pioneiro sobre 0 texto expositivo, segundo Ducrot & To- dorov (1972, p. 36), foi feito por Becker, em 1966. Este tiltimo caracteriza 0 texto expositivo como aquele que apresenta as categorias problema-solucio como seus constituintes bisicos. Na realidade, o texto expositivo (tipo 3, neste trabalho), amplamente utilizado na comunicagio do conhecimento técnico- cientifico, pode ser visto como uma estrutura constitufda de trés categorias: a) apresentacao do problema; b) causas ¢ conseqiiéncias do problema; c) solucio do problema, que pode ser esquematizado como a seguir: No terreno da informacaoe dotexio 61 ‘Texto Tipo 3 Problema Questo [Causas Razoes ‘Solugio Resposta Neste trabalho, a proposta no é inventariar exaustivamente as variantes textuais. Apresenta-se uma hipétese de trabalho — a possibilidade de utilizar a superestrutura textual como paradigma para a coleta de dados para fins documentirios. Com esse objetivo, foram apresentadas, anteriormente, trés variantes do texto técnico-cientifico e, a seguir, a estrutura do texto narrativo (Tipo 4) € do descritivo (Tipo 3), classificagao fandamentada na estruturacio interna Texto Tipo 4 [Quem [Actantes/Atores O qué [Acontecimento Quando [Aspecto temporal Onde [Aspecto espacial Como [Modo Por qué Razio Texto Tipo 5 Referente Objeto do mundo [Caracteristicas Predicados/Atributos 4 Condensacdo para indexa¢do e resumos As atividades documentétias so processos nos quais se identificam objetivos € operagdes. Os objetivos referem-se 4 natureza dos processos, enquanto as operagdes, aos procedimentos realizados. Nessa perspectiva, a indexagio tem como objetivo caracterizar o contefido de um documento por meio de uma linguagem documentéria; suas operagées bésicas sio: identifica o tema do texto; elaborar um enunciado temético e representar 0 enunciado temitico. Para identificar o tema, lé-se 0 texto tendo como parimetros as categorias da estrutura temitica, expostas no item 3.2. Deve-se observar ainda que, na indexagio, hé uma operagio final de conversio do enunciado temitico para a linguagem documentéria adotada no sistema, observando, igualmente, a poli- tica de indexacio. Tal como na operagio de indexagio, a elaboragio de resumos supde a selegao de informagées textuais, realizada com base em sua hierarquizagio. 62 Discurso € texto: multiplicidade de sentides na ciéncia da informagdo Segundo Van Dijk & Kintsch (1983), a superestrutura é um elemento funda- mental para a compreenséo dos textos porque: ) ele tem caréter convencional, sendo conhecido e reconhecido por uma comunidade lingiifstica: b) a supe- restrutura configura-se como um esquema abstrato que estabelece a ordem global de um texto e se compde de uma série de categorias, cujas possibili- dades de combinagio fandamentam-se em regras convencionais. Q dominio das superestruturas permite um processamento top-down coerente, porque a leitura é feita com base em hipsteses, e nio pela construgao do sentido por meio de processamento bottom-up (Van Dijk, 1992). Os passos da elabora¢io de resumos documentérios podem, tal como na indexagao, ser observados como principios ¢ operacdes. O objetivo é produzir representagSes paraftdsticas condensadas de um texto. As operagdes basicas sio: identificar o tipo de texto (superestrutura) e selecionar, nos constituintes as informages consideradas relevantes para a claboragio de diferentes tipos de resumos ~ resumo indicativo ou resumo informativo -, propostas em nor- mas de documentacio. © resumo informativo supde a condensacio de cada constituinte da superestrutura e sua articulago, de modo a, em certas circuns- tincias, substituir o texto de partida; o resumo indicativo, como o proprio nome sugere, é uma caracteriza¢io sumiria do contetido, Para a claboragio de resumos, sugere-se a sele¢io de constituintes segundo o tipo de resumo pretendido. Superestrutura Resumo informativo __Resumo indicative Resultados ‘Condlusées Superestrutura Resumo informativo ___Resumo indicativo [Argumentos [Conclusdes Superestrutura Resumo informativo __Resumo indicativo Superestrutura Resumo informative Resumo indicativo Objeto do mundo. Predicados No terreno da informacéoe do texto 63 64 Discurso € texto: muitiplicidace de sentides na ciéneia da informacéo Superestrutura Resumo informativo __Resumo indicativo 5 Consideragées finais A informagao documentéria, para cumprir adequadamente suas fang@es, deve manter relages de contigitidade e semelhanga com o texto-base. Essas relagGes so rompidas quando a selecio de dados é incompleta e equivocada. Dessa forma, sugere-se que a adogio de parimetros que guiem metodicamente © trabalho documentério, em suas varias etapas, desde a selegio de dados até sua combinacio final, possa ser feita com base nas contribuicdes da Lingiiistica ‘Textual e nas teorias do processamento cognitivo de textos. Afirma-se, portanto, que as atividades documentérias, em particular a indexacio ¢ a elaboragio de resumos, podem ser monitoradas, deixando de lado a concepgo de que a anilise de textos é pura subjetividade, nio se prestando 3 formulacdo de parimetros. No entanto, como em todo jogo de linguagem, a produgio de informacées documentarias sera mais efetiva se realizada observando regras. A metodologia proposta procura integrar os conceitos de textualidade, superestrutura textual e estrutura temitica, tornando operatérias as duas tilti_ mas para as finalidades da indexagao e elaboragio de resumos. Esses conceitos poderio, portanto, objetivar a identificagio e hierarquizar o contetido infor- macional de textos. A utilizagio da superestrutura e da estrutura temitica nos processos documentérios apéia-se no pressuposto de que o texto nao se oferece 4 compreensio de forma direta ¢ imediata. Desse modo, é necessério dispor de conceitos operatérios que facilitem a apreensio do texto ¢ a identificagio e selecio de informacao segundo 0 produto a ser elaborado. A nogio de superes- trutura, no entanto, nao deve ser utilizada de forma ingénua ou dogmatica, jé que os textos concretos nio sio puros. E possivel, porém, operar com a no¢io de domindncia para classifici-los no interior de tipos. A complexidade do real nao pode paralisar e impedir a busca de modelos para compreender, cada vez melhor, 0s fendmenos e objetos do mundo. Considerando que a forma de exposi¢io do conhecimento tende a seguir Padrdes estabelecidos por cada comunidade de discurso, sugere-se que, em cada area, procure-se identificar os tipos de textos produzidos para aprimorar as operacdes documentirias. A tipologizacio de textos nio é uma tarefa propriamente documen- aria; ela € uma atividade especifica da Lingiiistica do Texto. Cabe a anilise documentaria apropriar-se das classificagdes propostas, testando-as e adap- tando-as as finalidades documentérias. As atividades documentarias sao feitas Para promover a identificagio dos produtos da atividade intelectual, sendo a condensacio uma operacio que reduz textos para viabilizar seu armazena- mento ¢ circulagio como informagio. Desse modo, a indexacio e os resumos jamais poderio substituir a riqueza dos textos. Deve-se, no entanto, procurar modos de garantir a identificagio adequada do contetido informacional dos textos, objetivando os processos de elaboracio dos produtos documentirios, © fazer documentério se realiza sob coergdes pragmiticas. Essa com- preensao implica avaliar sistematicamente os métodos disponiveis, propondo novas formas de trabalho que substituam aqueles métodos que se tornam Obsoletos ou sio pouco rigorosos.A presente proposta de elaboracio de infor- miagio documentiria, inclusive, deve ser submetida a testes e criticas para ser validada. Ela certamente apresenta lacunas. Sio bem-vindas as criticas. Refer&ncias bibliograficas Apan, J. M. Pour une pragmatique linguistique et textuelle, In: Rercuten, C. Linter- pretation de textes, Paris: Minuit, 1989. p. 183-219. Asti-Vera,A. Metodologia da pesquisa cientifica. Porto Alegre: Globo, 1979. Baxutin, M. Marsismo ¢ filosofia da linguagem. Sio Paulo: Hucitec, 1992. Barxos, DL. P. Teoria do discurso: fandamentos semiéticos, Sio Paulo: Atual, 1988, Barras, R. O grau zero da escritura, Sao Paulo: Cultrix, 1971. Branpio, H. N,N. Introdugao a anélise do discurso. Campinas: Ed. UNICAMB, 1991. Bunce, M. La investigaciin cientifica. Barcelona: Ariel, 1973. Casstner, B. A filasofia das formas simbélicas. Sio Paulo: Martins Fontes, 2001. Cintra, A.M. M. et al. Do termo ao descritor: estudo exploratério. Revista Comunica sdes ¢ Artes, Sao Paulo, 1993. Crrexu, A. O. Linguagem e persuasio. Sio Paulo: Atica, 1989. Donors, J. et al. Diciondrio de lingifstica. Sio Paulo: Cultrix, 1973, Ducror, O. Dire et ne pas dire. Paris: Hermann, 1972. Ducror, O.;Tonoroy,T. Dictionnaire enciclopédique des sciences du langage. Paris: Seuil, 1972. Eco, U. Conceito de texto. Sio Paulo: T. A. Queirés, 1979. Favero, L. L.; Kocu, I. G.V. Lingitistica textual: introducio. S40 Paulo: Cortez, 1988. Fruzen, H. Manuel de terminologie. Paris: UNEsco/Inforterm, 1984. Garcia Guruinnez, A; Lucas, R. Documentacién automatizada de los médios informativos. Madrid: Paraninfo, 1987. Garp, J. C. Les analyses de discours. Neuchatel: Delachaux et Niestlé, 1974. No terreno da informagao e do texto 65 Garpn, J. C. Vanalyse logiciste. In: Garon, J. C. et al. Systémes experts et sciences humai- nes. Paris: Eyrolles, 1987. p.17-26. Grace, G. G. Por um conhecimento filos6fico. Sio Paulo: Contexto, 1980. Gretmas, A.J. Semntica esirsturat: pesquisa de método. Sio Paulo: Cultrix, 1976. Harais, Z. S. Discourse analysis reprints. Haia: Mouton, 1962. Kantscr, W; VAN Dux, T. Toward a model of text comprehension and production. Psychological Review, v. 85, n. 5, p. 363-304, 1978. Konast, N.Y. A elaboracio de informasdes documentérias, emt busca de uma metodologia. 1994. Tese (Doutorado) -ECA-USP, Sio Paulo. Lara, M.L. G. A representagio documentéria: em jogo a significa¢ao. 1993. Dissertagio (Mestrado) -ECA-USB Sio Paulo. Lasswett, H.D.A estrutura e a fungio da comunicagio na sociedade. In: Coun, G. Comunicagio ¢ indistria cultural. Sao Paulo: Nacional/EDUSP, 1971 Lr Roux, D.Automatisation de lactivité resumante: essai de typologie. Collogue sur le resumé de texte. Pont 4 Mousson, 1990 (separata). Losano, J. et al. Andtisis del discurso: hacia una semiética de la interaccién textual Madrid: Cétedra, 1989. Oxasane, H. Argumentagao e discurso politico. Sio Paulo: Kairos, 1979. PAicueux, M. Analyse automatique du discours. Paris: Dunod, 1969. TALamo, M. E.G. M. et al. A contribuigio da terminologia para a elaboragio de tesau- ros. Ciéncia da Informayao, v. 21, n. 3, p. 197-200,1992. Tatamo, M. F G.M. ct al. Instrumentos de controle terminoligico: limites e fungées. In: Simp6st0 LariNoaMERICANO DE TeRMINOLOGIA, 2. Brasilia: IBtCT; Paris: Uniéo La- tina. Anais... 1992a. ‘Titamo, M. BG. M. et al. A interface andlise documentéria, lingtifstica documental € terminologia. In: Simpdsto IBEROAMERICANO DE TERMINOLOGIA, 3. Anais... Espanha, i992b. Usimann, S. Seméntica. Madrid: Aguillar, 1967. Van Dik, T. Cognigio, discurso e interasio. Sio Paulo: Contexto, 1992. Van Dux, T; Kintscu, W. Strategies of discourse comprehension. Orlando: Academic Press, 1983. 66 Discurso texto: multipicidade de sentides ne ciéncia da informacao: eee eee ii ee I

Você também pode gostar