Você está na página 1de 13

DataGramaZero - Revista de Cincia da Informao - v.4 n.

2 abr/03

ARTIGO 01

Polticas de Monitoramento da Informao por Compresso Semntica dos seus Estoques[1][2]


Information monitoring policies through stock semantic compression

por Aldo de Albuquerque Barreto

Resumo: Este artigo se orienta para o estudo da estrutura do texto escrito e sua anlise morfolgica com a finalidade de extrair informaes para uso na gesto estratgica da informao, localizada em estoques especficos [3] [4]. Visa , ainda, fornecer subsdios para um processo de monitorao de contedos infomacionais em lngua portuguesa e a realizao de outros estudos de administrao da informao. Procura indicar subsdios tcnicos e tericos para construo de softwares para o estudo de contextos de informao utilizando o instrumental da cincia da informao e do processamento computacional do portugus em linguagem natural. Ambiciona ser um instrumento estratgico para localizar e caracterizar atravs de palavras-chave contedos de famlias de textos visando a gesto e o controle de um estoque especfico de informao. Palavras-chave: Compresso Semntica, Monitoramento da Informao, Estoques de Informao, Palavras-chave Abstract: This research is guided for the study of the structure of the written text and its morphologic analysis with the purpose of to extract information for strategic administration of the information, located in specific stocks as to supply and give subsidies for construction of intelligent apparatus of monitoring contents in portuguese language; other studies where this type of software agent is useful is also analysed. The intention of this research tries to supply technical and theoretical subsidies for construction of indispensable software to the current scenery in several information context using methodologies of the information science. The aggregation of the methodology and the software agent is intended to be a tool for management and control of information. Keywords: Semantic Compression, Information Monitoring, Information Stocks, Key-words

Uma explicao terica inicial O objetivo do presente artigo apresentar resultados de uma pesquisa sobre A Compresso Semntica[5] nos Estoques de Informao e os resultados que j podemos apresentar aps alguns meses de trabalho. O estudo se orienta para a analise da estrutura do texto escrito e sua anlise morfolgica com a finalidade de extrair informaes tanto para uso na gesto estratgica da informao, localizada em estoques[6] especficos, como para fornecer subsdios para construo de instrumental de monitorao de textos em lngua portuguesa e outros estudos onde um agente de software desta natureza seja necessrio. Em sua inteno paralela procura fornecer subsdios tcnicos e tericos para construo agentes indispensveis ao controle do cenrio atual em diferentes contextos informacionais. Uma anlise da eficincia econmica e da viabilidade dos produtos e servios de informao nos remete a uma reflexo da apreciao da manifestao do fenmeno da informao, aqui entendido, como a sensibilidade na percepo do contedo semntico das estruturas[7] de informao pelos sentidos e pela conscincia. A essncia deste fenmeno, sempre raro e surpreendente, se mostra pela transformao de conjuntos simblicos , uma pea de informao, em realizaes de uma conscincia individual ou coletiva, na criao ou na assimilao[8] desta informao. neste sentido que, a informao sintoniza o mundo, pois referencia o homem ao seu passado histrico, s suas cognies prvias e ao seu espao de com(vivncia), colocando-o em um ponto imaginrio do presente, com uma memria do passado e uma perspectiva de futuro. Coloca o individuo em um presente continuo espao de apropriao da informao. Assim, qualquer reflexo sobre as condies polticas, econmicas ou sociais de um produto de informao est condicionada a uma premissa bsica da existncia de uma relao da informao com uma gerao do conhecimento[9]. Desta forma , para demarcar nosso trabalho usaremos o conceito de informao como sendo: conjuntos simbolicamente significantes com a competncia e a inteno de gerar conhecimento no

indivduo, em seu grupo e na sociedade. Especificado o conceito, a informao fica qualificada como um instrumento modificador da conscincia do homem e de seu grupo social. Deixa de ser, somente uma medida de organizao, por reduo de incerteza, para ser a prpria organizao em si ao relacionar o homem aos seus passado e ao seu futuro e a um lugar do presente onde habita com outros. Fica, ainda, estabelecida uma relao entre informao, a sua produo pelo emissor e o conhecimento, este s se realizando se a informao for percebida e aceita, colocando o indivduo sensvel em um estgio melhor, consciente consigo mesmo e dentro de um mundo onde se realiza a sua odissia individual. Como agente mediador da produo de conhecimento, introduz-se o conceito de assimilao[8] da informao, como sendo um processo de interao entre o indivduo e uma determinada estrutura de informao, interao com apropriao que, vem gerar uma modificao em seu estado cognitivo inicial, produzindo conhecimento[9], que se relaciona corretamente com a informao recebida. um estgio qualitativamente superior ao simples acesso informao. No se pretende aqui debater as questes filosficas sobre a teoria do conhecimento. Aceitamos, que conhecimento uma a modificao provocada no estado cognitivo do indivduo. Em nossa argumentao conhecimento um processo, um fluxo de informao que se potencializa. Distinguimos, no nosso estudo, fluxos e estoques quando lidamos com a informao. Temos o um estoque de fatos idias para percepo, estoques institucionalizados ou no, estes se transformam em outro estoque, quando a informao inscrita ou registrada. Entendemos que o conhecimento um fluxo, isto uma sucesso de eventos, que se realiza fora dos estoques, em um espao social e na mente de um ser pensante. um fluxo subjetivo e diferenciado em relao ao estimulo, e ao receptor. Mesmo que o estimulo seja o mesmo a subjetividade da apropriao o diferencia. Quando falamos da inteligncia pensamos na introduo dinmica do conhecimento que foi assimilado, para a realidade vivencial do receptor; caracterizada como uma ao: seja ela social, poltica , econmica ou tcnica; representa um conjunto de atos voluntrios pelo qual o indivduo se re-elabora e tenta modificar o seu mundo. Trata-se de um inicio, do que no iniciou antes e que s se realiza na pluralidade poltica e vai resultar sempre em uma modificao como resultado da ao inicial. Ainda que ocorra uma volta, para uma permanncia ao estado inicial de partida a ao em si no deixou se ser percorreu seu processo , gerou efeitos. Consideramos , assim, toda inovao como uma ao de inteligncia social. Falo em saber, quando penso no conhecimento que aceitei, apropriei e acumulei nas parties de minha mente. um estoque que posso evocar para re-elaborar novamente. Pode acrescido, sedimentado ou modificado por novo conhecimento. E meu e de mais ningum; mas soma-se implicitamente para dar sinais do estado de aprimoramento ou desenvolvimento social e cultural de uma sociedade. A estrutura de informao considerada como qualquer base que aceite uma inscrio de informao; a estrutura pensada como sendo um conjunto de elementos que formam um todo ordenado e com princpios lgicos, com coerncia de raciocnio, de idias. Este conjunto pode ser linear ou no. Trabalhamos com a suposio de que, qualquer estrutura de informao textual, um texto de informao, possui caractersticas estruturais de linguagem que admitem uma anlise morfolgica, onde partes podem representar o todo para anlise deste todo. Os fluxos de informao de primeiro nvel Consideramos, tambm, que os fluxos de informao se movem em dois nveis: em um primeiro nvel os fluxos internos de informao se movimentam entre os elementos de um sistema de agregao, armazenamento e recuperao da informao, e se orienta para sua organizao e controle. Estes fluxos internos se agregam, por uma premissa de razo prtica e produtivista, em um conjunto de aes pautado por decises e um agir baseado em princpios. Este o mundo do gerenciamento e controle da informao. O sistema de armazenamento e recuperao da informao.

Os fluxos de informao de segundo nvel So aqueles que acontecem nas extremidades do fluxo interno de primeiro nvel, indicados acima.Os fluxos extremos so aqueles que por sua atuao exibe a Essncia do fenmeno de transformao, entre a linguagem do pensamento de um emissor e a linguagem de inscrio da informao.

desapropriao cognitiva

apropriao cognitiva

Assim, no fluxo extremo a direita, a premissa se transforma na promessa, uma promessa ou a esperana de que a informao gerada pelo autor possa ser assimilada como um conhecimento pelo receptor. No extremo esquerdo do fluxo se realiza um fenmeno de transferncia para a informao cuja Essncia est na passagem de uma experincia, um fato ou uma idia, que se encontra em uma linguagem de pensamento do seu criador, para um texto de informao editado por este mesmo gerador; aqui a narrativa mental do autor se transforma em um texto expresso em uma linguagem de edio. Um nico fluxo, duas linguagens. No fluxo do extremo direito temos um processo de cognio[11] que transforma a informao em conhecimento pela correta apropriao desta informao pelo sujeito receptor. Uma apropriao da informao pblica para um subjetivismo que se quer privado. Um desfalecer para um renascimento. No fluxo extremo a direita traz uma desapropriao cognitiva, quando o pensamento se arranja em informao em uma linguagem de inscrio prpria, intencionalmente dirigida para tornar-se pblica. Aqui a passagem ocorre na direo, dos labirintos do pensar privado para um espao de vivncia pblica. A passagem da linguagem privada do autor para uma linguagem que ambiciona ser, intencionalmente, para o entendimento do pblico. Para a aceitao do usurio. Uma pulso de criao. Duas pulses operando em sentido contrrio. Uma pulso de vida na criao de uma nova informao e um desfalecer tenso, intentado para o processo dinmico, que faz o a informao cumprir uma meta de conhecimento. Particularmente nos preocupa o estudo do texto, enquanto uma estrutura de informao; o texto[12] e sua estrutura, em um enfoque quantitativo e qualitativa do contedo da escritura de informao. A literatura sustenta nossa pretenso de ser o texto um transmutar do pensar para o escrever: Escrever , pois, mostrar-se, dar-se a ver, fazer aparecer o rosto prprio junto ao outro.... O que quer dizer que a escrita um jogo ordenado de signos que se deve menos ao seu contedo significativo do que prpria natureza do significante (Foucault, 1992)[13] Em nosso trabalho no nos interessa discutir a presena ou a ausncia do autor no texto, mas o texto em si, como uma estrutura livre e com caractersticas prprias de existncia: Escrever retirar-se no para a sua tenda para escrever, mas da sua prpria escritura. Cair longe de sua linguagem emancip-la ou desampar-la, deix-la caminhar sozinha e desmunida. Deix-la falar sozinha o que ela s pode fazer escrevendo (Derrida, 1967)[14].

Existindo uma linguagem do texto, com configuraes estruturais delineadas e talvez gerais, seria possvel utilizar maquinismos de anlise, para obter dados de seu contedo, dentro de uma ttica de compresso semntica do do seu contedo: o texto realiza, se no a transparncia das relaes sociais, pelo menos a das relaes de linguagem; ele o espao em que nenhuma linguagem comanda a outra, em que as linguagens circulam.... a teoria do texto no pode coincidir seno com uma prtica da escrita. (Barthes, 1984) . Estudos da Universidade de Toronto, Canad, apresentam evidncias neurocognitivas de que existem duas diferentes linguagens; uma sendo a do pensar, que antecede a linguagem do editar, de formatar o texto. Estas linguagens teriam caractersticas diferenciadas. Nos estudos do grupo canadense que edita a revista "Texte e Informatique" pode-se encontrar indicaes de que a linguagem do pensamento se processa em sentenas pequenas; usando, freqentemente, de cinco at sete palavras, e as palavras com um nmero pequeno de letras. Assim existir, em uma fase a de edio, uma nova linguagem, com caractersticas mais formais na estrutura e no estilo, Esta segunda linguagem aparece como que encobrindo a linguagem do pensamento.(Lancashire, 1993)[15]. Nesta mesma linha Walter Ong discute a maneira como a escrita distancia o autor do seu pensar. Ong indica as caractersticas da linguagem do pensamento de um ator. Elaboramos sobre o texto de Walter Ong (Ong, 1988)[16] para indicar o que entendemos serem as caractersticas bsicas da linguagem do pensamento onde o autor organiza sua narrativa antes de sua transposio para a escrita: * as expresses so aditivas em sua narrativa, no se subordinam; uma linguagem agregativa no analtica; * possui uma tendncia para ser redundante ou a re-utilizar conceitos constantemente; * possui uma organizao conservadora em sua estrutura e simples em sua forma; elabora com frases pequenas de cinco a sete palavras e com palavras pequenas de quatro a sete letras; * as expresses tm quase sempre um enunciado de verdade; * uma linguagem enftica e direcionada, mantendo um distanciamento objetivo; * uma linguagem homeosttica[17] ; possui uma tendncia estabilidade interna com um retorno constante aos conceitos j usados; * uma linguagem situacional mais que abstrata; tende assim a conceitualizar experincias e memrias adquiridas e ento expressa-las com uma relativa proximidade das vivncias do cotidiano. A linguagem de edio ou da escrita tem tambm caractersticas prprias: * explcita, formal, de padres normativos e de procedimentos formalizados; coloca em prtica desgnios ou intentos; * procura eliminar as repeties das expresses e conceitos; * procura eliminar a redundncia e palavras indeterminadas; * utiliza figuras de linguagem para facilitar a agilidade das expresses; * opera com qualidades e relaes, e no s com a realidade sensvel; portanto rica em metforas; possui uma grande fluncia de palavras, usa termos peculiares de uma rea de atuao, possui extrema liberdade semntica; * utiliza estruturas sintticas complexas, mas determinveis e possivelmente generalizveis e passveis de padronizao; * uma linguagem sem controle ou inibio de suas expresses e conceitos; utiliza excesso de sinonmia e

de conectores entre conceitos; * utiliza as palavras sem preocupao com seu tamanho, em frases de construo livre, simples ou complexas e com grande liberdade de elaborar significados. * uma linguagem morfologicamente coerente e passvel de ter alguma definio de padres e procedimentos. a partir da linguagem de processamento, usada pelo autor no texto, e dentro desta ambincia terica conceitual que realizada nossa observao; analisamos a linguagem de edio do autor para concluir resultados de relevncia e prioridade de um conjunto de textos, patentes, e-mails, URLs, etc. Poltica de compresso da Informao Aqui se insere o conceito compresso da Informao[5], para anlise, estudo e monitoramento da informao. O quantum de informao disponvel abundante; cabe pois, uma articulao estratgica para conhecer, avaliar e filtrar a informao relevante e prioritria passvel de ser transformada em conhecimento, de ser controloda e monitorada para atingir um fim especfico. Uma poltica de monitorar a informao, por compresso semntica, tem por base a seguinte articulao tericaoperacional: * No processo de gesto da informao, armazenada em estoques especficos, existem configuraes conjuntas de informao que relevante e prioritria pela sua singularidade; estes conjuntos podem ser organizados em ncleos. Tais configuraes minimizam a tenso cognitiva do usurio ao interagir com um estoque de informao de contextualizao intensa; * A qualidade de informao relevante[18] est diretamente relacionada com a quantidade das palavras mais freqentes, que aparecem em um texto de informao; * A qualidade da informao que prioritria[19] pelo seu vis, est diretamente relacionada com as palavras de freqncia igual a um (1) no texto de anlise . So as palavras que aparecem somente uma vez e mostram, quando devidamente examinadas a singularidade de um texto; * A informao que relevante para um determinado receptor razoavelmente inelstica[20] em relao ao tempo. No demonstra variaes radicais em um determinado espao de tempo[21]; * A informao que prioritria, por seu vis de singularidade, razoavelmente elstica em relao ao tempo, para um determinado receptor. A condio de prioridade por especificidade, modifica-se com maior rapidez em funo do tempo; * As palavras que indicam a relevncia de um texto, as de maior de maior freqncia situam-se dentro de um conjunto (clusters) de palavras com uma freqncia limite. A partir deste conjunto a de palavras a relao freqncia de ocorrncia e relevncia da palavra apresenta rendimentos decrescentes de escala, em relao relevncia. A relevncia das palavras nestes clusters, existem em uma condio de rendimentos decrescentes em escala. Quando menor a freqncia menor tambm, a relevncia no cluster considerado. Assim o corte da freqncia para explicar a relevncia fica determinado pelo coeficiente de relevncia[22] abaixo indicado, que so calculados para cada conjunto de palavras de uma mesma freqncia. A frmula permite indicar que na freqncia 10, por exemplo, 80 % das palavras so relevantes, e a partir da haver um continua perda na taxa de relevncia, sendo, assim, est a freqncia limite para estudo daquele conjunto especifico de documentos;

S Palavras relevantes
Coeficiente = x 100

S Palavras cluster

* As palavras de freqncia igual a um se agregam em clusters de significncia . Estes clusters so delimitados pelo tamanho das palavras, (em nmero de letras) contidas naquele cluster. Existe um rendimento decrescente em escala[23] do valor (das palavras) destes clusters em funo do tamanho das palavra. O coeficiente de relevncia acima indicado uma opo de trabalho, para o analista, para determinar o tamanho do cluster desejado; * Existe uma relao positiva entre o tamanho de uma palavra de um texto e a sua qualidade de relevncia e prioridade. Isto palavras maiores so mais significantes; esta parece ser um diferencial de uma linguagem de pensamento e uma linguagem de edio; * As configuraes de zonas de qualidade intensa, com relevncia e prioridade podem ser determinadas automaticamente por agentes de software, sem interferncia humana; Os preceitos operacionais bsicos, validados em pesquisa realizada, agregados ao agente de software[*] formam um instrumental de monitoramento, gesto e controle da informao. Procedimentos operacionais Para proceder a nossa anlise era preciso um corpus de documentos em portugus digitalizados e preferencialmente disponveis on-line na Internet. Neste momento foi utilizada a base do projeto Scielo da Fapesp/Bireme. A base Scientific Electronic Library Online - SciELO uma biblioteca virtual que abrange uma coleo selecionada de peridicos cientficos brasileiros, em formato digital e disponvel na Internet. Nossa anlise mostrou a validade de todo o raciocnio operacional anteriormente citado. As mais importantes: as palavras de freqncia 1 indicam a individualidade de um texto, seus mtodos, insumos, processos reaes, modelos etc. So diferentes das palavras de freqncia alta que mostram a relevncia, utilidade, da escrita em uma condio mais geral. Existe uma relao entre o tamanho da palavra, medido pelo nmero de letras, e sua importncia para a relevncia e prioridade do texto considerado; A inscrio da informao em uma estrutura utiliza duas linguagens , uma linguagem que se processa no pensamento do autor e outra na qual os textos so editados para o pblico O comportamento das palavras em um texto em relao a sua freqncia ser maior que 1 ou igual a 1 mostram as seguintes configuraes, para trs campos distintos: Tabela 1 - PALAVRAS COM FREQUNCIA MAIOR QUE 1 (F>1)
CAMPO DE CONFIGURAO NMERO CONHECIMENTO GRFICA PALAVRAS NO NCLEO PALAVRAS NMERO DE RELEVANTES LETRAS DAS NO NUCLEO PALAVRAS RELEVANTES MDIA CINCIA DA INFORMAO hiprbole decrescente, convexa origem e tendendo ao no eixo do x 28 12 % 40 WORDS 9 a 3 pensamento convergente/divergente; prprio das sociais aplicadas? pensamento divergente, fluncia das idias e palavras pensamento convergente; vocabulrio exato linguagem de edio: pensamento de processamento da informao

CINCIAS SOCIAIS CINCIAS EXATAS E DA SADE

80

20

20

16

60

Ncleo = das palavras de maior freqncia at a freqncia limite escolhida a = desvio padro

Em algumas reas como a sociologia , comunicao, historia a fluncia de palavras to grande que preciso operar em um limite bem mais baixo de relevncia para evitar perda de contedo, aumentando assim o tamanho do ncleo. Pelo contrrio em reas mais formalizadas como a fsica qumica,etc um ncleo de 16 palavras tem alta percentagem de palavras relevantes.

Tabela 2 - PALAVRAS COM FREQUNCIA IGUAL A 1 (F1 = 1)


CAMPO DE CONFIGURAO A CONHECIMENTO GRFICA Numero de palavras at o cluster com 20 palavras B percentagem nmeros de B/ A palavras relevantes at o cluster de 20 palavras mdia 15 20 18 30 % 40 % 50 %

total CINCIA DA INFORMAO CINCIAS SOCIAIS CINCIAS EXATAS E DA SADE Clusters decrescentes em relao ao numero de letras das palavras nele contidas.* 30/50 60/70 30/40

mdia 40 50 43

* Clusters em escada. Palavras relevantes so diretamente proporcionais ao seu tamanho em nmero de letras, em um mesmo cluster

Aqui , os Clusters evoluem em progresso decrescente ao tamanho das palavras, medido em nmero de letras. A Relevncia das palavras nos clusters tem uma evoluo como em uma progresso decrescente. Os Clusters crescem no tamanho do conjunto por agregados de palavras com tamanho decrescente: Exemplo: 1: 3: 7 : 12 : 15 - clusters contendo 1 palavra de 20 letras , 3 de 17 letras, 12 de 14 letras, 15 de 9 letras, assim em diante. As palavras se clusterizam , em importncia, em uma progresso decrescente ao seu tamanho em letras. Existe, ainda, uma diferente articulao da morfologia do texto para diferentes reas do conhecimento. A tabela 3 a seguir, mostra estas diferenciaes, fatos que necessitam, ainda, melhor estudo: Tabela 3 - COMPORTAMENTO DA PALAVRAS NA ESCRITURA DE INFORMAO
REA caractersticas do sub-cdigo lingstico -difcil delimitao do sub-cdigo -Extrema liberdade semntica. - discurso longo, difuso e informal com conceitos interligados Lxico de edio do texto -estruturas sintticas complexas -excesso de sinonmia, metforas, conectores e plurais - linguagem sem controle ou inibio Cadeia de pensamento na edio do texto -fluncia de idias e palavras muita independncia em elaborar significados -re-evocao de palavras da memria com grande liberdade conceitual - pensamento divergente na recognio dos conceitos INTERMEDIRIAS -cdigo mais formalizado e visvel Tipo: sociais aplicadas -condies semnticas ( com um aporte controladas do discurso tecnolgico) - discurso -estruturas sintticas elaboradas - vocabulrio com alguma inibio das figuras de linguagem -alguma independncia na elaborao dos significados -re-evocao de conceitos da memria com orientao ao assunto - predomina o pensamento

LEVES Tipo: cincias humanas e sociais

semi-tcnico

orientado a recognio convergente dos conceitos na memria

DURAS Tipo: cincias exatas e da natureza

-cdigo bastante formalizado e delineado - discurso tcnico e direcionado

-estruturas sintticas simples -vocabulrio formal e especifico - bastante inibio quanto as figuras de linguagem

-pouca fluncia de idias e conceitos -preciso na re-evocao dos conceitos da memria -pensamento altamente convergente na re-evocao das palavras

Conceito[24]; Pensamento Convergente[25]; Pensamento Divergente[26]

Considerando o eixo vertical igual a quantidade de palavras e o horizontal como freqncia das palavras, quanto mais o texto se enquadra na rea leve, mais a curva se acentua. Quando o texto caminha na direo da rea dura a curva vai tendendo ao eixo horizontal [18]

Consideraes sobre os resultados A anlise precedente indica que, existindo um conjunto de condies tericas e operacionais coerentes e consistentes e um agente de software apropriado tm-se um poderoso instrumental estratgico para anlise , monitoramento e controle de contedos informacionais diversos. Diferente de uma simples contagem de palavras em um texto ou uma famlia de textos, sem um direcionamento lgico e uma base terica e conceitual de anlise , prope-se um estrutura terica que fundamente e, direcione esta operao pratica e fundamenta com raciocnio adequado uma anlise especfica. Trabalha-se com este modelo para verificar desde condies estratgicas dos mais diversos tipos de monitoramento at a gesto da informao para estabelecer zonas de qualidade intensa[27] em um determinado contexto informacional. Do ponto de vista da gesto e monitoramento da informao em seus estoques a informao relevante e prioritria pode ser zoneada. Na elaborao de uma poltica de compresso cabe ao administrador do estoque a responsabilidade de selecionar indicadores representativos desta compactao, que pode ser feita automaticamente. O Grfico a seguir, adaptado de Jakobiak[28], mostra o posicionamento das zonas de boa informao, informao dispersiva e informao em excesso em um estoque de informao: ZONAS DE QUALIDADE DA INFORMAO

Com a mesma inteno tem-se a tabela 4, 2x2, ponderando relevncia e prioridade


Relevncia A DOCUMENTOS RELEVANTES E PRIORITRIOS ZONA 1 Prioridade C DOCUMENTOS NO RELEVANTES MAS PRIORITRIOS ZONA 3 B DOCUMENTOS RELEVANTES MAS NO PRIORITRIOS ZONA 3 D DOCUMENTOS NO RELEVANTES E NO PRIORITRIOS ZONA 2

A zona de excelncia seria a zona 1, que poderia ainda ser fragmentada em diferentes nveis de qualidade. A zona 2 seria descartada para quele receptor ou grupo de receptores semelhantes. As zonas C3 e B3 necessitam de um trabalho de identificao estratgica junto ao grupo ou a estratgia de monitoramento. A zona B3 pode indicar, por exemplo, que uma informao sobre turismo pode ser prioritria para um planejamento de frias no ms de dezembro, mas no relevante no tempo atual. A zona C3 ou pode indicar que existem informaes sem utilidade (no relevantes) naquele tempo e contexto por falta da abrangncia ou completeza ou por serem marginais ao foco atual do receptor que lhes atribui prioridade potencial pela possibilidade de uma adio de valor no futuro. Seguramente, a possibilidade de uma partio dos estoques de informao com a criao de contextos informacionais de excelncia para o receptor traria a facilidade de amenizar a tenso cognitiva[29] dos usurios de informao. Uma boa poltica, entendida como um conjunto de procedimentos para execuo de uma ao de monitoramento da informao com benefcios para sua gesto e controle, com melhoramentos para o receptor e sua qualidade de interatuao com conjuntos de documentos. Interatuao, apropriao, conhecimento. No caso de uma poltica , entendida como a arte de controle no governar com, prticas de governo de interesse

e favorecimento do Estado, ento, um monitoramento desse tipo pode ser tornar um perigoso instrumento de controle das liberdades individuais, da privacidade do sujeito e de seus escritos. Notas [1] Nesta notas muitos conceitos foram definidos. Preciso indicar que so conceitos vlidos para o contexto deste trabalho. Como diria Derrida, so mais uma aventura de meu olhar que uma maneira de questionar o objeto em si. [2] O presente artigo fruto de pesquisa realizado com auxlio da Coordenao de Cincias Humanas e Sociais do CNPq. [3] Estoques de informao: conjunto de itens de informao agregados segundo critrios de interesse de uma comunidade informacional. [4] Estrutura: forma de organizao de elementos, onde estes adquirem sentido apenas enquanto fazendo parte de um conjunto com sentido de ordenao lgica e racionalidade. [5] Compresso semntica: ao ou efeito de uma movimento que comprime um corpo, tendendo a aproximar, uma das outras, as partes que o compem; pretende que determinadas palavras existindo no texto em condies morfolgicas demarcadas e especiais podem possuir condies de qualidade, quando em conjunto, que podem ser explicadas por condies especficas de representao e compreenso do contedo de todo o texto. Uma destas condies de compresso semntica ou de substituio representativa seria um grupo de palavras representando a relevncia e a prioridade pelo vis temtico do contedo. Existem ferramentas e modelos, que de modo totalmente automatizada podem exercer esta compresso semntica em um texto, analisando e retirando estas palavras parta uso estratgico. [6] Estoques de informao: conjunto de itens de informao agregados segundo critrios de interesse de uma comunidade informacional. [7] Estrutura: forma de organizao de elementos, onde estes adquirem sentido apenas enquanto fazendo parte de um conjunto com sentido de ordenao lgica e racionalidade. [8] Assimilao: misto de sensibilidade e percepo e apropriao, na assimilao o receptor aceita a informao reconhecendo-a como tal , e esta atua para alterar o seu estoque de saber por acrscimo, por modificao ou sedimentao de saber j estocado. [9] Conhecimento: organizado em estruturas mentais por meio das quais o sujeito assimila o meio (informao). Conhecer um ato de interpretao, uma assimilao do objeto (informao) pelas estruturas mentais do sujeito. Estruturas mentais no so pr-formatadas no sentido de serem programadas nos genes. As estruturas mentais so construdas pelo sujeito sensvel, que percebe o meio. A Produo ou gerao de conhecimento uma reconstruo das estruturas mentais do indivduo atravs de sua competncia cognitiva, ou seja, uma modificao em seu estoque mental de saber acumulado, resultante de uma interao com uma informao. O conhecimento seria operado atravs de uma ao de cognio. [10] Essncia: ao com vigor de propsitos; onde o fenmeno desenvolve a fora de sua energia. Escreve-se o E em maiscula para diferenciar de essncia como natureza. [11] Cognio: conjunto dos processos mentais subjetivos usados quando da aquisio de conhecimento; relaciona-se s caractersticas funcionais e estruturais da representao de um saber, um objeto, um procedimento, fatos e idias. A cognio sendo um ato de conhecimento, representa as atividades relacionadas como ateno, criatividade, memria, percepo. Um enfoque cognitivista considera a mente humana como um sistema de estruturado de informao, um estoque de informao organizado.A entrada de nova informao analisada pela mente do receptor, significados so evocados e comparados na memria, e se processa a confirmao de um conhecimento j existente, a modificao de um conhecimento j existente ou a aceitao da informao como novo conhecimento. Em qualquer caso cumpre-se uma cerimnia da informao operando intencionalmente sobre o conhecimento. [12] Texto: qualquer inscrio de informao em uma base que a aceite e a mantenha, sendo o papel a base mais comum e tambm a mais conservadora. Pode estar em diferentes bases e em diversas linguagens de inscrio.

[13] Foucault,M., O que um autor, 3 edio, Passagens, Lisboa, 1992. [14] Derrida, J., A Escritura e a diferena, 2 edio, Perspectiva, So Paulo, Brasil, 1995. [15] Lancashire, I. , Uttering and Editing: Computational Text Analysis and Cognitiuve Studies in Authorship, Texte et Informatique ,n. 13/14, (1993): pp 173-218 [16] Ong, W.J. , Orality and Literacy:The Technologizing of the Word, Terence Hawkes, New York, 1988 [17] Tendncia estabilidade do meio interno do organismo. Propriedade auto-reguladora de um sistema ou organismo que permite manter o estado de equilbrio de suas variveis essenciais ou de seu meio ambiente. [18] Relevante: tudo aquilo que possui a condio de utilidade, que a qualidade das coisas materiais e imateriais em satisfazer nossas necessidades e desejos. [19] Prioridade: qualidade do que est em primeiro lugar; o que antecede aos outros em tempo, lugar, serie ou classe quando da prtica de alguma coisa. Em nossa anlise a prioridade se associa a individualidade de um texto, ao seu vis. [20] Elasticidade tempo (E t): variaes relativas entre as condies da relevncia e prioridade (neste caso) em decorrncia da passagem do tempo. No caso da relevncia inelstica, indica sua maior permanncia com o passar do tempo. A prioridade elstica indica uma maior variao em relao ao tempo. [21] Definido aqui como a perodo de tempo em que a informao permanece relevante para um determinado usurio, considerando sua permanncia na rea, contexto informacional e contexto reflexivo e profissional; pode variar no entorno de (1-8) anos; [22] No Curso de Cincia da Informao, no Rio de Janeiro, em 2001, foi oferecida a disciplina "Estrutura e Fluxos de Informao" para alunos de doutorado e mestrado que, durante um semestre, discutiram as bases tericas e submeteram a prova o modelo de trabalho exposto neste trabalho. Deste curso participaram: Carla Tavares, Cldece Nbile Diniz, Cludio Starec, Eugenia Vitria Loureiro, Jaqueline de Almeida Netto, Jose Ricardo Ozrio Jardim, Leila Beatriz Ribeiro, Marta Catarina Feghali, Mauro Behring, Michell Xavier da Costa, Mnica Cristina Santiago, Nilton Bahlis dos Santos, Palmira Moriconi, Suzana Tavares Blass, Vera Mangas da Silva. Estes alunos produziram na disciplina excelente material complementar, que aqui aproveitamos. [23] Rendimento decrescente em escala: termo utilizado em economia; ao se aumentar uma quantidade de produo, em quantidades definidas de determinado elemento , existe uma perda quantitativa ou qualitativa , em quantidades crescentes, na produo total do produto que se est produzindo. [24] Conceito: a menor unidade de uma estrutura significante, com condies representacionais; para ns o mesmo que uma palavra. [25] Pensamento convergente: aquele em que a seleo das palavras do texto se direciona a uma cadeia de ligaes precisa, determinada, convencional, pontual. [26] Pensamento divergente: aquele em que a seleo das palavras para o texto caminha em diferentes direes como que pesquisando livremente os meandros das figuras de elaborao do estilo no momento da edio da informao. [27] Zonas de qualidade intensa: parties de um estoque de informao, onde os textos estejam contextualizados por qualidade de relevncia e por condies das propriedades de sua singularidade, seu vis. Zona de relevncia com escalonamentos de preferncia duma coisa que deve ser posta em primeiro lugar, numa srie ou ordem. [28] JAKOBIAK, F. Matriser l'Information Critique, Les Editions Organization, Paris, 1988. [29] Tenso cognitiva representa o tempo despendido pela informao na procura necessria e o esforo mental de um receptor para apropriar a informao como conhecimento. Devido alta exposio atual informao,

esta tenso considervel e todos os instrumentos para sua reduo representam uma eficincia no processo cognitivo. [*]Desenvolvimento de um software especfico Existe em nvel internacional uma quantidade razovel de instrumentais para anlise computacional da linguagem natural, para as mais diversas finalidades. Entretanto, existem trs problemas com os softwares j desenvolvidos e disponveis comercialmente, ou do tipo freeware: so elaborados para um estudo especifico de um determinado pesquisador e no atendem necessidade de outro estudo especfico; b) seu desenvolvimento se direciona para a lngua para a qual haviam sido programados, no reconhecendo particularidades do portugus, tais como acentuao e cedilha; c) grande parte destes instrumentos havia sido projetado para anlise literria, como poesia e fico, e no suportam adequadamente a literatura de cincia e tecnologia. Foi indispensvel construir um software especfico para o desenvolvimento de nossa pesquisa. Para tanto, tivemos a colaborao da pesquisa do Dr. Luiz Carlos Paternostro, professor da UFRJ, que desenvolveu um instrumento chamado de Protexto. O Protexto, ainda em desenvolvimento, foi projetado para as especificidades do nosso trabalho, mas ser um software de carter geral para o estudo do processamento do portugus como linguagem natural, seguramente um dos poucos existentes no Brasil, com as caractersticas de um instrumento orientado para o usurio, fcil de operar e conversacional. Referncias Bibliogrficas 1. Arendt, H , A Vida do Esprito- O pensar, o querer, o julgar , Relume-Dumara, Rio,1991. 2. Barreto A. de A. "Padres de assimilao da informao - a transferncia da informao visando a gerao do conhecimento", Relatrio apresentado ao CNPq em fevereiro de 2000. Publicado como "O Rumor do Conhecimento" pela Revista So Paulo em Perspectiva, v 12, n. 04, Fundao Seade, So Paulo. 3. Barreto A. de A. "A Transferncia de Informao, o Desenvolvimento Tecnolgico e a Produo de Conhecimento", IBICT/ECO, 1993 ( Relatrio Apresentado ao CNPq). 4. Barreto, A. de A. "A Informao e o Cotidiano Urbano", IBICT/ECO, 1991 (Relatrio apresentado ao CNPq). 5. Barreto, A. de A. "Perspectivas da Cincia da Informao", Revista de Biblioteconomia de Braslia, v. 21, n.2, 1997. 6. Barreto, A. de A. "A Questo da Informao", So Paulo em Perspectiva, v. 8, n. 4 ,1994, p. 3-8, Fundao Seade, So Paulo. 7. Barthes, R, "A morte do autor", em O Rumor da Lngua, Edies 70, Lisboa ,1987. 8. Bloor, D , Poppers Mystyfication of Objective Knowledge, Science Studies , v 4, pp 65-76, 1974. 9. Boulding, K , Knowledge and Life in the Socity, University of Michigan Press, USA, 1960. 10. Bourdieu, P , O Poder Simblico, Bertrand, Rio,1989. 11. Butcher, H J , A Inteligncia Humana, Perspectiva, So Paulo, 1968. 12. Farradane, J , Relational Indexing and Classification in the Light of Recent Experimental work in Psychology, Information Storage and Retrieval, vol 1, pp 3-11, 1963. 13. Farradane, J, Knowlwdge, Information and information Science, Journal of Information Science,v2,n2,1980. 14. Farradane, J, The Nature of Information, Journal of Information Science, v 1 , n 3, 1979. 15. Franck, S e Mehler, J (ed.), Cognition on Cognition, MIT Press, USA, 1994. 16. Gardner, H ,The Minds New Science : A history of the cognitive revolution, Basic Books, USA, 1987.

17. Guilford,J P , Three Faces of Intellect, Americam Psychologist, v. 14 , n. 8, 1959. 18. Habermas, J , Conhecimento e Interesse, Guanabara, Rio, 1987. 19. Habermas, J , Cincia e Tcnica Como Ideologia, Edies 70, Lisboa, 1987. 20. Heidegger, M , Discurso sobre o Humanismo, Tempo Brasileiro, Rio, 1962. 21. Jakobson, R. , Lingstica e Comunicao , Cultrix, So Paulo, 1993 - Coletnea de trechos selecionados de Roman Jakobson. 22. Levy, P , A Mquina Universo, Atmed, Porto Alegre, 1998 23. Luninn L F (Ed), "Perspectives in Knowledge Utilization", Jasis (Special Issue), v44, n4, 1993 24. Mannheim, K. , Conhecimento e Sociedade 25. Ricoeur, P , Teoria da Interpretao , Edies 70, 1976, Lisboa. 26. Simon, H. "Literary Criticism: A Cognitive Approach", Stanford Humanities Review, SEHR v.4, n. 1, "Constructions of the Mind", updated in 1995. 27. Simon, H. The Sciences of the Artificial, 3rd ed., Cambridge, MA, MIT Press, 1996. 28. Wittgenstein, L. Zettel (Fichas) , Edies 70, Lisboa, 1981

Sobre o autor / About the Author: Aldo de Albuquerque Barreto aldoibct@alternex.com.br Pesquisador Titular Mct