Você está na página 1de 371

UNIVERSIDADE FEDERAL DE MINAS GERAIS

ESCOLA DE CINCIA DA INFORMAO


Programa de Ps-Graduao em Cincia da Informao

MINERAO DE TEXTOS E GESTO DO CONHECIMENTO:


Aplicao na Experincia Operacional em Gerao de
Energia Nuclear nas Usinas de Angra I e II

ANDR MOREIRA PINTO

BELO HORIZONTE
2007

Andr Moreira Pinto

MINERAO DE TEXTOS E GESTO DO CONHECIMENTO:


Aplicao na Experincia Operacional em Gerao de
Energia Nuclear nas Usinas de Angra I e II

Tese apresentada ao Programa de


Ps-Graduao
em
Cincia
da
Informao da UFMG, como requisito
parcial para a obteno do titulo de
doutor em Cincia da Informao.
Orientao: Professor Doutor Jorge
Tadeu de Ramos Neves

BELO HORIZONTE
ESCOLA DE CINCIA DA INFORMAO DA UFMG
2007

DEDICATRIA

minha esposa, Leda, doce


presena luminosa em minha
existncia, pelo amor, pelo
carinho, pela dedicao e
pacincia e, sobretudo, por
ser quem : pessoa to
especial que escolhi para
compartilhar a minha vida.
minha filha, Beatriz,
presente maior do amor de
minha esposa e que, to
pequenininha nesse momento
de recm-nascida, me faz to
grande e to feliz como
pessoa.

Aos meus pais, pelo amor e


carinho sem limites.

AGRADECIMENTOS
Sobretudo a Deus, por me permitir existir e iluminar e guiar a minha vida.
Ao meu orientador, Prof. Dr. Jorge Tadeu de Ramos Neves, pela orientao, incentivo,
confiana a mim dedicados e pela competncia a ser referenciada.
Aos meus irmos, Raquel e Marcos e meu sobrinho Rafael, pela pacincia.
Professora Regina Ftima Gibson Gonalves, pelos ensinamentos valiosos, pela
amizade, parceria e carinho fraternal.
Ao Marcelo Gibson de Castro Gonalves, pela amizade, companheirismo e dedicao
no esforo em converter os modelos tericos de minerao de dados em rotinas
computacionais complexas, contribuindo decisivamente para realizao dos
experimentos realizados nessa Tese.
Ao Sr. Luiz Celso de Oliveira, funcionrio da ELETRONUCLEAR, Coordenador da
Experincia Operacional, pela receptividade carinhosa, pela competncia perspicaz em
perceber a potencialidade do conhecimento humano e do trabalho desenvolvido nessa
Tese de Doutorado, bem como pelo acolhimento nas vrias idas a Angra dos Reis.
Aos funcionrios da ELETRONUCLEAR que contriburam com este trabalho,
especialmente os Srs. Carlos Maurcio Cruz Belo e Ricardo Lowe Stukart pelo apoio no
grupo de pesquisa.
Ao Padre Benjamim Carreira de Oliveira (in memoriam) pelo exemplo e amizade
inesquecveis e por ter despertado em mim o gosto e a busca pelo conhecimento.
Ao copanheiro Lui e copanheira Luna que apesar das quatro patas me
mostraram nas noites e madrugadas de escrita desse trabalho a lealdade e a fidelidade de
uma amizade incondicional.
Aos companheiros e colegas de trabalho da Faculdade Cenecista de Sete Lagoas e do
Centro de Incluso Digital e Social, pelo incentivo e pacincia.
ELETRONUCLEAR, pela abertura das portas ao meu trabalho, pela confiana em
mim depositada e pela receptividade s minhas idias e propostas.
Aos professores, funcionrios e colegas da ECI/UFMG que contriburam com o
presente trabalho.
Universidade Federal de Minas Gerais, pela oportunidade de nela realizar tantas
conquistas, descobrir tantos conhecimentos e comprometer- me com a transformao da
sociedade brasileira que a mantm e que me proporcionou oportunidades relevantes
atravs dessa Instituio para que eu pudesse nela realizar minha Graduao, meu
Mestrado e agora, meu Doutorado.

A Mudana e o Conhecimento
No tenho dentro de mim um ncleo pequeno e duro, uma esttua completamente
formada, real e autntica, permanente e fixa.
Ser pessoa implica um processo dinmico. bom que quanto mais conhecermos a vida,
mais podemos mudar. E sempre podemos conhecer mais. E mudar mais ainda.
Por outras palavras, se me conheceu ontem, no v pensar que a mesma pessoa que
est a encontrar hoje. Experimentei mais da vida, encontrei mais coisas nas pessoas que
amo, sofri e supliquei, e estou diferente.
Nem tente atribuir- me um valor mdio fixo e irrevogvel, porque estou atento o tempo
todo, aproveitando cada oportunidade do meu dia-a-dia.
Ento quando me encontrar, aproxime- se de mim com um sentido de quem pergunta a
meu respeito. Estude o meu rosto, mos e voz, procurando os sinais de mudana.
Pois certo que mudei.
(Sabedoria de um autor desconhecido)

RESUMO
O conhecimento um diferencial importante para que as organizaes alcancem seus
objetivos. Ele possui uma dimenso tcita e uma dimenso explicita, sendo que a
elaborao de documentos e relatrios, artigos e relatos livres so formas acessveis
maioria das pessoas para tornar explicito o conhecimento que possuem. Nas duas
ltimas dcadas, especialmente aps a intensificao do uso de mdias digitais e do uso
da Internet as organizaes constataram o rpido e elevado crescimento de seus acervos
de documentos textuais em formato digital. Em organizaes que empregam uso de
conhecimento intensivo em suas operaes e gesto os documentos textuais possuem
uma expressividade enquanto objetos potencialmente portadores de informao e
conhecimento ainda maior. Entretanto, extrair e empregar esse conhecimento um
grande desafio, sobretudo quando a organizao possui porte elevado e grandes acervos.
A descoberta de conhecimento em bases textuais ou simplesmente minerao de
textos um relevante recurso para explorar o universo do conhecimento embutido em
colees textuais digitais, permitindo construir vises estratgicas e relevantes a partir
do tratamento dessas bases com diferentes recursos computacionais e da Cincia da
Informao para apoiar a Gesto do Conhecimento em organizaes, especialmente
aquelas de conhecimento intensivo. Produzir informao relevante e gerar
conhecimento novo e estratgico o grande desafio da minerao de textos. A presente
Tese estuda tais questes a partir de avaliao da realidade organizacional de empresa
do setor de energia eltrica de fonte nuclear: a ELETRONUCLEAR, uma vez que esta
possui grandes bases de dados textuais relativas ao conhecimento de sua atividade fim
ou seja: a Experincia Operacional. Foi utilizada a ferramenta de minerao de textos
Difbrain, constatando-se sua adequao gerao de conhecimento novo e relevante
atravs da anlise sinptica dos conjuntos de documentos envolvidos. Considerando
uma base de documentos textuais digitais a ferramenta realizou leituras inteligentes
desses textos, com anlise semntica, agrupamentos de textos comuns e inferncias
avanadas, utilizando para isso recursos metodolgicos e computacionais vinculados s
reas de Recuperao da Informao e Inteligncia Artificial. Tecnologias inteligentes
so necessrias para acelerar a anlise, examinando de forma automatizada os
documentos e aferindo o que efetivamente significativo para o usurio. A partir da
anlise sinptica de um grupo de documentos foi possvel descobrir relaes
importantes entre eles e que no seriam percebidas sem o uso da descoberta de
conhecimento em bases textuais.
Palavras-Chave: Minerao de textos, descoberta do conhecimento em textos, text
mining, gesto do conhecimento, recuperao da informao, inteligncia artificial,
gesto da experincia operacional, conhecimento em energia nuclear.

ABSTRACT
The knowledge is important differential for the organizations to achieve its aims. It to
have two dimensions: tacit and explicit. The documents, reports, releases, articles and
free texts are accessible forms to most of persons for become explicit the yours topics of
knowledge. In last two decades, especially after intensive use of digital mdia and
Internet technologies, the organizations noticed the quickly and great growth of digital
text databases. In the organizations that to use great level of knowledge in the yours
operations and management, the text documents to have great value while objects of
information and knowledge. However, to extract and to use this knowledge is great
match, especially in large databases of documents. The knowledge discovery in text
databases text mining is one powerful resource to explore the universe of knowledge
enable in digital textual collections and can be to build strategic views of reality
elements to set of texts. This is achieving with computation resources and approaches of
Information Science for support Knowledge Management in organizations, especially
those use of intensive knowledge. To produce relevant information and to generate new
and strategic knowledge is the great aim of text mining. This thesis studies these
questions, to set analysis of organization reality ELETRONUCLEAR, enterprise of
power energy of nuclear fonts, that to have large database of digital textual document to
concern of activities of generate nuclear energy. Difbrain, is text mining software that
has been use in process text analysis of ELETRONUCLEAR text databases, to doing
intelligent reading of documents and extracting relationships, patterns, relevant contents
in texts, across semantic analysis, use of Information Retrieval and Artificial
Intelligence technologies in synoptic studies about of set of documents.
Key-words : Text mining, knowledge discovery in text, knowledge management,
information retrieval, artificial intelligence, operational experience management,
nuclear power knowledge.

LISTA DE FIGURAS

Figura 1: A Gesto do Conhecimento sob Quatro Prismas...................................... 21


Figura 2 : Dos dados sabedoria.................................................................................43
Figura 3: Sinopse das Idias de Hessen sobre a Essncia da Filosofia.....................52
Figura 4: o processo de equilibrao majorante.........................................................59
Figura 5: Duas dimenses de criao do conhecimento.............................................64
Figura 6: Espiral do Conhecimento.............................................................................69
Figura 7: Espiral de criao do conhecimento organizacional..................................70
Figura 8: Quatro categorias do conhecimento............................................................78
Figura 9 : Diferentes Nveis de Compartilhamento do Conhecimento.....................81
Figura 10: O conceito de sistema de BERTALANFFY...........................................110
Figura 11: Componentes de um Sistema de Informao.........................................112
Figura 12: Bancos de dados armazenando dados.....................................................122
Figura 13: As Duas Faces de um Sistema de Recuperao da Informao...........120
Figura 14: Funes de um Sistema de Recuperao da Informao......................130
Figura 15: Viso Lgica do Documento....................................................................134
Figura 16: O Processo de Recuperao de Informaes..........................................135
Figura 17: As idias de preciso e revocao............................................................140
Figura 18: Tarefas do Usurio no uso de um SRI....................................................144
Figura 19: Uma Taxonomia dos Modelos de Recuperao da Informao...........148
Figura 20: O Espao Vetorial ....................................................................................151
Figura 21: Uma representao da Indexao Semntica Latente..........................154
Figura 22: Representao de uma rede bayesiana simples.....................................157
Figura 23: Representao documental com listas de indexao.............................159
Figura 24: Representao da estrutura de um documento ....................................161
Figura 25: Representao Para Entendimento de uma Rede Neural.....................176
Figura 26: O processo de Descoberta de Conhecimento em Bases de Dados........184
Figura 27: O Balanced Scorecard..............................................................................204
Figura 28: O modelo multidmensional de um negcio.............................................210
Figura 29: Modelagem Muldimensional de Dados...................................................212
Figura 30: Fluxo operacional da Gesto Eletrnica de Documentos......................220
Figura 31: Processo de integrao entre aplicaes.................................................221
Figura 32: Relacionamento Interativo do Usurio Com Entradas e Sadas..........233
9

Figura 33: Questes solucionadas por minerao de textos....................................235


Figura 34: Modelo Genrico das Etapas de Minerao de Textos.........................237
Figura 35 (a): Fisso Nuclear.....................................................................................252
Figura 35 (b): A reao em Cadeia............................................................................255
Figura 36: Planta de Usina Ncleo-Eltrica..............................................................258
Figura 37: Gerao de energia eltrica a partir de um reator PWR......................259
Figura 38: Distruibuio dos Empregados por Idade na ELETRONUCLEAR...271
Figura 39: Etapas da Metodologia de Gesto do Conhecimento do CRIE............275
Figura 40: Estrutura genrica de competncias de uma atividade .........................277
Figura 41: Estrutura de competncias para Engenharia de Materiais..................278
Figura 42: Exemplo de Mapeamento do Capital de Relacionamento....................279
Figura 43: Proceso de experincia operacional como recomendado pela IAEA...290
Figura 44: Interao do Capital Intelectual com Solues de TI............................295
Figura 45: GED, Automao de Processos e Portal................................................297
Figura 46: Conceito do EPRI : PIM - Plant Information Management...............299
Figura 47: Processo de Busca e Navegao Bsicas da Soluo de Portal.............300
Figura 48: Estrutura Geral da GEA.T......................................................................308
Figura 49: Representao do Processamento...........................................................319
Figura 50: Tela DifBrain Escolhendo os tipos de cluster (a)................................321
Figura 51: Tela DifBrain Escolhendo os tipos de cluster (b)................................321
Figura 52: DifBrain gera resumo automtico de um documento...........................322
Figura 53: Indexao Semntica Latente na ELETRONUCLEAR.......................325

10

LISTA DE ABREVIATURAS E SIGLAS


AIEA Agncia Internacional de Energia Atmica
CNEN - Comisso Nacional de Energia Nuclear
ELETRONUCLEAR Eletrobrs Termonuclear S.A.
GC Gesto do Conhecimento
IA Inteligncia Artificial.
INPO (Institute of Nuclear Power Operators).
KDD Knowledge Discovery in Databases
KDT Knowledge Discovery in Text
NRC United States Nuclear Regulatory Commission
ORO Ocorrncia de Relato Obrigatrio
PLN Processamento da Linguagem Natural
RDO Relatrios de Desvio Operacional RDO
RE Relatrios de Evento RE
RES Relatrios de Evento Significante RES
SRI Sistema de Recuperao da Informao
UFMG Universidade Federal de Minas Gerais
WNA Word Nuclear Association (Associao Nuclear Mundial)
WANO (Word Association of Nuclear Operators)

11

SUMRIO

PARTE I INTRODUO

1 CONSIDERAES INICIAIS.................................................................................19

2 MOTIVAO E OBJETIVOS.................................................................................22
2.1 Justificativa..............................................................................................................22
2.1.1 Aspectos Preliminares..........................................................................................22
2.1.2 Problemas e Desafios da Informao Textual ................................................22
2.2 Problema de Pesquisa e Pressupostos....................................................................23
2.2.1 Problema de Pesquisa...........................................................................................23
2.2.2 Pressupostos..........................................................................................................24
2.3 Objetivos...................................................................................................................25
2.3.1 Objetivo Geral.......................................................................................................25
2.3.2 Objetivos Especficos ...........................................................................................25

3 METODOLOGIA.......................................................................................................27
3.1 Viso Geral ..............................................................................................................27
3.2 A Pesquisa Ao....................................................................................................31
3.3 A Pesquisa Experimental e O Projeto de Experimentos......................................34
3.4. Grupo Focal.............................................................................................................36
3.5 Processo Interativo e Desenvolvimento de Software e a Orientao a Objetos......38
3.6. Consideraes Finais Sobre o Emprego de Metodologia....................................40

PARTE II REFERENCIAL TERICO

4 GESTO DO CONHECIMENTO ..........................................................................42


4.1 Aspectos Preliminares e Definies. ......................................................................42
4.1.1 Dados, Informao, Documento e Conhecimento..............................................43
4.1.1.1 Dados...................................................................................................................44
4.1.1.2 Informao.........................................................................................................45
12

4.1.1.3 Conhecimento.....................................................................................................47
4.1.1.4 Documento..........................................................................................................48
4.1.2 A Questo da Gesto do Conhecimento ............................................................50
4.2. Prisma Filosfico-Cognitivo...................................................................................51
4.2.1 Face Filosfica.......................................................................................................51
4.2.2 Face Cognitiva.......................................................................................................55
4.2.2.1 Behaviorismo e Gestalt......................................................................................55
4.2.2.2 O Desenvolvimento do Conhe cimento na Perspectiva Construtivista..........56
4.2.2.3 Pensamento, Linguagem e Conhecimento Tcito e Explcito........................60
4.3. Prisma Organizacional ..........................................................................................62
4.3.1 Uma abordagem funcional e organizacional do conhecimento........................62
4.3.2 Codificao, Taxonomia, Aplicabilidade e Transferncia................................74
4.3.2.1 Codificao e Taxonomia do Conhecimento...................................................74
4.3.2.2 Aplicabilidade e Transferncia do Conhecimento..........................................75
4.4 Gesto do Conhecimento sob o Prisma da Informao e Tecnologia ................81
4.5. Aproximaes Conceituais dos Pris mas Cognitivo e Organizacional................86
4.6. O Prisma do Fator Humano no Conhecimento...................................................88
4.7. Uma apreciao crtica gesto do conhecimento..............................................91
4.8 Avaliao e Posicionamento Sobre as Crticas Gesto do Conhecimento.......98
4.9 Redes Sociais e Redes de Conhecimento..............................................................100
4. 10 Conhecimento e Memria Organizacional.......................................................100
4.11 Desafios e Perspectivas em Gesto do Conhecimento......................................101
4.12 Concluso do Captulo........................................................................................106

5 SISTEMAS DE RECUPERAO DA INFORMAO.....................................108


5.1 Consideraes Preliminares..................................................................................108
5.2 O Conceito de Sistema...........................................................................................109
5.3 Sistemas de Informao e Sistemas de Recuperao da Informao...............111
5.4 O Paradigma da rea de Banco de Dados e Sistemas Vinculados...................117
5.4.1 A Perspectiva do Modelo Relacional................................................................120
5.5 O Paradigma da Recuperao de Informao....................................................123
5.5.1 Viso Geral..........................................................................................................123
5.5.2 Conceito e Processos dos Sistemas de Recuperao da Informao..............127
5.5.3 A Face da Gesto Documental.. ........................................................................129
13

5.5.3.1 Representando os Documentos.......................................................................131


5.5.3.2 Viso Lgica dos Documentos no Processo de RI.........................................133
5.5.3.3 Processo de Recuperao da Informao......................................................134
5.5.3.4 Armazenando os Documentos........................................................................136
5.5.4 A Face da Gesto das Relaes com o Usurio................................................137
5.5.4.1. A Questo da Relevncia e da Atinncia no Atendimento ao Usurio......137
5.5.4.2 A Necessidade de Informao........................................................................ 140
5.5.4.3 A Tarefa da Busca...........................................................................................143
5.5.4.4 A Tarefa da Navegao...................................................................................145
5.6 Modelos de Recuperao da Informao............................................................146
5.6.1 Modelos Clssicos...............................................................................................148
5.6.1.1 Modelo Booleano.............................................................................................149
5.6.1.2 Modelo Vetorial...............................................................................................150
5.6.1.3 Modelo Probabilstico.....................................................................................155
5.6.2 Modelos Estruturados de Recuperao em Textos.........................................158
5.6.2.1 Listas No-Sobrepostas...................................................................................159
5.6.2.2 Proximidade de Ns.........................................................................................160
5.6.2.3 Recuperao por Passagens ............................................................................161
5.6.3 Modelos por Aglomerados e Contextual..........................................................162
5.6.3.1 Modelo Por Aglomerados...............................................................................162
5.6.3.2 Modelo Contextual..........................................................................................163
5.7 Anlise das Taxonomias dos Modelos e Perspectivas.........................................165

6 SISTEMAS INTELIGENTES E PROSPECO DE CONHECIMENTO.......167


6.1 Consideraes Iniciais...........................................................................................167
6.2 Conceito de Inteligncia Artificial e de Sistemas Inteligentes...........................169
6.3 Viso Geral de Abordagens Tcnicas Para Sistemas Inteligentes....................172
6.3.1 Aprendizado de Mquina..................................................................................172
6.3.2 Algoritmos Genticos.........................................................................................174
6.3.3 Lgica Difusa......................................................................................................175
6.3.4 Redes Neurais Artificiais....................................................................................175
6.3.5 rvores de Deciso.............................................................................................177
6.3.6 Sistemas Hbridos ..............................................................................................177
6.3.7 Sistemas Frmicos (Ant Systems) .....................................................................178
14

6.3.8 Minerao de Dados, OLAP e Data Warehousing...........................................179


6.4 Sistemas Dedicados Descoberta de Conhecimento..........................................179
6.4.1 Viso Geral..........................................................................................................179
6.4.2 O Processo de Descoberta de Conhecimento em Bases de Dados.................182
6.4.3 Tarefas de Minerao de Dados........................................................................184
6.4.4 Estratgias de Descobe rta de Conhecimento na Busca Pelo Usurio............186
6.4.5 Abordagens Tecnolgicas Utilizadas em Descoberta de Conhecimento em
Bases de Dados.............................................................................................................187
6.5 Processamento da Linguagem Natural PLN....................................................187

7 TECNOLOGIA DA INFORMAO....................................................................193
7.1 Consideraes Preliminares..................................................................................193
7.2 Informao Estratgica no Suporte Gesto do Conhecimento......................201
7.2.1 Data Warehousing , Minerao de Dados e Mine rao de Textos.................205
7.2.1.1 Data Warehousing Processo de Gerao de Informaes Estratgicas...206
7.2.1.2 Minerao de Dados (Data Mining)...............................................................212
7.3 Computao Colaborativa em Gesto do Conhecimento..................................214
7.4 Gesto Eletrnica de Documentos GED...........................................................217
7.5 Portais Corporativos.............................................................................................220
7.5.1 Integradores de Aplicaes Corporativas........................................................221
7.5.2 Os Portais............................................................................................................222

8 A MINERAO DE TEXTOS...............................................................................226
8.1 Consideraes Preliminares..................................................................................226
8.2 Necessidades de Textos do Usurio......................................................................229
8.3 Conceito e Benefcios.............................................................................................229
8.4 Implementao de Software de Minerao de Textos........................................232
8.5 Facilitadores e propiciadores da expanso da Minerao de Textos................235
8.6 Abordagens da Minerao de Textos...................................................................236
8.7 Etapas de Minerao de Textos...........................................................................237
8.8 Formas de Descoberta do Conhecimento em Minerao de Textos.................239
8.9 Funcionalidades de um Software Text Mining ...................................................241
8.10 Minerao de Textos e Inteligncia...................................................................244

15

8.11 Aplicaes de Softwares de Minerao de Textos............................................246


8.12 O Software DifBrain.........................................................................................248

PARTE III DESENVOLVIMENTO DA PESQUISA

9 O CONTEXTO DA ENERGIA NUCLEAR E A ELETRONUCLEAR ............251


9.1 Histrico da Energia Nuclear...............................................................................251
9.2 O Combustvel Nuclear.........................................................................................253
9.3 A Operao de Usinas e Reatores .......................................................................255
9.4 A Gerao de Energia Atravs do Reator gua Pressurizada (PWR)..........258
9.5. Uso e Perspectivas da Energia Nuclear..............................................................260
9.6 Descrio da Eletronuclear...................................................................................263

10 INFORMAO E CONHECIMENTO NA ELETRONUCLEAR...................268


10.1 Histrico...............................................................................................................268
10.2 O Projeto de Gesto do Conhecimento da Eletronuclear................................271
10.2.1 Consideraes Iniciais......................................................................................271
10.2.2 Metodologia Proposta.......................................................................................274
10.2.3 O Projeto de Mapeamento do Conhecimento da Eletronuclear..................275
10.2.4 Desafios do Mapeamento do Conhecimento da Eletronuclear.....................280
10.2.4.1 Fundamentos e Propostas.............................................................................280
10.2.4.2 Plano de Ao Para Mapeamento dos Capitais do Conhecimento ..........284
10.2.4.3 Aes Empresariais Realizadas....................................................................285
10.3 A Experincia Operacional na Eletronuclear...................................................288
10.4 Sistemas e Tecnologias da Informao em GC na Eletronuclear...................294
10.4.1 Viso Geral........................................................................................................294
10.4.2 GED, Automao de Processos e Portal Corporativo em GC......................295
10.4.2.1 Portal de Experincia Operacional e Informao Tecnolgica.................299
10.4.2.2 Implantao da GEDT e Workflow..............................................................302
10.4.2.3 Resultados Almejados com Portais, GEDT e Workflow.............................303

11 MINERAO DE TEXTOS NA ELETRONUCLEAR.....................................304


11.1 Consideraes Preliminares................................................................................304
16

11.2 Caracterizao da Necessidade de Minerao de Textos.................................305


11.3 A Pesquisa-Ao na Eletronuclear.....................................................................307
11.3.1 Viso Geral e Escolha da Questo-Alvo da Minerao de Textos...............307
11.3.2 Anlise de Eventos em Suporte ao Monitoramento de Usinas Nucleares...313
11.4 O Projeto de Experimentos na Eletronuclear...................................................316
11.4.1 Proposta do Projeto..........................................................................................316
11.4.2 Execuo dos Experimentos............................................................................318
11.4.3 Avaliao dos Experimentos............................................................................322
11.4.4 Minerao de Textos Aplicada na Analise de Falhas Humanas..................323

PARTE IV FINALIZAO

12 CONSIDERAES FINAIS.................................................................................326
12.1 Avaliao da Trajetria da Pesquisa.................................................................326
12.2 Perspectivas Futuras...........................................................................................330

REFERNCIAS...........................................................................................................332
ANEXO I......................................................................................................................343
ANEXO II.....................................................................................................................348
ANEXO III...................................................................................................................366
ANEXO IV...................................................................................................................368

17

PARTE I - INTRODUO

18

1 CONSIDERAES INICIAIS

A maior parte das organizaes enfrenta hoje uma srie de desafios em seu
esforo de sobrevivncia crescente. A magnitude dos desafios empresariais, sociais,
econmicos e polticos colocados pela globalizao e uma nova configurao e
posicionamento dos agentes econmicos tornam mais complexa a compreenso da
realidade e a ao empreendedora sobre ela. Os processos produtivos desenhados numa
perspectiva rgida, baseados em atividades mecnicas e repetitivas, em grande parte
cederam lugar a novas formas que passaram a demandar volume crescente de
informao e conhecimento. Novas capacidades estratgicas e operacionais tornam-se
necessrias para as organizaes que desejam obter resultados relevantes atravs da
construo de vantagens competitivas e excelncia no seu modus operandi. A
construo dessas vantagens e a busca da excelncia passam a ser desafio de toda
organizao arrojada que busca diferenciao e melhoria contnua no relacionamento
com seu pblico alvo. No caso das empresas, destacam-se aquelas que buscam
elementos concretos e eficazes para vencer a concorrncia, agora em nvel mundial, e
conquistar um lugar no mercado. As vantagens competitivas, entretanto, servem a uma
causa maior: a sustentabilidade da organizao ao longo do tempo. Vantagens
competitivas so, em geral, temporrias, mas a necessidade de manter a organizao
como um empreendimento sustentvel o objetivo maior.

Algumas vantagens

competitivas, por outro lado, podem ser mais duradouras, embora nem sempre
percebidas de forma clara pelos stakeholders da organizao. Podemos dizer que so
vantagens competitivas de raiz, ou seja, sustentam outras vantagens competitivas mais
explcitas para clientes e acionistas. o caso do fator humano e do conhecimento
construdo por ele na organizao.

As vantagens competitivas podem ser construdas atravs da ao sobre aspectos


fundamentais para as organizaes, tais como: estratgia empresarial, desenvolvimento
e qualidade de produtos, sistemas de produo, sistemas de informaes e suas
tecnologias agregadas e, em especial, as pessoas. O conhecimento humano sempre foi
importante para as organizaes, mas atualmente podemos dizer que se tornou a
principal vantagem competitiva para grande parte delas. Esse conhecimento gerado
em um contexto no qual se encontram pessoas socialmente articuladas e, cada vez mais,
sistemas de informaes, os quais, impulsionados pelos avanos tecnolgicos, passaram
19

a apoiar um processo de acelerao da gerao e uso do conhecimento, especialmente


em melhoria de processos e desenvolvimento de conceitos, inovaes e produtos. O
binmio pessoas sistemas de informao resgata e aprofunda uma perspectiva sciotcnica que se mostra pertinente para compreender o desenvolvimento das sociedades
complexas contemporneas, especialmente a partir da segunda metade do sculo XX.
No obstante o papel do trabalho humano possa estar diminuindo de importncia em
termos quantitativos, com a crescente automao nas atividades industriais e de
servios, em termos qualitativos para a construo de vantagens competitivas, o mesmo
tende a permanecer como sendo muito relevante. As pessoas continuam a ser um
elemento central na existncia das organizaes, sejam as que esto dentro (os
empregados), sejam as que esto fora (os clientes) e a percepo correta desse fato pode
ser a diferena entre o xito e o fracasso de um empreendimento. As empresas esto
inseridas numa atmosfera de alta mutabilidade. A necessidade de respostas rpidas e
criativas por parte das organizaes passa a ser um imperativo, o que pode ocorrer no
apenas com o uso de novas tecnologias, mas, sobretudo, com pessoas devidamente
comprometidas com a gerao de tais respostas. Destarte, relevante, hoje, estudar
como a articulao das pessoas com os sistemas de informao, que permite a gerao
de conhecimento, leva a uma postura estratgica adequada, contribuindo para o maior
xito das organizaes nas misses para as quais se estabelecem. Para CHOO (2003) a
informao , em essncia, a matria prima do cotidiano do ser humano, que tem cinco
sentidos e deve passar pelo crivo da cognio, da emoo e da situao.
A estrutura do presente trabalho inicia-se com as consideraes iniciais descrita
no presente captulo. O captulo 2 apresenta a justificativa e os objetivos (geral e
especficos) do trabalho de tese para sua realizao, indicando a relevncia do estudo. O
captulo 3 discorre sobre e a metodologia empregada. Os captulos 4, 5, 6, 7 e 8
apresentam os marcos tericos do estudo, abordando a gesto do conhecimento, a
recuperao da informao, os sistemas inteligentes e a descoberta de conhecimento em
bases textuais, respectivamente. O captulo 9 descreve o contexto da Eletronuclear,
caracterizando os desafios setoriais que enfrenta, enquanto o captulo 10 relaciona os
processos de gesto do conhecimento e de uso de tecnologia da informao presentes na
empresa. Na seqncia, o capitulo 11 analisa a minerao de textos na Eletronuclear e
so apresentadas posteriormente, no captulo 12 as consideraes finais com uma
concluso e perspectiva futura. Na seqncia so apresentadas as referncias e os

20

anexos. A Figura 1 a seguir apresenta uma viso geral da proposta dessa tese. O foco
principal a questo do conhecimento humano, considerada e estudada por quatro
prismas diferentes, filosfico-cognitivo, organizacional, fator humano e da informao e
tecnologia com destaque para este ltimo, em que a minerao de textos aplicada num
contexto organizacional especfico: o da ELETRONUCLEAR.

Figura 1: A Gesto do Conhecimento sob Quatro Prismas e o Foco de Aplicao


da Tecnologia de Minerao de Textos na ELETRONUCLEAR.
Fonte: Elaborado pelo autor.

21

2 MOTIVAO E OBJETIVOS

2.1 Justificativa

2.1.1 Aspectos Preliminares

O tema gesto do conhecimento, nos ltimos anos, est absorvendo a ateno de


muitas organizaes, especialmente daquelas que possuem viso estratgica, estruturas
amplas e complexas na gerao e comercializao de bens e servios e, bem como das
buscam continuamente aperfeioar as respostas e resultados oferecidos aos seus clientes
e comunidades nas quais se inserem. Iremos assumir, para efeito desse trabalho, o
importante vnculo existente entre conhecimento e informao, especialmente a
informao textual, dentro das organizaes. Conhecimento e informao expressam
realidades diferentes que sero exploradas ao longo desse trabalho em uma perspectiva
no exaustiva. A importncia do presente trabalho vincula-se especialmente gerao
automtica de informao a partir de bases textuais, visando apoiar a gesto do
conhecimento. Para indicar a importncia dessa perspectiva, ser desenvolvida uma
pesquisa-ao vinculada a um conjunto de experimentos com uso de software em um
contexto complexo, expresso pela atividade empresarial da ELETRONUCLEAR.

2.1.2 Problemas e Desafios da Informao Textual

Na maior parte das organizaes a quantidade de documentos textuais grande.


Muitas consultas a esses documentos so necessrias na dinmica do dia-a-dia de
muitas empresas e a busca por tais documentos pode ser muitas vezes lenta devido
diversidade de temas tratados por tais documentos e qua ntidade deles que est
armazenada, muitas vezes em mltiplos locais. Alm disso, muitas vezes documentos
armazenados em locais diferentes podem estar relacionados uns com os outros e
preciso identificar tal relao para soluo de muitas questes empresariais. O tempo
sempre um fator importante. Muitas vezes, em uma pesquisa, localiza-se um grande
conjunto de documentos de interesse, mas apenas uma pequena parte realmente
relevante. Relevncia uma questo importante para a recuperao de informaes.
Um sistema de recuperao da informao s pode apresentar informaes relevantes se
conseguir identificar o que significa ser relevante para o usurio. E isso no simples.
22

O que relevante para uma pessoa pode no ser para outra. Informao relevant e
aquela informao que o usurio necessita em determinado momento para a realizao
de alguma coisa, ou seja, ela deve estar no contexto que o usurio quer e no momento
certo.

Para SARACEVIC (1970) o conhecimento adequadamente comunicado

quando h mudanas e a relevncia a medida dessas mudanas.

Em um passado recente, na maior parte das organizaes, os dados textuais,


embora em volume significativo, quase no eram considerados como elemento de
sustentao para gerao de informao gerencial e definio de vantagem competitiva.
De igual forma, embora intuitivamente fosse percebida a importncia da informao
textual para gesto do conhecimento organizacional, o manejo de grandes volumes de
textos dificultava o uso da mesma em termos prticos.

Os editores de texto e o

ambiente web, bem como os processos que vem sendo denominado por minerao de
textos (Text Mining) permitiram mudar essa perspectiva. Se por um lado, editores de
texto e pginas web garantem facilidades ao usurio na gerao de informao e
expresso do conhecimento, as ferramentas de minerao viabilizam inferncias
inteligentes sobre texto e sua progressiva explorao como recurso informacional cada
vez mais relevante para as organizaes. Tecnologias se apresentam como necessrias
para acelerar a anlise dos textos, examinando de forma automatizada os documentos e
aferindo aquilo que verdadeiramente significativo. possvel tambm, a partir da
anlise sinptica de um grupo de documentos, descobrir relaes importantes entre eles
e que antes no seriam percebidas.

2.2 Problema de Pesquisa e Pressupostos

2.2.1 Problema de Pesquisa

Considerando a necessidade de se extrair conhecimento de grandes acervos


em formato digital compostos por bases de documentos textuais neles armazenados, no
seio de uma organizao, o problema de pesquisa que a tese pretende tratar o de como
utilizar a estratgia tecnologia da descoberta de conhecimento em textos minerao de
textos como suporte diferenciado ao processo de gesto do conhecimento
organizacional. Para tanto, coloca-se o imperativo da viabilizao e utilizao
inteligente e tempestiva de coletneas de textos digitalizados na gerao de
23

conhecimento relevante para essa organizao, atravs de ferramenta de software que


atue com referenciais semnticos e estatsticos os quais incluam o uso de estratgias de
recuperao da informao, recursos de inteligncia artificial e uso de elementos
computacionais, todos integrados sob o prisma de um projeto de gesto do
conhecimento.

Considera-se que a elaborao de textos, livres (artigos, descries, mensagens


ou correspondncias) ou semi-estruturados (sob a forma de relatrios e formulrios,)
uma forma de converter parcelas importantes de conhecimento tcito em conhecimento
explicito, dada a relativa facilidade de sua elaborao por parte de mltiplos usurios
que podem faz- lo com elevado grau de liberdade, dentro de estilos, intenes e vises
de forma como melhor entendem. O processamento de linguagem natural, processo de
inteligncia artificial embutido em softwares de minerao de textos, contribui para o
tratamento de colees textuais digitais, permitindo o alcanar a descoberta de
significados (aspecto semntico) com a anlise de textos.

2.2.1 Pressupostos

Os pressupostos vinculados abordagem do problema so:

Os textos so expresses do pensamento humano com grande flexibilidade e


grau de liberdade para elaborao por parte das pessoas, tornando-se assim um
modo acessvel de converso de conhecimento tcito para conhecimento
explicito em muitos contextos organizacionais.

A minerao de textos d s colees textuais digitais armazenadas nas


organizaes um novo e significativo potencial de gerao da informao e
conhecimento.

possvel utilizar ferramenta informatizada, baseada em abordagens semnticas


e estatsticas para responder de forma inovadora e eficaz as necessidades de
gerao de informao til para o usurio.

24

As informaes geradas pela ferramenta de minerao de textos, por sua


capacidade de anlise semntica e possibilidade de construo de vises
sinpticas de grupos de documentos (derivadas especialmente dos processos de
sumarizao, categorizao e clustering) so relevantes para a gerao de
conhecimento novo para o usurio, satisfazendo-o em suas necessidades.

A minerao de textos, usando recursos de inteligncia artificial, uma


tecnologia que apresenta potencialidades e ganhos visveis para o usurio,
podendo cumprir de maneira inovadora o suporte gesto do conhecimento em
ambientes complexos que incluam a necessidade de manipular grandes volumes
de informao textual.

2.3 Objetivos

2.3.1 Objetivo Geral

Apontar a contribuio da tecnologia de minerao de textos text mining - para


o aprimoramento da gesto do conhecimento, propondo, implantando e avaliando os
resultados de modelo de recuperao automtica da informao textual digital em
organizaes fortemente dependentes de conhecimento, inovao bem como de
informaes estratgicas e operacionais para tomada de deciso e excelncia na atuao.

2.3.2 Objetivos Especficos

Desenvolver os aspectos conceituais do modelo de minerao de textos


proposto, descrevendo seus fundamentos, objetivos e caractersticas e indicando
a relevncia dessa tecnologia como suporte gesto do conhecimento.

Definir e descrever os recursos de minerao de textos que devero ser


utilizados em um sistema informatizado, apontando a relevncia do
desenvolvimento de software adequado a tal funo.

Atuar no desenvolvimento de sistema de minerao de textos, junto a grupo de


trabalho especializado, participando de seu projeto, desenvolvimento e teste e

25

viabilizando a recuperao automtica de informao textual para deteco


inteligente de conhecimento embutido em bibliotecas digitais.

Entender e caracterizar as necessidades de informao de uma organizao alvo


de pesquisa, que seja fortemente dependente de conhecimento e inovao e de
informaes estratgicas e operacionais para tomada de deciso, especialmente
no que tange a questes gerenciais relevantes sobre as qua is a minerao de
textos pode redundar em benefcios importantes, consistentes e robustos.

Conduzir projeto de experimentos que permita avaliar e monitorar a utilizao


do sistema de minerao de textos na organizao pesquisada, avaliando seus
resultados e explicitando de que forma tal tecnologia pode contribuir para a
gesto do conhecimento e o desenvolvimento de uma postura estratgica na
mesma.

26

3 METODOLOGIA

3.1 Viso Geral

Conforme THIOLLENT (1986):


a metodologia entendida como disciplina que se relaciona com
epistemologia ou a filosofia da cincia. Seu objetivo consiste em analisar as
caractersticas dos vrios mtodos disponveis, avaliar suas capacidades,
potencialidades, limitaes ou distores e criticar os pressupostos ou as
implicaes de sua utilizao. Ao nvel mais aplicado, a metodologia lida com
a avaliao das tcnicas de pesquisa e com a gerao de experimentao de
novos mtodos que remetem aos modos efetivos de captar e processar
informaes e resolver diversas categorias de problemas tericos e prticas de
investigao. Alm de ser uma disciplina que estuda os mtodos, a metodologia
tambm considerada um modo de conduzir a pesquisa (p.25)

Em geral, numa viso clssica, o processo de uma pesquisa envolver a


definio de uma questo ou problema de pesquisa que depois ser traduzida em
hipteses ou pressupostos, os quais sero, por sua vez, verificados. A definio do
problema envolver conhecimentos e valores do pesquisador, ou seja, h dimenses
tericas e ticas compondo seu quadro pessoal de referncia. Uma vez consciente do
problema, ou questo da pesquisa, o pesquisador procurar delimita- lo elaborando
hipteses, para as quais em geral revisar a produo intelectual j existente (reviso
bibliogrfica e busca de outros dados relevantes em artigos, jornais, revistas, Internet,
etc.). De acordo com a questo de pesquisa definida e com as hipteses formuladas
(vale dizer tambm, de acordo com a consistncia inicial dessas hipteses) o
pesquisador adotar determinadas estratgias de verificao. Hipteses diversas
implicam em diferentes necessidades

De acordo com BERTO & NAKANO (1999) o primeiro passo para se projetar
uma boa pesquisa determinar qual o seu propsito, que pode ser exploratrio,
descritivo, explanatrio ou preditivo. A determinao das estratgias de verificao
levar isso em considerao, redundando assim nesse ou naquele mtodo de pesquisa
bem como num ou noutro instrumento de coleta de dados.

Essas estratgias de

verificao so baseadas em mtodos de abordagem quantitativa e/ou qualitativa,


embora muitas pesquisas possam mesclar algumas posturas. Ainda de acordo com
BERTO & NAKANO (1999):
27

a metodologia de pesquisa prov subsdios ao planejamento e


desenvolvimento sistematizado de uma investigao cientfica a respeito de um
fenmeno observado na realidade do mundo fsico material. Utiliza um ou
vrios mtodos combinados de observao, de maneira a apreender fatos e
dados dessa realidade, com a inteno de entender, explicar e, se possvel ou
necessrio, aplic-la ou replic-la em favor de outros eventos ou episdios
semelhantes. Inicialmente, a dificuldade de escolha ou opo por um
determinado mtodo est ligado dificuldade em se estabelecer ou identificar
claramente o problema (ou soluo) que se quer verificar ou conhecer. A
pesquisa bibliogrfica permite construir (ou reconstruir) um modelo implcito
nos diferentes constructos, criando um arcabouo terico capaz de sustentar ou
subsidiar as questes de pesquisa (p.2).

As perspectivas modernas de pesquisa repousam sobre duas grandes vertentes


conceituais: o racionalismo e o empirismo. Na primeira, segundo VARGAS (1985), a
viso de Descartes assumiu que atravs da razo, do raciocnio lgico-dedutivo
possvel chegar-se verdade sobre um fato, baseando-se nos princpios de igualdade
entre verdade e evidncia e da diviso de um problema em pequenas partes para ser
analisado. J na perspectiva empirista a importncia recai sobre a observao da
realidade, com uso de um raciocnio indutivo, atravs do qual pela observao dos fatos,
sem preconceitos, possvel se chegar a uma lei geral. Modernamente, de acordo com
BERTO & NAKANO (1999) a cincia vem se servindo de uma conduta de pesquisa
que consiste de uma mesclagem das duas perspectivas e que d origem ao mtodo
emprico, ou pesquisa quantitativa. Segundo BRYMAN (1989: 6-9), essa conduta
enfatiza a formulao de hipteses slidas, a partir de um marco terico, da qual se
extraem conceitos passveis de serem medidos e verificados (operacionalizao). Ainda
segundo esse autor, busca-se com as hipteses a demonstrao de uma relao de causa
e efeito, seja de forma explcita ou implcita e a pesquisa deve-se preocupar com a
construo de concluses que possam ser generalizadas e novamente verificadas por
outro pesquisador que utilize os mesmos pressupostos e procedimentos.

Uma pesquisa quantitativa em geral se apresenta adequada quando possvel


realizar medidas quantificveis de variveis e inferncias a partir de amostras de uma
populao. Esse tipo de pesquisa usa medidas numricas para testar vises cientficas,
hipteses e proposies. O Projeto de Experimentos e a realizao de Pesquisa de
Survey so exemplos de mtodos de pesquisas quantitativas.

28

Uma outra conduta de pesquisa dada pela abordagem qualitativa ou


interpretativa, que caracterizada por um nvel baixo ou inexistente de medidas
numricas ou anlises estatsticas. Nesse tipo de pesquisa, examinam-se questes e
aspectos mais profundos, com considerao de elementos subjetivos de um objeto de
estudo.

CALDER (1977) classifica os mtodos qualitativos de acordo com seus


diferentes

possveis

usos,

agrupando-os

em

trs

abordagens:

exploratria,

fenomenolgica e clnica. A primeira abordagem, a exploratria, pode ocorrer quando


um pesquisador se interessa em testar aspectos operacionais de uma pesquisa
quantitativa ou quando pretende incentivar e incrementar o pensamento cientfico
atravs de uma formulao mais profunda de uma determinada questo ou tema.

Uma abordagem fenomenolgica o segundo tipo de possibilidade de uma


pesquisa qualitativa. De acordo com BERTO & NAKANO (1999) na pesquisa
qualitativa:
o pesquisador procura reduzir a distncia entre a teoria e os dados, entre o
contexto e a ao, usando a lgica da anlise fenomenolgica,isto , da
compreenso dos fenmenos pela sua descrio e interpretao.

De acordo com AAKER (1990) a abordagem fenomenolgica, chamada por ele


como sendo de orientao tem como propsito

transferir o pesquisador para o ambiente que lhe pouco ou nada familiar,


fazendo com que experimente as mesmas sensaes, problemas, necessidades e
satisfaes da populao pesquisada. Ao se transformar em membro dessa
populao, o pesquisador aprende sua linguagem, seu vocabulrio e adquire
subsdios mais consistentes para sua pesquisa, a partir de uma interao muito
mais prxima com a realidade, sob o ponto de vista do universo pesquisado
(p.162).

A fenomenologia est ligada, sobretudo, produo intelectual de HUSSERL1 .


Segundo HUSSERL (1913) a fenomenologia

Edmund Husserl. Filsofo alemo (1859-1938) considerado o terico fundador da fenomenologia que,
de certa forma, retoma modernamente o objetivismo de Plato, no qual as idias so realidades
objetivamente dadas que formam uma ordem factual. Mas HUSSERL se afasta de Plato na medida em
que, no lugar de uma concepo mitolgica, que pressupe a existncia da alma, pe uma intuio das

29

o estudo dos fatos vividos da conscincia na sua pura generalidade


essencial e no como fatos realmente experimentados e apreendidos
empiricamente por seres conscientes.

A fenomenologia buscar respostas para uma questo crtica do conhecimento:


como a nossa conscincia pode ter acesso aos objetos? Como se forma, para ns o
campo da nossa experincia? HUSSERL ir recusar a noo clssica de conhecimento
como representao e partir da idia de que o conhecimento surge do encontro entre a
subjetividade e os objetos a partir de uma atitude intencional. Isso significa que a
conscincia a conscincia de alguma coisa e no da representao (imagem ou
smbolo) dessa coisa. A conscincia apresenta os objetos para o indivduo e no os
representa. ABRO (1999: 439-440), analisando a obra de HUSSERL afirmar:
se nossa conscincia intencional, se ela sempre direo a um objeto, a
tarefa primeira da fenomenologia ser verificar quais as snteses que se
encontram na origem desse efeito espetacular: temos conscincia de um mundo,
a despeito da variedade das perspectivas que possamos ter sobre ele. Enquanto
em nossa experincia efetiva existe um fluxo permanente de manifestaes e
fenmenos de objetos, a capacidade sinttica de nossa conscincia faz com que,
por meio dessa multiplicidade de fenmenos, tenhamos conscincia de um
objeto uno e idntico

J MERLEAU-PONTY (1945) caracteriza a fenomenologia como :


uma filosofia para a qual o mundo est sempre e j em a, comantecedncia
reflexo, como presena inalienvel e cujo esforo ode recobrar esse contato
ingnuo com o mundo para lhe conceder,finalmente, um estatuto filosfico
(Prlogo)

Ao

procurar

compreender,

descrever

interpretar

os

fenmenos,

fenomenologia ir fornecer suporte terico para abordagens qualitativas de pesquisa.


Para VAN MAANEN (1979) as experincias pessoais do pesquisador so importantes
elementos na anlise e compreenso dos fenmenos estudados. Para BRYMAN (1989),
na pesquisa qualitativa no h hipteses fortes no incio da pesquisa e o pesquisador
observa os fatos como algum interno organizao, sendo que a pesquisa busca
compreender melhor o contexto da situao. Para esse autor, a pesquisa deve enfatizar o
processo dos acontecimentos e a seqncia de fatos ao longo do tempo.
essncias condicionada pelo fenmeno concreto e consumada pelo prprio fenmeno. (Cf. HESSEN,
1999: 70-71).

30

Ainda de acordo com a viso de CALDER (1977), temos tambm a terceira


abordagem de uma pesquisa qualitativa que a clnica, em que se pretende trazer tona
sensaes e sentimentos que no seriam fa cilmente percebidos por meio de mtodos de
pesquisa muito estruturados. Lida com informaes latentes, por vezes inconscientes e
inacessveis nos relacionamentos inter-pessoais, constituindo-se em uma boa ferramenta
na obteno de informaes teis para o julgamento clnico de um profissional
especializado.

Dentre os mtodos de abordagem qualitativa podemos citar o Estudo de Caso e a


Pesquisa-Ao.

Esses mtodos utilizam diferentes estratgias de verificao, com

instrumentos que podem ser utilizados isoladamente ou combinados entre si. Dentre
estes podemos citar as entrevistas (estruturadas, semi-estruturadas ou no-direcionadas),
uso de questionrios, observao direta, participao direta, tcnicas projetivas 2 e os
grupos focais.

A presente tese adotou como mtodo principal a Pesquisa-Ao. Porm, houve


tambm sua interseo com recursos do Projeto de Experimentos para desenvolvimento
de teste de software de minerao de textos. Duas tcnicas foram associadas a esses
mtodos: o Grupo Focal e o Processo Interativo Orientado a Objetos para
Desenvolvimento de Software.

3.2 A Pesquisa Ao

A presente Tese utilizou o mtodo da Pesquisa-Ao conforme descrito em


THIOLLENT (1986) e que procuraremos descrever resumidamente com base nesse
autor. Essa abordagem lida com a ao interativa de um pesquisado dentro de um grupo
implicado em uma situao problema, sendo que um dos objetivos desse tipo de

Tcnicas projetivas so usadas quando o pesquisador considera praticamente impossvel aos


entrevistados responderem sobre as reais razes que os levam a assumir certas atitudes e comportamentos.
Muitas vezes as prprias pessoas desconhecem seus sentimentos e opinies a respeito de determinado
assunto, sendo incapazes de verbalizar seus verdadeiros sentimentos e motivaes. O pesquisador, nesses
casos, apresenta um estmulo ambguo aos entrevistados e observa suas reaes no relacionamento com
esse estmulo. Esse tipo de tcnica bastante utilizado em sesses de psicoterapia, quando o paciente
solicitado a se projetar como se fosse outra pessoa ou objeto e a expressar seus sentimentos sob essa nova
identidade .

31

proposta metodolgica conferir aos pesquisadores e grupos participantes os meios de


se tornarem capazes de lidar com situaes-problema sob a forma de uma ao
transformadora.

De acordo com LIEBSCHER (1998), para saber utilizar mtodos

qualitativos preciso aprender a observar, registrar e analisar interaes reais entre


pessoas, e entre pessoas e sistemas. Isso tem muito em comum com a Pesquisa-Ao,
mtodo de pesquisa de carter interativo e fenomenolgico e que busca a construo de
solues para certos problemas, com grande envolvimento do pesquisador com a
realidade pesquisada. De acordo com THIOLLENT (1986), a pesquisa-ao destina-se
a estudos do que chama de faixa intermediria, ou seja: o estudo de situaes que no
se encontram nem no nvel micro-social (indivduos e pequenos grupos) e nem no nvel
macro-social (a sociedade como um todo). Tal faixa intermediria corresponde a uma
grande diversidade de atividades de grupos e indivduos no seio ou margem de
instituies ou coletividades, sendo um instrumento de trabalho e de investigao com
grupos, instituies e coletividades de pequeno e mdio porte, o que o caso da grande
maioria das organizaes pblicas e privadas. O autor afirma ainda que:
Pesquisa - ao um tipo de pesquisa social com base emprica que
concebida e realizada em estreita associao com uma ao ou com a
resoluo de um problema coletivo e no qual os pesquisadores e os
participantes representativos da situao ou do problema esto envolvidos de
modo cooperativo ou participativo (..)Para que no haja ambigidade, uma
pesquisa pode ser qualificada de pesquisa-ao quando houver realmente uma
ao por parte das pessoas ou grupos implicados no problema sob observao.
Alm disso, preciso que ao seja uma ao no trivial, o que quer dizer uma
ao problemtica, merecendo investigao para ser elaborada e conduzida.
(...) Na pesquisa-ao os pesquisadores desempenham um papel ativo no
equacionamento dos problemas encontrados, no acompanhamento e na
avaliao das aes desencadeadas em funo dos problemas . (p:14-15)

Os principais aspectos dessa abordagem so:

Interao entre pesquisadores e pessoas envolvidas na situao a ser


investigada;

Prioridades dos problemas como resultado da interao;

Relao do objeto de investigao com a situao e os problemas


encontrados;

Objetivo da pesquisa-ao: resoluo do problema ou seu esclarecimento;

H o acompanhamento das decises, aes e de toda atividade intencional;

32

Ampliao do conhecimento de todos inseridos na situao nvel de


conscincia.

Prosseguindo na descrio apresentada por THIOLLENT (1986), cumpre


salientar que no caso da pesquisa-ao em geral no possumos hipteses prvias
totalmente desenhadas e consolidadas e associadas a um pequeno grupo de variveis
precisas, isolveis e quantificveis, como no mtodo cientfico tradicional. Na pesquisaao temos interaes entre grupos e dentro de grupos, situaes nas quais se
manifestam muitas variveis imprecisas dentro de certo contexto em mudana
permanente. Por isso a pesquisa ao opera a partir de certas premissas, instrues ou
diretrizes concernentes ao modo de encarar os problemas identificados na situao
investigada e relativa aos modos de ao. A partir dos resultados da pesquisa, tais
premissas podem sair fortalecidas ou, ao contrrio, serem abandonadas ou reformuladas.
Tais premissas no obrigatoriamente precisam ser submetidas a experimentos ou testes
estatsticos. Sempre que possvel podemos utilizar experimentos, mas eles podem ser
enfocados em uma tica tambm qualitativa e no somente quantitativa ou sujeitos
somente mensurao estatstica. Dentro da abordagem de Pesquisa-Ao, a hiptese
ou diretriz, ou ainda os pressupostos precisam de uma formulao de modo claro e
conciso, sem ambigidade gramatical e designar os objetos em questo a respeito dos
quais seja possvel fornecer provas concretas e argumentos convincentes, favorveis ou
no.

Para fins descritivos, a hiptese qualitativa, ou diretriz deve ser usada para

organizao da pesquisa em trono de possveis conexes ou implicaes no causais,


mas com preciso suficiente para se estabelecer que X tem a ver com Y na situao
considerada (THIOLLENT, 1986, p. 56).

Merece tambm avaliao a questo das inferncias e da generalizao na


Pesquisa-Ao, ou seja: a passagem de um nvel local para o global, conforme
THIOLLENT (1986). Conforme o autor:

a inferncia considerada como passo de raciocnio possuindo qualidades


lgicas e de controle. A concepo estatstica das inferncias no esgota toda a
complexidade qualitativa das inferncias no contexto particular da pesquisa
social. As inferncias constituem passos do raciocnio na direo da
generalizao. Isto corresponde induo. Antes de serem problema de
estatstica, as inferncias so tema de lgica. O seu controle remete ao
conhecimento de algumas regras de lgica elementar. (...) Em situaes de

33

pesquisa, os pesquisadores devem estar atentos em no confundir as inferncias


efetuadas por eles e as inferncias efetuadas por outros participantes. Os
pesquisadores devem identificar as generalizaes populares e cotej-las com
generalizaes tericas. (...) Independentemente das exigncias estatsticas e
lgicas que podem ser aplicadas nos casos de uma quantificao ou de uma
formalizao do conhecimento, os pesquisadores aplicam outros tipos de
exigncias no que diz respeito aos aspectos qualitativos das inferncias, como
identificar os defeitos da generalizao, em particular aqueles que consistem
em, a partir de poucas informaes locais, tirar concluses para o conjunto da
populao ou universo. Uma segunda exigncia consiste em identificar as
formas ideolgicas que interferem na generalizao (p. 37-38).

No que tange ao campo de observao, realizao de amostragens e


representatividade qualitativa, a Pesquisa-Ao proposta por THIOOLLENT (1986),
existem trs posies relativas realizao de amostras nas pesquisas:

a) Excluso da pesquisa por amostra, uma vez que a ao coletiva implica em


considerar a totalidade dos indivduos de um grupo;
b) Recomendao do uso da amostra, a partir de critrios estatsticos
c) Valorizao de critrios de representatividade qualitativa, uma vez que na
prtica da pesquisa social a representatividade dos grupos investigados se d por
critrios quantitativos (amostragem estatsticamente controlada) e por critrios
qualitativos (interpretativa ou argumentativamente controlados). Isso implica
em valorizar as amostras intencionais pequeno grupo de pessoas que so
selecionadas de modo intencional em funo da relevncia que possuem no que
tange a um determinado tema ou assunto, o que sistematicamente aplicado em
Pesquisa-Ao, no obstante possa infringir o principio da aleatoriedade que, em
geral, considerado como condio de objetividade (THIOLLENT, 1986, p. 62).

A Pesquisa-Ao implica na constituio de um ou mais grupos de trabalho para


realizao de suas atividades, envolvendo pesquisadores e participantes. Na abordagem
dessa Tese, utilizou-se a tcnica do Grupo Focal descrita no tpico 3.4.

3.3 A Pesquisa Experimental e O Projeto de Experimentos

Alm da Pesquisa-Ao, utilizou-se no trabalho de pesquisa vinculado a essa


tese elementos de pesquisa experimental. Uma vez definido o software de descoberta de
conhecimento em textos a ser utilizado na Eletronuclear, realizou-se uma srie de

34

experimentos para verificar sua adequao realidade da organizao, sua competncia


na recuperao de informaes e seu real impacto como ferramenta de apoio gesto do
conhecimento.

Um experimento pode ser definido como um teste ou uma srie de testes, onde
so feitas mudanas propositais nos dados de entrada, de um sistema ou de um
processo, de modo que seja possvel observar e identificar o efeito dessas mudanas,
sobre os dados de sada. O Projeto de Experimentos, por sua vez, diz respeito ao
planejamento e conduo do experimento, alm da anlise dos dados de sada, para que
concluses

vlidas

objetivas

possam

ser

obtidas

desse

experimento

(MONTGOMERY, 1997).

Um Projeto de Experimentos pode consistir de uma srie de combinaes


experimentais de ordem aleatria, onde, em cada combinao, testam-se diferentes
ajustes dos fatores de controle e registram-se os resultados observados, os quais devem
ser analisados (Montgomery, 1991). Os objetivos principais de anlise dos resultados de
um projeto experimental so (MONTGOMERY, 1997):
(i) Identificar a influncia dos fato res controlveis sobre as variveis de
resposta; (ii) Identificar ajustes dos fatores controlveis que resultem em
respostas com propriedades desejveis, tais como prximas a valores nominais
e com variabilidade mnima; e (iii) Identificar ajustes dos fato res controlveis
que minimizem o efeito de fatores no controlveis (tais como temperatura e
umidade no ambiente de experimentao) sobre as variveis de reposta.

As etapas principais necessrias para o desenvolvimento de um experimento so


as seguintes (RIBEIRO et al., 2000):
(i) identificao do problema; (ii)planejamento e execuo do experimento; (iii)
modelagem da varivel de resposta e da sua varincia; (iv) escolha da funo e
de critrios a serem utilizados na otimizao do experimento; e (v)
formalizao da otimizao.

No contexto dessa Tese, o Projeto de Experimentos no foi utilizado de forma


rgida, conforme previsto em diferentes abordagens tericas sobre Metodologia de
Pesquisa, com medies estatsticas ou de outra ordem matemtica. Ele foi desenhado
de forma a:

35

Complementar e enriquecer o processo desenvolvido sob a gide da


Pesquisa-Ao;

Atuar de modo associado a uma abordagem interativa de desenvolvimento


de software;

Submeter diferentes colees de documentos textuais digitais ao


processamento pelo software escolhido;

Permitir que os resultados apresentados pelo software pudessem ser


avaliados pelo grupo focal constitudo para a presente pesquisa, que com seu
conhecimento informal, conforme descrito em THIO LENT (1986, p. 67-69),
poderia validar ou no tais resultados, do ponto de vista qualitativo.

Permitir que, as avaliaes dos resultados servissem de insumo para o


redesenho de rotinas de modelagem e programao do software em uso de
modo a adequ- lo s exigncias dos resultados a serem obtidos no processo
de minerao de textos. Dessa forma, os resultados permitiram ajustar
algoritmos, selecionar os melhores recursos de inteligncia artificial a serem
aplicados, bem como atualizar e aprimorar o desenho dos programas de
computador componentes do software em termos de adequao, usabilidade
e desempenho.

3.4. Grupo Focal

Os grupos focais (utilizados na Eletronuclear, conforme capitulo 11) tm sido


utilizados h cerca de cinqenta anos em pesquisas qualitativas. Tiveram inicio em
processos teraputicos grupais conduzidos por psiquiatras. Tornou-se, desde ento,
importante ferramenta em vrias reas, como por exemplo, no campo da Administrao
Mercadolgica. Na concepo de VAUGHN et alli. (1996), grupo focal instrumento
qualitativo que pode ser usada isoladamente ou com outros instrumentos qualitativos ou
quantitativos para aprofundar o conhecimento das necessidades de usurios e clientes.
Sua meta compreender o que as pessoas tm a dizer sobre alguma coisa e por qu. De
acordo com McDANIEL & GATES (2003) nessa ferramenta:

a nfase est em fazer com que as pessoas falem exausto e detalhadamente


sobre o assunto escolhido. A inteno descobrir o que elas sentem em relao
a um produto, um conceito, uma idia ou uma organizao, como tudo isso se

36

encaixa na vida delas e seu envolvimento emocional com essas coisas (p.123124) .

Para CAPLAN (1990), os grupos focais so


pequenos grupos de pessoas reunidos para avaliar conceitos ou identificar
problemas (p.527).

O propsito principal de um grupo focal o de determinar as percepes, os


sentimentos, atitudes e idias dos que dele participam sobre um certo tema ou objeto,
que pode ser um produto, proposta, pesquisa, etc.. Em pesquisas de cunho
fenomenolgico, como o caso da Pesquisa-Ao, essa tcnica se presta a entender
como os participantes vem e interpretam a realidade e quais so seus conhecimentos e
experincias. Sua utilizao parte do pressuposto que h um elemento de sinergia entre
os participantes e que faz com que os resultados ultrapassem as contribuies
meramente individuais. O uso desses grupos envolve:

Definio de um objetivo

Seleo de um participante

Seleo de um moderador

Criao de guia de discusso (esboo dos tpicos que devem ser abordados
nos trabalhos do grupo e nas diferentes sesses ou reunies que realiza) Esse
guia geralmente desenvolvido pelo moderador com base nos objetivos da
pesquisa e nas informaes necessrias para que determinado objetivo seja
atingido McDANIEL & GATES (2003)

Conduo das atividades do grupo em quantas sesses ou reunies forem


necessrias

Elaborao de um relatrio de concluso das atividades do grupo.

Na ELETRONUCLEAR essa tcnica se mostrou adequada e pertinente, afinada


com os objetivos da pesquisa da presente tese, uma vez que, alm de permitir um
conhecimento aprofundado de aspectos operacionais da organizao, podemos
considerar que a empresa constitui pblico-alvo da tecnologia em desenvolvimento, sob
um processo interativo. Em uma perspectiva de Administrao Mercadolgica, a
ELETRONUCLEAR pode ser vista como cliente para adquirir e utilizar um software de
minerao de textos.

37

3.5 O Processo Interativo de Desenvolvimento de Software e a Orientao a


Objetos

A presente Tese serviu-se de um software de minerao de textos para


implementao prtica de suas propostas e avaliao de resultados. Tal software poderia
ter sido uma ferramenta j existente e disponvel no mercado ou desenvolvida. Embora
o objetivo principal da Tese no seja o desenvolvimento de um software, o processo de
desenvolvimento do mesmo, em uma abordagem interativa, contribuiu para uma melhor
compreenso das necessidades e da pertinncia da proposta para a organizao em
estudo no que tange dinmica da Gesto do Conhecimento na ELETRONUCLEAR,
facilitando o entendimento mais amplo dos problemas por ela enfrentados e
contribuindo de modo efetivo para a viabilizao de adoo de uma estratgia de
Pesquisa-Ao.

Um processo interativo de desenvolvimento de software aquele em que h uma


forte participao do usurio em todas as fases, que so continuamente enriquecidas
pelos mltiplos e sucessivos feedbacks avaliaes, sugestes, crticas e propostas de
melhoria realizadas pelo usurio, permitindo revises nos estudos dos requisitos e
anlises necessrias sua construo. No se espera o software ficar totalmente pronto
para submet- lo a uma apreciao do usurio, mas isso feito desde o projeto.
Prottipos so ento construdos e vo se transformando gradativamente na verso
definitiva Em tecnologia da informao existem vrias estratgias e metodologias
possveis para uso e processos de desenvolvimento de software. O desenvolvimento do
software DifBrai n, usado nessa Tese, teve como parmetro a anlise e projeto
orientado a objeto, cuja essncia enfatizar a considerao de um domnio de problema
e de uma soluo lgica segundo a perspectiva dos objetos (coisas, conceitos, e
entidades) de acordo com LARMAN (2000). Um objeto, ou classe , de acordo
BOOCH, RUMBAUGH & JACOBSON (2000):
alguma coisa geralmente estruturada a partir do vocabulrio do espaoproblema ou do espao da soluo; uma classe a descrio de um conjunto de
objetos comuns. Todos os objetos tem uma identidade (voc pode atribuir-lhes
nomes ou diferencia -los dos demais objetos de alguma maneira), um estado
(costuma haver dados a eles associados) e um comportamento (voc poder
fazer algo com o objeto ou ele poder fazer algo com outros objetos) (p.11).

38

No contexto da anlise e projeto orientados a objetos, o desenvolvimento do


software DifBrai n seguiu processos e fluxos baseados na rea de Engenharia de
Software, tendo por base a me todologia do processo unificado 3 (Unified Process UP).
Um processo de desenvolvimento de software um mtodo para organizar as atividades
relacionadas com a criao, entrega e manuteno de sistemas de software. De acordo
com PAULA FILHO (2003), esse mtodo possui as seguintes caractersticas centrais:

Ser dirigido por casos de uso 4 ;

Ser centrado na arquitetura;

Ser interativo e incremental.

Tambm para esse autor o UP, sendo interativo e incremental, constitui um


ciclo, em espiral, no qual h uma prototipagem evolutiva, em que h uma srie de
verses provisrias, as quais, a cada ciclo, cobrem cada vez mais requisitos at que se
atinja

produto

desejado,

permitindo

que

os

requisitos

sejam

definidos

progressivamente e apresentando alta flexibilidade. Cada ciclo composto por fases,


que so as seguintes:

Concepo justifica-se a execuo de um projeto de desenvolvimento de


software do ponto de vista de uma atividade a ser executada ou, comercialmente,
de um negcio de um cliente;

Elaborao o produto detalhado o suficiente para permitir um planejamento


acurado da fase de construo;

Construo produzida uma verso operacional do software;

Transio o produto colocado disposio de uma comunidade de usurios.

O processo unificado, abordagem consolidada para desenvolvimento de sistemas, foi proposto em


JACOBSON, I. RUMBAUGH, J. BOOCH, G. Unified Software Development Process. Addison-Wesley,
Reading MA. , 1999. No faz parte do escopo do trabalho discutir tal metodologia de desenvolvimento,
j consolidada na rea de tecnologia da informao. Apresentamos apenas as informaes fundamentais.
De acordo com PAULA FILHO (2003), um processo um conjunto de passos parcialmente ordenados
para se atingir a uma meta.
4
Um caso de uso uma descrio narrativa de uma atividade de um domnio, como, por exemplo,
emprestar livros em uma biblioteca. Um ciclo de desenvolvimento a implementao de um ou mais
casos de uso, ou de verses simplificadas de casos de uso. Os casos de uso constituem um parte dos
diagramas da Linguagem de Modelada Unificada UML (Unifiel Modeling Language) uma notao
sobretudo diagramtica para modelagem de sistemas, usando conceitos orientados a objetos. Alm dos
casos de uso, a UML define os diagramas de classes, objetos, seqncias, colaboraes, grficos de
estados, atividades, componentes e implantao (BOOCH, RUMBAUGH & JACOBSON, 2000).

39

Alm disso, em cada fase as atividades possuem fluxos de trabalho composto por:

Estudo de Requisitos fluxo que visa obter um conjunto de requisitos de um


produto, acordado entre usurio e desenvolvedor;

Anlise fluxo que objetiva detalhar, estruturar e validar os requisitos de forma


a permitir planejamento detalhado.

Desenho fluxo que permite formular um modelo estrutural do produto que


sirva de base para implementao.

Implementao fluxo que visa realizar o desenho em termos de componentes


de cdigo.

Testes Fluxo cujo objetivo verificar o resultado da implementao.

3.6. Consideraes Finais Sobre o Emprego de Metodologia

O presente trabalho resultado de um processo longo de interao entre o


pesquisador autor da presente Tese e a organizao pesquisada: a ELETRONUCLEAR.
Esse processo de interao deu-se em muitas visitas s instalaes da empresa, em
Angra dos Reis, troca de correspondncias eletrnicas com seus funcionrios, acesso a
documentos, conversas formais e informais com seus funcionrios e interlocuo com
um responsvel principal pelo projeto prospectivo de uso de minerao de textos na
ELETRONUCLEAR. Atravs de sucessivas anlises, apresentao de resultados,
anlise do feedback dos responsveis, foi possvel implementar o trabalho.

O desenvolvimento da pesquisa que levou aos resultados do presente trabalho


aps um perodo longo de atuao em que houve forte interao do autor com uma
equipe de profissionais da ELETRONUCLEAR e com os quais passou-se a buscar
soluo para problemas complexos relativos gerao e entrega de informaes
estratgicas a usurios especiais que executam tarefas relativas operao e
manuteno de usinas nucleoeltricas. Por isso, a abordagem da Pesquisa-Ao
mostrou-se indicada ao processo, associando-se a ela um projeto de experimentos com
software de minerao de textos especfico

40

PARTE II REFERENCIALTERICO

41

4 GESTO DO CONHECIMENTO

4.1 Aspectos Preliminares e Definies

No fcil definirmos conhecimento, como discutiremos a seguir. O fato


concreto que conhecimento humano, que sempre foi importante, tornou-se, a partir da
segunda metade do sculo XX, elemento decisivo na conduo de mudanas
econmicas, sociais e polticas da humanidade, passando a ser cada vez mais elemento
de transformao e diferenciao crescente entre pessoas, grupos sociais e pases. O
desenvolvimento cientfico e tecnolgico intensificou, a partir dessa poca, a imposio
de mudanas e transformaes sociedade e s organizaes em um ritmo cada vez
mais acelerado. O conhecimento comeou a ser visto como um emergente fator de
produo, somando-se aos tradicionais fatores terra, trabalho e capital. O acesso e o
domnio do conhecimento foi se caracterizando cada vez mais como vantagem
competitiva, seja de empresas, seja de naes. A capacidade de adicionar valor
agregado aos produtos, a partir do resultado do desenvolvimento cientfico, tecnolgico
ou da melhoria de processos organizacionais passou a fazer cada vez mais a diferena
no sucesso de organizaes e pases. Em seu famoso artigo Como ns pensamos,
BUSH (1945) afirmou:
O conhecimento humano vem crescendo assustadoramente e se tornando cada
vez mais especializado. medida que o conhecimento cresce e a especializao
se estende, mais complicado se torna o nosso acesso a esse monumental acervo.
O investigador fica perplexo quando tem que lidar com o produto da pesquisa
de milhares de colegas -- no tendo tempo para ler, muito menos para analisar
e memorizar, tudo o que publicado, mesmo em sua rea de especializao. A
especializao talvez seja a nica maneira de fazer o conhecimento progredir.
Mas o esforo de construir pontes entre as vrias disciplinas especializadas
ainda incipiente e artificial

A gesto do conhecimento nasceu do esforo organizacional em tratar de forma


intencional e sistematizada a questo do conhecimento de forma a desenvolver um
conjunto de possibilidades de sobrevivncia em cenrios de turbulncia e alta
competio, bem como de gerar crescimento a partir da construo de vantagens
competitivas apoiadas no conhecimento. De acordo com NEVES e NASCIMENTO
(1999):
as pessoas sempre detiveram conhecimento, adquirido atravs de informaes
e experincias. O que as organizaes esto descobrindo agora so maneiras

42

de transformar e gerir esse conhecimento existente para alavancar vantagens


competitivas e gerar novos conhecimentos, auxiliadas ou no por novas
tecnologias.

4.1.1 Dados, Informao, Documento e Conhecimento

Em muitos escritos de Cincia da Informao h uma proliferao de usos dos


termos dados, informao e conhecimento, sendo que muitas vezes esses termos ou so
tratados como sinnimos ou no fluxo das discusses e anlises h uma passagem quase
automtica de uma instncia outra. O problema que o caminho dados => informao
=> conhecimento => gesto do conhecimento no se faz de modo to automtico,
havendo diferenas entre tais instncias e um processo humano e social quanto mais se
caminha em direo ao conhecimento. A definio e diferenciao entre o que venha a
ser dados informao ou conhecimento polmica e no h a inteno do presente
trabalho em exaurir tal questo. Entretanto, para o fluxo da discusso apresentada nessa
tese, torna-se necessrio realizar uma caracterizao de referncia para o contexto da
discusso sobre o assunto que aqui tratado. DAVENPORT & PRUSAK so autores
que se preocuparam com a diferenciao de tais conceitos. Na seqncia, ser feito um
exame mais detalhado sobre a questo da gesto do conhecimento. A Figura 2 a seguir
pretende expressar inicialmente a evoluo dado => informao => conhecimento =>
sabedoria (entendida aqui como conhecimento em que se adicio nam valores e uma
postura tica). As setas verticais indicam os elementos que vo sendo adicionados a
cada instncia, que apreciaremos a seguir.

- DADOS +
-Combinao de Dados
-Significado
-Utilidade
-Propsito

Dado

Informao

-CONHECIMENTO +
-tica

Conhecimento

Sabedoria

- INFORMAO +
-Unidade Quantificvel
-Diferentes Tipos
-Transfer vel

-Reflexo
-Sntese
-Contextualizao

Figura 2: Dos dados sabedoria. Fonte: Elaborado pelo autor.

43

4.1.1.1 Dados

De acordo com SETZER (1999):


Um dado puramente objetivo no depende do seu usurio. A informao
objetiva-subjetiva no sentido que descrita de uma forma objetiva (textos,
figuras, etc), mas seu significado subjetivo, dependendo do usurio. O
conhecimento puramente subjetivo cada um tem a experincia de algo de
forma diferente(p.3).

Para LE COADIC (2004), dados so representaes convencionadas,


codificadas de uma informao em uma forma que permita submet- la a processamento
eletrnico em que as letras das palavras so representadas por dgitos binrios (0 ou1)
no cdigo ASCII que expressa um conjunto de sinais eltricos. Na perspectiva de
TURBAN (2003), dados so fatos puros ou descries bsicas de coisas, eventos,
atividades e transaes que so capturados, registrados, armazenados e classificados,
mas no so organizados para transmitir qualquer significado por si s. Dado a
matria-prima da informao. Na viso de REZENDE (2003) um elemento puro,
quantificvel sobre um determinado evento e, em geral, usados em ambiente
operacional, registrados, selecionados e recuperados de um banco de dados ou de
diferentes formas de documentos. De acordo com SOUZA (2006):
dados podem ser definidos como seqncias de smbolos para os quais so
atribudos significados; smbolos estes que podem ser codificados,
interpretados e manipulados por programas de computador, e enviados atravs
de redes e dispositivos de comunicao.

Em geral, um dado por si s no confere sustentao ao entendimento de uma


situao. Sob um ponto de vista mais simples, de uma lgica computacional, um dado
tudo aquilo que fornecido como entrada para um processamento e informao,
tudo aquilo que o processamento gera como uma sada. De acordo com DAVENPORT
& PRUSAK (1998):
dados so um conjunto de fatos distintos e objetivos relativos a eventos. Num
contexto organizacional, dados so utilitariamente descritos como registros
estruturados de transaes.

44

4.1.1.2 Informao

Sob o ponto de vista etimolgico, confo rme ZEMAN (1970), o termo


informao originrio do latim, derivando do verbo informare, que significa dar
forma, colocar em forma mas tambm representar uma idia ou noo. Informaes
podem ser entendidas como dados contextualizados, objetivos, confiveis e utilizveis
para algum propsito. As informaes nascem de dados processados. A informao
envolve a interpretao de um conjunto de dados, o qual s faz sentido em um contexto
de referncia, ou seja, da informao (REZENDE, 2003). Podemos defini- la como um
conjunto de fatos (dados) organizado de modo a fazer sentido para o destinatrio
(usurio). Para O'BRIEN (2001), a informao requer a elaborao de cenrio, a
identificao dos elementos que atuam nesse cenrio, a localizao do dado nesse
contexto e a avaliao das relaes entre o dado em questo e ambiente onde ele est
inserido. Para esse autor, a informao o dado contextualizado. Portanto, a
manipulao do dado atravs de modelos que o contextualizem constitui uma forma de
construir informaes, e estas so fundamentais na gesto do conhecimento ou em
qualquer atividade humana. De acordo com TURBAN (2003), para ser til ao usurio, a
informao precisa ser completa, flexvel, confivel, relevante, pontual, verificvel,
acessvel e segura.

Na verdade, temos problemas para definir o que seja informao. Conforme


LANCASTER (1989):
Informao uma palavra usada com freqncia no linguajar quotidiano e a
maior parte das pessoas que a usam pensam que sabem o que ela significa. No
entanto, extremamente difcil definir informao, e at mesmo obter consenso
sobre como deveria ser definida. O fato , naturalmente, que informao
significa coisas diferentes para pessoas diferentes.

Segundo KANDO apud MACHADO (2001) possvel identificar trs grupos


distintos acerca do conceito de informao para a Cincia da Informao:
a) Informao com entidade objetiva: compreende o contedo do documento;
b) Informao com entidade subjetiva: representada pela imagem-estrutura
do receptor e as permutas da mesma;
c) Informao com processo: faz referncia ao processo mediante o qual o
sujeito se informa.

45

Na perspectiva de SHANNON (1998) informao algo que um receptor recebe


de um emissor em processo de comunicao, ou seja, em uma mensagem. Entretanto,
tal mensagem requer ser devidamente compreendida para, posteriormente ser
reconhecida como contendo algo de novo para o receptor. Quando um receptor recebe
uma mensagem contendo alguma coisa que j ele j entende ou ento que no
compreende, essa mensagem no transmite informao para ele. Assim sendo, a idia
de que dados ou mensagens podem trazer informao uma coisa subjetiva. Alguns
dados podem gerar informaes para um determinado usurio e no gerar para outros,
alm de poderem trazer diferentes informaes, em diferentes quantidades e em
diferentes tempos. possvel tambm que dados diferentes possam vir a transmitir uma
mesma informao e na verdade tudo depender daquele que recebe e analisa os dados
com o estado de conhecimento que possui.

Para SOUZA (2006) o conceito de

informao mais abstrato, sendo que a informao no prescinde do sujeito que a


depreenda a partir dos dados, no ato conhecido como interpretao. De acordo com
DAVENPORT & PRUSAK (1998):
a informao descrita como uma mensagem que tem sempre um emissor e um
receptor e que tem por finalidade mudar o modo como o destinatrio v algo,
exercer algum impacto sobre seu julgamento e comportamento. (...) Os
computadores podem ajudar a agregar os dados e a transform -los em
informao, porm quase nunca eles ajudam na parte de contexto, e os seres
humanos geralmente precisam agir nas partes de categorizao, clculo e
condensao. (...)

MESSIAS E MORAES (2003) avaliam que o conceito de informao no pode


ser desenvolvido isoladamente, o que implica na unio de diversas abordagens e
perspectivas terica, sendo possvel classificar algumas dessas abordagens de forma
sintetizada, tais como centrada na mensagem, na tomada de decises, nas estruturas
semiticas, no significado, no processo e na cognio. 5
5

A abordagem da informao centrada na mensagem ou teoria matemtica da informao privilegia a


teoria de Shannon & Weaver, que descreve o funcionamento de um sistema mecnico, onde as mensagens
emitidas pela fonte so transmitidas por um canal a fim de serem recebidas com o mnimo de deformao
por um usurio. Nesse contexto, a importncia est centrada no canal e na sua capacidade de veicular
mensagens a um custo baixo. A abordagem pragmtica pressupe que a informao um elemento que
auxilia na tomada de deciso de um sujeito. Assim sendo, a mensagem funciona com um redutor de
incertezas. Na abordagem estruturalista, a informao vista como estruturas semiticas, caracterizada
por uma estruturao deliberada da mensagem pelo emissor, com o objetivo de atingir a estrutura da
imagem do receptor. Sendo a informao modificadora de estruturas cognitivas. A abordagem centrada
no significado oriunda da lingstica e centra-se na organizao da mensagem em trs nveis:
predominncia sinttica, semntica ou pragmtica. A abordagem centrada no processo considera a
informao como um processo que ocorre na mente humana quando um problema e dado til para sua

46

Para ARAJO (1994) a informao algo dinmico, que faz com que o agente
modifique seu estado de conhecimento do mundo atual, modificando estruturas, e s
tendo sentido no contexto da ao acabada, ou seja, no contato efetivo de uma
mensagem, um potencial de infomao e o usurio.

4.1.1.3 Conhecimento

Na perspectiva de MIZZARO (1996), conhecimento a forma que a pessoa


percebe o mundo, processando dados e informaes que recebe e transformando-os em
conhecimento, o qual um potencial para um conjunto de aes. Esse conhecimento
mutvel e, ainda conforme esse autor, o conhecimento de uma pessoa em determinado
momento o seu estado de conhecimento. Conhecimento envolve experincia,
julgamentos e correlaes entre informaes e contextos de interesse do usurio. De
acordo com REZENDE (2003), conhecimento diz respeito habilidade de criar um
modelo mental que descreva o objeto e indique as aes a implementar e as decises a
tomar. A compreenso, a anlise e sntese, necessrias para a tomada de decises
inteligentes, so realizadas a partir do nvel do conhecimento. Em DAVENPORT &
PRUSAK (1998), as relaes entre dados, informaes e conhecimento so relevantes e,
em geral, essas categorias podem ser relativamente bem separadas. Esses autores
afirmam que:

conhecimento no dado nem informao, embora esteja intimamente


relacionado com ambos e que o sucesso ou fracasso organizacional
muitas vezes pode depender de se saber de qual deles precisamos, com
qual deles contamos e que podemos ou no fazer com cada um deles
(DAVENPORT & PRUSAK, 1998: 1)..

soluo encontram-se numa unio produtiva. E, finalmente, a abordagem cognitivista apresenta a


informao e o conhecimento como elementos diferentes, sendo o conhecimento avalivel somente em
nvel mental e a informao sendo o substituto fsico usado para a comunicao. Por meio dessa reflexo
podemos perceber que o conceito de informao pode ser desenvolvido em ambientes diversos,
englobando vrios ramos do saber, tais como, comunicao, filosofia, lingstica, teoria matemtica da
informao e at na biologia, que compreende a informao enquanto regularidades mantidas em sistemas
complexos. (MESSIAS, 2002). importante ressaltar que essa variedade de abordagens ao termo
informao dificulta em sua compreenso. Na ausncia de delimitaes precisas, muitos outros termos
so utilizados como sinnimo de informao, a comear por dado e conhecimento. Essa discusso muito
antiga e muito extensa. Nosso objetivo nesse momento no aprofundar essa questo. MESSIAS E
MORAES (2003, p. 6-7).

47

Esses mesmos autores tentam estabelecer uma diferena entre os trs conceitos
com objetivo de melhor situar o tema do conhecimento empresarial. Na sua abordagem:
O conhecimento uma mistura fluida de experincia condensada, valores,
informao contextual e insight experimentado, a qual proporciona uma
estrutura para a avaliao e incorporao de novas experincias e
informaes. Ele tem origem e aplicado na mente dos conhecedores. Nas
organizaes, ele costuma estar embutido no s em documentos ou
repositrios, mas tambm em rotinas, processos, prticas e normas
organizacionais (DAVENPORT & PRUSAK, 1998: 2-6).

Sob o ponto de vista organizacional, conhecimento consiste em informaes


organizadas e processadas para transmitir discernimento, experincia, aprendizagem
acumulada ou habilidade, se aplicvel a um problema ou processo empresarial atual.
Enfim, de acordo com BURKE (2003), conhecimento o que foi processado pelo
pensamento e existem diferentes tipos de conhecimento em toda cultura. H o
conhecimento filosfico, o senso comum, o cientfico, o religioso, dentre outros e todos
geram objetos pelos quais so representados.

4.1.1.4 Documento

Na presente tese, que aborda a minerao de textos em documentos, faz-se


importante abordar o conceito de documento. O documento pode ser visto, baseando-se
em BRIET (1951) 6 uma evidncia que suporta um fato, um signo de natureza fsica ou
simblica que permite representar, preservar, registrar e reconstituir ou demonstrar um
fenmeno fsico ou conceitual.

De acordo com MESSIAS E MORAES (2003):

A Cincia da Informao parece privilegiar a viso de informao como


conhecimento (de alguma forma) registrado, atrelado ao conceito de
documento, e a transferncia de tais contedos informacionais seria o foco de
maior interesse da rea. Podemos constatar tambm que o conceito de
informao para a Cincia da Informao mantm uma relao muito estreita
com o conceito de documento e consequentemente com os processos realizados
na instituio biblioteca (p. 11).

Citado em MESSIAS E MORAES (2003)

48

Em geral, para a Biblioteconomia e a Cincia da Informao, o documento a


unidade bsica que viabiliza expresso de um determinado conhecimento, atravs das
informaes nele contidas, sendo, de maior interesse, a transferncia de contedos
atravs de tais documentos ou objetos portadores de informao. Por outro lado,
BRAGA e CHRISTOVO (1997) postulam que documentos no so e nem contm
informao. Documentos so mensagens que podem ou no produzir informao,
dependendo do estado cognscio do receptor.

Na perspectiva de Paul Otlet, no final do sculo XIX, conforme citado por


OLIVEIRA (1) (2005) documento passou a ser o livro, a revista, o jornal, a pea de
arquivo, a estampa, a fotografia, a medalha, a msica, o disco, o filme e toda parte
documentria que precede ou sucede a emisso radiofnica. Segundo LE COADIC
(2004),

documento um termo genrico que designa os objetos portadores de


informao. Um documento todo artefato que representa ou expressa um
objeto, uma idia, ou uma informao por meio de smbolos grficos e icnicos
(palavras, imagens, diagramas, mapas, figuras, smbolos), sonoros e visuais
(gravados em suporte de papel ou eletrnico). O documento, segundo o tipo de
suporte, denominado documento de papel ou documento eletrnico (LE
COADIC, 2004:5 .

Em uma perpectiva mais ampla, de acordo com BUCKLAND (1991), um


documento inclui tambm imagens, sons ou qualquer outro objeto informativo e no
apenas os textos, que obviamente tem um papel de destaque, especialmente nas
bibliotecas digitais atuais.

Em outro trabalho BUCKLAND (1997) afirma que

documento qualquer forma ou expresso que o pensamento humano possa vir a


assumir ou qualquer fonte de informao, materialmente expressa que possa ser usada
como referncia ou estudo como uma autoridade. De acordo com ele, o que confere a
condio de documento a um determinado objeto ou a um ser a possibilidade de ser
relacionado com outras evidncias.

No presente trabalho, importante delimitar o conceito de documento, uma vez


que ser discutido o conceito de minerao de textos. Nesse contexto, portanto,

49

mantm-se para foco de anlise a idia de documento como um objeto de informao


textual, portador de assuntos, conceitos, autoria, local e data de elaborao, e passvel de
interesse de uma determinada comunidade de usurios potenciais. Sendo descritos em
forma de texto, portanto, esto em escritos em linguagem natural e como tal devem ser
alvo de tratamento pela minerao de textos.

4.1.2 A Questo da Gesto do Conhecimento

A questo do conhecimento cresceu em relevncia para o campo da


Administrao no seu esforo para gerenciar e desenvolver as organizaes, muito
ligada gesto do fator humano e de como responder aos desafios de como as pessoas
podem interagir e compartilhar experincias e informaes importantes para o bom
manejo e operao dessas mesmas organizaes. As questes da obteno, gerao,
tratamento e uso da informao que suportam os mltiplos relacionamentos das pessoas
na organizao so uma derivada desse processo. Preocupaes sobre o que seja
conhecimento e os seus diferentes tipos, bem como quais so interessantes para as
organizaes tambm aparecem. H tambm crticas ao conceito. Por isso, o campo da
Gesto do Conhecimento interdisciplinar, envolvendo a Administrao, a Cincia da
Informao, a Cincia da Computao, a Pedagogia, a Psicologia e a Filosofia.

O conceito de gesto do conhecimento no possui um consenso e pode ser


considerado e estudado sob diversos prismas. Inicialmente, precisamos colocar foco
numa reflexo sobre o que venha a ser conhecimento e, em seguida, sobre os
desdobramentos sobre as questes organizacionais. Nesse sentido, podemos tratar o
assunto a partir da considerao de quatro prismas: a) filosfico-cognitivo; b)
organizacional; c) informao e tecnologia e d) fator humano. possvel, tambm, fazer
uma reflexo crtica sobre a evoluo da gesto do conhecimento. Ao final, o enfoque
principal recair sobre questes organizacionais e tecnolgicas, discutindo contribuies
de autores que foram considerados importantes para a consolidao de uma viso mais
articulada sobre gesto do conhecimento organizacional, as quais se tornaram
importantes para efeito desse trabalho, em especial as de POLANYI (1966) que foram
absorvidas por NONAKA & TAKEUCHI (1997) e DAVENPORT & PRUSAK (1998)
e CHOO (2003).

50

4.2. Prisma Filosfico-Cognitivo

4.2.1 Face Filosfica

Podemos considerar que a filosofia e a epistemologia sempre estiveram


envolvidas na questo do entendimento do que seja conhecimento e de suas possveis
conceituaes, as quais podem ser diversas e no pretendem esgotar-se nesse trabalho.
O prprio conceito de epistemologia pode apresentar variaes. Classicamente,
conforme viso de GARCIA MARCO (1993) a epistemologia pode ser entendida como
a parte da filosofia voltada ao estudo dos processos do conhecimento humano,
considerando sua lgica, seus princpios e suas origens. Porm, hoje 7 a esfera de estudo
da epistemologia se concentra em uma perspectiva no to ampla, focando o estudo das
caractersticas do discurso cientfico e da evoluo dos paradigmas da cincia dentro de
um campo de conhecimento.

Conhecimento, derivado do latim, cognoscere, que quer dizer conhecer ou


procurar, indicando a funo ou ato da vida psquica que tem por efeito tornar os objetos
presentes ao sentido ou inteligncia. algo, portanto, colocado no nvel do humano,
do pessoal, embora possa receber a moldura da cultura, da histria, da tica e dos
padres de desenvolvimento tecnolgico de uma determinada sociedade em um
determinado momento do espao e do tempo. Podemos citar alguns marcos importantes
que envolvem a abordagem da filosofia e da epistemologia ao conhecimento. Na Grcia
antiga a questo do conhecimento teve um papel central. A expresso filosofia, com o
significado de amor sabedoria, ou de aspirao ao conhecimento j confere ao
conhecimento humano um destaque relevante em sua inteno e essncia. Em busca da
essncia da filosofia, DILTHEY (1921) afirma que deve ser primeiramente buscado
um contedo comum nos sistemas em que se forma a representao geral da filosofia. 8
HESSEN (1999) ir afirmar que
esses sistemas existem, como o so os sistemas de Plato, Aristteles,
Descartes, Leibniz, Kant e Hegel e que quando nos aprofundamos neles,
deparamos nos com caractersticas essenciais comuns, apesar de todas as
7

A Epistemologia ficar mais voltada ao estudo das cincias. Ao longo do sculo XX, trs grandes
perspectivas podem ser identificadas na Epistemologia: o Empirismo Lgico (Crculo de Viena), o
Falseabilismo (Karl Popper) e a Estrutura das Revolues Cientficas (Kuhn).
8
Cf. DILTHEY, W. Das Wesen der Philosophie, in: Kultur der Gerenwart I, VI: 3a. ed. 1921.

51

diferenas que apresentam. Encontramos uma atrao pelo todo um


direcionamento para a totalidade dos objetos. Esses sistemas, portanto,
possuem o carter da universalidade. A essa caracterstica essencial comum
soma-se outra. A atitude do filosofo com relao totalidade dos objetos uma
atitude intelectual, uma atitude de pensamento. Cabe ao filsofo conhecer,
saber. O filsofo um conhecedor por natureza. Aparecem , portanto, as
seguintes marcas da essncia da filosofia: 1) a atitude em relao totalidade
dos objetos; 2) o carter racional, cognoscitivo dessa atitude (HESSEN,
1999:5).

Ainda segundo HESSEN (1999), dois outros elementos podem ser considerados:
a viso de si e a viso do mundo. H uma interao entre esses quatro elementos.
Conforme afirma HESSEN (1999):
a totalidade dos objetos pode se referir tanto ao mundo exterior quanto ao
mundo interior, tanto ao macrocosmo quanto microcosmo. Se a conscincia
filosfica dirige-se ao macrocosmo, tratamos de filosofia como viso de mundo.
Se o microcosmo que constitui o objeto do enfoque filosfico, surge um
segundo tipo de filosofia: a filosofia como viso de si, do esprito (HESSEN,
1999:9).

HESSEN afirma que ento possvel definir a essncia da filosofia como

auto -reflexo do esprito sobre seu comportamento valorativo terico e


prtico e, igualmente, aspirao a uma inteligncia das conexes ltimas das
coisas ,a uma viso racional de mundo. Podemos, porm, estabelecer uma
ligao mais profunda entre esses dois elementos essenciais. Como Plato e
Kant nos mostram, existe entre ambos uma relao de meio e fim. A auto reflexo do esprito meio para se atingir uma imagem de mundo, uma viso
metafsica de mundo. Em concluso portanto, podemos dizer que a filosofia a
tentativa do esprito humano de atingir uma viso de mundo, mediante a auto reflexo sobre suas funes valorativas, tericas e prticas (HESSEN,
1999:9).

Um quadro sinptico poderia apresentar essas idias de HESSEN (1999) na


Figura 3:
MUNDO
EXTERIOR
TOTALIDADE
DOS OBJETOS
COGNOSCITIVIDADE

MUNDO
INTERIOR

MACROCOSMO

MICROCOSMO

VISO DO MUNDO

VISO DE SI

Figura 3: Sinopse das Idias de Hessen sobre a Essncia da Filosofia


Fonte: Baseado em HESSEN (1999)

52

Plato e Aristteles apresentaro vises diferentes em seus sistemas filosficos.


Para HESSEN (1999) a viso de Plato significa que a filosofia busca uma viso de si,
do esprito, estendendo-se totalidade dos objetos, sejam eles prticos, sejam eles
coisas como virtude, valores do bom, do belo e do verdadeiro. J em Aristteles temos
uma concentrao no que podemos chamar de conhecimento cientfico e em seu objeto,
o ser.
No seu ncleo est uma cincia universal do ser:a filosofia primeira ou
como seria chamada mais tarde, a metafsica. Ela nos informa sobre a essncia
das coisas, a contingncia e os princpios ltimos da realidade. Se a filosofia
socrtico-platnica pode ser caracterizada como uma viso de si do esprito,
devemos dizer que, em Aristteles, a filosofia aparece antes de tudo como viso
de mundo (HESSEN, 1999:6)

NONAKA E TAKEUCHI (1997) Na discusso sobre o que seja conhecimento,


iro afirmar:
Apesar das diferenas fundamentais entre racionalismo e empirismo, os
filsofos ocidentais, em geral, concordam que conhecimento a crena
verdadeira justificada, um conceito introduzido inicialmente por Plato em
Mnon, Pdon, e Teeteto . No entanto, a definio de conhecimento est longe
de ser perfeita em termos lgicos. Segundo essa definio, nossa crena na
verdade de uma coisa no constitui nosso verdadeiro conhecimento dessa
coisa, por isso existe uma chance, por menor que seja, de que nossa crena
esteja errada. Portanto, a busca do conhecimento na filosofia ocidental
carregada de ceticismo, o que induziu diversos filsofos a buscarem um mtodo
que os ajudasse a estabelecer a verdade indubitvel do conhecimento. Eles
almejavam descobrir o conhecimento fundamental sem prova ou indcio
sobre o qual seria possvel assentar todo e qualquer conhecimento. (NONAKA
E TAKEUCHI,1997: 24-25).

Esses autores lembram, portanto, que o ocidente marcado por duas grandes
tradies epistemolgicas: o racionalismo e o empirismo. Afirmam que no
racionalismo, marcado pelos sistemas de Scrates, Plato, Descartes e Kant, o
conhecimento produto de um processo mental ideal, enquanto que para o empirismo,
marcado pelos sistemas de Aristteles, Locke, Espinosa e Leibniz, o conhecimento
produto da experincia sensorial.

Lembram que tambm no mtodo h distines

importantes: enquanto o racionalismo utiliza a deduo, que recorre a construes


mentais, como conceitos, leis ou teorias, o empirismo recorrer induo, servindo-se
de experincias sensoriais especficas. De qualquer forma, um ponto importante aqui
precisa ser destacado: ao lidar com o conhecimento ser necessrio lidar com a idia der
representao desse conhecimento. Na medida em que os seres humanos conhecem a

53

realidade, tem a necessidade de assimilar as coisas atravs das representaes na mente


da pessoa que conhece.

Outro ponto importante nessa considerao preliminar sobre a questo do


conhecimento a diferena que NONAKA E TAKEUCHI fazem sobre a viso
ocidental e oriental (japonesa) do conhecimento. Enquanto na filosofia ocidental, h
uma longa tradio de separao entre o sujeito que conhece e o objeto conhecido,
mente e corpo ou mente e matria, na filosofia oriental japonesa postula-se uma unidade
do homem com a natureza, do corpo com a mente e, por conseguinte, do eu e do outro.
Segundo os autores:

o dualismo cartesiano entre sujeito e objeto ou mente e corpo partia do


pressuposto de que a essncia de um ser humano o seu pensante racional.
Esse eu pensante busca o conhecimento isolando-se do resto do mundo e dos
outros seres humanos. Mas os desafios contemporneos impostos ao dualismo
cartesiano enfatizam a importncia de alguma forma de interao entre o eu e
o mundo externo na busca do conhecimento (NONAKA E TAKEUCHI,

1997: 29).
Na verdade, as afirmaes de NONAKA e TAKEUCHI relativas a Kant
precisam ser revistas, uma vez que Kant avalia criticamente os contrapontos tanto do
racionalismo como do empirismo. Ao propor sua filosofia, Kant o faz considerando
duas ameaas: o dogmatismo e o empirismo. O primeiro confia demasiado na razo sem
desconfiar o suficiente das iluses especulativas. O segundo, por medo de erros
dogmticos, tende a reduzir tudo experincia. Para Kant, a razo precisa ser alvo de
um justo uso, aps fazer uma triagem daquilo que lhe possvel e daquilo que lhe
escapa. Na Crtica da Razo Pura 9 , investiga os limites do emprego da razo no
conhecimento e procura estabelecer as condies de possibilidade do conhecimento,
distinguindo os usos legtimos da razo na produo de conhecimento dos usos
especulativos que no agregam conhecimento. Para Kant o conhecimento vem da
sensibilidade e do entendimento. Pela primeira, os objetos so dados ao homem e pelo
segundo so pensados. Sem a conjugao de ambos no possvel a exp erincia do real.
Portanto, preciso analisar as condies de possibilidade do conhecimento, isto ,
refletir criticamente sobre os fundamentos da cincia e da experincia em geral.

Kritik der reinen Vernunft editado inicialmente em 1781 e posteriormente em 1787 com alteraes.

54

Assim sendo, sob a face filosfica, a questo do conhecimento pode ser


amplamente abordada, sob diferentes perspectivas e mltiplos pontos de vista
filosficos de variados autores, no sendo este o propsito do presente trabalho. Mas,
conforme debatido acima, precisamos buscar pontos em comum em tais discusses e
fica aqui assinalada a idia de se buscar pontos em comum em diferentes sistemas
filosficos, sendo estes a busca da universalidade, a atrao pela totalidade na
compreenso dos objetos do mundo.

4.2.2 Face Cognitiva

4.2.2.1 Behaviorismo e Gestalt

O embate entre empirismo e racionalismo se tornou presente na reflexo


contempornea sobre aprendizagem e conhecimento, sendo o primeiro representado
pela teoria behaviorista (de conotao positivista e mecanicista) e o segundo pelo
movimento chamado gestalt (de conotao idealista) 10 . O behaviorismo assumiu o valor
da experincia como determinante do conhecimento o qual fruto da aprendizagem.
Essa aprendizagem implica em condicionamentos, isto : o indivduo aprende aquilo
para o qual estimulado e reforado. Portanto, o comportamento, luz do
behaviorismo, modelado e isso implica na importncia do estudo dos elementos de
reforo. A aprendizagem seria, portanto, uma mudana de comportamento que
resultante do treino e da experincia, podendo ser acelerada e direcio nada por
mecanismos de reforo (estmulos). Para o behaviorismo o conhecimento tem uma
conotao associativa, isto , se constitui numa cadeia de idias atomisticamente
formadas a partir do registro dos fatos que vo sendo acumulados pela experincia do
sujeito. Na perspectiva associativa que confere base a essa corrente de pensamento
aprender um processo gradativo pautado em ensaios e erros e no exerccio repetitivo.

10

No objetivo do presente trabalho analisar em detalhes o behaviorismo e gestaltismo. A presente


explanao sobre behaviorismo e gestaltismo foi baseada na interpretao de A. GIUSTA Concepes de
Aprendizagem e Prticas Pedaggicas artigo publicado na Revista de Educao, Belo Horizonte (1985:
24-31). um panorama reduzido de seus aspectos e caractersticas para contextualizar o estudo do
conhecimento e abrir perspectiva para as idias de J.PIAGET que sero apresentadas a seguir. Uma viso
mais detalhada das duas correntes implica na avaliao dos estudos clssicos de J.B. WATSON,
I.P.PAVLOV e B.F.SKINNER, dentre outros representantes do behaviorismo e de M.WERTHEIMER,
K.KOFFKA e W.KHLER representantes do gestaltismo.

55

O gestaltismo, (do alemo gestalten, isto configurao) por sua vez, caminha
no sentido oposto ao do behaviorismo, numa perspectiva racional e subjetiva, afirmando
que o conhecimento anterior experincia. resultado do exerccio de estruturas
racionais pr- formadas no sujeito. H estruturas mentais como totalidades organizadas
e pr- formadas que no so, portanto, fruto da ao desse sujeito. A organizao
perceptual o elemento primordial. Perceber totalidades, formas atravs de
intravises (Einsicht em alemo que redundou no termo ingls insight), ou seja, da
reestruturao do campo perceptual. Isso permite que as totalidades sejam melhor
captadas da realidade e, uma vez que isso aconteceu, no h mais necessidade de
repeties.

4.2.2.2 O Desenvolvimento do Conhecimento na Perspectiva Construtivista


Uma perspectiva diferente das duas anteriores aberta por PIAGET 11 . Enquanto
epistemlogo, PIAGET (1976) ocupou-se significativamente do estudo da formao e
desenvolvimento do conhecimento. Analisando sua obra, CELLRIER (1978) postula
que a problemtica inicial daquele autor fundamentalmente filosfica e nelas se
colocam questes clssicas da filosofia, tais como: o que conhecimento? Como
conhecemos? Como conseguimos conhecer o que conhecemos? A filosofia possui uma
formulao clssica para tratar essas questes em termos de verdades normativas (que
so independentes de verificao emprica, como a lgica e a matemtica) e verdades de
fato (que so verificveis empiricamente, como, por exemplo, a solidificao da gua a
0o C.). Teramos ento dois tipos de conhecimento, o normativo e o verificativo. Alm
disso, outra questo se coloca: como estabelecer relaes entre ambos? Dar uma
resposta satisfatria a este problema da relao existente o desafio a qualquer teoria do
conhecimento e PIAGET reformular todas essas questes recolocando as perguntas em
outros termos, tais como: como se passa de um estado de menor conhecimento a outro

11

Tambm no que tange extensa e complexa obra de PIAGET o presente trabalho pretende apenas
apresentar uma viso panormica geral resgatando conceitos considerados fundamentais para os objetivos
do presente estudo. Uma anlise mais detalhada deve recorrer, alm das inmeras obras no campo da
cincia cognitiva, aos trabalhos e publicaes originais do autor, em especial: PIAGET, Jean. A
equilibrao das estruturas cognitivas . So Paulo. Zahar, 1976

56

de maior conhecimento? Ou em outros termos, como se passa de um estado


conhecimento de menor validade para um conhecimento de maior validade?

12

De acordo com PIAGET, no processo de conhecimento, para estabelecermos


relaes do sujeito com o objeto, devemos rejeitar as hipteses empiristas, pois os
conhecimentos cientficos, no so simples reflexos do real, mas resultam de uma
atividade do sujeito que organiza e estrutura os dados da experincia a fim de
compreend- los. Opondo-se simultaneamente ao behaviorismo e ao gestaltismo e
adotando uma posio dialtica, o autor acima analisado afirmar:
o conhecimento no procede nem da experincia nica dos objetos nem de
uma programao inata pr-formada no sujeito, mas de uma interao entre
ambos, que resulta em construes sucessivas com elaboraes constantes de
estruturas novas graas a um processo de equilibraes majorantes, que
corrigem e completam as formas precedentes de equilbrio (PIAGET, 1976:7)
.

preciso entender o que so essas construes sucessivas e o processo de


equilibrao majorante. Para esse autor, as construes sucessivas so resultados da
relao sujeito-objeto na qual no h oposio, mas interao e formao de um todo
nico. As aes de um sobre o outro so recprocas. H uma perspectiva contingencial
em PIAGET, para quem
o sujeito constitui, com o meio, uma totalidade, sendo, portanto, passvel de
desequilbrio em funo das perturbaes desse meio. Isso o obriga a um
esforo de adaptao, de readaptao, a fim de que o equilbrio seja
reestabelecido (GIUSTA,1985: 29)

Para PIAGET a ao do indivduo, o deflagrador do desenvolvimento


cognitivo e da construo do conhecimento. Na medida em que o indivduo vai agindo
no mundo, ou seja, interagindo com os objetos, ele vai transformando a realidade e os
objetos (assimilao). Isso significa que vai assimilando os objetos e a realidade em
suas estruturas de representao dessa mesma realidade (poderamos dizer, do
conhecimento). Tais estruturas so o conjunto articulado de elementos que o indivduo
assimilou, interligado por regras de conexes e transformaes. , portanto, uma

12

Para uma discusso mais detalhada dessas questes que possuem grande complexidade e relevncia
ver CELLRIER, G. El pensamiento de Piaget Barcelona, Pennsula, 1976

57

totalidade que se transforma e se auto-regula continuamente na medida em que o


indivduo interage com o meio. Nas palavras de PIAGET (1968):
uma estrutura um sistema de transformaes que comporta leis enquanto
sistema (por oposio propriedade dos elementos) e que se conserva ou se
enriquece pelo prprio jogo de suas transformaes, sem que estas ultrapassem
suas fronteiras ou faam apelo a elementos exteriores. Em sntese, uma
estrutura compreende assim as caractersticas de totalidade, de transformaes
e de auto-regulao (p 6-7).

Mas tambm o indivduo sofre a ao do seu meio, dos objetos da realidade e


precisa se adaptar (acomodao) e as estruturas de representao tambm se adaptam.
Assimilao e acomodao so processos complementares.

Sem a acomodao a

assimilao no seria possvel. A ao do sujeito sobre o seu meio (sua interao com
os objetos e a realidade atravs de assimilao e acomodao) promove a constante
transformao das estruturas de representao. A essa contnua dinmica de ao
envolvendo assimilao e acomodao pela qual passa o indivduo chamamos de
equilibrao majorante. Alm da assimilao e da acomodao, importante para
viabilizar a equilibrao majorante a funo de organizao. Analisando o processo
GIUSTA (1985) afirmar:

chamamos a ateno para o fato de que a assimilao/acomodao, desde os


seus primrdios, apresenta -se como um ponto de partida relativo, como suporte
para uma equilibrao majorante, isto para o restabelecimento do equilbrio
no apenas como uma volta ao equilbrio anterior, mas como formao de um
novo equilbrio, ou, mais precisamente, de um melhor equilbrio. Esse
equilbrio de nvel superior funciona, ento, como um novo ponto de partida, e
assim sucessivamente Para que essa equilibrao majorante tenha lugar, uma
funo de organizao se faz necessria, pois, medida que indivduo assimila
e acomoda, a organizao se faz presente para integrar uma nova estrutura a
uma estrutura pr-existente, que mesmo total, passa a funcionar como
subestrutura. Constata -se, ento, que a funo de organizao garante a
totalidade, atravs da solidariedade dos mecanismos de diferenciao e de
integrao, preservando a continuidade e a transformao (p29) .

A Figura 4 abaixo pode expressar o processo de equilibrao majorante: as


estruturas de representao, ou seja, as estruturas de conhecimento, vo sendo
reconfiguradas na medida em que o indivduo vai interagindo com o mundo. A
equilibrao majorante consiste, portanto no processo de fazer com que esse
conhecimento seja sempre reconfigurado a partir de constantes organizaes que

58

ocorrem com a assimilao de novos elementos (objetos) a partir da ao do sujeito e da


acomodao ou ajuste desse sujeito e de seu conhecimento ao novo, ao real.

Figura 4: o processo de equilibrao majorante


Fonte: Adaptado de GIUSTA (1985)

Nas palavras de PIAGET (1972):


A mais bela das adaptaes ao meio que a vida tenha realizado , de fato, a
adaptao do conhecimento realidade e a mais surpreendente das evolues,
fonte de novidades e estruturas cada vez mais ricas a evoluo da prpria
inteligncia a partir de seus comeos promissores, ainda que modestos entre os
animais superiores e depois se afirmando de conquista em conquista no
decorrer da histria humana. (...) Um primeiro resultado geral se imps e se
impe, sempre com maior fora: o papel ativo e construtivo do sujeito
pensante no ato do conhecimento, do sujeito pensante no ato do conhecimento,
do sujeito pensante com relao simples aquisio, do simples requisito das
propriedades do objeto. Em outras palavras, como KANT bem vira, todo
conhecimento resulta de uma sntese que depende de estruturas prprias ao
sujeito, mas ns acreditamos que essas estruturas prprias ao sujeito, em lugar
de serem dadas anteriormente, se constroem pouco a pouco, o que alis refora
a parte das atividades do sujeito 13 .

Na tentativa de tentar sintetizar a complexidade das idias de PIAGET, podemos


sugerir que o conhecimento o estado de desenvolvimento e configurao atingido
pelas estruturas de representao da realidade (e que engloba uma viso de si e uma
viso do mundo), num determinado momento, fruto da organizao que ocorre nessas
mesmas estruturas na equilibrao majorante a partir da interao do indivduo com seu
meio.

13

Trecho do discurso de Jean PIAGET ao receber o Prmio Erasmo, na Holanda em 1972 e que foi
publicado na revista francesa LEducation (n. 150 janeiro de 1973)

59

PIAGET insere-se, portanto, na perspectiva construtivista, um campo da teoria


do conhecimento que se baseia numa concepo dialtica das relaes entre o sujeito
que conhece e o objeto conhecido. A razo ao mesmo tempo elemento de estruturao
da realidade e estruturada por ela.

Ainda na perspectiva construtivista, merece destaque as reflexes relacionadas


epistemologia histrica de BACHELARD 14 . Nela temos algo anlogo idia de
equilibrao majorante que o chamado conhecimento aproximado.

Nos

aproximamos da verdade a partir de sucessivos erros retificados, ou seja: o


conhecimento se amplia, a verdade se manifesta e a cincia avana atravs de sucessivas
e constantes retificaes de teorias anteriores que revelam como o verdadeiro pode ser
extrado do falso, numa constante polmica em relao ao erro e num
reqestionamento contnuo dos saberes j objetivados. Para esse autor, o esprito
cientfico essencialmente retificao do saber

4.2.2.3 Pensamento, Linguagem e Conhecimento Tcito e Explcito


A questo do conhecimento no poder ser separada do processo de linguagem e
do significado que as pessoas do aos objetos e expresso da linguagem. POLANYI
(1969) indica que as pessoas adquirem conhecimentos criando e organizando suas
prprias experincias num processo interativo com a realidade. Nesse processo,
fundamental separar os conceitos de conhecimento tcito e conhecimento explcito. Em
seu trabalho, Significado e Ensino, HAYNES (1999), analisando o trabalho de
POLANYI, afirmar:
Michael POLANYI (1969) concorda diz que todo pensamento humano
acontece dentro da existncia, abarcando o significado e dominando o uso da
linguagem. Para abarcar o significado temos que interiorizar as coisas
externas, ou entrarmos dentro delas. O significado surge reunindo indcios em
nosso prprio corpo ou fora dele. No podemos aprender a subir numa
bicicleta memorizando as leis da fsica que governam seu equilbrio. As leis
tm que ser feitas significativamente, tomando-se a bicicleta e tentando-se as
diferentes aes que a mantm na vertical e que a encaminham para a direo
que queremos. A linguagem da fsica menos necessria para a bicicleta andar
do que uma compreenso do equilbrio, a qual aprendida fisicamente e
socialmente ao mesmo tempo.

14

Gaston Bachelard (1884 1962).

60

POLANYI (1969) ilustra a necessidade e a insuficincia da linguagem para o


significado com um exemplo sobre como aprendemos a descobrir uma doena
pulmonar atravs de radiografias. medida que o estudante presta ateno
durante algumas semanas, examinando chapas de casos diferentes, um rico
panorama de detalhes significantes de variaes fisiolgicas e mudanas
patolgicas, de cicatrizes e sinais de doena aguda ser gradualmente
revelado. As radiografias comeam a fazer sentido. No mesmo momento em ele
aprendeu a linguagem da radiologia pulmonar, o estudante tambm ter
aprendido a ver significativamente as radiografias. A experincia imediata do
significado da radiografia coincidente mas no idntica sua conscincia
focal que est presente em pensamento. Conhecimento conscincia focal,
aquilo de que estamos conscientes e de que podemos falar. A compreenso a
integrao tcita do conhecimento. Passamos do conhecimento compreenso
sem esforo.
De acordo com POLANYI (1969), nossa conscincia auxiliar de algo que nos
dota de significado. Um significado que conduz a um objeto do qual ns somos
conscientes de modo focal. A compreenso tcita, que nos d significado,
consiste em coisas subsidirias que afetam um enfoque em virtude de uma
integrao executada por uma pessoa.
No podemos formular leis rgidas derivando leis gerais de experincias
individuais porque cada instncia de uma lei diferir, em cada particular, de
cada outra instncia sua. Para formar conceitos de classe, essenciais ao
significado, temos que presumir aquele processo indeterminado e global de
compreenso tcita. Aplicando nossa concepo de qualquer classe de coisas,
quer dores, pronomes ou pessoas, como podemos identificar objetos ou
sentimentos que parecem ser diferentes em aspectos decisivos?
A compreenso tcita no pode ser reduzida sua articulao explcita porque
ela pode ser articulada por um nmero indeterminado de sistemas de
linguagem. Quando o estudante olha uma radiografia, ele pode foc-la com a
viso de um artista e v-la em formas de luz e sombras, ou ele pode v-la como
sendo uma radiografia. Suas experincias mdicas so parte da compreenso
subsidiria que informar o seu foco sobre ela15 .

A distino estabelecida por POLANYI (1969), apresentando o conhecimento


tcito como um conhecimento interno, pessoal, prprio das pessoas e inserido nas
circunstncias, enquanto o conhecimento explcito aquele que pode ser codificado,
sistematizado e transmitido, a base para as duas mais recentes e significativas
abordagens do conhecimento organizacional: os trabalhos de NONAKA & TAKEUCHI
e de DAVENPORT & PRUSAK. Num prisma organizacional, que ser desenvolvido no
prximo tpico, NONAKA E TAKEUCHI iro assumir as colocaes de POLANYI ao
afirmar que:

15

HAYNES, Felicity Significado e Ensino. University of Wertern Austrlia. Trad. Emilia Siller . A obra
de Michael Polanyi referida pela autora Knowing and Being. Chicago University Press, 1969

61

o conhecimento que pode ser expresso em palavras e nmeros representa


apenas a ponta do iceberg do conjunto de conhecimentos como um todo. Como
diz Polanyi (1969), Podemos saber mais do que podemos dizer. Na
epistemologia tradicional, o conhecimento deriva-se da separao do sujeito e
do e do objeto da percepo; os seres humanos como sujeitos da percepo
adquirem conhecimento mediante a anlise dos objetos externos. Por outro
lado, Polanyi argumenta que os seres humanos criam conhecimento
envolvendo-se com objetos, ou seja, atravs do envolvimento e compromisso
pessoal, ou o que Polanyi chama de residir em. Saber algo criar sua
imagem ou padro atravs da integrao tcita de detalhes. Para entender o
padro como um todo significativo, necessrio integrar o corpo com os
detalhes. Assim, o residir em rompe com as dicotomias tradicionais entre
mente e corpo, razo e emoo, sujeito e objeto, conhecedor e conhecido.
Portanto, a objetividade cientfica no constitui a nica fonte de
conhecimentos. Grande parte de nossos conhecimentos fruto de nosso esforo
voluntrio de lidar com o mundo (NONAKA E TAKEUCHI,1997: 65-66) .

CHOO (2003) lembra que as inovaes organizacionais germinam a partir do


conhecimento tcito e que embora esse conhecimento desenvolva-se inicialmente nas
habilidades

intuies

dos

indivduos,

tal

conhecimento

gradativamente

compartilhado, sendo que o grupo modula ento seu conhecimento pessoal por meio de
uma rede de papeis, relacionamentos e ferramentas para inventar um novo
conhecimento. Portanto, o conhecimento pode emergir da articulao de pessoas e/ou
organizaes que compartilham informaes e constroem esse conhecimento por meio
de suas interaes.

4.3. Prisma Organizacional

4.3.1 Uma abordagem funcional e organizacional do conhecimento

De acordo com CHOO (2003), uma organizao do conhecimento


aquela que possui informaes e conhecimentos que a tornam bem informada
e capaz de percepo e discernimento. Num nvel mais profundo, a organizao
do conhecimento possui informaes e conhecimentos que lhe conferem uma
vantagem, permitindo-lhe agir com inteligncia, criatividade e, ocasionalmente,
com esperteza. (...) No corao da organizao do conhecimento est a
administrao de processos de informao, que constituem a base para criar
significado, construir conhecimento e tomar decises.

A abordagem organizacional do estudo do conhecimento e da qual emerge mais


explicitamente o termo gesto do conhecimento tem em sua gnese o reconhecimento
da crescente importncia do conhecimento na dinmica organizacional. Na medida em
62

que a dinmica dos mercados globalizados e os sistemas produtivos se tornam cada vez
mais complexos, em especial pelos constantes investimentos em novas tecnologias e
pela sofisticao das exigncias para sua operao, torna-se cada vez mais necessria
uma abordagem terica e organizacional que responda a esses desafios. Essa nova
abordagem pode passar pelo conceito de gerncia do conhecimento. De certa maneira,
os principais conceitos que so apresentados pelos principais autores dessa abordagem,
tem fortes razes na abordagem filosfico-cognitiva apresentada na seo anterior.
Entretanto h uma perspectiva funcionalista no uso dos conceitos em favor da
otimizao da dinmica da organizao, o que leva muitas vezes interpretaes
simplistas e que muitas vezes no explicitam as contribuies recebidas. Na definio
de NONAKA e TAKEUCHI (1997)

criao do conhecimento organizacional a capacidade que uma empresa


tem de criar conhecimento, dissemin-lo na organizao e incorpor-lo a
produtos, servios e sistemas e o sucesso alcanado pelas empresas japonesas
se deveu em grande parte sua capacidade e habilidade em criar e aplicar o
conhecimento organizacional (NONAKA E TAKEUCHI,1997: Cap 1) .

Conforme j mencionado, o trabalho de NONAKA e TAKEUCHI pode ser


considerado um marco no estudo recente do que podemos chamar de viso
organizacional do conhecimento. Em sua teoria, eles esto a propor um modelo de
espiral do conhecimento16 baseado no confronto de trs dimenses, que classificam de
ontolgica e epistemolgica, conforme apresentada na Figura 5 abaixo. A terceira
dimenso o tempo, que expresso por um conjunto de fases no processo de criao do
conhecimento organizacional.

16

No Captulo 3 NONAKA E TAKEUCHI (1997) descrevem de modo sistematizado o que chamam de


Teoria da Criao do Conhecimento Organizacional, cuja essncia apresentamos no resumo que se segue
a esta descrio. Conceitos filosficos so resgatados pelos autores ao longo da obra e colocados numa
perspectiva funcionalista para a organizao contempornea.

63

Dimenso
Epistemolgica

Conhecimento
Explicito

Conhecimento
Tcito

Dimenso
Ontolgica

Indivduo

Grupo

Organizao

Interorganizao

Nvel de conhecimento

Duas dimenses de criao do conhecimento (NONAKA E TAKEUCHI, 1997)

Figura 5: Duas dimenses de criao do conhecimento


Fonte: NONAKA E TAKEUCHI (1997: 62)

Em termos ontolgicos, apresentam a viso de que o conhecimento numa


organizao no pode ser criado sem indivduos. Na perspectiva de STEWART (1998)
esses indivduos podem ser os empregados, os clientes, os fornecedores ou os parceiros
e todos precisam ser ouvidos. O papel da organizao estimular os indivduos
criativos e oferecer- lhes contexto para que criem conhecimento. Apreciar suas idias e
valoriza-las, estimulando ambientes que favoream a partilha de experincias e a
criao

do

conhecimento.

Esse

conhecimento

pode

ser

expandido

organizacionalmente, cristalizando-se como parte da rede de conhecimentos da


organizao dentro de uma comunidade de interao. Uma expanso que poderia,
inclusive, extrapolar as fronteiras organizacionais. Essa anlise pode salientar o papel
importante da cultura organizacional e do trabalho coletivo. SHEIN (1986), citado na
obra de FLEURY (1997), afirma que

a cultura formada pelo conjunto de pressupostos bsicos que um grupo


inventou, descobriu, ou desenvolveu, ao aprender a lidar com os problemas de
adaptao externa e integrao interna e que funcionaram bem o suficiente

64

para serem considerados vlidos e ensinados a novos membros como a forma


correta de perceber, pensar e sentir com relao a esses problemas17 .

Na mesma obra de FLEURY (1997) exposto um enriquecimento deste


conceito:
cultura organizacional um conjunto de valores, expressos em elementos
simblicos e em prticas organizacionais, que em sua capacidade de ordenar,
atribuir significaes, construir a identidade organizacional, tanto agem como
elementos de comunicao e consenso como expressam e instrumentalizam
relaes de dominao 18 .

Conjunto de valores e prticas que fazem com que a organizao possa agir no
seu ambiente expressam simultaneamente a cultura e o conhecimento organizacional.
Realmente so as pessoas que criam o conhecimento, mas quando essa criao se d
dentro de um ambiente e dentro de determinadas circunstncias podemos ter o
conhecimento organizacional, ou seja: um conhecimento que foi gerado pela interao
de pessoas atuando sob um conjunto de princpios, valores, objetivos e estratgias.
Alm disso, esse conhecimento s faz seu maior sentido dentro daquele ambiente, isto
: os resultados ou transformaes que podem produzir esto em conexo com esse
contexto organizacional. Abre-se, portanto, uma perspectiva sistmica para a questo do
conhecimento.

Em seu estudo sobre sistemas, BERTALANFFY (1968), postula que as


propriedades dos sistemas no podem ser descritas significativamente em termos de
seus elementos separados e sua compreenso ir ocorrer apenas quando estudarmos os
sistemas globalmente 19 . CHIAVENATO (1976) afirma que o ho lismo a tese que
sustenta que algumas totalidades representam mais do que a soma das partes e, citando
o trabalho de Jan Christhian SMUTS (1926), Holismo e Evoluo, descreve que ao
serem reunidos para constituir uma unidade funcional maior, os compone ntes
individuais de um sistema desenvolvem qualidades que no so produzidas a partir de
seus comportamentos isolados. 20

Portanto, numa perspectiva organizacional e

17

SHEIN, E. Organizational culture and leadership. San Francisco: Jossey-Bass, 1.ed. 1986, in
FLEURY, A . & FLEURY, M. Aprendizagem e Inovao Organizacional: as experincias de Japo,
Coria e Brasil So Paulo: Atlas, 1997. P. 24
18
FLEURY, M.T. Cultura e poder nas organizaes. So Paulo. Atlas, 1989
19
BERTALANFFY, Ludvig von. General Systems Theory. Nova York, George Brasilier, 1968
20
CHIAVENATO, Idalberto. Introduo Teoria Geral da Administrao. 5a. ed. So Paulo, Makron
Books, 1976

65

sistmica, que focaliza mais a interao entre elementos componentes de um sistema, no


caso o sistema seria a organizao, do que os elementos em si, no caso os elementos so
as pessoas, poderamos afirmar que o conhecimento organizacional emerge do interrelacionamento entre as pessoas que trabalham juntas no seio de uma cultura,
permanecendo vivo ou existente dentro dessa mesma cultura ou quando ser
formalizado ou explicitado em normas, regras, planos, documentos e sistemas de
informao.

Dentro dessa perspectiva temos dois conhecimentos que se relacionam: um


conhecimento informal, fludo nas habilidades das pessoas e na sua interao, mas que
gradativamente pode, ao menos em parte, ir sendo explicitado formalmente em sistemas
de controle e gesto das organizaes.

Essa anlise se coaduna com a viso de NONAKA E TAKEUCHI (1997) que


podemos retomar, agora em termos epistemolgicos. Na opinio desses autores, as
empresas precisam detectar e valorizar o conhecimento tcito, ou seja, o que sabemos
implicitamente, por dentro, e o que sabemos formalmente. O conhecimento tcito
pessoal, especifico do contexto e, portanto, difcil de formalizar e comunicar. O
conhecimento explcito ou codificado, por outro lado, refere-se ao conhecimento que
transmissvel na linguagem formal e sistematizada. Por isso, ser de fundamental
importncia a converso do conhecimento tcito em explicito, processo no qual os
gerentes de nvel mdio vo desempenhar importante papel, na medida em que captar o
conhecimento tcito dos empregados dos nveis operacionais e tambm daqueles da alta
direo, tornando-o explicito e incorporando-o a novas tecnologias. Na viabilizao da
utilizao do conhecimento tem-se um processo de converso do conhecimento,
caracterizado por quatro modos que se interagem de modo cclico no processo de
converso do conhecimento. Esses quatro modos so:
Socializao: descreve o compartilhamento implcito de conhecimento tcito, muitas
vezes sem uso de linguagem, como por exemplo atravs da experincia, que pode ser
passada a outra pessoa at mesmo pela observao, imitao e prtica. NONAKA &
TAKEUCHI afirmam que se trata de um processo de compartilhamento de
experincias e, a partir da, da criao do conhecimento tcito, como modelos

66

mentais ou habilidades tcnicas compartilhadas Uma nota no trabalho desses


autores esclarece o conceito de modelo mental, na qual se afirma
CANNON-BROWERS, J.A ., E. SALAS, e S. CONVERSE (1993) definem
modelos mentais compartilhados como sendo estruturas de conhecimento
mantidas pelos membros de uma equipe que lhes permitem elaborar
explicaes e expectativas precisas para a tarefa e, em contrapartida,
coordenar suas aes e adaptar seu comportamento demandas da tarefa e a
outros membros da equipe.(...) Para compreender como um modelo mental
compartilhado criado, til conhecer o conceito de fuso de horizontes do
filsofo alemo Hans-Georg GADAMER (1989) que argumenta que uma
verdadeira compreenso de um texto uma fuso dos horizontes do
intrprete e do autor. Define o horizonte como a faixa de viso que inclui tudo
o que pode ser visto de um determinado ponto de observao (p.302).
Aplicando esse conceito ao nosso conceito, podemos argumentar que a
socializao uma fuso dos conhecimentos tcitos dos participantes em um
modelo mental compartilhado21 .

Externalizao: significa converter o conhecimento tcito em conhecimento


explcito. Isso pode se dar atravs de mtodos analticos, como deduo e induo
atravs da formalizao objetiva de idias, obtida pela linguagem na criao de
conceitos, hipteses e modelos. Mas, quando a linguagem no competente o
suficiente para externalizar idias, ainda assim h os recursos da utilizao de
metforas, analogias. O modo de externalizao da converso do conhecimento
normalmente visto no processo de criao do conceito e provocado pelo dilogo
ou pela reflexo coletiva, afirmam NONAKA E TAKEUCHI (1997). Alm disso,
fundamental considerar que externalizao a chave para a criao do
conhecimento, pois cria conceitos novos e explcitos a partir do conhecimento
tcito. 22
Combinao: conforme os atores do modelo, um processo de sistematizao de
conceitos em um sistema de conhecimento. A reconfigurao das informaes
existentes atravs da classificao, do acrscimo, da combinao e da categorizao
do conhecimento explicito (como o utilizados em bancos de dados de computadores)
pode levar a novos conhecimentos. Bancos de dados, redes de informao

21

Anlise realizada por NONAKA & TAKEUCHI, opus cit. P. 69 e p. 297. As obras citadas pelos
autores so: CANNON-BROWERS, J.A ., E. SALAS, e S. CONVERSE. Shared Mental Models in
Expert Team Decision Making, org. N.J.CASTELAN, JR., pp 221-246. HILLSDALE, NJ: Lawrence
Erbaum Associates. 1993. Tambm: GADAMER, H. Truth and Method. 2a. ed. para o ingls de J.
Weinsheimer e D.G. Marshal. Nova York. Crossroad. 1989.
22
Para uma anlis mais detalhada, conferir em (NONAKA E TAKEUCHI,1997: 71-73).

67

computadorizadas, sistemas de informao e cursos, como de ps-graduao so


bons exemplos de elementos que viabilizam a combinao de conhecimentos.
Internalizao: consiste

na

incorporao

do

conhecimento

explcito

no

conhecimento tcito As pessoas que trabalham, internalizam em suas bases de


conhecimentos tcitos as experincias e oportunidades de aprendizado que tiveram.
Isso feito sob a forma de construo de novos modelos mentais e absoro de
know-how tcnico, os quais podero ser utilizados no futuro.

Esse processo

auxiliado por processos de verbalizao e diagramao do conhecimento, atravs de


descries coletivas de histrias orais, documentaes e manuais elaborados para
promover uma nova experincia no futuro junto a outras pessoas. 23

A partir do exposto acima, NONAKA & TAKEUCHI prope o modelo


chamado de espiral do conhecimento

24

. No se tornando explicito, o conhecimento

compartilhado no pode ser facilmente utilizado pela organizao como um todo. O


processo de inovao 25 , por exemplo, surge da interao dinmica entre o conhecimento
tcito e conhecimento explicito, o que significa que experincias so socializadas e
compartilhadas at que possam ser externalizadas pelo dilogo e pela reflexo coletiva,
empregando-se para isso recursos analticos, metforas ou analogias. Em seguida, esse
conhecimento novo pode ser confrontado com aquele j existente num processo de
combinao. Por ltimo, um processo de aprender fazendoprovoca a inovao. A
abordagem desses autores pode ser representada no diagrama seguinte, no qual tambm
so explicitados o contedo do conhecimento criado por cada modo de converso do
conhecimento. Os contedos do conhecimento so:

Conhecimento compartilhado (habilidades tcnicas e modelos mentais, por


exemplo);

Conhecimento conceitual, fruto da externalizao por metforas e processos


analticos de reflexo, conhecimento sistmico ( caracterizado pela combinao
de diversos elementos que podem gerar, por exemplo, novas tecnologias e
produtos);

23

Ibid p. 77-78
Ibid p. 79-82
25
A inovao uma expresso relevante da gerao e aplicao concreta do conhecimento dentro de uma
organizao, bem como de sua relevncia:
24

68

Conhecimento operacional (expresso pela capacidade de internalizar o uso de


habilidades e executar tarefas e processos diversos).

Para
Conhecimento Tcito

Conhecimento
Tcito
De

Conhecimento
Explcito

Conhecimento Tcito

SOCIALIZAO

EXTERNALIZAO

Conhecimento
Compartilhado

Conhecimento
Conceitual

INTERIORIZAO

COMBINAO

Conhecimento
Operacional

Conhecimento
Sistmico

A expiral do do conhecimento (Nonaka e Takeuchi, 1997)

Figura 6: Espiral do Conhecimento


Fonte: (NONAKA E TAKEUCHI,1997: 80-81 )

Continuando a exposio da Teoria da Criao do Conhecimento Organizacional


de NONAKA & TAKEUCHI, devemos lembrar que esses contedos do conhecimento
interagem continuamente entre si numa outra espiral, a da criao do conhecimento, que
enfoca o que eles caracterizam como sendo a dimenso ontolgica do modelo.
Conforme afirmam:
O conhecimento tcito dos indivduos constitui a base da criao do
conhecimento organizacional. A organizao tem de mobilizar o conhecimento
tcito criado e acumulado no nvel individual. O conhecimento tcito
mobilizado ampliado organizacionalmente atravs dos quatro modos de
converso do conhecimento e cristalizado em nveis ontolgicos superiores.
Chamamos isso de espiral de criao do conhecimento, na qual a interao
entre conhecimento tcito e conhecimento explcito ter uma escala cada vez
maior na medida em que subirem os nveis ontolgicos. Assim, a criao do
conhecimento organizacional um processo em espiral, que comea no nvel
individual, e vai subindo, ampliando comunidades de interao que cruzam
fronteiras entre sees, departamentos divises e organizaes. Um bom
exemplo desse processo exemplificado pelo desenvolvimento de produtos (...)
A funo da organizao no processo de criao do conhecimento
organizacional fornecer o contexto apropriado para facilitao das

69

atividades em grupo e para criao e acmulo de conhecimento em nvel


individual26 .

A espiral de criao do conhecimento organizacional apresentada na Figura 7


abaixo:
Dimenso
Epistemolgica

Externalizao
Combinao

Conhecimento
Explicito

Conhecimento
Tcito
Internalizao

Socializao

Indivduo

Grupo

Organizao

Dimenso
Ontolgica

Interorganizao

Nvel de conhecimento

Espiral de criao do conhecimento (NONAKA E TAKEUCHI, 1997)

Figura 7: Espiral de criao do conhecimento organizacional

Fonte: (NONAKA E TAKEUCHI,1997: 82)


Incorporando a dimenso tempo ao modelo de NONAKA & TAKEUCHI 27 ,
teremos a viso de que o processo de criao do conhecimento organizacional ocorre
numa seqncia de cinco fases, que so:
Compartilhamento do Conhecimento Tcito: o primeiro desafio do processo de
criao do conhecimento organizacional e significa que os indivduos devem ter a
possibilidade de interagir uns com os outros levando em conta suas mltiplas
diferenas. Essa uma etapa crtica, pois como afirmam esses autores, uma vez que
o conhecimento adquirido com a experincia nem sempre facilmente articulvel
pela linguagem formal. Alm disso, emoes, sentimentos e modelos mentais tem de
26
27

Ibid. p 83
Ibid. Conferir anlise p. 95-102

70

ser compartilhados para permitir o desenvolvimento da confiana mtua Equipes


auto-organizadas, nas quais pessoas de rea diferentes trabalham em conjunto para
alcanar uma meta comum um campo excele nte para viabilizar esta fase.
Criao de Conceitos: a fase que corresponde externalizao, j citada. Implica
que as pessoas conseguem formalizar, explicitar o conhecimento. A criao de
conceitos pode se dar de forma cooperativa, atravs do dilogo e para isso a
autonomia importante.
Justificao de Conceitos: A justificao significa a determinao de que conceitos
novos que foram desenvolvidos tem algum valor para a organizao ou a sociedade.
Basicamente um processo de filtragem e validao do novo, do recm criado luz
de critrios que sejam considerados como relevantes, tais como: custo, margem de
lucro, grau de inovao, relevncia para uma empresa. Tais critrios podem ser tanto
quantitativos quanto qualitativos.
Construo de Arqutipos: a concretizao de uma idia ou conhecimento que foi
validado e aceito. Um conceito que foi justificado precisa ser transformado em algo
tangvel ou concreto, que o arqutipo, ou modelo. Esse processo coincide com a
combinao, na qual o conhecimento novo se funde com o antigo para produzir
resultados reais. como um prottipo, uma maquete desenvolvida por um
arquiteto para expressar seu projeto.
Difuso Interativa do Conhecimento: Expressa uma realidade dinmica na qual a
gerao de um conhecimento concretizado reinicia o ciclo gerando ainda mais novos
conhecimentos. Um modelo de produto, uma inovao em um processo continua e
reinicia novamente o ciclo de criao do conhecimento num processo contnuo de
inovao.

Outro trabalho igualmente importante relativo questo da gesto do


conhecimento o de DAVENPORT & PRUSAK (1998). Esses autores afirmam que o
conhecimento um ativo corporativo, constituindo a maior vantagem competitiva da
empresa e que, por isso precisa ser gerido com o mesmo cuidado dedicado a outros
ativos tangveis. Avaliam que as vantagens competitivas das empresas possuem ciclos
cada vez mais curtos e que o conhecimento uma vantagem com maior
sustentabilidade, uma vez que:

71

Com o tempo, os concorrentes quase sempre conseguem igualar a qualidade e


o preo do atual produto ou servio do lder do mercado. Quando isso
acontece, porm a empresa rica em conhecimento e gestora do conhecimento
ter passado para um novo nvel de qualidade, criatividade ou eficincia. A
vantagem do conhecimento sustentvel porque gera retornos crescentes e
dianteiras continuadas (DAVENPORT & PRUSAK, 1998:14-20).

Questes centrais so a idia de que o porte de uma organizao e sua disperso


geogrfica tornam difcil o gerenciamento do estoque de conhecimento de uma
empresa globalizada e a viso de que os computadores, cada vez, mais acessveis em
termos de custo e operabilidade so ferramentas cada vez mais poderosas como
propiciadores de conhecimento, na medida em que possuem recursos de armazenagem e
comunicao de dados e produo de informaes na medida em que redes dessas
mquinas podem integrar as pessoas.

DAVENPORT & PRUSAK (1998) procedem a uma anlise comparativa do


conhecimento como se houvesse juntado organizao um

mercado.

Nesse

mercado do conhecimento afirmam existir compradores (pessoas que esto tentando


resolver algum problema cuja complexidade ou incerteza no permite uma resposta
fcil),

vendedores (aqueles que

desenvolvem ou possuem algum conhecimento

relevante) e corretores (todo profissional que coloca as duas figuras anteriores em


contato (podem ser bibliotecrios, pesquisadores, analistas de informao). A relao
entre os agentes possui um sistema de preos especfico que inclui reciprocidade,
reputao, altrusmo (quem oferece conhecimento um dia precisar requisitar, em geral,
deseja ser reconhecido explicitamente, embora possa algumas vezes ajudar sem receber
nada em troca). Isso s pode ser obtido num ambiente de grande confiana entre esses
agentes. Cabe organizao evitar ineficincias e patologias do mercado de
conhecimento, tais como os monoplios (apenas alguns detm conhecimento) e as
barreiras diante de inovaes de idias e prticas organizacionais (DAVENPORT &
PRUSAK, 1998: 36-53). Afirmando que
organizaes geram e usam conhecimento. medida que interagem com seus
ambientes, elas absorvem informaes, transformam-nas em conhecimento e
agem com base numa combinao desse conhecimento com suas experincias,
valores e regras internas (DAVENPORT & PRUSAK, 1998: 63)

72

esses autores descrevem o que classificam como os cinco modos de gerao consciente
e intencional de conhecimento, isto , iniciativas especfica que as organizaes
empreendem para aumentar o estoque de conhecimento corporativo. Tais modos so:
Aquisio: o mais importante para a organizao a utilidade e no a originalidade
do conhecimento. Portanto, a organizao tem que contar com a disponibilidade do
conhecimento apropriado quando e onde ele possa ser aplicado. Por isso, muitas
vezes a melhor e mais rpida maneira de obter um conhecimento necessrio poder
ser a aquisio de indivduos ou pessoas que o possuem. Muitas vezes pode
significar a compra de empresas inteiras que detm algum tipo relevante e especfico
de conhecimento ou competncia.
Aluguel: uma variao do processo de aquisio e significa que uma empresa pode
terceirizar parte do desenvolvimento de seus produtos e servios ou soluo de srios
problemas. Pode implicar desde parcerias acadmicas at contratos com consultores.
Recursos Dirigidos: significa que a organizao destina recursos diversos, como
departamentos de pesquisa e desenvolvimento, bibliotecas corporativas, centros de
informao, softwares e etc para viabilizar o desenvolvimento do conhecimento que
interessa a ela.
Fuso: significa estimular a gerao do conhecimento pelo confronto de diferentes
perspectivas, opinies e pontos de vista, mesmo que inicialmente seja necessrio
introduzir alguma desordem ou caos criativo. Isso parte da perspectiva de que
inovaes em geral ocorrem justamente do confronto entre diferentes pontos de vista
e da combinao de diferentes opinies, trabalhos e habilidades.
Redes: grupos formais ou informais, comunidades ad hoc ou auto-organizadas
tambm so responsveis pela gerao do conhecimento. As pessoas se aglutinam,
motivadas por interesses comuns, e em geral, podem conversar pessoalmente, por
telefone, correio eletrnico ou groupware (DAVENPORT & PRUSAK, 1998: 6481).

73

4.3.2 Codificao, Taxonomia, Aplicabilidade e Transferncia do Conhecimento

4.3.2.1 Codificao e Taxonomia do Conhecimento

DAVENPORT & PRUSAK (1998) apresentam uma anlise sobre a codificao


e criao do conhecimento, uma vez necessrio apresentar o conhecimento de uma
forma acessvel a todos os pblicos de uma organizao, embora lembrem que nem todo
conhecimento pode ser codificado. Em sua opinio, os gerentes devem decidir a que
objetivos o conhecimento codificado ir servir, em quais formas ele existe dentro das
organizaes, qual sua utilidade e quais os meios apropriados para codificao e
disseminao. Essa perspectiva realmente importante, pois nem todo conhecimento
interessa a uma organizao, o que implica que sempre haver algum juzo de valor na
determinao daquilo que interessa ou no a ela. Esses autores afirmam que o
conhecimento tcito complexo e desenvolvido e interiorizado pelo conhecedor no
decorrer de um longo perodo de tempo. quase impossvel de reproduzi- lo num banco
de dados ou documento. DAVENPORT & PRUSAK (1998) descrevem um quadro que
apresenta um spectro das dimenses de codificao do conhecimento conforme
descrito abaixo:

Tcito ___________________________________________Articulvel
No passvel de ensino _____________________________ Passvel de ensino
No Articulado ____________________________________Articulvel
No observvel em uso _____________________________ Observvel em uso
Substancial _______________________________________ Esquemtico
Complexo ________________________________________ Simples
No documentvel _________________________________ Documentado

importante salientar uma questo central abordada por DAVENPORT &


PRUSAK (1998): a taxonomia do conhecimento. A separao e o reconhecimento da
existncia dos conhecimentos tcito e explicito, j citados neste trabalho, so retomados
e apresenta-se um imperativo de se codificar o conhecimento (DAVENPORT &
PRUSAK, 1998: 85-105). Realmente, para efeito do processo gerencial de uma

organizao e importante voltar ateno para o conhecimento que possa ser, de alguma
forma codificado ou sistematizado e para aquele conhecimento que, embora tcito, pode
74

ser explicitado. Ou ento, importante considerar o conhecimento tcito em sua prpria


natureza, mas fundamental que ele possa ser, pelo menos, localizado em mapas do
conhecimento, isto , processos e intervenes gerenciais que conduzam a criao,
manuteno e uso do conhecimento na organizao. Uma ateno ainda mais especial
pode ser dada para o conhecimento explicito, uma vez que pode ser apoiado pela
tecnologia da informao. H uma percepo muito importante no trabalho dos ltimos
autores citados ao afirmarem:
o conhecimento tcito e complexo, desenvolvido e interiorizado pelo
conhecedor no decorrer de um longo perodo de tempo quase impossvel de
se reproduzir num documento ou banco de dados (...) Simplesmente alguns
tipos de conhecimento no podem ser representados efetivamente fora da mente
humana e por isso que o processo de codificao do mais substancial
conhecimento tcito existente nas organizaes se limita a localizar algum
que possua aquele conhecimento, encaminhar o interessado para aquela
pessoa e estimular ambos a interagir(DAVENPORT & PRUSAK, 1998: 8687).

Sobre a montagem dos mapas de conhecimento organizacional iro afirmar


que se monta um mapa pblico a partir de mapas individuais :
As informaes necessrias para se criar um mapa do conhecimento
normalmente j existem nas organizaes, porm de forma fragmentada e no
documentada. Cada pessoa tem um pedacinho do mapa na cabea, sabe qual
o seu prprio conhecimento e onde ir para obter respostas para as suas
perguntas. Criar um mapa organizacional uma questo de combinar esses
mini-mapas individuais em um mapa corporativo (DAVENPORT &
PRUSAK, 1998: 90).

Na opinio desses autores, a organizao pode pesquisar junto aos funcionrios


que conhecimentos eles possuem, suas fontes e em que esse conhecimento til. Pode
tambm se servir de um processo de trilha de recomendaes, isto : uma pessoa sugere
outras que conhecem assunto as quais por sua vez vo, em cadeia, sugerindo outras, at
que a organizao delimite o conhecimento desejado.

4.3.2.2 Aplicabilidade e Transferncia do Conhecimento

O conhecimento ou um corpo de conhecimentos pode ser classificado de


diferentes formas. A classificao por domnio, ou seja, do que trata um determinado
conhecimento, quais assuntos e temas esto embutidos nesse domnio muito comum.

75

A partir de estudos no Ernst & Young Center of Business Innovation, NOVINS &
ARMSTRONG (2002) afirmam que existem maneiras de classificar o conhecimento
que tem pouca relao com o contedo. Ao invs de se indexar um conhecimento tendo
como base se ele sobre isto ou aquilo, por exemplo, ns podemos classific- lo com
base em sua origem (de onde ele pode ser obtido). Ele provm de uma nica fonte, ou
de mltiplas fontes? Esta uma classificao com foco na origem, e no no domnio
como mais comum se encontrar. Outras formas de classificao do conhecimento
incluem:

Pelo receptor: quem ir necessitar utiliz- lo?

Pela aplicabilidade: Qual a amplitude da utilizao do conhecimento? Ele de


natureza local ou global?

Pela transferncia: Qual o grau de dificuldade em realizar sua transferncia aos


outros, e qual o grau de dificuldade para os outros ao aplicar corretamente o
conhecimento recebido?

Pela qualidade: quanto um determinado conhecimento dependente de seu


contexto, e quanto ser perdido em sentido atravs de representaes,
explicitaes ou simplificaes?

Pela perenidade: qual a idade do conhecimento? O conhecimento continua


vlido independentemente da passagem do tempo?

Pela confiabilidade: fcil de ser conferido (testado)? Provm de fonte


confivel?

O conjunto de critrios poderia continuar de forma extensiva. O ponto que, ao


considerar a questo qual conhecimento compartilhar, a resposta no precisa ser
obrigatoriamente expressa como conhecimento sobre x ou sobre y. Ao avaliar quais
conhecimentos devemos gerenciar e como devemos fazer isso, pode ser mais til,
dependendo da perspectiva, considerar sua aplicabilidade e transferncia, do que
raciocinar em termos de domnio.

De fato, entendemos que pensar no conhecimento exclusivamente em termos de


domnio s vezes pode no ser muito til em se tratando de orientar o seu
gerenciamento. Uma nova viso surge ao analisarmos o conhecimento quanto a seu

76

grau relativo de aplicabilidade e transferncia. NONAKA E TAKEUCHI (1997)


trataram dessa questo sob uma determinada perspectiva que agora podemos
complementar e que implica na idia de que todo o conhecimento que pode ser
importante para as decises de um negcio pode ser classificado numa linha crescente
de aplicabilidade e transferncia, ou seja: plotado, inserido em ponto ao longo de um
continuum quanto possibilidade de aplicao e transferncia. Tais idias so
elementos bsicos da viso de NOVINS & ARMSTRONG (2002), sintetizada na Figura
8, que uma matriz com quatro categorias de conhecimento possveis, cujos ttulos
apontam para diferenas chave na forma como eles devem ser gerenciados. Nessa
matriz, a aplicabilidade se encontra no eixo horizontal e a transferncia no eixo vertical.
Segundo tais autores na linha horizontal o conhecimento classificado sob o ponto de
vista da aplicabilidade, variando em um continuum de local para global. Em um
extremo, um conhecimento sobre alguma coisa pode ser de natureza puramente local.
Isto quer dizer que ele se aplica exclusivamente a um conjunto especifico de condies,
sendo dependente de uma dada situao geogrfica ou fsica. Em outro extremo, o
conhecimento possui natureza global, podendo ser aplicado largamente atravs de toda
uma organizao, e atravs de fronteiras de processos, tcnicas, e culturais. Uma
maneira de se raciocinar sobre esta forma de classificao pensando em termos de
conhecimento detalhado versus conhecimento geral. Infere-se ento que um dado
conhecimento pode ser gerenciado diferentemente dependendo da amplitude de sua
aplicao. J na linha vertical, o conhecimento classificado entre nico e programvel,
em que considerado ento o grau de transferncia exibido por um certo conjunto de
conhecimentos Conhecimento que pode ser classificado com base em regras altamente
transfervel, pois ele pode ser facilmente recuperado a qualquer tempo. (se a condio x
est presente, ento a melhor abordagem y). Ele pode ser transferido mltiplas vezes
sem perder sua validade. No outro extremo, a transferncia baixa Olhar o
conhecimento em termos de aplicabilidade e transferncia nos d uma clara direo de
como armazenar e transferir conhecimento. A Figura 8, portanto, resume os quatro
tipos de conhecimento dentro da viso de NOVINS & ARMSTRONG (2002). Para
cada um dos quatro tipos de conhecimento mostrados, definida uma forma de
gerenciamento, como segue:

77

Programvel

Conhecimento de
Fcil Acesso

Conhecimento
Geral

Local

Global
Conhecimento de
Aplicao nica

Conhecimento
Complexo

nico

Figura 8 Quatro categorias do conhecimento .


Fonte: NOVINS & ARMSTRONG (2002) p. 48

Conhecimento de Acesso Rpido: gerenciado atravs de sua colocao em um


local facilmente acessvel, na maioria das vezes atravs de sofisticados bancos
de dados. Seria um erro distribuir este conhecimento pr-ativamente para todo o
pessoal, s pelo fato de algum, algum dia, poder necessitar dele para tomar uma
deciso especfica. Um exemplo deste tipo de conhecimento so relatrios
tcnicos emitidos, por institutos de pesquisa, cuja existncia seria informada a
poucas pessoas, e ficariam em lugar de fcil acesso.

Conhecimento Geral: Estes conhecimentos so de fcil acesso e de uso geral


dentro da empresa. Vale a pena, portanto, divulg- los pr-ativamente atravs de
circulao e publicao na Intranet. Um exemplo uma instruo que
regulamente viagens a servio.

Conhecimento Complexo: So conhecimentos de difcil acesso, via de regra com


grande parcela de conhecimento tcito, e que so de interesse de um grande
nmero de pessoas na empresa. Este conhecimento melhor transferido atravs
de programas de treinamento estruturados e atravs do aprendizado no trabalho,
utilizando-se, por exe mplo o mentoring. Um exemplo deste caso o
gerenciamento de um empreendimento.

78

Conhecimento de Aplicao nica: So conhecimentos difceis de serem


transferidos, tem grande parcela de conhecimento tcito, e de aplicao restrita.
No se deve investir muito na gesto deste tipo de conhecimento, a no ser no
caso de algo de excepcional relevncia. estratgica.

Sob a perspectiva acima analisada, sugere-se que pensar sobre conhecimento em


termos de aplicabilidade e transferncia resulta numa orientao bem mais efetiva para
o seu gerenciamento do que se pensarmos em termos de domnio. Nos quatro casos,
assim como em muitas reas de negcio, a melhor forma de gerenciamento um
balano cuidadoso entre influenciar o comportamento das pessoas, introduzir processos
efetivos, e disponibilizar tecnologia de suporte. O mix vai diferir, entretanto, com a
categoria. Conhecimento de acesso rpido, por exemplo, forte candidato
informatizao, e o gerenciamento em tal caso dever ser intensivo em tecnologia da
informao. Conhecimento complexo, por outro lado, demanda o mais alto grau de
gerenciamento de pessoas. As quatro categorias comportam claras implicaes quanto
ao nvel de investimento e esforos necessrios para o seu gerenciamento.
Conhecimento de aplicao nica pode oferecer baixo retorno para um alto esforo de
gerenciamento. O gerenciamento do conhecimento complexo pode representar grande
fonte de vantagem competitiva.

NOVINS & ARMSTRONG (2002) tambm fazem um anlise do conhecimento


quanto a sua forma de compartilhamento, a qual fornece importantes subsdios para a
melhor forma de geri- lo. A figura 9 mostra diferentes possibilidades de
compartilhamento, e apresenta mecanismos para efetiv- lo. Uma pergunta colocada:
Entre quem o conhecimento precisa ser compartilhado? e tal pergunta pode ser
respondida sob o ponto de vista qualitativo (quem so as pessoas) e quantitativo
(quantas pessoas esto envolvidas). O ponto de vista quantitativo coloca desafios
importantes e precisa ser bem visualizado, e isso significa que o conhecimento pode ser
compartilhado de:

um-para- um;

um-para- muitos;

muitos-para-um;

79

muitos-para-muitos.

Os mecanismos para efetivar o compartilhamento do conhecimento propostos


so:

De um-para-um aprendizagem, mentoring e coaching. 28

De um-para- muitos apresentaes, livros e artigos.

De muitos-para-um redes.

De muitos-para- muitos alavancagem. 29

Os indivduos sentem-se mais confortveis com o compartilhamento de


conhecimento que provm de outros indivduos. Uma pessoa detentora de conhecimento
se imagina transferindo conhecimento para outra pessoa, ou para muitas outras pessoas.
Similarmente, ao se imaginar recebendo novos conhecimentos, pensa em receb- los de
alguma outra pessoa que est se dirigindo a ela diretamente ou a considerando como
membro de um grupo.

28

Mentoring uma expresso utilizada no campo da Administrao de Recursos Humanos ARH que
significa um processo de orientao direcionada de carreira, envolvendo aconselhamento, identificao e
estimulo de habilidades e competncias com planejamento das estratgias de desenvolvimento das
mesmas ao longo do tempo. J a palavra coaching utilizada em ARH no sentido de formao e
capacitao profissional direcionada, envolvendo atividades de educao profissional e treinamento.
29
O termo alavancagem resultado da fora de uma alavanca indica aqui o resultado sinrgico e
vigoroso obtido pela mesclagem e compartilhamento de mltiplos conhecimentos de diferentes pessoas
na organizao. Conforme NOVINS & ARMSTRONG (2002), a transferncia de conhecimento na
modalidade muitos para muitos certamente no vai se tornar confortvel da noite para o dia. Os
gerentes nas organizaes iro continuar com a tendncia de aprender da forma tradicional,
individualmente, e continuaro acreditando em indivduos. Ao se depararem com uma troca muito mais
ampla iro impor resistncia por experimentarem uma sensao de perda de controle. ( muito
conhecimento sendo distribudo de uma forma muito ampla). No entanto, apesar destas dificuldades, cada
vez mais est se reconhecendo que a real alavancagem obtida dos ativos do conhecimento alcanada
com esta modalidade de compartilhamento, e que o gerenciamento do conhecimento deve focar nela
primeiro.

80

UM

MUITOS

APRENDISAGEM
UM

MENTORING

REDES

COACHING
MUITOS

APRESENTAES
LIVROS

ALAVANCAGEM

ARTIGOS

Figura 9 Diferentes Nveis de Compartilhamento do Conhecimento


Fonte: NOVINS & ARMSTRONG (2002) p. 51

Uma grande organizao pode aprender mais em um dia do que uma pessoa
em toda a sua carreira. Desta forma faz sentido, que quando algum necessitar tomar
uma deciso no seu trabalho, o faa utilizando o conhecimento de toda a organizao,
ao invs de usar somente o de um nico indivduo, mesmo que este seja muito capaz.
As configuraes de transferncia de conhecimento, um-para-um, e um-para- muitos
representam apenas a metade do universo de possibilidades. Entretanto, as grandes
oportunidades se encontram no campo onde as pessoas e as organizaes se sentem
menos confortveis transferncia de conhecimento de muitos para muitos. Podemos
considerar que o objetivo da gesto do conhecimento assegurar que cada pessoa, ao
tomar uma deciso, tenha a sua disposio toda a experincia e o intelecto da sua
organizao. Desta forma fcil de perceber que os grandes ganhos com a gesto do
conhecimento estejam associados forma de compartilhamento muitos-para-muitos.
Mas esta tambm a forma de compartilhamento mais difcil de ser colocada em
prtica. No a forma intuitiva de se pensar em troca de conhecimento. H, portanto,
barreiras culturais que devem ser suplantadas. Mas aqui reside uma grande oportunidade
de alavancar o desenvolvimento estratgico da empresa atravs do conhecimento.
4.4 Gesto do Conhecimento sob o Prisma da Informao e Tecnologia 30
H um inexorvel vnculo entre a Gesto do Conhecimento e a questo da
informao.

Quando a informao adequadamente capturada, tratada e

disponibilizada, dinamiza-se o seu fluxo fazendo com que tenhamos um impacto


virtuoso sobre o processo de gesto do conhecimento. Quando os fluxos de informao
30

Questes relacionadas Tecnologia da Informao sero abordadas com maior detalhe no Captulo 7.

81

so dinmicos e as tecnologias que os suportam esto adequadas a tal propsito, temos


melhor integrao entre grupos de pessoas, anlises e avaliaes mais geis dos objetos
de conhecimento que esto sendo interpretados, bem como melhor tomada de deciso e
atuao de pessoas e organizaes.

um desafio hoje dinamizar os fluxos de

informao considerando os volumes crescentes delas nos ltimos anos. Diante do


turbilho de informaes que possumos, torna-se necessria uma apreciao adequada
da mesma. De acordo com BUSH (1945):
as publicaes se estenderam muito alm de nossa capacidade atual de fazer
real uso dela s. O registro das idias humanas expandiu -se prodigiosamente -e, no entanto, os meios de que nos valemos para tentar encontrar algo de
importante nesse labirinto de idias, so os mesmos que utilizvamos quando
muito menos existia para pesquisar.

A perspectiva do estudo da gesto do conhecimento sob o prisma do suporte


informacional e tecnolgico est vinculada anlise das teorias, estratgias, conceitos,
processos, instrumentos, tecnologias e ferramentas que podem viabilizar o processo de
gerao, reteno tratamento e utilizao de dados e informaes como suporte gesto
do conhecimento pela organizao e que por isso mesmo envolvem metodologias e
tecnologias da informao.

A Cincia da Informao tem muito a dizer, ento.

Conforme BORKO (1968):


A cincia da informao a disciplina que investiga a propriedade e o
comportamento da informao, as foras governantes do fluxo de informaes
e os meios de processamento da informao para otimizar a acessibilidade e
usabilidade. Ela engloba um corpo de conhecimentos relativos origem,
coleo, organizao, armazenamento e recuperao, interpretao,
transmisso, transformao e utilizao da informao.

Por outro lado, a Tecnologia da Informao, apoiada na Cincia da Computao


e na Engenharia de Computao, tornou-se uma dimenso indispensvel para viabilizar
a proposta da Cincia da Informao, ao definir e processar algoritmos bem como
construir sucessivos e avanados equipamentos (hardware) que assegure resultados
computacionais cada vez melhores. Abre-se ento uma perspectiva para que uma fora
interdisciplinar oriunda da conjuno entre a cincia da informao e as tecnologias da
informao, especialmente suportadas pelos processos computacionais, possa
proporcionar melhores resultados gesto do conhecimento. Devemos assumir como

82

necessria e importante a relao entre Cincia da Computao e Cincia da Informao


para que, de tal sinergia possa emergir resultados satisfatrios para o usurio. De acordo
com SARACEVIC (1992), a base da relao entre Cincia da Informao e Cincia da
Computao reside na aplicao dos computadores e da computao na recuperao da
informao, bem como nos produtos, servios e redes associados. Enquanto a cincia da
computao trata de algoritmos que transformam informaes, a Cincia da Informao
trata da natureza mesma da informao e sua comunicao para uso pelas pessoas.
Ambos os objetos so interligados e complementares, embora possam ter agendas
bsicas e aplicadas diferentes. Ainda na perspectiva desse autor, os trabalhos com
sistemas inteligentes, bases de conhecimento, hipertextos e sistemas relacionados,
interfaces inteligentes e interao homem-computador devem ter uma relao
importante com a Cincia da Informao, conforme afirma:
Essas reas tem um significativo componente informacional, associado com a
representao da informao, sua organizao intelectual e encadeamentos;
busca e recuperao de informao; a qualidade,o valor e o uso da informao
todos tradicionalmente tratados pela CI. De modo inverso, essa corrente de
pesquisa e desenvolvimento na cincia da computao fornece diferentes
vises, modelos e enfoques e um paradigma diverso para a pesquisa e
desenvolvimento em CI. Portanto, as relaes interdisciplinares esto
evoluindo em direo a um nvel diferente de cooperao intelectual.

importante salientar que tecnologia da informao no sinnimo de gesto


do conhecimento. A informtica chegou a apresentar ao mercado softwares aplicativos
com a pretenso de automatizar a gesto do conhecimento, o que obviamente de
resultado questionvel devido complexidade do processo e falta de percepo de que
h uma separao entre conhecimento e informao. Alm disso, sendo a gesto do
conhecimento um processo sinrgico, que envolve muitas dimenses, pode-se
considerar a denominao software de gesto do conhecimento um tanto quanto
inadequada ou forada. Entretanto, no se pode negar a importncia do suporte que a
tecnologia da informao confere gesto do conhecimento quando articula mltiplas
alternativas de hardware e software para apoiar o processo, suporte esse cada vez mais
importante, mas nunca completo e exaustivo.

Considerando a perspectiva de CHOO (2003) constatamos que a informao


um componente intrnseco de tudo o que uma organizao faz. Para esse autor, h trs

83

pontos fundamentais onde a criao e o uso da informao desempenham um papel


estratgico no crescimento e capacidade de adaptao da empresa. Primeiro, a
organizao usa a informao para criar significado, dando sentido s mudanas do
ambiente externo. Segundo, a organizao cria, organiza e processa a informao de
modo a gerar novos conhecimentos por meio do aprendizado. Novos conhecimentos
permitem a criao de novos produtos e servios ou aperfeioar os j existentes, bem
como os processos organizacionais. Terceiro, as organizaes buscam e avaliam
informaes de modo a tomar decises importantes. Esses trs pontos so processos
interligados e assim devem ser vistos, garantindo uma perspectiva holstica do processo.

Para CHOO (2003) a informao , em essncia, a matria prima do cotidiano


do ser humano. A busca da informao um processo pelo qual o individuo procura
obter informaes com um propsito definido, buscando modificar o seu estado de
conhecimento. A informao utilizada para que a pessoa possa dar sentido a uma
experincia, bem como de agir ou reagir luz de um novo conhecimento. O
comportamento das pessoas que buscam a informao passa pelo crivo da situao (as
pessoas constatam a situao em que a necessidade da informao configurada), da
cognio (preenc hem lacunas de conhecimento) e da emoo (percebem que o estado
psicolgico e a emoo afetam a busca da informao). Portanto, a informao precisa
ser enfocada sob o ponto de vista do comportamento humano, envolvendo trs
dimenses: a cognitiva, a emocional e a situacional. Segundo ele,

no nvel cognitivo, diferentes estratgias de busca de informaes so


ativadas para preencher diferentes lacunas de conhecimento. No nvel afetivo,
o estado emocional e psicolgico determina diferentes preferncias e mtodos
de buscar a informao. No nvel situacional, as caractersticas do trabalho ou
da situao problemtica determinam a maneira de usar e acessar a
informao (CHOO, 2003).

Do ponto de vista estrutural, a informao precisa ser avaliada no que tange


criao de significados, a criao de conhecimento e o processo de tomada de decises.
Na realidade, CHOO (2003) trabalha a perspectiva de como as organizaes usam a
informao para criar significado, construir conhecimento e tomar decises. Para esse
autor, as chamadas Organizaes do Conhecimento utilizam de modo estratgico a
informao para trs perspectivas de ao distintas mais interligadas, quais sejam:

84

Criao de significado (sensemaking)

Criao de conhecimento por meio da aprendizagem organizacional

Tomada de deciso com base no princpio da racionalidade limitada de Herbert


Simon31

Na etapa de criao de significado, CHOO (2003) postula que o objetivo


imediato do sensemaking permitir aos membros da organizao a construo de um
entendimento compartilhado do que a organizao e o que ela faz. Busca-se a
sobrevivncia e prosperidade da empresa no longo prazo e em um ambiente em
constante transformao. Por isso, necessrio interpretar o ambiente, analisando e
conferindo sentido aos dados coletados desse ambiente. A inteligncia competitiva e o
monitoramento ambiental sistemtico so prticas organizacionais de construo de
sentido. Na viso desse autor:
A criao de significados relaciona-se com a captao de mensagens sobre o
ambiente. necessrio identificar o que acontece, dar sentido aos
acontecimentos e, posteriormente, desenvolver uma interpretao comum para
direcionar uma ao, uma deciso.

31

De acordo com esse autor, toda a racionalidade no processo de deciso limitada. O gestor no
maximiza, toma decises que o satisfazem, descobre solues aceitveis para problemas bem reais.
Contenta-se com alternativas satisfatrias. Herbert Simon, Prmio Nobel da Economia de 1978, criticou a
abordagem neo-clssica da gesto que encara o processo de deciso por parte do gestor ou do empresrio
como algo "cartesiano", racional, visando a otimizao e maximizao de objetivos bem delineados. Uma
das contribuies de Herbert Simon para a Teoria da Administrao foi a contestao desta viso. De
acordo com esse autor, para se compreender a gesto, tem de se perceber como que as pessoas
realmente resolvem problemas e tomam decises. H enormes limitaes na capacidade de uma pessoa
levar em considerao, para a sua deciso, todos os fatos que se do no mundo, ou em seu ambiente, e
que seriam relevantes para essa deciso. Estes limites - a racionalidade limitada - surgem simplesmente
porque os seres humanos tm um conhecimento restrito, tm capacidades limitadas para poder analisar as
conseqncias do prprio saber que elas detm. Especialmente, h srios limites para poder predizer o
futuro e as reaes dos outros s suas decises. Portanto, no possvel saber todas as alternativas que
esto disponveis para a tomada de deciso - muitas destas prprias oportunidades esto por se descobrir
ou desenhar, e as decises tm de ser tomadas, apesar de tudo, muitas vezes considerando uma nfima
frao daquelas possibilidades. Assim sendo, quando alguns economistas afirmam que as pessoas
racionais atuam no sentido de maximizar, no s falam de algo que no se "encaixa" com fatos
observveis, como no ajudam em nada a que se tomem boas decises ou seja: decises que possam
resolver problemas do mundo real que enfrentamos, mesmo que estas solues nunca sejam "timas" no
sentido literal do termo. As decises que tomamos "satisfazem", no otimizam. Herbert Simon
Entrevista. Herbert Alexander Simon tem uma produo terica invejvel em vrios domnios. Na rea da
economia e da gesto h duas obras suas consideradas fundamentais: "Administrative Behavior",
publicada em 1947, e "Models of Bounded Rationality" (sobre o tema da racionalidade limitada, que lhe
deu celebridade), cujos dois primeiros volumes foram escritos em 1982, j depois de laureado com o
Nobel da Economia. Em http://www.janelanaweb.com/digitais/simondigest.html. Acessado em 10 set
2006

85

Segundo CHOO (2003), a etapa de criao do conhecimento o momento em


que as organizaes criam ou adquirem, organizam e processam a informao com o
propsito de gerar novo conhecimento atravs da aprendizagem organizacional. O novo
conhecimento gerado permite que a organizao desenvolva novas habilidades e
capacidades, crie novos produtos e servios, aperfeioe os antigos e melhore seus
processos organizacionais. Em suas palavras:

A construo do conhecimento , em essncia, o adequado relacionamento do


conhecimento tcito e do conhecimento explcito pessoal ou organizacional,
visando a criao de mais conhecimentos.

J no que tange tomada de decises, considerando a racionalidade limitada j


citada, CHOO (2003) afirma que :

A tomada de decises uma etapa natural depois da criao de significados e


da construo do conhecimento. Nesse momento, definem-se as alternativas
possveis para tomar a deciso que, em tese, deveria envolver a trs dimenses
do psiquismo humano, contribuindo para miminizar conflitos, tanto para o
tomador de decises quanto para o grupo sujeito tomada de deciso.

Cumpre salientar que alm do conhecimento tcito e do explicito, CHOO


caracteriza tambm o conhecimento cultural, expresso nas crenas, valores, normas e
pressupostos utilizados para dar valor a novos conhecimentos e informaes.

O prisma do suporte informacional e tecnolgico ser desenvolvido nos prximos


captulos, abordando os vnculos entre recuperao da informao, sistemas de
descoberta de conhecimento, tecnologia da informao e gesto do conhecimento.

4.5. Aproximaes Conceituais dos Prismas Cognitivo e Organizacional

A partir do exposto at o momento, podemos inferir algumas observaes sobre


o conhecimento na perspectiva terica de PIAGET (1976). Nela, o conhecimento
expresso pelas estruturas de representao da realidade, que vo sendo construdas pelo
indivduo ao longo do tempo atravs da interao deste com o seu meio. Essas
estruturas se modificam e se auto-regulam no que foi descrito como processo de

86

equilibrao majorante. Esse processo compatvel com teoria do conhecimento tcito


e explcito de POLANYI (1969).

Se assumirmos a perspectiva de PIAGET, na tentativa de aplic- la ao universo


da organizao, podemos sugerir que tambm ela possui suas estruturas de interpretao
e representao da realidade, ou seja, conhecimento. Esse conhecimento se expressa
pela cultura, pelos valores e princpios, pela ao estratgica e pela memria
organizacional (presente nos bancos de dados e sistemas de informao). Tambm o
conhecimento organizacional evolui na medida em que a organizao interage com o
ambiente, assimila elementos da realidade e se acomoda a ela. Esse processo emerge
das relaes entre os indivduos no ambiente de trabalho quando compartilham suas
prprias estruturas individuais de representao (ou conhecimento) entre si, no seio da
cultura a qual, ao mesmo tempo em que os influencia, influenciada por esses mesmos
indivduos (nesse contexto, empregados de uma organizao).

Analisando as perspectivas propostas por PIAGET (1976) e POLANYI (1969) e


confrontando com o prisma organizacional que tem foco em NONAKA & TAKEUCHI
(1997) e DAVENPORT & PRUSAK (1998) podemos perceber aproximaes explcitas
e subjacentes. Dentre as aproximaes explcitas podemos citar os conceitos de
conhecimento tcito e explicito de POLANYI (1969) que so utilizados pelos dois
grupos de autores organizacionais. Por outro lado, podemos avaliar as aproximaes
subjacentes, como entre NONAKA & TAKEUCHI (1997) e PIAGET (1976):
confrontando a teoria de criao do conhecimento organizacional do primeiro com a
teoria da equilibrao majorante perceberemos que, embora se refira organizao ou a
pessoas no contexto organizacional, ambas parecem ter o mesmo arcabouo. Os
processos de socializao, externalizao, combinao, interiorizao da criao do
conhecimento organizacional se confrontam bem com os de ao, assimilao,
organizao, acomodao e estruturas de representao de PIAGET (1976). Ou seja, as
idias desse ltimo parecem estar subjacentes ao ncleo terico de NONAKA &
TAKEUCHI, os quais, em suas colocaes parecem extrapolar o desenvolvimento
terico de PIAGET, focado na construo do conhecimento pelo indivduo para um
processo anlogo na organizao.

87

CANNON-BROWERS, J.A ., E. SALAS, e S. CONVERSE (1993), citados por


NONAKA & TAKEUCHI (1997), ao descreverem o conceito de modelos mentais
compartilhados, tem como linha subjacente a teoria de PIAGET (1976), inovando, no
entanto ao aplic- la s pessoas trabalhando em conjunto.

Tambm

podemos

fazer

uma

aproximao

entre

as

afirmaes

de

DAVENPORT & PRUSAK (1998: 90) sobre mapas do conhecimento individuais e


organizacionais com as mesmas idias das estruturas de representao do conhecimento
de PIAGET (1976). Percebemos a convergncia das idias e uma mesma raiz que indica
o conhecimento como um estado do desenvolvimento individual e que pode ser
compartilhado

com

outras

pessoas

para

termos

ento

um

conhecimento

organizacional

Poderemos identificar outras aproximaes da viso de PIAGET com outros


autores do campo organizacional que realizaram enfoques sobre questes de
aprendizagem nas organizaes (embora para PIAGET aprendizagem e conhecimento
sejam elementos diferentes), mas que preferimos no tratar nessa dissertao em funo
do seu escopo e de suas limitaes 32 .

4.6. O Prisma do Fator Humano no Conhecimento

A Gesto do Conhecimento um campo interdisciplinar que alm dos aspectos


da informao e tecnolgicos j apresentados, deve tambm se articular com o campo
da Administrao. A Administrao o campo do conhecimento que tem as
organizaes por objeto de estudo e como tal tambm estuda o comportamento humano
dentro dessas mesmas organizaes como fator relevante para elas.

importante

salientar que as pessoas possuem suas vises de mundo, seus valores e seus interesses e
mesmo dependendo da venda de seu trabalho para sobreviver, de alguma forma
procuram afirmar isso de mltiplas formas. Possuem, tambm, suas habilidades, seus

32

Como exemplo podemos citar: ARGYRIS, C. Doubl Loop Learning Organizations Harvard Business
Review (set-out 1977: 115-125). Tambm SENGE, P. A Quinta Disciplina arte, teoria e prtica da
organizao de aprendizagem. So Paulo: Best Seler, 1990. De igual forma: KIM, D. The Link between
Individual and Organizational Learning. Sloan Managemente Review, (out. 1993: 37-50).

88

talentos, sua expertise. Tais aspectos podem estar ou no vinculados a uma diretriz que
valorize e estimule prticas de gesto do conhecimento.

Por outro lado, de nada adianta todo o aperfeioamento tecnolgico e a melhoria


dos fluxos de informao se as pessoas no so capazes de fazer bom proveito de tais
avanos. Por mais que avancem as tecnologias e mais sofisticados que sejam hardware e
software, dificilmente poderemos prescindir do ser humano como elemento central e
decisivo em todo o processo de gesto do conhecimento. Mesmo com o avano dos
sistemas denominados inteligentes dentre os quais esto includos as propostas de
minerao de textos, o ser humano continua sendo elemento decisivo para entender,
avaliar e interpretar conjuntos de informaes a ele disponibilizados e dar- lhes efetivo
sentido. ele quem pode participar proativamente das intranets organizacionais e dlhes vigor, fazendo com que efetivamente exista compartilhamento de informao e
conhecimento, da mesma forma que o ser humano quem interpreta indicadores
financeiros, analisa e coteja resumos de textos para tomar decises adequadas para uma
organizao.

Cada vez mais as organizaes desejam identificar e capturar o

conhecimento estratgico, dentro e fora delas, retendo e protegendo o conhecimento de


valor, orquestrando sua consolidao e disseminao para gerar inovaes e garantindo
o desenvolvimento de vantagens competitivas. A principal vantagem competitiva de
uma organizao, portanto, o talento humano e a competncia das pessoas que
trabalham para ela.

A gesto do conhecimento, sob o prisma do fator humano, articula-se com a gesto


por competncias, prtica da gesto de talentos humanos, cada vez mais presente nas
organizaes. O que vem sendo chamado de modelo de competncias em geral
implica no desenvolvimento de uma taxonomia vinculada ao processo de gesto de
pessoas no contexto do conhecimento, ou ento de tentar valorizar o conhecimento que
est nas pessoas. A definio de competncias envolve:

Uma

combinao

de

conhecimentos,

saber

fazer,

experincias

comportamentos;

Exerccio num contexto preciso;

Implica em tomar iniciativa e assumir responsabilidade diante de situaes com


as quais uma pessoa pode se deparar, incluindo a noo de imprevisto;

89

Entendimento prtico de situaes que se apia em conhecimentos adquiridos e


os transforma na medida em que aumenta a diversidade das situaes.

O conceito de Competncias, no contexto do campo da Gesto de Pessoas ou das


reas de Recursos Humanos das empresas vem sendo entendido como o conjunto de
conhecimentos, habilidades e atitudes. Tais competncias configuram o aporte de
conhecimento e esforo para viabilizar os processos que a organizao possui. Portanto,
indicam o potencial humano para gerar as respostas desejadas pela organizao. O
mapeamento das competncias que a organizao possui, bem como daquelas que
necessita possuir um processo desenvolvido em projetos de Gesto do Conhecimento.
Identificar quais pessoas realizam o qu, com qual formao e experincia e onde
elas se encontram fsica e organizacionalmente o que se coloca. Estimar a lacuna entre
competncias atuais possudas e as almejadas, gerando uma classificao e um ndice
para localizao um esforo legtimo de organizaes preocupadas com o crescimento,
a inovao e a gesto de processos complexos de operao e negcio.

O Fator Humano um prisma de estudo sobre gesto do conhecimento que tem


um grande campo para desdobramentos e a presente tese apenas o pontua. No contexto
da pesquisa desenvolvida, as pessoas tm um papel decisivo para dinamizar os
resultados das implantaes e aplicaes de novas tecnologias, como a proposta de
estudo que prope o uso da minerao de textos, cujo processo, uso e interpretaes e
avaliaes de seus resultados sero feitas por pessoas.

Um conjunto de vises, metodologias e procedimentos, vinculados s prticas


gerenciais da chamada Administrao de Recursos Humanos ARH ou, mais
modernamente chamada de Gesto de Pessoas esto sendo usadas por organizaes
para apoiar e viabilizar iniciativas e programas de Gesto do Conhecimento, tais como:
gesto por competncias, mapeamento de competncias, gesto de carreiras, mentoring,
implantao de universidades corporativas, uso de mapas conceituais, dentre outras.
Programas de treinamento estruturado para cobrir gaps (espaos) de conhecimento
mapeados e para fornecer conhecimento complexo so tambm utilizados como aes
de ARH para subsidiar a Gesto do Conhecimento, cujo papel em uma organizao
pode ser sintetizado nos itens seguintes:

90

estabelecer juntamente com as reas tcnicas e operacionais os perfis necessrios


a execuo das diversas atividades;

coordenar um processo de mudana cultural para criar um ambiente adequado a


criao e o compartilhamento de conhecimento;

providenciar programa de treinamento para reduzir as lacunas identificadas no


mapeamento dos capitais do conhecimento;

organizar plano de substituio do pessoal (plano de sucesso), e programas de


treinamento no trabalho (mentoring);

desenvolver e implementar uma poltica de adequada de Recursos Humanos.

4.7. Uma apreciao crtica gesto do conhecimento

A idia de Gesto do Conhecimento no um consenso. H muitas crticas e


questionamentos relevantes so a ela formulados. NEHMY (2001) analisa que o
programa de gesto do conhecimento pretende abordar o conhecimento numa dimenso
micro-social, aquela relativa s organizaes e define-o da seguinte forma:

Programa de tecnologia gerencial que prope forma alternativa de otimizar


os recursos e a competitividade das empresas no cenrio das novas tecnologias
e da globalizao. sedutor. Uma caracterstica importante desse programa e
que o diferencia de outros modismos da Administrao sua aproximao do
formato acadmico, valorizando o arcabouo terico e desenvolvendo-se
tambm como programa de pesquisa, o que aumenta suas condies de
institucionalizao e disseminao no mundo acadmico. Mesmo assim, esse
programa no pode ser caracterizado como cientfico, uma vez que se encontra
em um momento inaugural e devido ao fato das tecnologias gerenciais serem
por demais efmeros. O melhor caracteriza-lo como um movimento, uma
tendncia emergente do mundo dos negcios.

A prpria definio de conhecimento na sociedade contempornea vem sendo


fortemente influenciada pelos ventos do mercado. A esse respeito, KURZ (2002)
afirmar:
Conhecimento poder trata -se de um velho lema da filosofia burguesa
moderna, que foi utilizado pelo movimento dos operrios europeus do sculo
19. Antigamente conhecimento era visto como algo sagrado. Desde sempre
homens se esforaram para acumular e transmitir conhecimentos. Toda
sociedade definida, afinal de contas, pelo tipo de conhecimento de que dispe.
Isso vale tanto para o conhecimento natural quanto para o religioso ou para a
reflexo terico-social. Na modernidade o conhecimento representado, por
um lado, pelo saber oficial, marcado pelas cincias naturais, e, por outro, pela
inteligncia livre-flutuante (Karl Mannheim) da crtica social terica. Desde

91

o sculo 18 predominam essas formas de conhecimento. Mais espantoso deve


parecer que h alguns anos esteja se disseminando o discurso da sociedade
do conhecimento que chega com o sculo 21; como se s agora tivessem
descoberto o verdadeiro conhecimento e como se a sociedade at hoje no
tivesse sido uma sociedade do conhecimento. Pelo menos os paladinos da
nova palavra-chave sugerem algo como um progresso intelectual, um novo
significado, uma avaliao mais elevada e uma generalizao do conhecimento
na sociedade. Sobretudo se alega que a suposta aplicao econmica do
conhecimento esteja assumindo uma forma completamente diferente .

A principal vertente crtica aponta na direo que o movimento de gesto do


conhecimento situa-se na perspectiva de desdobramento contemporneo da dinmica
capitalista, que cria a cada tempo histrico, novas manifestaes e formas de se
apresentar. IANNI (1992, p. 47) ir afirmar:
O capital dissolve, recobre ou recria formas de vida e trabalho, de ser e
pensar, em mbito local, regional, nacional e internacional. Simboliza uma
espcie de revoluo burguesa permanente, ainda que desigual e contraditria,
progressiva e regressiva, democrtica e autoritria.

O desejo de obter resultados expressivos sobre o investimento realizado e as


presses da concorrncia configura o capitalismo como um processo dinmico no que
diz respeito ao desenvolvimento das foras produtivas. A competio econmica fora
as empresas a buscarem a eficcia, modificando o processo de trabalho em sua
estrutura, criando novos produtos e impondo um novo modo de se trabalhar. O processo
de desenvolvimento do capitalismo aprofunda a relao j existente entre
desenvolvimento cientfico e tecnolgico e aprimoramento das foras produtivas. Na
perspectiva de KURZ (1993), h um aprofundamento desde processo no decorrer do
sculo XX, sobretudo em suas ltimas duas dcadas, com um casamento cada vez mais
slido entre desenvolvimento de novas tecnologias e produo capitalista. Isso
explicado pela lgica do sistema mundial de produo de mercadorias buscar sempre
maior eficincia e produtividade. Portanto, difcil abordar o funcionamento das
economias

capitalistas

sem

considerar

desenvolvimento

tecnolgico.

desenvolvimento tecnolgico est intrinsecamente ligado ao processo pelo qual o


conhecimento gerado e alocado em desenvolvimento das foras produtivas. Captar o
entendimento de como a tecnologia afeta a economia decisivo para a compreenso do
crescimento da riqueza dos pases e dinmica das sociedades contemporneas. SMITH
(1983) refora a importncia da mudana tcnica. MARX (1968) aponta o capitalismo

92

como um sistema em que o progresso tecnolgico intrinsecamente produzido.


SCHUMPETER (1985) fixa a inovao tecnolgica no centro da dinmica do
capitalismo. Inovaes modificam a realidade econmica e social, alm de aumentarem
a capacidade de acumulao de riqueza e gerao de renda. Portanto, qual a relao
entre conhecimento e a produo contempornea?

Podemos dizer que toda a discusso recente em torno do papel do conhecimento


liga-se questo da ampliao da competitividade, num ambiente no qual a inovao e
o desenvolvimento de novos produtos se tornou fundamental para a sobrevivncia
dentro do sistema, uma vez que: necessrio inovar para garantir maiores vendas a uma
base de consumidores cada vez menor e mais exigente. O ciclo de vida dos produtos
diminui e eles precisar ser redesenhados a cada instante para se tornar mais atrativos ao
consumidor. MSZROS (2002) discute a questo da obsolescncia planejada e da
caduquice dos produtos como sendo algo necessrio s empresas modernas, uma vez
que, num ambiente onde a excluso ao consumo crescente, somente assim possvel
manter nveis de vendas que interessam e garantam a sobrevivncia das empresas
redesenhadas pela tecnologia que, ao excluir tantos trabalhadores, excluiu tambm
muitos consumidores, dificultando o funcionamento do mercado, o que caracteriza uma
grande contradio histrica do capitalismo.

O conhecimento sempre foi importante para os sistemas produtivos. Seu papel


est fortemente ligado produo de inovaes. O que podemos perceber hoje que,
em funo de uma maior velocidade dos processos de mudanas, ele se tornou ainda
mais importante. No que exista uma mudana substantiva em curso no sistema social
ou econmico. A dinmica capitalista persiste e aprofunda seus mecanismos de gerao
de excedentes e persistindo os processos de propriedade privada, gerao de mais valia
e a existncia de duas categorias bem distintas que so os capitalistas e os trabalhadores
assalariados. O que muda o fato do sistema produtivo ter absorvido e continuar
absorvendo doses elevadas de tecnologias que modificam severamente os processos de
produo. Um bom exemplo disso a intensificao da microeletrnica nos sistemas
produtivos.

O modelo taylorista- fordista e a abordagem de automao de base

eletromecnica no conseguiram fazer o que a microeletrnica vem conseguindo no


aprimoramento dos processos de automao A introduo crescente na indstria da
automao de base microeletrnica permitiu que as atividades de produo discreta
93

pudessem tambm ser alvo de aumentos de produtividade e reduo dos custos de mode-obra.33

Diante do exposto, uma crtica importante ao programa de gesto do


conhecimento sua inteno de apresentar este objeto como sendo uma novidade nas
estratgias de competitividade empresarial, o que no verdade. O discurso do
programa de gesto do conhecimento pretende transformar o conhecimento dos
trabalhadores em principal recurso econmico, dando muitas vezes a isso o carter de
novidade. Entretanto, o conhecimento dos trabalhadores sempre foi o fator de produo
mais importante, seja atravs do trabalho vivo, seja atravs do trabalho morto, com
cristalizao desse conhecimento sob a forma de processos automatizados e outras
tecnologias de produo (NEHMY, 2001). Sob esse aspecto, importante salientar que
todo esforo taylorista caminhou nessa direo. A ao de Taylor no incio do sculo
XX se expressou pela busca de quebrar a redoma de vidro que possua o trabalhador
e, ao desvendar as nuances do trabalho, extrair o conhecimento que o operariado detinha
sobre o processo de trabalho. A idia de redoma de vidro proposta por MORAES
NETO (1987) ao estudar a dinmica entre conhecimento e trabalho na ao promovida
por Taylor no inicio do sculo XX. Segundo MORAES NETO (1987) Taylor vai
quebrar a redoma de vidro que envolve o trabalhador da manufatura no seu tempo. Este
trabalhador possua uma forte expertise, um saber fazer relevante, mas que era pouco
compreendido pelo empresrio capitalista. A expertise dos trabalhadores sofreu a
tentativa (realizada com xito) de explicitao por parte de Taylor, com sua
representao atravs de normas, regulamentos e definio dos processos e mtodos.
Atravs dessa captura, Taylo r pode interferir fortemente na dinmica de produo do
seu tempo. Por sua vez, a Administrao, atravs das atividades chamadas e
Organizao e Mtodos, intensificada desde 1940, procura conhecer, interpretar e
sistematizar o conhecimento da organizao, via mapeamento e representao de
processos, captando e instrumentalizando o conhecimento embutido nas atividades
dos empregados, direcionando esse conhecimento da melhor forma requerida pelos
imperativos da produtividade, racionalidade e reduo de custos. FOUCAULT (1975)
citado por (NEHMY, 2001), vai estabelecer uma ntima relao entre poder e sistemas
33

A automao eletromecnica foi eficiente em grandes campos para os processos de produo contnua.
A microeletrnica, alm de romper novas barreiras para a prpria produo de fluxo continuo, vai
permitir a ruptura de barreiras orgnicas na produo discreta, fazendo com que atividades antes
impossveis de serem automatizadas possam, nessa nova abordagem, vir a ser.

94

de conhecimento, na medida em que embutem tcnicas e prticas para o exerccio do


controle e domnio social em contextos localizados e particulares (a famlia, a escola, a
priso, o hospital, a empresa).

Outra crtica importante diz respeito ao papel do novo trabalhador na proposta


sociedade do conhecimento. Para KURZ (1993) temos a ecloso de um capitalismo
sem trabalho, uma vez que a microeletrnica permitiu romper barreiras orgnicas de
produo que antes no eram imaginadas. O aprofundamento da relao entre a cincia
e o capitalismo, embora esteja dentro da lgica de busca do desenvolvimento das foras
produtivas, provoca agora um colapso histrico desencadeando a crise da sociedade do
trabalho. A quantidade de trabalhadores requeridos ao processo de trabalho passa a ser
cada vez menor, uma vez que a automao de base microeletrnica amplia as fronteiras
das possibilidades de uso nos setores indus triais e de servios. Portanto, um aspecto
importante que merece destaque aqui , por mais contraditrio que possa parecer, o
problema da desqualificao. Em muitos setores industriais temos, alm da reduo
quantitativa do nmero de trabalhadores, a diminuio real da necessidade de
qualificao. A operao de processos produtivos com intensidade de automao, em
geral, requer com certeza grandes nveis de qualificao no seu planejamento e gesto,
mas cada vez menor qualificao na operao, minimizando, portanto a importncia do
conhecimento. Qual ser a importncia do conhecimento 34 para uma operador de
mquinas com CNC comando numrico computadorizado, um operador de centrais de
atendimento (call center) ou um trabalhador bancrio nos dias atuais? A mediao da
tecnologia, ao contrrio de boa parte do discurso, desqualificante e a importncia do
conhecimento , para a maior parte dos trabalhadores, uma quimera. Muitos
trabalhadores se transformam em apndices de mquinas, equipamentos ou sistemas
informatizados e cuja operao requer um conjunto de conhecimentos inferior ao que se
tinha no passado. Por concluso temos que, o processo de intensificao tecnolgica dos
nossos dias sofistica e aprofunda a lgica taylorista-fordista de expropriao do
conhecimento do trabalhador e da banalizao da presena do mesmo no processo
produtivo. Obviamente iremos perceber trabalhadores envolvidos em processos de
gesto ou de conhecimento intensivo, como produo de softwares ou desenvolvimento
de novos produtos, mas numa proporo muito menor do que na categoria explicitada.
34

E qual tipo de conhecimento? Em geral requer-se o conhecimento operacional ou instrumental, voltado


s necessidades diretas de produo.

95

Uma terceira crtica importante diz respeito ao exagero com que reforada a
questo da tecnologia informao em muitas experincias, como se elas pudessem
resolver todos os problemas de captura, organizao, disponibilizao e uso da
informao. Essa informao, de certa maneira vista como sinnimo de conhecimento.
Muitas empresas desenvolveram softwares em quantidade crescente para outras que
adquiriram os mesmos na esperana de amp liarem as fronteiras de gesto e uso do
conhecimento (ou seria da informao, uma vez que no h ainda consenso sobre se
temos na verdade muito mais informao do que conhecimento efetivo). NEHMY
(2001) aponta que o programa de gesto do conhecimento pretende abordar o
conhecimento numa dimenso micro-social, aquela relativa s organizaes. Para essa
autora, o fenmeno da gesto do conhecimento possui forte impreciso terica, sendo
as formulaes dos seus autores principais ainda muito frgeis. KURZ (2002) critica
severamente esta idia de exploso de informao ao afirmar:
Elucidativo talvez o fato de que o conceito da "sociedade do conhecimento
esteja sendo usado mais ou menos como sinnimo do de sociedade da
informao. Vivemos numa sociedade do conhecimento porque somos
soterrados por informaes. Nunca antes houve tanta informao sendo
transmitida por tantos meios ao mesmo tempo. Mas esse dilvio de informaes
de fato idntico a conhecimento? Estamos informados sobre o carter da
informao? Conhecemos afinal que tipo de conhecimento esse? Na verdade
o conceito de informao no , de modo nenhum, abarcado por uma
compreenso bem elaborada do conhecimento. O significado de informao
tomado num sentido muito mais amplo e refere-se tambm a procedimentos
mecnicos. O som de uma buzina, a mensagem automtica da prxima estao
do metr, a campainha de um despertador, o panorama do noticirio na TV, o
alto-falante do supermercado, as oscilaes da Bolsa, a previso do tempo...
tudo isso so informaes, e poderamos continuar a lista infinitamente.

Um quarto aspecto de crtica questo da gesto do conhecimento a idia de


empresa do conhecimento que valoriza o papel da inovao e, portanto, da gerao do
conhecimento necessrio para produzi- la. No h como comparar trabalhadores do
conhecimento com cientistas em uma comunidade acadmica. No ambiente acadmico,
a autoria, a posse e o reconhecimento garantem ao cientista uma relao digna e direta
entre o seu trabalho e os frutos do conhecimento produzido, enquanto na empresa temos
que a inteno desta se apropriar e utilizar desse bem do trabalhador para transformlo em bem e estoque da empresa. Para NEHMY (2001):

96

Quando o trabalhador expe o seu conhecimento, e o socializa, o


conhecimento no se acumula, ao reverso, perde-se. No possvel provocar
adeses fortes a essas propostas. O conhecimento racional, lgico esperado do
trabalhador detentor do saber pessoal especialista teria de ser de resistncia e
no de predisposio favorvel(...) Fica bem clara na exposio dos diferentes
autores a no existncia da transferncia espontneado conhecimento do
trabalhador nas empresas, indicando a necessidade alavanca (um motor
exterior ao cotidiano da vida da empresa) capaz de iniciar e manter o processo
de converso (NONAKA E TEKEUCHI, 1998) Entretanto, o conhecimento do
trabalhador sempre foi apropriado pela empresa desde o sistema de
administrao taylorista.

Na esteira dessas consideraes podemos dizer que temos a ecloso de um


quinto ponto de crtica, tambm adequadamente formulada por NEHMY (2001), que o
fato do ponto de vista do trabalhador ser completamente desconsiderado nas exposies
sobre capital intelectual ou gesto do conhecimento, ao afirmar:

A mxima do regime ps-fordista prega a autonomia do trabalhador e a


competncia pessoal adquire importncia primordial, que na gesto do
conhecimento torna-se o foco da gerncia. (...) O programa de gesto do
conhecimento pretende que o trabalhador entregue seu saber tcnico, sua
experincia (o saber como, e o saber ser) alm daqueles aspectos j
apropriados pela administrao flexvel (horas de trabalho para alm do
horrio, o trabalho em casa, participao em reunies). Nada se fala do
crescimento pessoal do trabalhador dentro da empresa. Em nenhum momento o
trabalhador chamado a refletir sobre seu conhecimento no sentido libertador
do qual fala Habermas (1982) de forma a amplia -lo e desloc-lo da situao
particular da ao instrumental para constituir o conhecimento pleno,
abstrato.

Na viso de HABERMAS (1982), a reflexo refere-se ao ato de se posicionar


face a algo que de alguma maneira no lhe est disponvel. Refletindo, damos conta
daquilo que pensamos saber. Para reflexo estranha a idia de que algum no possa
saber como e porque sabe. Para quem reflete seria non sense, por exemplo, acertar o
resultado de uma operao matemtica sem saber matemtica. Nessa dinmica, o saber
fica descomprometido com essa ou aquela experincia singular, e livre para assimilar
novas situaes, constelaes imprevistas, apenas hipotticas em relao ao que j foi
experimentado como conhecimento. At que ponto podemos realmente considerar o
conhecimento como algo que pode ser separado do seu autor? At que ponto podemos
realmente explicitar o conhecimento?

97

4.8 Avaliao e Posicionamento Sobre as Crticas Gesto do Conhecimento

Todas essas crticas so importantes para garantir que tanto a reflexo terica
quanto as prticas organizacionais possam aprofundar sua densidade e consistncia,
evitando percepes incompletas ou muito ideolgicas e buscando garantir um enfoque
mais adequado da participao e envolvimento das pessoas no que podemos assumir
como gesto do conhecimento. Isso importante tambm para identificar qual deve ser
o verdadeiro papel da Cincia da Informao e da Tecnologia da Informao em suas
relaes com o conhecimento humano. Hoje, no podemos considerar mais que a
questo da Gesto do Conhecimento se encontra em um momento inaugural, uma vez
que muitas organizaes pblicas e privadas j vivenciaram programas em sua esfera,
de diferentes tipos e diferentes objetivos.

Embora, conforme foi apontado nas crticas, seja mesmo impossvel comparar
trabalhadores do conhecimento com cientistas em uma comunidade acadmica, uma vez
que no meio acadmico cientistas tem o reconhecimento da autoria e a posse do
conhecimento e na empresa os trabalhadores possam mesmo ser expropriados do
conhecimento que geraram, no necessariamente precisa ser assim. Com o
aprofundamento das necessidades de inovao em produtos e processos, estimular e
envolver o trabalhador em processos de gerao do conhecimento tornou-se
fundamental. Hoje vivemos numa sociedade pluralista em que, no obstante a mdia no
seja uma instncia democrtica (uma vez que suas principais expresses so controladas
e mantidas por grandes e concentrados grupos econmicos), o trabalhador em muitos
paises, tem possibilidades mais amplas de participao na vida social e econmica da
nao, embora tenha se fragilizado enquanto classe social pela reestruturao produtiva
que fez o sistema capitalista realmente demandar menos trabalhadores e enfraqueceu
suas instancias de representao: os sindicatos. Porm, os trabalhadores que continuam
a atuar nos contextos empresariais, tendem, em grande parte, ser mais qualificados e
conscientes de seu papel, tendo as organizaes mais desafios estratgicos em envolvlos em atitudes colaborativas e de partilha de seu conhecimento, para o qual precisar
ser estimulado, de forma cada vez mais consciente e, muitas vezes, com compensao
financeira por sua produo intelectual, seja por prmios, bnus, salrios indiretos, etc.
Ou seja: embora possa acontecer, talvez at na maior parte das situaes, no
obrigatoriamente o trabalhador precisa ser ou ser expropriado de seu conhecimento
98

sem o devido reconhecimento e estmulo, mas tal conhecimento pode ter, inclusive,
valor econmico. O reconhecimento do valor desse conhecimento e a incluso do
mesmo entre seus pleitos um novo desafio para as classes trabalhadoras naquilo que
vem sendo chamada (adequadamente ou no) de Sociedade do Conhecimento, ou um
novo tempo no qual tal questo passou a ser discutida objetivamente.

Realmente, a questo do valor do conhecimento no algo novo em importncia


no contexto econmico, conforme afirmado por KURZ (2002), mas h hoje uma
intensificao de sua absoro no processo produtivo das empresas, em busca de maior
velocidade na inovao e de maior diferenciao. Nesse sentido, podemos assumir
como real a proposta de IANNI (1992) de que:
O capital dissolve, recobre ou recria formas de vida e trabalho, de ser e
pensar, em mbito local, regional, nacional e internacional.

O que percebemos agora, entretanto, que esse capital assume uma postura de
conferir um valor muito alto para o conhecimento, o que alguns autores abordam como
capital intelectual. Para STEWART (1998), o valor de uma empresa determinado mais
pelo seu capital intelectual do que por seu capital financeiro. Alguns autores calculam
que 2/3 dos resultados financeiros de uma empresa so devidos ao Capital Intelectual
(TERRA, 2001). Segundo STEWART (1998), Capital Intelectual a soma de 3
capitais:

a) Capital humano: inclui conhecimento e competncias individuais dos


funcionrios (refere-se ao valor que a empresa perde quando funcionrios
vo embora);
b) Capital estrutural: inclui conhecimento ou competncia coletiva, como
processos, know-how, marcas e patentes, documentos ( o valor que fica
quando funcionrios vo embora);
c) Capital do cliente: inclui conhecimento e vantagens advindas dos clientes (
o valor que se ganha com relacionamentos com clientes).

99

4.9 Redes Sociais e Redes de Conhecimento

Na perspectiva de JARVENPAA & TANRIVERDI (2003) o relacionamento


intra e interorganizacional, visando a cooperao, , hoje, ponto central de uma
nova forma organizacional que a rede, uma vez que na rede informao e
conhecimento podem melhor fluir entre os atores envolvidos. As unidades que integram
a rede, formando um todo, so responsveis por compartilhar informao e
conhecimento na rede.

Esse um assunto vasto e complexo, com muitos

desdobramentos e aqui apenas citado para pontuar a sua relevncia, uma vez que
referncia para aplicao de certas iniciativas em Gesto do Conhecimento na
ELETRONUCLEAR que esto fora do escopo dessa tese, mas que so tangenciadas
pelas abordagens e tecnologias aqui estudadas.

4. 10 Conhecimento e Memria Organizacional

Um desafio organizacional significativo, diretamente ligado s prticas de


Gesto do Conhecimento e relevante no contexto da presente tese a questo da
administrao da memria organizacional. A expresso memria organizacional pode
gerar polmica. Tal como conhecimento organizacional no h consenso. Alguns
podem no concordar com ela. No h a pretenso de defini- la aqui de modo exaustivo.
Por memria queremos dizer mais do que base de dados ou repositrios de documentos.
Queremos nos referir a uma linha relevante de articulao de conhecimentos ao longo
de um perodo de tempo os quais tem significado e relevncia para uma organizao,
sendo que tais conhecimentos tm impacto sobre seu agir no presente e no futuro.
Eventos do passado da organizao ou de seu ambiente podem ter novas releituras e
ajudar a solucionar problemas e tomar decises no presente e no futuro. Promover o
dinamismo da memria e o acesso histria, criando uma adequada taxonomia,
utilizando tesauros 35 , portais corporativos36 , e os processos de recuperao da
informao embutidos na tecnologia de minerao de textos abordada nessa Tese torna35

Tesauro pode ser definido como uma estrutura de dados composta de uma lista de palavras importantes
dum dado domnio de conhecimento e para palavra da lista, um lista de palavras relacionadas (sinnimos,
etc...).
36
Portal Corporativo: Tipo de software que permite configurar uma rede de computadores de uma
organizao (intranet) de forma dinmica no sentido de integrar distintos repositrios de contedos de
informao sob um mesmo ambiente de acesso a eles. Atravs de um portal, desde que esteja
devidamente credenciado, o usurio tem acesso a quantos repositrios de dados e documentos que a sua
organizao possui.

100

se cada vez mais importante diante dos volumes crescentes de contedos que so
abarcados por essa memria. ARAUJO (1994), afirma que os sistemas de recuperao
de informaes do acesso s informaes nele armazenadas e que essas informaes
constituem a memria humana registrada, o que, segundo ela, BELKIN E
ROBERTSON (1976) categorizam como informao cognitivo-social: as estruturas
conceituais referentes ao conhecimento coletivo, ou seja, as estruturas de conhecimento
partilhadas por membros de um grupo social (manuscritos, livros, peridicos, mapas,
filmes, vdeos, quadros, partituras, etc.). Podemos acrescentar aqui todos os tipos de
documentos digitais.

As organizaes sempre vo depender das pessoas e no podem delas prescindir.


Entretanto, em grande parte das situaes, as organizaes possuem objetivos mais
amplos que os objetivos individuais e tendem a sobreviver mais tempo do que elas. As
pessoas ingressam e deixam as organizaes. Durante sua permannc ia nelas, e no
contexto econmico e cultural em que essas pessoas se inserem, muito conhecimento
gerado e grande parte dele pode ser explicitado, sendo traduzido em documentos,
informaes e dados a ponto de serem armazenados em sistemas de informao
computadorizados para serem posteriormente recuperados. Portanto, em certo sentido,
impe-se reduzir a dependncia estratgica das pessoas desenhando processos objetivos
e institucionais relativos preservao e recuperao da memria organizacional. Alm
disso, a consulta a essa memria no questo hoje de mero exerccio de recordao,
mas passo preliminar para alavancar novas oportunidades. Despersonalizar os
processos, tornando-os mais independentes portanto e facilitar simulao de processos
com base no histrico enriquece e aprimora a atividade gerencial. ?Compartilhar as
melhores prticas, criar banco de solues, classificar documentos j existentes e
incluir novos em portais corporativos e bibliotecas digitais so atividades vinculadas
idia de gerir a memria da organizao.

4.11 Desafios e Perspectivas em Gesto do Conhecimento

A expresso conhecimento pode ser definida pelo conjunto de princpios,


regras, modelos mentais e memrias nos quais a ao humana est enraizada. Conforme
CHOO (2003), o conhecimento pode ser divido em:

101

Explcito aquele conhecimento que pode ser objetivado em dados,


informaes, memoriais, obras, documentos e mesmo produtos.

Implcito aquele conhecimento que est subjacente ao humana e que


emerge da relao do homem com a realidade mas cuja objetivao ainda no se
fez ou ser dificilmente realizada.

Cultural Aquele que est disperso em suposies crenas e valores para


descrever e explicar a realidade e para dar valore e importncia a cada nova
informao.

Somente os indivduos conhecem, criam coisas novas e podem dizer que


geraram novos conhecimentos. H um ciclo no processo de conhecer perceptvel e
indicado por:

aquisio/criao de conhecimento;

codificao e registro do conhecimento;

compartilhamento e transferncia de conhecimento.

A expresso conhecimento organizacional uma abstrao e indica a


importncia de implementao de modelos que valorizam a sinergia entre processos de
criao e transferncia de conhecimentos entre pessoas e grupos que nela se encontram.
O conhecimento organizacional um status do engajamento em grupo das pessoas no
sentido expressar sua formao, habilidades, impresses, cultura e comportamentos. A
palavra competncia pode ser usada para objetivar o conhecimento pessoal, que pode
ser traduzido em organizacional num determinado momento do tempo. Da mesma
forma que o conhecimento no tem limites, tambm no tem o desenvolvimento das
competncias.

Embora somente os indivduos conheam, a organizao pode ser proativa,


facilitando, estimulando, orquestrando a sua gerao e absoro em inovaes de
produtos e processos.

O conhecimento organizacional est fortemente objetivado em produtos e


processos. Novos produtos e servios, bem como processos continuamente

102

redesenhados indicam preocupao com excelncia e gerao de valor. A inovao tem


hoje importncia catedral para as organizaes. Indica a introduo, na atividade
econmica, de novas tcnicas, processos, produtos servios e solues. Embora seja um
fenmeno antigo, o desenvolvimento de inovaes, na segunda metade do sculo XX
vai ganhar uma velocidade exponencial. Hoje, podemos dizer que a inovao est no
centro das estratgias organizacionais competitivas e portadoras de xito.

At

recentemente, a inovao era fruto de processos de pesquisa e desenvolvimento. Hoje


resultado da aprendizagem organizacional, realidade abstrata que significa em que
intensidade os indivduos, que compe equipes organizacionais, so capazes de
interagirem com a realidade e, coletivamente, produzirem coisas novas e relevantes. Ou,
numa perspectiva centrada na teoria da Equilibrao Majorante de Piaget, atingirem
novos e sucessivos patamares de reflexo sobre si mesmas e sobre a realidade, gerando
as respectivas competncias para nela atuar e transformar. O processo de inovao
depende de estruturas de interface entre grupos, pessoas, realidades. Redes de conexes
entre seres humanos e organizaes, aprendizagem, enfim valorao do que entendemos
por conhecimento.

A Gesto do Conhecimento sustenta os processos de criao, transferncia e


registro do conhecimento, do qual as inovaes dependem. Por isso cada vez mais
importante a formalizao e a institucionalizao do processo de Gesto do
Conhecimento nas organizaes.

A precariedade nos processos de conexo entre

equipes e grupos, gerenciamento da aprendizagem e articulao do conhecimento ter


por conseqncia baixa criaes de inovaes.

A gesto do conhecimento implicar

em aes no campo da gesto das pessoas, dos processos e da tecnologia.

Diante do exposto at o presente momento o conceito de conhecimento de


DAVENPORT & PRUSAK (1998: 2-6), o que chamamos de gesto do conhecimento
possui, portanto conjuntos distintos de processos relevantes, que devem ser conduzidos
com intencionalidade e que podem ser sumarizados nos seguintes tpicos:
Reconhecimento das diferenas e articulaes entre o conhecimento tcito e
explcito, conforme as categorias de POLANYI;
Reconhecimento da importncia das teorias do equilbrio majorant e (PIAGET) e da
criao do conhecimento organizacional e de suas relaes recprocas;
103

Adoo da postura de que todo conhecimento provm da prtica social e a ela retorna
e de que a busca do conhecimento organizacional um empreendimento coletivo;
Percepo da incapacidade e da falta de necessidade de gesto de todo o
conhecimento de uma organizao, ou seja: o conhecimento que, via de regra,
interessa organizao aquele associado inovao em produtos, servios e seus
respectivos processos ou sua gesto e, portanto, essa mesma organizao deve
delimitar o escopo daquilo que deseja gerir em termos de conhecimento;
Percepo de que so as pessoas que geram conhecimento e que um possvel
desenvolvimento do conhecimento da organizao se d a partir do momento em
que a cultura dessa organizao absorve e moldada pelo conjunto das mltiplas
contribuies e influncias das pessoas sobre ela ao longo do tempo o que fora sua
percepo como um sistema aberto que interage continuamente com o seu ambiente
em fluxo contnuo de transformao;
Percepo de que as pessoas, compartilhando seus conhecimentos umas com as
outras, no seio da organizao, fazem com que se possa usar uma imagem figurada
da organizao que gere conhecimento;
Reconhecimento de que a interao humana, seja ela virtual ou presencial,
fundamental para a construo do conhecimento e que, para muitas circunstncias a
interao presencial imprescindvel;
Conduo consciente do processo de criao do conhecimento organizacional, cuja
teoria de NONAKA & TAKEUCHI bastante elucidativa;
Construo de uma taxonomia do conhecimento que permita classific- lo, organizlo e recuper-lo sempre que necessrio para a organizao.

Conhecimento,

Capital

Intelectual,

Desenvolvimento

de

Competncias,

Tecnologia da Informao e Business Intelligence so expresses, dentre outras, que


passam a fazer parte no s do vocabulrio de negcios, mas tambm da dinmica
organizacional, transformando-se em questes decisivas para a sobrevivncia e
crescimento de empresas inteligentes e geis no ambiente empresarial emergente do
milnio que est a iniciar-se. Urge, pois, moldar as condies facilitadoras que
capacitam pessoas e empresas a criar e utilizar continuamente o conhecimento em favor
da inovao contnua, da diferenciao e do estabelecimento de padres de excelncia
na organizao, conduzindo processos empresariais que valorizem a Gesto do

104

Conhecimento, desenvolvendo aes em gesto de pessoas, tecnologia da informao e


planejamento geral do modelo de gesto. Pessoas, agindo de forma colaborativa, em
times de trabalho e apoiadas por polticas institucionais, metodologias de tratamento do
conhecimento e recursos avanados de tecnologia da informao, podem construir uma
postura competitiva para as organizaes em que trabalham. possvel envolver e
articular os times de trabalho na construo constante do conhecimento e na gerao de
inovaes e soluo de problemas, com o uso de tecnologia e aes em gesto de
pessoas. O desenvolvimento de estratgias organizacionais relacionadas gesto do
conhecimento pode envolver alguns aspectos descritos a seguir.
a) Implementao de modelos conceituais de negcio vinculados a metodologias
de tratamento da informao e do conhecimento, como por exemplo, articulao
dos conhecimentos tcito e explcito, implicando:

definio de modelo conceitual de Projeto e Polticas de Manejo do


Conhecimento;

diagnstico e anlise de bases, fontes e dinmica das articulaes entre


conhecimento tcito e explicito;

mapeamento de capital intelectual e Estratgias de Avaliao de Ativos


Intangveis;

diagnstico e criao de condies facilitadoras da criao do conhecimento e da


inovao;

desenvolvimento de Modelos de Gerenciamento Baseados tais como o balanced


scorecard.

b) Desenvolvimento de estratgias e polticas de gesto de talentos humanos que


induzam o desenvolvimento do conhecimento na empresa, o que implica em:

desenvolvimento de modelos e instrumentos de gesto de pessoas por


competncias;

estabelecimento de polticas e desenvolvimento de modelos e instrumentos


relacionados educao corporativa e aprendizagem virtual.

105

c) Desenvolvimento

implementao

de

tecnologias

da

informao

processamento de dados que suportem a demanda por ativos de conhecimento,


tais como data warehousing, business intelligence e trabalho colaborativo por
computador com intranets e a internet. Exemplos de aes:

desenvolvimento de Sistemas de Informaes Gerenciais;

desenvolvimento de Portais Corporativos;

desenvolvimento de Sistemas Baseados em Inteligncia Artificial envolvendo


estratgias de minerao de dados;

desenvolvimento de Sistemas Inteligentes de Pesquisa Textual (Text Mining).

4.12 Concluso do Captulo

O papel do conhecimento na vida social crescente na medida em que se


aprofundam as relaes de interdependncia entre pessoas, organizaes e pases e na
medida em que o xito das aes humanas e organizacionais depende cada vez mais do
bom entendimento da realidade e da capacidade de gerar respostas competentes sobre
essa mesma realidade. Seres humanos buscam o sucesso pessoal, organizaes aspiram
o xito em seus objetivos e naes anseiam pelo desenvolvimento e crescimento de seus
povos e de suas riquezas. Em todas essas dimenses o conhecimento passa a
desempenhar papel importante na medida em que est vinculado a palavras chave como
o xito e o sucesso. Esse conhecimento estar em geral ligado inovao e sua
dinmica implica em constante metamorfose, transformao contnua a partir da
construo do saber humano. O conhecimento tem natureza dinmica e est
profundamente caracterizado por dois grandes aspectos: primeiro o mundo humano, das
relaes entre pessoas que, trabalhando juntas, criam continuamente o conhecimento,
solucionando problemas e produzindo inovaes. o conhecimento tcito, to
fundamental quanto difcil de delimitar.

Em segundo lugar, preciso dizer que o

conhecimento est ligado a uma importante matria prima: a informao. No so a


mesma coisa, mas sem a informao, tempestiva, precisa e formatada na necessidade
das pessoas, torna-se muito difcil gerar ou mesmo utilizar o conhecimento. A
informao o lastro do conhecimento, expressando a manifestao do conhecimento
explcito, sempre menor que o tcito, porm importantssimo uma vez que permite

106

registrar o que possvel e ajudar resgatar a experincia individual e coletiva no interior


das organizaes. Informao no sinnimo de conhecimento, mas est
profundamente a ele atrelada. Gerar, armazenar e saber utilizar informao grande
diferencial competitivo, como o criar ambientes no quais as pessoas se sintam
estimuladas a gerar, compartilhar e utilizar o conhecimento para o prprio crescimento,
de suas organizaes e da prpria sociedade.

107

5 RECUPERAO DA INFORMAO

5.1 Consideraes Preliminares

Dados

informaes,

conceitos

discutidos

anteriormente

no

exaustivamente nesse trabaho, so realidades intrinsicamente ligados vida e


trajetria da humanidade. Eles esto vinculados profundamente ao conhecimento gerado
pelo homem. O ser humano tem conscincia daquilo que e do que pode vir a ser. Tem
capacidade de refletir, de elaborar, de construir (e muitas vezes destruir) sobre a
realidade em que vive. No apenas caminha sobre a terra, mas procura entender o
sentido dessa caminhada, fazendo-se ser histrico e criando sentido para si, no tempo e
no espao. Faz isso atravs da busca do entendimento do mundo e de si. Em sua relao
com o mundo, ao longo de sua existncia sobre o planeta terra, portanto, adquire
conhecimento sobre si e sobre o mundo. Portanto, o homem busca de conhecimento
para existir sobre o mundo e para alcanar esse conhecimento necessita obter
informaes, interagindo com outros seres humanos e objetos. No s adquire
conhecimentos, mas tambm os gera, compartilhando-os (muitas vezes) com outros
homens. De certa forma, isso vem se estabelecendo em nosso jeito de ser e de viver, em
nossa cultura. Por isso, ao longo dos sculos, o ser humano sedimentou expressiva
concentrao de itens ou objetos capazes de transmitir informao.

Bibliotecas,

museus, acervos de obras de arte, colees particulares de indivduos ou grupos foram


sendo institudas ao longo do tempo, bem como os esforos e processos para
administrar e tratar esses agrupamentos de objetos de informao, aos quais podemos
chamar de unidades ou centros de informao. A biblioteca obviamente destaca-se entre
eles. Instrumentos de suporte foram desenvolvidos para que os ambientes propostos
pelos centros de informao se tornassem gerenciveis e pudessem ter continuidade.
Esse processo demandou o estabelecimento da grande maioria dos mtodos de
armazenamento, localizao e manipulao de informaes que existem atualmente.
Podemos assumir que, na complexidade do contexto scio-cultural e econmico que
caracteriza hoje nossa sociedade, recuperar, tratar e transformar a informao em
substrato do conhecimento alavanca para a competncia e certamente hoje um dos
maiores desafios organizacionais. O conhecimento uma caracterstica diferenc iadora
dos seres humanos e sua construo e utilizao demanda a busca de informaes.

108

Historicamente, de acordo com BUCKLAND (1997), por certo perodo de tempo, a


atividade de produzir e gerenciar a literatura em geral foi chamada de bibliografia. A
partir da revoluo cientifica e industrial, no sculo XVII, somado ao desenvolvimento
da imprensa, houve um crescimento rpido de publicaes, o que demandou novos
processos de organizao de acervos para coleta, preservao, organizao,
representao, recuperao e reproduo de documentos. Surge ento a documentao
como um conjunto de tcnicas requeridas pela gesto de documentos. Para esse autor,
documentao tornou-se um termo mais genrico capaz de incluir a bibliografia, os
servios de informao, gesto de registros e atividade de arquivamento.
Posteriormente, ao longo do tempo, especialmente a partir da dcada de 50,
denominaes mais adequadas passaram a ser usadas, tais como Cincia da Informao,
Armazenamento da Informao ou Gerenciamento de Informaes, ou ento,
simplesmente, Recuperao da Informao.

A operacionalizao das funes dessa

rea, to importante para a Gesto do Conhecimento, se d a partir da utilizao de


sistemas que cumpriro o papel de selecionar, inserir, descrever, representar, organizar,
armazenar, recuperar e disponibilizar ao usurio os dados ou informaes (dependendo
da perspectiva terica de um outro autor ou olhar do observador, uma vez que para
certos autores, sistemas no lidam com informaes, mas apenas com dados ou objetos
potencialmente portadores de informao, como os documentos).

Nas ltimas trs dcadas assistimos a um processo intenso de virtualizao dos


documentos associado tambm ao grande crescimento de suas bases, ou seja: cada vez
mais os documentos se apresentam em grandes volumes, em muitas bases e sob formato
digital, demandando cada vez mais sistemas informatizados para lidar com esses
mesmos documentos.

5.2 O Conceito de Sistema

A idia de sistema aplicada ao fenmeno da gerao, tratamento e uso da


informao adequada por embutir na sua essncia que tal atividade possui uma
complexidade e envolve diferentes elementos. Um sistema pode ser entendido como um
conjunto de elementos relacionados entre si, organizados de acordo com determinada
lgica ou certos princpios, formando um conjunto global, um todo ou uma unidade. H
uma articulao, uma coerncia com certos princpios bsicos, ou mesmo com certos
109

objetivos ou funes que esse sistema possa ter. BERTALANFFY (1968) foi um autor
importante no campo do estudo dos sistemas. Em sua obra Teoria Geral dos Sistemas,
criticou as vises reducionistas na cincia propondo um modelo ampliado, que
pressupe uma interao das diversas realidades existentes entre si. Props uma viso
de mundo como uma hierarquia de sistemas em que as idias de interao e de todo
articulado so importantes. Embora tenha iniciado seus estudos na Biologia, seu
trabalho influenciou muitas reas, incluindo as sociais e as exatas, obviamente com
algum vis funcionalista, o que no diminui sua importncia.

De acordo com a Teoria Geral dos Sistemas, apresentada em BERTALANFFY


(1968), um sistema possui: entrada, processamento, sada e retroalimentao (feedback),
conforme a figura 10. Essa viso teve aderncia muito grande idia de sistemas de
informao.

Processamento

Entrada

Sada

Retroalimentao
Figura 10: O conceito de sistema de BERTALANFFY
Fonte: Ilustrao elaborada pelo autor

Aplicando tal idia ao campo dos estudos da informao de selecionar, inserir,


descrever, representar, organizar, armazenar, recuperar e disponibilizar ao usurio os
dados ou informaes chegaremos aos conceitos de sistema de informao e sistema de
recuperao da informao. ARAJO (1994), baseando-se especialmente em PAO
(1989) e SARACEVIC (1983), afirma que temos diferentes maneiras de subdividir um
sistema que lida com informao e que uma delas justamente a subdiviso nos trs
subsistemas abaixo descritos.

Entrada envolve os processos de seleo/aquisio, descrio, representao e


organizao de arquivos, bem como o armazenamento.

Sada engloba a questo da interface com o usurio com a anlise e negociao


de questes relacionadas ao comportamento de busca da informao, a partir do
110

entendimento das necessidades de informao dos usurios. So consideradas


aqui as estratgias de busca/recuperao / e acesso aos dados/informaes e as
formas de entrega dos mesmos a tais usurios.

Avaliao processo que se refere tanto entrada quanto sada, procurando


avaliar o custo/eficcia do sistema, os benefcios e o retorno por ele
proporcionados, quo bem ele est funcionando, dentre outros aspectos.

Considerando a proposta terica de BERTALANFFY (1968), algumas das


atividades inseridas nos processos de entrada e de sada poderiam ser reclassificadas na
caixa do processamento acima apresentada. Como exemplo, talvez pudessem assim
ser a representao e questes relacionadas s estratgias que o sistema deve processar
para organizar, tratar e recuperar dados/informao.

5.3 Sistemas de Informao e Sistemas de Recuperao da Informao


As expresses Sistemas de Informao e Sistemas de Recuperao da
Informao so usadas s vezes como equivalentes s vezes de forma diferenciada.
Inicialmente poderamos ver na expresso recuperao uma idia restritiva para o
sistema, uma vez que, na prtica, no temos s a idia de recuperar, mas tambm de
inserir, manter, armazenar, atualizar e organizar os objetos de informao mantidos pelo
sistema.

Entretanto, em muitos escritos e muitos autores, um exame mais atento

permite definir tais expresses como equivalentes. Por outro lado, a idia de sistema de
informao na literatura recente embute uma viso mais generalista e um componente
tecnolgico mais forte, mormente influenciado pela Cincia da Computao. J a idia
de sistemas de recuperao da informao embute uma viso mais especfica, em que a
idia de documento, em geral textual mais central. De qualquer forma, h variao no
uso e no significado dos dois termos para diferentes autores.

Na perspectiva de TURBAN (2003), que tomaremos como referncia nesse


trabalho para a idia de sistema de informao, tal sistema coleta, processa, armazena,
analisa e dissemina informaes com um propsito especfico. Como qualquer outro
sistema, um sistema de informao abrange entrada (dados), processamento (clculos,
organizao e tratamento dos dados) e sadas (informaes e relatrios). Portanto, um
conjunto de componentes relacionados, trabalhando juntos para coletar, recuperar,

111

processar, armazenar e distribuir informao. Tambm na perspectiva desse autor, nem


todos os sistemas de informao so computadorizados. Um sistema de informao
baseado em computador aquele que usa o computador e a tecnologia das
telecomunicaes para executar suas tarefas. Uma tecnologia de informao um
componente particular de sistema (por exemplo, um computador pessoal, uma
impressora ou uma rede). Poucas tecnologias de informao so usadas isoladamente.
Os principais componentes de um sistema de informao baseado em computador so: o
hardware, o software, as bases de dados, registros ou documentos (conforme o caso), o
processo de conectividade que viabiliza o compartilhamento de recursos (rede), os
procedimentos (estratgias, polticas e mtodos para usar os sistema de informao) e as
pessoas (elemento mais importante que inclui usurios finais e operadores do sistema).
Isso pode ser representado na figura 11 abaixo:

6. Pessoas

5. Procedimentos

4. Redes

1. Hardware

2. Software

3. Bancos de
Dados,
ou
Documentos

Figura 11 Componentes de um Sistema de Informao


Fonte: Adaptado de TURBAN (2003)

Um sistema de informao , portanto, um sistema scio-tcnico, composto por


um conjunto de componentes relacionados entre si, que coletam, processam, armazenam

112

e distribuem informao para pblicos nela interessados. Como sistema scio-tcnico,


utilizado, concebido e operado por pessoas e possui hardware, software, bases de dados,
recursos de conectividade (rede), procedimentos de uso do mesmo. A minerao de
textos, objeto do presente trabalho, pressupe o uso de um sistema de informao
baseado em computador para viabilizar seu propsito, que o de permitir a recuperao
inteligente

automtica

de

documentos

digitais,

servindo-se

de

recursos

computacionais para atingir tais objetivos.

Para SALTON & MCGILL (1983) temos diferentes tipos de sistemas de


informao, quais sejam:

Sistemas de Recuperao da Informao

Sistemas Gerenciadores de Banco de Dados

Sistemas de Informaes Gerenciais

Sistemas de Suporte Deciso

Sistemas de Recuperao de Fatos (query answering systems)

H uma grande variedade e diferentes possibilidades de classificao de sistemas


que lidam com a informao. VICKERY & VICKERY (1987), citado por ARAUJO
(1994) enumeram oito critrios principais para dife renciao e criao de uma tipologia
dos sistemas que lidam com informao. De acordo essa viso, podem ser utilizados os
seguintes pontos de discernimento:

em relao ao processo de transferncia da informao, que implica em troca de


mensagens, estas podem ser registradas (em base de dados, ou qualquer
documento) ou no registradas;

em relao s audincias do usurios, podemos t- los concentrados ou dispersos;

em relao natureza da audincia, o nmero de usurios que podem ser


atingidos simultaneamente podem ser individual, uma comunidade restrita ou
destinado uma massa de usurios;

em relao coleta de informaes, as fontes podem ser tambm concentradas e


dispersas;

113

em relao sua forma de operao, o sistema pode operar de forma


centralizada ou descentralizada (em rede), com a definio de pontos de
aquisio em que as informaes so coletadas por ele, estabelecimento das
estruturas de armazenamento e pontos de acesso em que a informao
fornecida aos usurios;

em relao ao tipo de usurio, o que pode variar muito, indo desde um tomador
de deciso em uma organizao at um jovem que busca noticias esportivas na
Internet;

em relao ao meio utilizado para entregar as mensagens aos usurios, podendo


ser de forma oral, manuscrita ou eletrnica;

em relao forma da informao, o que permite classificar os sistemas como


lidando com dados e fatos, documentos, referncia a documentos, fontes de
referncia a pessoas e instituies, etc.

Podemos adicionar uma nona caracterstica que seria sobre a natureza


constitutiva ou estrutura do prprio sistema, em que poderamos classific- lo como
informatizado ou no informatizado, e uma ltima caracterstica distintiva, baseando-se
em VICKERY & VICKERY (1987), citado por ARAUJO (1994), que a sua finalidade
ou propsito, ou seja: para qual funo tal sistema foi concebido e desenvolvido, o que
pode ser para controle de um acervo, fornecimento de informao gerencial a
executivos tomadores de deciso, informao cientfica a pesquisadores, ou informaes
operacionais a pessoas que trabalham no cho-de-fbrica em uma indstria.

Isso

significa que, sob o ponto de vista organizacional, ento que temos a classificao de
sistemas de informao estratgica ou gerencial e sistemas de informao transacional
ou operacional.

A forma da informao ou dos dados, dependendo da perspectiva, tem sido


talvez o critrio mais forte utilizado para a classificao dos sistemas. Os sistemas
podem lidar com registros em bancos de dados relacionais, textos, imagens, sons e
outros itens multimdia. Na segunda metade do sculo XX duas fortes linhas se
consolidaram: a linha dos sistemas que tratam dados e dos sistemas que tratam
documentos. A linha do tratamento de dados cresceu vertiginosamente em funo da
ampla proliferao de sistemas de informaes em empresas para processamento de

114

transaes de negcios. J a linha do processamento de documentos evoluiu na


trajetria da rea da Biblioteconomia e da Gesto de Documentos no que se afirmou sob
a denominao de Recuperao da Informao. Podemos dizer que tais vertentes
geraram mesmo dois diferentes paradigmas: o da rea de Banco de Dados fortemente
vinculado idia de dados relacionais manipulados pelos DBMS (Database
management systems, ou sistemas gerenciadores de banco de dados) e o da rea de
Recuperao da Informao. Ao longo dos anos 90, o critrio do tipo de usurio foi
muito salientado, com uma forte discusso sobre a separao dos sistemas em gerenciais
(ou estratgicos) e transacionais (operacionais). Tais classificaes no so mutuamente
excludentes, mas sim vises por pontos de vista diferentes de um mesmo fenmeno: os
sistemas que lidam com o desafio de transformar dados em informaes para um
usurio ou uma comunidade usurios. Sob os pontos de vis ta, conceitual, metodolgico
e tecnolgico, considerar a forma dos dados um fator importante a ser avaliado, uma
vez que essa forma determinar o esforo computacional para trat- lo.

De acordo com SOUZA (2006):


h que se distinguirem os sistemas de recuperao de informaes (SRI) dos
sistemas de gesto de bancos de dados (SGBD). Dados podem ser definidos
como seqncias de smbolos para os quais so atribudos significados;
smbolos estes que podem ser codificados, interpretados e manipulados por
programas de computador, e enviados atravs de redes e dispositivos de
comunicao. O conceito de informao j carrega um grau maior de
abstrao. A informao no prescinde do sujeito que a depreenda a partir dos
dados, no ato conhecido como interpretao. No sentido estrito do conceito,
nenhum programa de computador lida, sob o ponto de vista da mquina, com
informaes, a no ser que possua alguma capacidade de arrazoamento, e,
assim mesmo, a utilizao do termo d margem a discusses. No uso corrente,
porm, ambos os termos so utilizados para sistemas, apesar das diferenas
entre os sistemas de recuperao de informaes e sistemas de recuperao de
dados, como os SGBDs (p.163).

realmente importante separarmos os dois paradigmas. Em um SGBD, que lida


com tabelas no modelo relacional, uma consulta, formulada em uma linguagem de
manipulao de dados, possui exclusivamente uma s resposta possvel e correta, isto ,
existe ou no existe um conjunto resposta de elementos que atendem exatamente ao que
o usurio est procurando ou no. Por outro lado, para os chamados SRIs, h sempre um
grau de incerteza associada ao tipo de documento e, por isso, possvel que no exista
uma nica resposta exata consulta do usurio. Na perspectiva de FRAKES (1992), tais

115

sistemas so difusos e probabilisticos, no trabalhando com a exatido dos SGBDs,


sendo que um SRI em geral recupera uma aproximao, apresentando diferentes
respostas possveis e construindo um ranking em que os documentos so enumerados
sequencialmente de acordo com uma estimativa de relevncia.

BAEZA-YATES & RIBEIRO-NETO (1999) afirmam que recuperar dados no


contexto de um SRI consiste principalmente em determinar quais documentos de uma
coleo contm a palavra chave na consulta de um usurio embora, muito
frenq entemente, isso no seja suficiente para satisfazer a necessidade de informao
dele. Na verdade, o usurio de um SRI est mais preocupado em recuperar informaes
sobre um assunto do que com recuperao de dados que satisfaa a uma determinada
consulta. Para esses autores, uma linguagem de recuperao de dados objetiva recuperar
todos os objetos que satisfaam a condies claramente definidas tal como aqueles em
uma expresso regular ou em uma expresso de lgebra relacional. Assim sendo, para
sistemas de recuperao de dados, um simples objeto errado dentro de um milho de
objetos recuperados uma falha total. Para um SRI, entretanto, objetos recuperados
com pequenos erros provavelmente passariam despercebidos. A principal causa dessa
diferena que a recuperao de informaes usualmente lida com textos em linguagem
natural, os quais nem sempre so bem estruturados e podem ter ambigidades
semnticas. Por outro lado, sistemas de recuperao de dados, tais como os bancos de
dados relacionais lidam com dados bem definidos em estrutura e semntica.

Continuando na perspectiva de anlise BAEZA-YATES & RIBEIRO-NETO


(1999), temos que a recuperao de dados, enquanto proporciona uma soluo para os
usurios de sistemas de bancos de dados no resolve o problema da recuperao de
informao sobre um sujeito ou tpico. Em sua tentativa de efetivamente satisfazer as
necessidades de informao dos usurios, sistemas de recuperao da informao
buscam de alguma maneira interpretar os contedos de itens de informao em uma
coleo, organizando-os e escalonando-os de acordo com o nvel de relevncia para a
consulta de um usurio. Tal interpretao de contedo implica na extrao de
informaes sintticas e semnticas dos textos dos documentos e no uso dessas
informaes para casamento com as necessidades de informao do usurio. difcil
no somente conhecer como extrair essas informaes sintticas e semnticas, mas
tambm como us- las para decidir sua relevncia.
116

Segundo ABITEBOUL, BUNEMAN et alli. (2000) os dados se apresentam em


trs formas distintas: estruturados, semi-estruturados e no estruturados. Analisando
sua proposta, podemos caracterizar tais formatos da seguinte maneira:

Dados estruturados aqueles que apresentam uma representao estrutural


homognea, com seu tipo bem definido. Sua forma de representao bem
clara, feita de forma documentada, atravs de descrio de lay-out com base na
documentao do aplicativo. Nestes dados inclui-se o cadastro de funcionrios,
clientes, produtos e as respectivas tabelas dos bancos relacionais que lhes do
sustentao, dentre outros.

Dados semi-estruturados aqueles que se apresentam com uma representao


estrutural heterognea, no so completamente estruturados e nem tem seu tipo
totalmente definido. Entretanto, possuem alguma estrutura. Os dados publicados
na Web so bons exemplos. Em alguns casos os dados portam uma descrio
uniforme como catlogos de produtos, em outros casos os dados possuem
formato que podem ser identificados como textos com alguma estrutura,
contratos e relatrios que possuem campos ou sees relativamente bem
definidas e identificveis. Neste tipo de dado a descrio do formato est, em
geral, implcito ao documento.

Dados no estruturados so aqueles em que impossvel ou muito difcil


encontrar a forma de representao. Enquadram-se neste tipo de dados textos
diversos e imagens, por exemplo. Em tal caso, no h geralmente informao
descritiva associada.

Podemos assumir que os dados estruturados tem sido, ao longo do tempo, o foco
de ateno do paradigma da rea de banco de dados, enquanto os dados semiestruturados e os no estruturados os da rea de recuperao da informao.
Impulsionada pela demanda gerada pela Web, a rea de recuperao da informao, tm
sido objeto de vrias pesquisas a fim de fornecer suporte ao atendimento das
necessidades de informao das organizaes. O volume de documentos disponveis

117

tem crescido consideravelmente e a tarefa de filtrar informao relevante passou a


representar uma boa dose de tempo para as organizaes.

5.4 O Paradigma da rea de Banco de Dados e Sistemas Vinculados

Um aspecto muito importante para a tecnologia da informao foi o surgimento


e crescente utilizao de bancos de dados e de seus sistemas gerenciadores de bancos de
dados - os SGBDs, que consistem em uma coleo de dados inter-relacionados e um
em um conjunto de programas para acess-los. O conceito de dado j foi discutido no
captulo anterior. A partir dele podemos refletir sobre a definio de processos
tecno lgicos de organizao e processamento de dados e de sua importncia para o
desenvolvimento dos sistemas de informao. Do ponto de vista tecnolgico vai do
menor nvel (bit digito binrio), passando por bytes, campos, registros e arquivos at
chegar ao banco de dados. Foi, portanto, necessrio estruturar e hierarquizar dados para
se obter resultados interessantes no que tange gerao de informao.

Antes do advento dos chamados sistemas gerenciados de bancos de dados


SGBDs a rea de informtica trabalhava com o chamado processamento de arquivos em
que os dados eram armazenados em estruturas de arquivos pouco flexveis e muito
seqenciais. Porm, havia problemas de inconsistncia, isolamento e redundncia dos
dados, dificuldade de acesso a eles, problemas de integridade, atomicidade, dificuldades
para o acesso por usurios ou aplicaes simultneas e segurana. Os SGBDs surgiram
como uma busca de resposta eficaz a tais problemas. SGBDs so conjuntos de dados
associados a um conjunto de programas para acess- los, conforme a viso de KORTH,
SILBERSCHATZ & SUDARSHAN (1999). O conjunto de dados, comumente
chamados de bancos de dados, contm informaes sobre uma organizao ou uma
realidade em particular.

Os SGBDs tratam os conjuntos de dados e operam tais programas com uma


estrutura lgica que permite melhor organizar o processo de gerao da informao a
partir de modelos conceitual, lgico e fsico de estruturao de dados nas bases dos

118

sistemas aplicativos 37 que utilizam as bases de dados por eles requeridas. SOUZA
(2006) comenta que:
Em sistemas gerenciadores de bancos de dados, os smbolos so armazenados
em uma estrutura matricial em campos determinados, com metadados que lhes
conferem certo sentido ontolgico. Para recuperar dados especficos, basta
especificar as restries necessrias aos campos de pesquisa e codific-las
numa questo ou query (argumento de entrada no sistema) para que se tenha a
resposta exata, fruto de busca completa e exaustiva(p.163).

J KORTH, SILBERSCHATZ & SUDARSHAN (1999), analisam que os


sistemas de bancos de dados so projetados para gerenciar grupos de dados que sero a
matria prima da informao, pelo menos no mbito dos sistemas nele baseados.
Atravs das linguagens de manipulao de dados eles permitem inserir, recuperar,
remover ou modificar os registros de dados armazenados nos bancos de dados. No nvel
fsico, devem operar com algoritmos eficientes para executar tais funes e no nvel
abstrato, da interface com o usurio, deve proporcionar uma interao eficie nte entre
desses com o sistema. Os SGBDs fornecem segurana contra falhas, evitam
redundncia e inconsistncia, garantem um armazenamento mais adequado, melhoram o
acesso aos dados e solucionam problemas de integridade. 38 O uso de bancos de dados
cresceu desde o advento da tecnologia da informao, uma vez que as estruturas de
dados por eles armazenadas podem ser utilizadas vrias vezes em muitos sistemas
diferentes, e isso ficou ainda mais ressaltado com a utilizao crescente do modelo
relacional de dados. Os sistemas gerenciadores de banco de dados, conforme TURBAN
(2003) possuem quatro componentes:

o modelo de dados, que define o modo como os dados so organizados e


estruturados em termos conceituais. Por exemplo, podem ser organizados
segundo o modelo, hierrquico, em rede, relacional, orientado a objetos, objetorelacional, hipermdia e multidimensional;

uma linguagem de definio de dados, que define os tipos de informaes


existem no banco de dados e como esto estruturadas;

37

Um sistema aplicativo qualquer programa de computador que tem uma finalidade ou aplicao bem
especifica para uma necessidade devidamente delimitada para certos grupos de usurios. Por exemplo, um
software comercial que controla vendas e faturamento ou um programa para controle contbil, so bons
exemplos.
38
Para anlise mais ampla, consultar estudo detalhado na obra KORTH, H., SILBERSCHATZ, A. &
SUDARSHAN, S Sistema de Banco de Dados. 3. Edio Brasileira. So Paulo. Makron Books, 1999.

119

uma linguagem de manipulao de dados, que define as formas de manipulao


dos dados nas bases de dados;

um dicionrio de dados, que armazena definies de elementos dos dados e suas


caractersticas. Um elemento de dado representa um campo. Padroniza e cria
dados sobre os dados (metadados).
Abordaremos a seguir o modelo relacional por sua representatividade

computacional e comercial e pelos efeitos significativos que produziu na informtica


comercial e na sociedade cada vez mais computadorizada.

5.4.1 A Perspectiva do Modelo Relacional

No propsito de que esse trabalho discuta de forma ampla esse assunto to


complexo, mas ele pretende apenas pontuar uma reflexo resumida e til para o
contexto da presente tese. Podemos postular que o chamado modelo relacional criou no
s uma forma de lidar com quantidades crescentes de dados, mas significou tambm a
solidificao de um paradigma que podemos denominar o do processamento e
recuperao de dados estruturados de forma relacional. Ao longo da dcada de 60, os
computadores comearam a ser utilizados nos negcios, e sistemas de informao e
linguagens de programao foram desenvolvidos especificamente para o uso
corporativo. Mas havia, at ento, apenas dois modelos de organizao de dados: o
modelo hierrquico e o modelo em rede 39 , ambos com limitaes para lidar com bases
de dados crescentes, embora buscando maior estruturao. Foi o trabalho pioneiro de
Edgar Codd, de proposio do chamado Modelo Relacional, que apresentou uma
opo mais simples, que no exigia de quem estivesse acessando o sistema um profundo
conhecimento de programao. ponto capital a publicao do artigo de Codd "O
Modelo Relacional de Dados para Grandes Bancos Compartilhados" (A Relational
Model of Data for Large Shared Data Banks), em 1970. O modelo props o uso da
teoria matemtica de relaes (lgebra relacional). baseado na lgica de predicados e
teoria dos conjuntos.

O postulado principal do modelo relacional o de os dados

podem ser representados por relaes matemticas ou um subconjunto do produto


cartesiano de vrios conjuntos.
39

O modelo hierrquico tratava os dados sob a perspectiva de uma estrutura de rvore de instncias
sucessivamente subordinadas, enquanto o modelo em rede podia permitir algumas relaes lgicas mais
complexas entre representaes de dados.

120

O modelo redundou em uma grande transformao no campo da informtica


comercial, uma vez que propiciava aos bancos de dados uma

organizao muito

diferente dos dois sistemas usados at ento. No modelo hierrquico, todos os registros
eram relacionados com outro, acima na hierarquia (um registro principal encabea a
lista, e todos os outros dados vinham abaixo) e, no modelo de rede relacionada uma
informao poderia estar listada em duas hierarquias distintas. Diferentemente, no
modelo relacional, CODD (1970) props que os dados fossem armazenados em tabelas
simples, constitudas por linhas e colunas e que tais dados fossem relacionados entre si.
Conforme analisa KORTH, SILBERSCHATZ & SUDARSHAN (1999):
um banco de dados relacional consiste em uma coleo de tabelas, cada uma
das quais um nome nico. Uma linha em uma tabela representa um
relacionamento entre um conjunto de valores. Uma vez que essa tabela uma
colao de tais relacionamentos, h uma correspondncia estreita entre o
conceito de tabela e o conceito matemtico de relao, a partir das quais se
origina o nome desse modelo de dados(p.61).

Portanto, o modelo relacional inclui uma coleo de estruturas de dados,


denominada formalmente de relaes ou de modo informal de tabelas. Alm disso,
operaes matemticas deveriam ser usadas para recuper- las destas tabelas (tais como
UNION, SELECT, SUM etc.). Isso redundou no estabelecimento de uma coleo dos
operadores, da lgebra e do clculo numa perspectiva relacional os quais passaram a
constituir o fundamento da linguagem SQL Structured Query Language.

Trs aspectos bsicos foram alcanados com o modelo relacional:

a) uma maior independncia dos dados, com definio mais explcita dos limites
entre os aspectos fsicos e lgicos de um gerenciador de banco de dados;

b) permitir um modelo estrutural simples de forma que usurios de vrias


categorias pudessem ter um entendimento comum dos dados e pudessem se
comunicar atravs do banco de dados;

121

c) uso de linguagem de alto nvel - existncia de uma linguagem que permitisse


a manipulao de um conjunto de dados atravs de apenas um simples comando
os previstos pela linguagem SQL.

Os bancos de dados relacionais passaram a permitir aos projetistas,


programadores e usurios escreverem consultas (queries), reorganizando e utilizando os
dados de modo flexvel e no necessariamente do modo definido pelos projetistas
originais. Tal flexibilidade se tornou especialmente importante em bases de dados que
deviam ser utilizadas por muito tempo, tornando as bases de dados relacionais muito
importantes no meio comercial. Por isso se difundiu intensamente, sendo at hoje ainda
a principal referncia em modelos de dados com aplicaes organizacionais. Deflagrou
uma srie de desenvolvimento de sistemas de informao aplicativos diferentes
necessidades das organizaes e continuam vigorosos nos dias de hoje. No modelo
relacional, o SGBD administra a integrao de tabelas de dados entre si que podem ter
os mais diversos arranjos. Por isso, tornou-se muito adequado para suportar as
aplicaes (sistemas) especficos das organizaes, desde as de pequeno porte, at os
sistemas de gesto integrada, os chamados ERP Enterprise Resource Planning. Com
as presses por aumento de competitividade, nos anos 80 e 90, grande parte das
empresas buscaram fortemente automatizar ao mximo suas operaes, o que levou a
um forte desenvolvimento de sistemas transacionais voltados para as transaes do
dia-a-dia dos seus negcios e os bancos de dados relacionais tiveram e ainda mantm
papel importante no que tange a isto (figura abaixo).

BANCO

SISTEMAS
TRANSACIONAIS

DE DADOS
RELACIONAL
Figura 12: Os bancos de dados armazenam dados e alimentam os sistemas de informao.

Em suma, a utilizao da idias de CODD (1970) levou a um paradigma no s


de gerenciamento de bases de dados, como tambm de diferentes tipos de sistemas
baseados em sua concepo. As linguagens de manipulao de dados, especialmente a
linguagem SQL, que passou a ter inclusive padres aceitos pela indstria de software,

122

foram intensamente difundidas e , ainda hoje, referncia em definio e manipulao


de dados atualmente, sobretudo em grandes aplicaes. Os sistemas baseados na viso
relacional no s utilizam como geram grande quantidade de dados relacionais, registros
relativos s transaes operaes de uma organizao. Essa base de dados torna-se
substrato para gerao de informaes a mltiplos e diferentes usurios.
5.5 O Paradigma da Recuperao de Informao

5.5.1 Viso Geral

Uma grande quantidade de informao pode hoje ser produzida e disponibilizada


com facilidade, especialmente aps a difuso do uso do computador. Com a elevao da
quantidade de documentos, o processo de recuperao de informao no uma tarefa
simples. De acordo com MEADOWS (1992) recuperar informao encontrar a
informao que se deseja em uma base de dados ou armazm de informao. Podemos
ampliar a anlise de tal definio afirmando que recuperar informao encontrar a
informao desejada em uma coleo de objetos capazes de transmitir informao,
sendo que essa coleo pode ser uma base de dados, uma base de documentos textuais,
uma biblioteca, uma pinacoteca, um museu, um acervo de imagens e sons, etc.

Recuperar informaes significa recuperar objetos de informao (ou seja,


documentos) que possivelmente contenham informaes para o usurio (LANCASTER
2004). Um documento, conforme discutido no capitulo anterior, um objeto do mundo
real com potencial para transmitir informao a algum. Ao ser recuperado, em um
contexto de busca, porqu faz algum sentido no contexto de um usurio especfico.

Diferentemente dos dados manipulados por sistemas gerenciadores de bancos de


dados relacionais, e anteriormente a eles, dados expressos sob a forma de documentos
textuais, sejam eles eletrnicos ou no, j colocavam desafios ao esforo de buscar
respostas para as necessidades de informao humanas. No obstante existam outros
eventos anteriores a considerar, a partir do fenmeno da exploso da informao,
logo aps a II Guerra Mundial, que a rea de Recuperao da Informao comea a
ganhar maior densidade e identidade. Os acervos de registros ou documentos crescem e
precisam ser alvo de processos de tratamento e recuperao para serem efetivamente

123

teis aos usurios. BUSH (1945), em seu clebre artigo j citado, prope o uso de novas
tecnologias da informao para viabilizar o acesso de modo satisfatrio, embora tais
tecnologias ainda estivessem em um grau de desenvolvimento principiante. Posterior e
gradativamente os documentos eletrnicos (digitalizados) no pararam mais de crescer
em volume. A estrutura que possuem distinta das tabelas manipuladas pelos SGBDs.
Precisam de estratgias adequadas de manipulao e recuperao. Portanto, o foco
central da discusso a seguir sobre documentos textuais.
A expresso Recuperao de Informaes foi proposta por MOORES (1951),
um empresrio atuante na rea e que definiu recuperao de informaes como o
nome do processo ou mtodo onde um posssvel usurio de informao pode
converter a sua necessidade de informao numa lista real de citaes de
documentos armazenados que contenham informaes teis a ele (...)
recuperao de informao abarca os aspectos intelectuais da descrio da
informao e a sua especificao para busca, assim como tambm quaisquer
sistemas, tcnicas ou mquinas que sejam empregadas para efetuar a operao
(p.20-32,)

Calvin Moores procur ava encontrar respostas para a necessidade de armazenar e


gerenciar eficazmente a informao, e conforme ARAJO (1994), permitir o acesso
rpido e preciso ao crescente volume de documentos que passava por exponencial
crescimento desde o sculo XVII e pelo surgimento do computador, o qual passou a ser
visto como potencial soluo para os problemas de recuperao da informao. Para
OLIVEIRA (1) (2005), a concepo proposta por MOORES (1951), implica em trs
questes importantes:

Como descrever intelectualmente a informao?

Como especificar intelectualmente a busca?

Quais sistemas, tcnicas ou mquinas devem ser empregados?

Ainda segundo essa autora,


as atividades desenvolvidas no mbito da temtica recuperao da
informao conduziram a estudos tericos e conceituais sobre a natureza da
informao; a natureza dos seus registros (incluindo a bibliometria); os
estudos relativos ao uso e aos usurios da informao; estudos do
comportamento humano frente informao; a interao homem computador,

124

dentre outros. Enfim, a recuperao da informao possibilitou o surgimento


dos sistemas automatizados de informao . (OLIVEIRA (1), 2005: 12).

O processo de recuperao da informao envolve trs elementos importantes: o


usurio, o sistema de recuperao e a base de documentos. No processo de recuperao
da informao, o objetivo maior de um sistema de recuperao automatizado fazer
com que o usurio encontre a informao de que necessita rapidamente, de modo que
esse usurio no precise analisar, ele prprio, as informaes existentes na base de
documentos.
Conforme j citado anteriormente, importante salientar que a conceituao do
que sejam os termos: dados, informao ou conhecimento polmica e no h a
inteno do presente trabalho em explorar tais divergncias e exaurir os mltiplos
conceitos e as mltiplas divises colocadas por diversos autores. Algumas questes de
ordem, entretanto, so importantes. Primeiro: podemos avaliar a pertinncia ou no da
expresso Recuperao da Informao. Se assumirmos, conforme ARAJO (1994)
que a informao algo dinmico, que faz com que o agente modifique seu estado de
conhecimento do mundo atual, modificando estruturas, e s tendo sentido no contexto
da ao, Recuperao da Informao pode ser um termo inadequado. Alm disso, a
informao depende do sujeito, do usurio para conferir significado aos dados que
foram recuperados para responder a uma determinada necessidade.

Baseando em (FOSKETT, 1997, p. 5), SOUZA (2006) afirma que:

A recuperao de informaes traz dificuldades intrnsecas ao conceito


de informao, como a dificuldade da determinao da real
necessidade do usurio e do seu melhor atendimento com os documentos
que fazem parte do acervo do sistema A associao entre os registros e
seus contedos informativos vaga, e isso pode acarretar problemas nas
respostas a questes especficas, como baixas taxas de revocao e
preciso.
Entretanto, a expresso Recuperao da Informao se consolidou na
perspectiva da definio formulada por MOORES, acima citada e a assumiremos no
contexto desse trabalho. De acordo com BAEZA-YATES & RIBEIRO-NETO (1999),
as bibliotecas figuram entre os primeiros tipos de instituio a adotar SRI. A primeira

125

gerao de SRI se limitava a automatizar tecnologias j utilizadas, tais como o uso de


catlogos. Em uma segunda gerao, foram acrescentadas funes de busca, pelo uso
das palavras-chaves e outros tipos de consultas mais complexas. Na terceira gerao,
que se encontra em curso, o principal foco est em criar interfaces grficas, formulrios
eletrnicos, caractersticas de hipertexto, e arquiteturas de sistemas abertos. A Web e as
Bibliotecas Digitais configuraram um cenrio novo para a rea de Recuperao da
Informao. Se considerarmos as mquinas de busca da web atualmente, conclumos
que elas continuam usando ndices similares aos utilizados por bibliotecrios h sculos
atrs. Entretanto, trs mudanas drsticas ocorreram durante o avano da tecnologia
computacional e no crescimento da web, quais sejam:

Atualmente h custos menores em ter acesso a vrias fontes de informao. Isso


permite que seja realizado um nmero de pesquisas muito grande, algo talvez
impensvel anteriormente.

O desenvolvimento de todos os tipos de comunicao digital produziu um


acesso ainda maior s redes. Isso implica que as fontes de informaes esto
disponveis, mesmo que localmente distantes e que o acesso pode ser realizado
rapidamente.

A liberdade de publicar e divulgar qualquer tipo de informao que uma pessoa


considere til ou importante para ela. Isso aumenta cada vez mais a popularidade
da web. Foi inaugurado um novo momento na histria, no qual muitas pessoas
tm acesso livre a uma enorme quantidade de publicaes de mdio e pequeno
porte. Basicamente a sociedade passou a contar com baixo custo, maior acesso, e
liberdade para publicaes, o que tm permitido s pessoas usarem a web e as
bibliotecas digitais modernas como a forma mais interativa de comunicao.

Esses aspectos conferem rea de Recuperao da Informao particular


importncia para a sociedade nos dias atuais.

126

5.5.2 Conceito e Processos dos Sistemas de Recuperao da Informao

Como ponto de dessa discusso faz-se mister pontua r a importante contribuio


de Wilfrid Lancaster, professor da Graduate School of Library and Information Science
da Universidade de Illinois (EUA) que um importante autor do campo da Recuperao
da Informao. De acordo com LANCASTER (1968), conforme o tipo de aplicao que
se d aos Sistemas de Recuperao da Informao SRIs, eles podem ser classificados
em sistemas de recuperao de documentos, sistemas de recuperao de referencias,
sistemas de recuperao de dados e sistemas de recuperao de fatos (ou query
answering systems). Ainda de acordo com ele, os SRIs no informam o usurio no
sentido de mudar seu conhecimento sobre objeto de sua questo, mas apenas o informa
sobre a possvel existncia de documentos atinentes questo, alm de caractersticas
desses documentos.

Posteriormente, LANCASTER & WARNER (1993) os SRIs

promovem o elo entre uma coleo de recursos de informao, em meio impresso ou


no, e um grupo de usurios. Eles cumprem as tarefas de aquisio, armazenamento,
organizao e controle de documentos, e sua respectiva entrega e disseminao aos
usurios. Ressaltando, LANCASTER (2004) postula que recuperar informaes, no
contexto de SRI, significa recuperar documentos que (supostamente) contenham
informaes relevantes para o usurio. Analisando os estudos desse autor e cotejando-os
com ARAJO (1994), que prope a idia de que um Sistema de Recuperao da
Informao possui os subsistemas de entrada, sada e avaliao, podemos construir uma
representao.

Um SRI pode ser visto como uma moeda que possui duas faces, dois
subsistemas ou, dependendo do ponto de vista, dois sistemas acoplados em torno de um
ncleo comum: a base de documentos. Por um lado, temos a face da gesto documental
e por outro a face da gesto das relaes com o usurio. Isso pode ser representado com
a figura 13. Na face da gesto documental, temos a entrada, processamento e sada dos
documentos com potencial para responder s necessidades de informao do usurio,
envolvendo as atividades de aquisio, insero, representao (indexao), organizao
e armazenamento dos documentos. Na gesto documental temos como centro da
ateno a descrio e representao dos documentos e das informaes neles contidas, a
partir das caractersticas de modelagem do prprio SRI. Na face da gesto das relaes

127

com o usurio, temos a entrada, processamento e sada das requisies e interaes dos
usurios para que possam responder s suas necessidades de informao. Os usurios
devem expressar suas necessidades de informao atravs de alguma forma de consulta
ou navegao que seja compatvel com o sistema e ele seja capaz de responder. Isso
implica em atividades de definio de estratgias de busca, formulao, submisso e
processamento de consultas, navegaes e interaes diversas do usurio com o SRI. A
partir desses dois aspectos, o SRI deve viabilizar o casamento que vincule a consulta do
usurio e as informaes do sistema, para especificar quais informaes so relevantes.

Figura 13: As Duas Faces de um Sistema de Recuperao da Informao


Fonte: Ilustrao elaborada pelo autor

Detalhando essa viso, podemos recorrer a CENDON (2005) que afirma que:
normalmente os sistemas de recuperao da informao lidam com
documentos que contem principalmente texto e esse seu grande desafio, j que
devem se defrontar com a ambigidade da palavra na recuperao da

128

informao. (...) Em uma definio mais ampla, podem, tambm lidar apenas
com a informao textual. (...) Um sistema de armazenamento e recuperao de
desenhos de engenharia, por exemplo, seria tambm um SRI. J um catlogo de
fichas seria um exemplo de SRI no automatizado. (p.62) .

A autora lembra que tais sistemas tendem a ser cada vez mais automatizados e
que automao oferece mais vantagens e possibilidades e seu uso vem aumentando.
Tambm em suas palavras, analisando essa automao:
esses sistemas oferecem maior nmero de pontos de acesso que os SRIs no
automatizados, podendo-se, muitas vezes, pesquisar palavras-chave que
aparecem em qualquer ponto do registro, inclusive no resumo e no texto
completo, quando estes esto disponveis. Alm disso, permitem realizar
pesquisas mais complexas, em que vrios conceitos necessitam ser
relacionados, pois pode-se combinar grande nmero de termos de busca com
lgic a booleana, de maneira que no seria possvel nos impressos (p. 62).

Partindo de definies de vrios autores, SOUZA (2006) afirma que os sistemas


de recuperao da informao organizam e viabilizam o acesso aos itens de
informao, desempenhando as atividades de:
a) representao das informaes contidas nos documentos, usualmente
atravs dos processos de indexao e descrio dos documentos; b)
armazenamento e gesto fsica e/ou lgica desses documentos e de suas
representaes; e c) recuperao das informaes representadas e dos prprios
documentos armazenados, de forma a satisfazer as necessidades de informao
dos usurios. Para isso necessrio que haja uma interface na qual os
usurios possam descrever suas necessidades e questes, e atravs da qual
possam tambm examinar os documentos atinentes recuperados e/ou suas
representaes(p.163).

5.5.3 A Face da Gesto Documental

Em uma face da moeda, conforme apresentado na figura 13, temos os


documentos e suas necessidades de representao e armazenamento. Documentos so
objetos (no contexto dessa tese, objetos textuais) potencialmente capazes de transmitir
informaes a provveis usurios. necessrio que os documentos sejam selecionados,
inseridos, descritos, representados, organizados e armazenados no SRI para que possam
atender a potenciais necessidades dos usurios. Baseando-se em CENDON (2005) e
LANCASTER (1979), podemos tambm apresentar um outro diagrama, adaptado
abaixo, e que represente um sistema de recuperao da informao e que ser analisado
na seqncia, com foco na gesto documental.

129

Figura 14 Funes de um Sistema de Recuperao da Informao


Fonte: Adaptado de LANCASTER, F. Wilfried. Information Retrieval Systems: characteristics,
testing and evaluation. 2 nd. New York: Wiley Interscience, 1979. In CENDON 2005.

Analisando as afirmaes de LANCASTER (2004) podemos melhor entender


esse diagrama e concluir que temos subsistemas ou etapas em um SRI e que a
configurao de um sistema de recuperao de informao SRI envolve tarefas a
serem executadas pelo que poderamos denominar o gestor do sistema (seu operador
principal, elaborador, ou mesmo o construtor) para atender o processo de recuperao
da informao, processo esse que parte sempre de uma necessidade do usurio. De
acordo com ele, inicialmente, o gestor do SRI, ou produtor da base de dados,40 como o
denomina, partindo de sua necessidade de informao, e/ou dos possveis usurios
40

A idia de um gestor do sistema, que pode ser um profissional da informao, um bibliotecrio, por
exemplo, ou qualquer pessoa responsvel por fazer com que um SRI atenda s necessidades de
informao de uma comunidade de usurios, torna-se a cada dia mais complexa. Isso se deve ao fato dos
usurios finais possurem cada vez mais autonomia e interatividade com os sistemas automatizados no
sentido, no s de buscar, mas tambm de adicionar contedo s bases de um SRI.

130

futuros do sistema as quais julga digna de serem contempladas, seleciona e insere


documentos na base de dados desse SRI, considerando critrios de autoria, assunto, tipo
de documento, lngua e origem. Em seguida, far o processo representao do contedo
temtico dos documentos atravs da indexao, ou seja: ne cessrio determinar os
pontos de acesso para a base de dados do sistema para que seja possvel ao SRI
responder s consultas dos usurios.

5.5.3.1 Representando os Documentos

Quanto maior e melhor a representao dos documentos, mais pontos de acesso


temos. Esses pontos de acesso podem ser resumos ou termos. Em geral, os termos so
mais utilizados, no obstante a importncia dos resumos, embora, conforme o autor,
listas de termos so como miniresumos. A representao, portanto, redunda na
indexao, em geral indexao de assuntos, cujo processo envolve duas etapas: a anlise
conceitual e traduo (para um vocabulrio ou linguagem de indexao). Para
LANCASTER (2004), a anlise conceitual implica em decidir o que trata o documento,
ou seja: qual o seu assunto. A traduo implica na converso da anlise conceitual de
um documento num determinado conjunto de termos de indexao. Essa traduo pode
levar ou no ao uso de um vocabulrio controlado, como um tesauro ou lista de
cabealho de assunto 41 . Um tesauro vocabulrio controlado o resultado da
traduo dos conceitos e assuntos dos documentos da base em termos controlados. A
indexao/traduo tambm pode ser feita a partir de termos livres, oriundos da
linguagem natural, extrados do prprio documento, tais como frases ou palavras que
ocorrem em um documento ou escolhidos pelo gestor do SRI.

De acordo com ele, ao desenvolver a traduo, para indexar, temos dois tipos
aes para a indexao, que pode ser por extrao ou atribuio, conforme afirma:
A esse respeito, faz-se uma distino entre indexao por extrao (indexao
derivada) e indexao por atribuio. Na indexao por extrao, palavras ou
41

De acordo com LANCASTER (2004), so trs os principais tipos de vocabulrios controlados:


esquemas de classificao bibliogrfica (como a CDD Classificao Decimal de Dewey), as listas de
cabealhos de assuntos e os tesauros. Todos procuram apresentar os termos tanto alfabtica como
sistematicamente. Os trs tipos de vocabulrio controlam sinnimos, distinguem homgrafos e agrupam
termos afins, mas empregam mtodos um tanto diferentes para alcanar tais objetivos. O autor faz um
estudo mais amplo do assunto em LANCASTER, F.W. Vocabulary control for information retrieval. 2nd
ed. Arlington, VA, Information Resources Press, 1986.

131

expresses que realmente ocorrem no documento so selecionadas para


representar seu contedo temtico. (...) A indexao por atribuio envolve a
atribuio de termos ao documento a partir de uma fonte que no o prprio
documento. Os termos podem ser extrados da cabea do indexador; por
exemplo, ele decidiria que os termos AJUDA EXTERNA e RELAES
EXTERIORES, que no aparecem explicitamente em nenhum dos resumos,
seriam termos bons de usar no documento. (...) Mais frequentemente, a
indexao por atribuio envolve o esforo de representar a substncia da
anlise conceitual mediante o emprego de termos extrados de alguma forma de
vocabulrio controlado(LANCASTER, 2004. p. 18-19).

ROBREDO & CUNHA (1994) descrevem quatro critrios de anlise relativos


atividade de indexao. Segundo esses autores, temos: a abrangncia da anlise
conceitual, a estrutura a ser analisada no documento (partes dos documentos que sero
analisadas), tipo de procedimento e o tipo de linguagem de indexao. No que tange ao
primeiro critrio, a abrangncia, segundo esses autores, podemos realizar uma
categorizao, uma indexao superficial ou uma indexao profunda, sendo que:

categorizar trabalhar com a idia de assuntos pr-existentes e em seguida


reconhecer os aspectos dominantes dos documentos que fazem com que estes se
enquadrem naqueles;

indexar superficialmente obter as principais idias e conceitos a que um


documento se refere;

indexar profundamente encampar todas as idias e conceitos que so


importantes.

Em relao ao segundo critrio, a estrutura do documento, ROBREDO &


CUNHA (1994) afirmam que a indexao pode se dar em relao no ttulo, ao resumo,
aos dois em conjunto, a partes determinadas tais como introduo ou concluso e, por
fim, em relao ao prprio documento completo. No terceiro critrio, o procedimento de
indexao pode ser manual, automtico ou semi-automtico (misto).

Por fim, em

relao linguagem, a indexao pode ser em linguagem natural ou em linguagem


artificial, sendo que:

a linguagem natural pode ser livre (quando utiliza palavras extradas do prprio
documento), natural controlada no estruturada (quando usa listas de descritores
padronizadas realizando eliminao de sinnimos e as listas de cabealhos de

132

assuntos), e natural estruturada (como um tesauro ou uma classificao


facetada);

a linguagem artificial pode ser artificial no estruturada (englobando esquemas


de categorizao que use qualquer smbolo no estruturado) ou artificial
estruturada (englobando os esquemas de classificao bibliogrficos, como a
CDU Classificao Decimal Universal).

Portanto, por meio das caractersticas de um objeto de informao, ou dos


documentos, que um SRI o pode tratar e representar para posteriormente o identificar e
localizar esses mesmos documentos para atender as necessidades de informao do
usurio. Assim sendo, preciso uma viso lgica desses objetos de informao de
forma a represent- los para que posteriormente possam ser dados como relevantes em
uma interao com o usurio. Para BAEZA-YATES & RIBEIRO-NETO (1999) uma
recuperao efetiva de informao relevante diretamente afetada pelas duas tarefas do
usurio, a busca e a navegao (analisadas na seo 5.5.4.2 e 5.5.4.3, respectivamente) e
pela viso lgica dos documentos adotada no SRI.

5.5.3.2 Viso Lgica dos Documentos no Processo de Recuperao da Informao

Conforme BAEZA-YATES & RIBEIRO-NETO (1999) por motivos histricos,


documentos em uma coleo no so armazenados diretamente num banco de dados,
preciso que estes passem por algum processo de abstrao e so geralmente
representados por um conjunto de termos de indexao ou palavras-chaves. Essas
palavras podem ser automaticamente extradas dos documentos ou selecionadas por
especialistas humanos. De qualquer forma, isso gera uma viso lgica dos documentos.
Computadores modernos esto tornando possvel a representao de um documento por
seu conjunto completo de palavras, a chamada representao total do texto (full text).
A representao full text a mais completa viso lgica de um documento, mas seu uso
implica em custos computacionais mais altos. Um conjunto menor de palavras
selecionadas por especialistas humanos a viso lgica mais concisa do documento,
mas seu uso pode levar a uma recuperao de informao de baixa qualidade. Alm
disso, o SRI deve, tambm, reconhecer a estrutura normalmente presente em um
documento, tais como: captulos, sees, subsees, etc. A informao sobre a estrutura
do documento deve ser usada nos processos de representao e recuperao em
133

diferentes modelos de sistemas de recuperao de documentos textuais. Esse processo,


para documentos textuais, pode ser representado na figura 15, proposta por esses autores
e reproduzida abaixo:

Documentos

Espaamento,
Acentos,
Etc

Texto +
Estrutura

Stopwords

Grupos de
Substantivos

Stemming

Indexao
Automtica ou
Manual

Texto

Reconhecimento da
Estrutura

Estrutura

Texto Completo
(full text)

Termos de Indexao

Figura 15: Viso Lgica do Documento: do texto completo ao conjunto dos termos de indexao.
Fonte: BAEZA-YATES & RIBEIRO-NETO (1999) p.6

5.5.3.3 Processo de Recuperao da Informao

Existem muitas avaliaes e representaes do processo de recuperao da


informao. BAEZA-YATES & RIBEIRO-NETO (1999), considerando documentos
textuais, apresentam tambm uma viso sobre o processo de recuperao na figura 16 a
seguir.

134

Texto
Interface com
o usurio

Texto
Operaes no Texto

Operaes de query

Indexao

Gerenciador de
banco de dados

query
Busca nos ndices

Indice

Documentos
recuperados

Documentos
Ordenados

Ranking
(ordenao)

Banco de
dados
de textos

Figura 16: O Processo de Recuperao de Informaes.


Fonte: BAEZA-YATES & RIBEIRO-NETO (1999) p.10

Nessa figura, os elementos representados significam o seguinte:

Interface com o usurio: a estrutura responsvel para permitir a interao


do usurio com os SRIs.

Operaes no texto: so operaes realizadas sobre o texto de modo que seja


reduzido o texto a ser pesquisado, a fim de que o processo de recuperao
seja mais eficiente. Consistem em retirar artigos, conjunes, preposies,
acentos e caracteres especiais e preposies que fazem elo entre as palavras,
por exemplo: linguagens de marcao o texto original digitado pelo
usurio, porm, o texto real para a pesquisa ficaria linguagens marcao.

Operaes de Query: so operaes realizadas sob expresso ou palavrachave utilizada pelo usurio para que o SRI possa fazer uma nova busca.

Busca: a estrutura que consiste em buscar na base de dados as informaes


contidas no mdulo Query operation.

135

Ranking ou ordenao: consiste em classificar os documentos recuperados


na Searching por ordem decrescente de relevncia e apresent- los ao
usurio.

Indexao: o processo de criao de ndices para os documentos que sero


adicionados base de dados.

ndice: so os documentos indexados.

Gerenciador da Base de Dados: Gerente da base de dados de textos

5.5.3.4 Armazenando os Documentos

Concludo o processo de indexao/descrio, tais atividades criam segundo


LANCASTER (2004), representaes de documentos de um modo a poder haver sua
incluso em uma base de dados. Os prprios documentos se destinam a uma base de
dados diferentes, ou seja: podemos ter a base de documentos e a banco de dados de
representaes dos documentos (informatizado ou no, como um recipiente de fichas
representando os documentos). De acordo com CENDON (2005)
A base de dados de documentos e a base de dados das representaes de
documentos hoje, j no so sempre distintas. Tornam-se cada vez mais comuns
representaes de documentos contendo no apenas termos de indexao, mas
tambm resumos e, mais recentemente, tem se firmado a tendncia das bases de
dados conterem documentos em texto completo (p. 64).

Posteriormente, os documentos que forem rele vantes para atender necessidades


de informao para o usurio devem ser recuperados pelo SRI e disponibilizados para
ele.

Os SRIs, realizam a atividade de armazenamento, tanto no nvel lgico quanto


fsico dos itens de informao e em suas representaes e os sistemas de arquivos so
utilizados para tal armazenamento. Conforme CLAYBROOK (1987), um arquivo pode
ser definido como um conjunto de registros que representam as entidades ou instncias
do mundo real atravs de seqncias de itens de dados (cada registro composto de
itens ou campos de dados). Tais itens so unidades de informao, representando os
atributos e caractersticas das entidades do mundo real. H distintos modelos para
armazenamento de arquivos. SALTON & MCGILL (1983) descrevem, por exemplo, os

136

modelos de arquivos seqenciais, arquivos seqenciais ordenados e arquivos indexados


(os quais se subdividem em arquivos diretos e arquivos invertidos).

5.5.4 A Face da Gesto das Relaes com o Usurio

5.5.4.1. A Questo da Relevncia e da Atinncia no Atendimento ao Usurio


A noo de relevncia o centro da recuperao da informao. Realmente, o
objetivo principal de um SRI , da melhor forma possvel, recuperar todos os
documentos que so relevantes para uma consulta do usurio, ao mesmo tempo em que
recupera poucos documentos no relevantes.

Para LANCASTER (2004) so sinnimas as expresses til, pertinente e


relevante para uma necessidade de informao. Ou seja: um documento pertinente (til)
aquele que contribui para satisfazer uma necessidade de informao. Esse documento
pode contribuir na medida em que atinente, ou seja: trata de assunto ou assuntos que
respondem s necessidades de informao do usurio. Para ele:
O tema da atinncia est relacionado muito de perto com o da relevncia
isto , a relao entre um documento e uma necessidade de informao ou
entre um documento e um enunciado de necessidade de informao (uma
consulta) (p. 14).

MIZZARO (1997) realizou um estudo amplo sobre a questo da relevncia,


tendo identificado a ocorrncia de uma vasta literatura sobre este tema em diversas
reas (filosofia, psicologia, lingstica, entre outras). Para esse autor, a informao
relevante est diretamente relacionada com o usurio, com a necessidade de informao
que ele possui bem como o momento que isso ocorre. Segundo ele, a relevncia pode
ser vista como o relacionamento entre duas entidades, uma de cada um dos seguintes
grupos:

Grupo constitudo do que denomina de entidades documento (o objeto que o


usurio vai obter depois de sua busca), sua representao ou surrogate (as
palavras-chave, por exemplo) e informao (o que o usurio recebe quando l
um documento);
137

Grupo do que classifica como entidades problema (que necessita de informao


para ser resolvido), necessidade de informao (o que o usurio entende ou
percebe do problema representao do problema na mente do usurio),
solicitao ou requisio (representao da necessidade de informao do
usurio em uma linguagem humana geralmente linguagem natural) e consulta
ou query (a representao da necessidade de informao do usurio na
linguagem do sistema).

Em outro trabalho, MIZZARO (1998) prope uma estrutura em quatro


dimenses que detalham o conceito de relevncia no processo de recuperao de
informao. Essas dimenses so: os recursos de informao, a representao do
problema do usurio, o tempo e os componentes.

Os componentes da primeira dimenso, os recursos de informao so: o


documento (entidade fsica que uma pessoa vai obter depois da busca da informao) a
representao (feita por titulo, palavras chaves, autor, resumo ou dados bibliogrficos) e
a informao (entidade no fsica que o usurio produz ao ler/examinar um documento).

A representao do problema do usurio a segunda dimenso. Ela


caracterizada por quatro pontos: necessidades reais e necessidades percebidas do
usurio, solicitao, que a representao de uma necessidade de informao em
linguagem humana e, na seqncia temos a consulta, que a expresso da necessidade
percebida de informao na linguagem de um SRI.

O tempo a terceira dimenso. Um documento pode ser relevante em relao ao


momento em que o usurio o examina. Ele pode no ser relevante agora e ser depois, ou
o contrrio.

Os componentes configuram a quarta dimenso, sendo eles:

o aspecto tpico, que se refere ao assunto que o usurio deseja;

a tarefa, que se refere ao que o usurio vai fazer com os documentos retornados; e

138

o contexto, que inclui tudo aquilo que no pertence aos tpicos anteriores, mas, de
alguma forma, afeta a busca e a avaliao dos resultados, tais como documentos
recuperados j conhecidos, tempo ou dinheiro disponvel para a busca, situao na
qual a busca realizada, compreensibilidade da informao recuperada, dentre
outros.

Para MONEY (2006) a relevncia resultado de um julgamento subjetivo,


podendo incluir:

a realizao das expectativas do usurio, no sentido de satisfazer os usos


desejados, atendendo, portanto, suas necessidades de informao;

a pertinncia no assunto que se deseja;

a atualidade (ser informao recente);

a confiabilidade (de uma fonte que merea crdito).

Conforme LANCASTER (2004), h seis critrios para avaliao de SRIs:

Preciso

Revocao

Tempo de Resposta

Esforo do usurio para obter resultados que atendam suas necessidades

Formato de apresentao dos resultados

Exaustividade (quanto uma coleo em questo contm de documentos


potencialmente relevantes)

Os dois primeiros critrios, preciso e revocao, medem a eficcia do sistema


na recuperao de informaes relevantes. A preciso a taxa de documentos relevantes
recuperados sobre o total de documentos recuperados, isto : a proporo de material
recuperado que efetivamente interessante. Por outro lado, a cobertura ou revocao
uma taxa ou coeficiente de documentos relevantes recuperados sobre o total de
documentos relevantes existente na base, ou seja: a proporo de material relevante
recuperado em relao ao que existe no acervo ou base. As idias de preciso e
revocao podem ser representadas na figura 17 abaixo:

139

Figura 17: O problema da recuperao da informao e as idias de preciso e revocao.


Baseado em LANCASTER, 2004, p3

O papel dos SRIs ajudar os usurios a descobrir quais documentos so


relevantes para ele em uma coleo, servindo-se para isso de vises e modelos
diferentes para atender a tal necessidade. De acordo com BAEZA-YATES & RIBEIRONETO (1999) nos sistemas automatizados isso realizado por algum algoritmo que,
atuando com base em alguma heurstica previamente definida pode escolher os
documentos que considera relevantes para recuperao e os ordena de acordo com
critrios previamente estabelecidos no desenho ou proposta conceitual do sistema.

5.5.4.2 A Necessidade de Informao

De acordo com a perspectiva de BURNETT & MCKINLEY (1998) sobre os


Estados Anmalos de Conhecimento (Anomalous State of Knowledge), que pode ser
representativa de grande parte dos modelos de SRIs existentes em suas suposies,
representaes e na tureza, uma pessoa utiliza um sistema de informao a fim de sanar
uma anomalia pessoal de conhecimento. A anomalia tratada quando a informao
recuperada satisfaz o estado de anomalia individual de conhecimento.

140

Realmente, usurios se relacionam com os SRIs a partir de suas necessidades de


informao as quais buscam responder. Responder a uma necessidade de informao
encontrar a informao relevante em base de documentos a partir de estratgias de
busca. Uma informao relevante. Relevante, portanto, tudo o que pode satisfazer a
certas necessidades de informao dos usurios. As relaes com o usurio passam
pelas questes da tarefas do usurio e de sua interface com o SRI.

O SRI um conjunto de atividades integradas capazes de promover o casamento


entre as necessidades do usurio com as informaes recuperadas na base de
documentos, gerando, portanto, resultados relevantes para busca desse usurio. Um
usurio uma pessoa que possui alguma necessidade de informao e adota uma
postura de busca dessa informao para satisfazer tal necessidade. Uma necessidade de
informao, de acordo com MIZZARO (1996), uma carncia de conhecimento que um
usurio tem para realizar uma determinada ao. SARACEVIC (1983) citado por
ARAJO (2004) pontua cinco eleme ntos bsicos em situaes de busca de informaes
pelos usurios, quais sejam:

o problema

o estado interno de conhecimento

a inteno

a questo

o pedido.

SHNEIDERMAN (1997) apresenta quatro fases para busca de informao:

Formulao: expresso da busca;

Ao: lanamento da busca;

Avaliao dos Resultados: leitura das mensagens e sadas;

Refinamento: formulao do prximo passo.

REES & SARACEVIC (1963) lembram que inicialmente tem-se um problema


de informao que traduzido em necessidade de informao. Essa necessidade gera
uma pergunta, expressando um conceito mais concreto. Pode acontecer que a pergunta

141

no expresse a necessidade de informao. A pergunta redunda em uma solicitao ao


SRI, sendo que, novamente, nem sempre a pergunta que o usurio possui na mente a
que expressa explicitamente na sua solicitao. As perguntas embutem aspectos de
significado e linguagem. A partir da pergunta, temos a formulao de uma estratgia de
busca para atender necessidade do usurio.

BAEZA-YATES & RIBEIRO-NETO (1999) abordam a questo da interface do


usurio com o sistema e o processo de acesso informao. Avaliam a importncia de
um adequado processo de interao (interface) entre o usurio e o SRI para que o
processo de recuperao da informao funcione adequadamente. De acordo com esses
autores, o processo de acesso informao se inicia com a manifestao de uma
necessidade de informao. A partir da, o usurio seleciona um sistema e as colees
para realizar buscas sobre elas. Para isso, ele formula uma consulta e a submete no SRI.
Recebe ento os resultados em forma de itens de informao, avaliando e interpretando
os resultados. Ele pode encerrar o processo ou, se os resultados no forem satisfatrios,
recomear tudo outra vez.

Nos SRIs, o projeto de interface essencial para o uso eficiente do sistema. A


interface deve atender a diferentes tipos de usurios com a gama completa de tarefas
que o usurio poder procurar para executar com esse sistema. O processo de interface
tornou-se mais importante com o aumento e variedade de usurios. A interao feita
atravs dos dispositivos de entrada e sada do computador (SOUZA, 2006).

Retomando a perspectiva de LANCASTER (2004) e partindo da premissa da


existncia de bases de documentos, impressos ou eletrnicos, o ciclo da recuperao da
informao se fecha com o atendimento s necessidades de informao dos usurios
finais ou comunidade de usurios. A partir de suas necessidades, os usurios definem
suas estratgias de busca, que podem ser simples, tal como a escolha de um nico termo
para consultar uma determinada base ou envolver muitas combinaes em estratgias
mais complexas. Essa busca significa, em geral, na localizao dos conceitos, dos
temas, dos assuntos requeridos pelo usurio, cujos termos, em geral, representam sua
explicitao. Se o SRI em questo utilizar um vocabulrio controlado, as consultas dos
usurios devem ser analisadas conceitualmente e traduzidas para o vocabulrio do
sistema.
142

As estratgias de busca podem ser consideradas, de acordo com BAEZAYATES & RIBEIRO-NETO (1999), dentro de tarefas ou atividades realizadas pelo
usurio do SRI. Os autores em questo postulam que o usurio possui dois papis no
processo de recuperao da informao: recuperao ou busca e navegao, ou
brauseio, conforme ARAJO (1994). A busca ocorre em geral quando o usurio
possui objetivos mais bem definidos, enquanto a navegao uma estratgia em que os
objetivos do usurio no esto bem definidos. SRIs clssicos normalmente permitem
recuperao de informao rpida. Por outro lado, sistemas de hipertexto so
geralmente criados para permitir navegao rpida. Bibliotecas digitais modernas e
interfaces para a web devem tentar combinar essas duas tarefas, sendo essa uma
tendncia.

SHNEIDERMAN (1997), por sua vez, relaciona tipos de tarefas de busca de


informao:

Busca de fatos especficos (busca de item conhecido): por exemplo, encontrar a


informao de um livro especfico de um determinado autor;

Busca de fatos estendida: por exemplo, que outros livros do autor de uma
determinada publicao existem?

Browsing: por exemplo, h novo estudo sobre os peixes marinhos em Angra dos
Reis?

Explorao de disponibilidade: por exemplo, que informao existe sobre a mata


atlntica no sul do Rio de Janeiro?

Trataremos os dois primeiros itens como tarefa de busca e os dois ltimos como
tarefa de navegao, a seguir

5.5.4.3 A Tarefa da Busca

Partindo de sua necessidade, o usurio de um SRI tem que traduzi- la em uma


consulta, escrita na linguagem fornecida pelo sistema. Geralmente, isso implica em
especificar um conjunto de palavras que conduzam semntica de sua necessidade.

143

Nesse caso, o usurio est buscando por informaes teis executando uma
tarefa de recuperao.

Existe uma distino entre duas tarefas que podem ser

executadas pelo usurio de um SRI: a recuperao de informao ou a navegao entre


documentos, como mostra a Figura 18

Recuperao

Base de
Documentos
Navegao

Usurio

Figura 18: As Tarefas do Usurio no uso de um Sistema de Recuperao da Informao


Fonte: BAEZA-YATES & RIBEIRO-NETO (1999), p. 4

Conforme CENDON (2005):


elaborada a estratgia de busca e formulada a expresso de busca, na qual
os termos da busca so relacionados entre si atravs de operadores booleanos
ou no booleanos. A estratgia de busca consiste em um plano para encontrar
a informao desejada em que vrias expresses de busca podem ser utilizadas.
Atravs da expresso de busca, o sistema compara, ento, as representaes
dos documentos com as das perguntas dos usurios. Na fase final, os
documentos recuperados atravs da consulta ao sistema so apresentados ao
usurio para que julgue, ento, sua relevncia para as suas necessidades de
informao..

SOUZA (2006), baseando-se em BAEZA-YATES & RIBEIRO-NETO (1999),


lembra que a recuperao pode se dar ad hoc e por filtragem. Conforme suas
palavras:

Quando o acervo de documentos sofre poucas alteraes enquanto novas


queries so submetidas ao sistema, chama-se o modo de operao de
recuperao ad hoc. Quando as queries se mantm relativamente estticas
enquanto novos documentos so adicionados, chama-se a esse modo de
operao de filtragem ( filtering). A filtragem acontece usualmente em
processos de monitorao de fontes de informao, enquanto a recuperao ad
hoc representa as buscas usuais em SRIs (p. 165-166).

144

5.5.4.4 A Tarefa da Navegao

A navegao a arte de no saber o que se quer at se encontre, conforme


ARAJO (1994) que lembra tambm que essa tarefa fortemente visual e tem um forte
componente de acesso direto, podendo ser associado com formas e padres em termos
de imagens e distribuio do texto numa pgina ou numa tela de computador. Essa
autora cita COVE & WALSH (1988), para os quais a navegao uma ao do usurio
de caminhar no com um objetivo claramente definido, mas com uma noo ou
referenciais vagos de interesse. Ele anda a esmo sobre uma coleo de documentos,
recolhendo ou examinando alguns deles, ora superficialmente, ora com um pouco mais
de detalhe. Tambm apresenta a contribuio de MORSE (1973), que afirma ser a
navegao um tipo de busca semelhante busca de um navio, realizada por um
observador em um avio. Esse observador no sabe ao certo se aquilo que est a
procurar, o alvo, est l ou no, e mesmo de que ele perceber esse alvo se l ele estiver,
mas o vo ajuda muito.

Para BAEZA-YATES & RIBEIRO-NETO (1999), na navegao o usurio no


prope uma questo ou realiza uma busca (query), que represente uma necessidade de
informao ao sistema. mas, navega atravs dos documentos que no foram
necessariamente indexados previamente buscando informaes de interesse. Ainda de
acordo com os autores, temos trs tipos de navegao: a plana (flat browsing), a guiada
pela estrutura (structure guide browsing) e a do modelo de hipertexto (hipertext model).
Uma navegao hipertextual , por exemplo, aquela realizada em estruturas de arquivos
ligados em rede.

O aumento das colees digitais e a grande difuso do hipertexto, sobretudo com


a expanso da Internet e das redes corporativas, demandam e ampliam hoje as
necessidades e as possibilidades da tarefa de navegao, sobretudo com o advento dos
softwares de navegao, tais como Netscape, Explorer, Mozzila, alm dos recursos
inseridos em ferramentas de colaborao e de portais corporativos de organizaes
diversas, tais como Ltus Notes e Verity. Cumpre salientar tambm que a navegao no
se resume s colees digitais, mas pode ser tambm realizada em acervos fsicos, como
em uma biblioteca.

145

Em um sentido mais estrito, a navegao a forma como os usurios se


movimentam atravs de um hiperdocumento. Ela pode ser influenciada pela estrutura do
documento, pela estratgia de navegao e pelos mecanismos auxiliares de navegao
que o usurio possa encontrar no SRI.

5.6 Modelos de Recuperao da Informao

possvel propor diferentes classificaes para os SRIs, com base em diferentes


critrios e objetivos, da mesma forma que h diferentes possibilidades de se classificar
um sistema de informao, conforme j discutido anteriormente. Essas classificaes
do origem a modelos que so classificaes conceituais ou abordagens genricas
visando recuperar informaes. Conforme j dito na presente tese, de acordo com
LANCASTER (1968), de acordo com o tipo de aplicao que se d aos Sistemas de
Recuperao da Informao SRIs, eles podem ser classificados em:

sistemas de recuperao de documentos;

sistemas de recuperao de referencias;

sistemas de recuperao de dados e:

sistemas de recuperao de fatos (ou query answering systems).

WIVES (2002) prope uma classificao derivada desse modelo em que os SRIs
poderiam ser classificados em:

sistemas de recuperao bibliogrfica;

sistemas de recuperao de informao textual;

sistemas de recuperao de informao visual;

sistemas para bibliotecas digitais.

No detalhamento dos modeles de recuperao textual esse autor enumera como


modelos de recuperao:

booleano;

espao vetorial;

146

probabilstico;

difuso;

busca direta;

aglomerados;

lgico;

contextual.

Sob a perspectiva da estrutura do documento, em geral todos os documentos


textuais tendem a ser considerados documentos no estruturados em oposio aos dados
estruturados de sistemas relacionais, sobretudo por serem escritos em linguagem natural
livre. Entretanto, com um olhar mais atento, necessrio fazer algumas ressalvas.
Muitos documentos textuais possuem sim elementos estruturais significativos que
podem permitir a representao e a recuperao mais eficientes. Ento, no em relao
outro tipos de objetos informacionais (pois no se pode comparar a intensidade de
estruturao de um texto com uma tabela de banco dados relacional), mas em relao
aos prprios textos, podemos classificar os documentos em textos estruturados e textos
no estruturados. Os documentos de textos estruturados so aqueles em que possvel
reconhecer elementos estruturais e de semntica bem definida, enquanto os no
estruturados correspondem a textos livres, com pouco ou nenhum formato, bem como
estrutura facilmente identificvel. Por isso uma forma de classificar os modelos de
recuperao da informao se eles visam a documentos de texto estruturados ou de
textos no estruturados. Sendo assim, teramos a seguinte taxonomia:

Modelos de recuperao para textos no estruturados: booleano, vetorial e


probabilstico.

Modelos de recuperao para textos estruturados: listas no-sobrepostas,


proximidade de ns e recuperao por passagens.

Uma outra taxonomia que ilustra quinze modelos de Recuperao da Informao


apresentada por BAEZA-YATES & RIBEIRO-NETO (1999), conforme a Figura 19 a
seguir.

147

Teoria dos Conjuntos


Fuzzy
Booleano Estendido

Tarefas do Usurio

Modelos Clssicos

Booleano
Vetorial
Probabilistico
RECUPERAO

Adhoc
Filtragem

Modelos Estruturados

Listas no-sobrepostas
Proximidade de ns

Algbricos
Vetorial Generalizado
Indexao Semntica
Latente
Redes Neurais
Probabilsticos
Redes de Inferncia
Redes de Crena

NAVEGAO

Navegao

Plana
Guiada pela
Estrutura
Hipertextual

Figura 19: Uma Taxonomia dos Modelos de Recuperao da Informao


Fonte: BAEZA-YATES & RIBEIRO-NETO (1999), p. 21

Uma breve explanao sobre tais modelos, a partir da anlise da concepo


desses autores, e algumas outras contribuies pode ser sintetizada a seguir.

5.6.1 Modelos Clssicos

Os modelos clssicos de recuperao possuem estratgias de busca de


documentos relevantes para uma consulta (query). Eles so trs: booleano, vetorial e
probabilstico e para cada um deles h desdobramentos possveis que visam melhor- los
em seus propsitos e na sua performance. Tanto a consulta feita pelo usurio, quanto os
documentos que compem a coleo a ser pesquisada, so representados pelos seus
termos. Portanto, tal abordagem assume que cada documento descrito por um
conjunto de palavras chaves, chamadas termos de indexao. Nem todos os termos de
um documento so teis para representar seu contedo. Os termos com freqncia
menor permitem identificar conjuntos mais restritos. A importncia de um ndice
representada pelos pesos a ele associados. Se considerarmos que ki um ndice e dj
um documento, wij o peso associado a (ki,dj), que quantifica a importncia do ndice
na descrio do contedo do documento, conforme especificado por BAEZA-YATES &
RIBEIRO-NETO (1999).
148

5.6.1.1 Modelo Booleano

um dos modelos clssicos que define uma consulta como uma expresso
booleana convencional, que liga seus termos atravs de conectivos lgicos de Boole
(AND, OR e NOT). Considera os documentos como conjuntos de palavras e manipula e
descreve esses conjuntos com base em tais conectivos. No modelo booleano um
documento considerado relevante ou no relevante para uma consulta, no existindo
resultado parcial e no havendo informao que permita a ordenao do resultado da
consulta, uma vez que possui a desvantagem de trabalhar com a lgica binria. um
modelo muito mais utilizado para recuperao de dados do que para recuperao de
informao. A passagem da necessidade de informao do usurio expresso booleana
considerada complicada: o usurio precisa conhecer lgebra booleana, o que na
maioria dos casos, no acontece. Alm disso, as consultas booleanas formuladas pelos
usurios so freqentemente simplistas, o que faz com que exista um retorno de poucos
ou de muitos documentos em uma consulta. Apesar das restries, o modelo bastante
utilizado em sistemas comerciais.

possvel melhorar os resultados gerados nesse modelo, usando conjuntos


denominados difusos ou nebulosos (fuzzy), atribuindo pesos aos termos, dividindo a
consulta em classes e conceitos, trabalhando com proximidades dos termos entre si num
documento e identificando mais precisamente que termos so melhores para definir um
consulta. Ele possui alguns desdobramentos conforme se segue.

a) Modelo Nebuloso (Fuzzy)

Esse modelo trabalha com a teoria dos conjuntos em que a pertinncia ou no de


um elemento a ele pode variar entre 0 e 1. Essa teoria de conjuntos difusos (fuzzy),
baseada em ZADEH (1965) para quem as caractersticas de determinado universo esto
presentes em todos os conjuntos, mas tal presena , alm de poder ser medida, e pode
no ser exata, ou seja, pode haver incerteza. Assim sendo, no temos, por exemplo, um
conjunto vazio, mas sim um conjunto cujos elementos possuem uma relevncia muito
baixa (prxima de zero). Na viso desse autor, muito severa a idia de que um objeto
pertence ou no a um conjunto, ou seja: no h possibilidade do objeto pertencer
149

parcialmente ao conjunto. Na prtica, as pessoas utilizam raciocnios onde um objeto


pode pertencer parcialmente ao conjunto. Um exemplo quando usamos expresses do
tipo mais ou menos, muito, pouco e talvez. Considerando que tem como base
uma viso terica que manipula conjuntos, esse modelo considerado uma extenso do
modelo booleano. possvel utilizar um como um tesauro para determinar que termos
relacionados semanticamente aos termos ndice tambm possam determinar algum grau
de pertencimento ao conjunto difuso determinado pela query.

b) Modelo Booleano Extendido

o modelo que desenhado com atribuio de pesos aos termo s, uma vez que
leva em conta a importncia das palavras nos documentos. A carga semntica dos
termos completamente diferente, quando se tem, por exemplo, uma consulta com dois
termos ou duas consultas distintas com um termo cada. O usurio pode especificar a
importncia de um termo na consulta, embora isso possa aumentar para ele o grau de
complexidade para uso desse tipo de sistema.

5.6.1.2 Modelo Vetorial


Esse modelo foi desenvolvido e descrito por SALTON & MCGILL (1983) para
ser utilizado num SRI chamado SMART. No modelo vetorial, cada documento
representado como um vetor de termos. Cada termo possui um valor associado que
indica o grau de importncia (peso) deste termo em um documento. De acordo com
WIVES (2002), as distncias entre um documento e outro indicam seu grau de
similaridade. Por isso, o vetor resultante para uma consulta especfica definido atravs
de um clculo de similaridade. So atribudos pesos aos termos das consultas e
documentos que determinam o tamanho e a direo de seu vetor de representao. O
ngulo formado por estes vetores recebe o nome de q. O cos de q determina a
proximidade da ocorrncia. O clculo da similaridade baseado neste ngulo entre os
vetores que representam o documento e a consulta (Figura 20). Isso implica que os
documentos que possuem os mesmos termos acabam sendo colocados em uma mesma
regio do espao e, em teoria, tratam de um assunto similar (caracterstica que confere o
nome espao-vetorial ao modelo). As consultas dos usurios podem tambm ser
expressas por um vetor, o que faz ento com que possam ser comparados os vetores de

150

documentos e os de consulta. O grau de similaridade entre cada um deles pode ser


identificado. Os documentos mais similares, prximos ao espao da consulta so mais
relevantes para os usurios e devem ser retornados como resposta a ela.

j
dj

q
i

Figura 20: O Espao Vetorial

Conforme SOUZA (2006):


nesse modelo, os documentos so modelados como sacos de palavras (bags
of words), e so representados como vetores no espao n-dimensional, onde n
o total de termos ndices (palavras) de todos os documentos no sistema. No
modelo, que no binrio, pode-se calcular um grau de similaridade a ser
satisfeito pelos documentos para serem considerados relevantes (ex: que as
palavras apaream ao menos duas vezes, etc.) e determinar o grau de
similaridade, com vistas a construir um rank ing. O modelo vetorial a base da
grande maioria de sistemas de recuperao de informaes, mais notadamente
os que tm como objeto a Internet, embora estes utilizem tambm outras
tcnicas para determinar o ranking de documentos como resposta a uma

consulta.

Dentre as vantagens do modelo vetorial podemos dizer que:

atribuir pesos aos termos leva a uma melhora o desempenho;

um processo de encontro parcial (funo de similaridade), sendo melhor do


que a exatido do modelo booleano;

documentos so ordenados de acordo com seu grau de similaridade com a


consulta.

151

No que tange s suas desvantagens podemos pontuar:

a ausncia de ortogonalidade entre os termos pode fazer encontrar relaes


entre termos que aparentemente no tm nada em comum;

ele um modelo generalizado;

um documento relevante pode no conter termos da consulta.

Alguns outros modelos possuem a proposta de desdobrar o modelo vetorial


acima descrito, tais como o vetorial generalizado, a indexao semntica latente e as
redes neurais. So eles o vetorial generalizado, a indexao semntica latente e as redes
neurais.
a) Vetorial Generalizado

Tambm conforme SOUZA (2006):

nesse modelo, questiona-se a independncia dos termos ndices, assumida nos


modelos clssicos, e abre-se a possibilidade de considerar que certos conceitos
representados por estes termos sejam relacionados.Uma das formas de determinar
relaes entre termos examinar a co-ocorrncia desses no texto de cada documento,
alm do exame das relaes semnticas estabelecidas por um tesauro, como foi
comentado (p. 167).

b) Indexao Semntica Latente

O grande aumento do volume de textos digitais e a sofisticao das necessidades


de informao dos usurios provocaram um maior interesse em processos de busca que
levem em conta o contedo dos objetos de informao (os documentos), valorizando
seu entendimento semntico para aprimorar as respostas s consultas formuladas pelos
usurios. Respondendo a esse desafio, a indexao semntica latente promove a
identificao de conceitos nos textos de modo independente dos termos que os
representam. Ela viabiliza encontrar uma estrutura semntica associada a uma coleo
de documentos. Mesmo que existam palavras diferentes expressando uma mesma idia,
esse mtodo consegue detectar as idias ou conceitos-chave presentes e identific- los.
De acordo com ANDERSON & PREZ-CARBALLO (2001) citado por LANCASTER
(2004), a indexao semntica latente (ISL):

152

um dos mais elaborados esforos atuais visando a uma indexao


automtica de qualidade. Fundamenta-se em agrupamentos de termos baseados
em co-ocorrncia e identificao de documentos relativos a tais agrupamentos.
Ao se apoiar em dados de co-ocorncia a ISL tambm consegue lidar com o
problema da variedade de termos que expressam idias semelhantes. Como
exemplo da capacidade da ISL lidar com documentos diferentes, imaginemos
documentos sobre conserto e manuteno de automveis. Documentos
diferentes usaro vrios termos diferentes como automvel, carro,
veculo, sed, alm dos nomes das marcas e modelos (...). O programa
(baseado em ISL) relacionar esses termos entre si devido ao alto nvel de coocorrncia com termos como leo, gasolina, combustvel, carburador, pneus,
ar-condicionado, etc. Ele cria agrupamentos de termos altamente relacionados
(por meio da co-ocorrncia), de modo que, quando um nmero suficiente deles
ocorre num documento, este pode ser ligado ao agrupamento respectivo. Assim,
possvel fazer buscas sobre cuidado e manuteno de carburadores de
automveis a gasolina sem nos preocuparmos com as palavras especficas
usadas para automvel. Todas as palavras que significam mais ou menos o
mesmo que automvel sero ligadas ao mesmo agrupamento . (p. 266).

Embora possa ser visto como um mtodo para realizar indexao automtica, a
ISL, de acordo com LANCASTER (2004) muito mais uma maneira de desenvolver
automaticamente uma estratgia de busca para produzir termos semanticamente
relacionados. Por exemplo, de acordo com ele:

o termo A estar um tanto relacionado com o termo Y se ambos ocorrerem


frequentemente com o termo Q. Com esse mtodo, poder-se- recuperar
documentos possivelmente relevantes cujos termos de indexao diferem dos
termos da consulta mas esto estatisticamente relacionados a ele. (p. 316).

GORDON & DUMAIS (1998) afirmam que:


Na prtica isso significa que dois documentos que usam vocabulrios com alto
grau de duplicidade podem ser ambos recuperados mesmo que a consulta
somente empregue os termos que indexam um deles. Igualmente, termos sero
considerados prximos` uns dos outros se ocorrerem em conjuntos de
documentos coincidentes (p. 677).

A Indexao Semntica Latente (ISL) procura trabalhar com um espao menor


do que os espaos booleano ou vetorial de palavras. Esse espao dimensional menor
porm mais significativo, implicando em uma anlise sinptica das correlaes de

153

termos em uma coleo de documentos. Podemos estabelecer o seguinte esquema para a


ISL, expresso na Figura 21:

Um termo (T1, T2 ou T3), representando um conceito ou idia de interesse,


ativa um espao conceitual.

O espao conceitual caracteriza uma perspectiva, uma viso, um contexto, uma


idia central em torno do qual outras idias ou eventos se articulam e se fazem
presentes.

Esse espao conceitual expresso por palavras, termos ou trechos em


documentos em uma base de documentos de interesse (D1, D2, D3, D4...).

D1
D2
T1

Espao
Espao
Conceitual
Conceitual

D3
D4
D5

T2

T3
Termos que representam
um conceito ou evento de
interesse a ser buscado

Espao
Conceitual
Documentos

Figura 21: Uma representao da Indexao Semntica Latente


Fonte: Ilustrao elaborada pelo autor

A ISL procura responder necessidade de anlise semntica no tratamento da


informao. Auxilia a encontrar uma relao semntica entre uma consulta e os termos
indexados. A ISL consegue recuperar documentos mesmo nas situaes em que no se
encontrem palavras idnticas s da consulta. De acordo com FORONDA (2005):

A Indexao Semntica Latente (do ingls Latent Semantic Indexin g, LSI)


tenta superar as deficincias da recuperao por combinao de termos,
tratando a falta de confiabilidade dos dados associados a uma relao termodocumento ou documento -documento, como um problema estatstico. Este
mtodo assume que h uma estrutura semntica oculta (latente), subjacente aos
dados. Esta semntica esquecida parcialmente pela aleatoriedade da escolha
da palavra no que se refere recuperao, pelo fato de que se escolhem

154

palavras individuais para serem recuperadas, indexadas, etc. Utiliza-se no LSI


um modelo matemtico para estimar esta estrutura latente, que liberta do
rudo constitudo pela polissemia e pela sinonmia existente nos documentos.
A descrio dos termos e dos documentos baseados na estrutura semntica
latente utilizada tanto para a indexao como para a recuperao. Entendese por estrutura semntica a estrutura de correlao entre as palavras
individuais que aparecem nos documentos; semntico implica o fato de que
os termos, em um documento, possam ser tomados como referentes ao
documento ou ao assunto desse documento. Esta tcnica de anlise da
semntica de palavras em distintos documentos automtica: essa a
diferena principal que existe entre o LSI e os outros modelos existentes. (p.
31).

c) Redes Neurais

Do ponto de vista conceitual as redes neurais podem ser vistas como uma
estratgia ou tcnica inspirada no funcionamento do crebro, em que neurnios
artificiais, conectados em rede, so capazes de aprender e de generalizar. Do ponto de
vista matemtico, uma tcnica de aproximao de funes por regresso no linear.
Nesse modelo elas so usadas para realizar o casamento entre consultas e os
documentos armazenados no acervo de um SRI. Cada consulta deflagra um processo
que dispara sinais ativadores dos termos ndices e esses, por sua vez, propagam os sinais
aos documentos relacionados. Ento, os documentos relacionados retornam os sinais a
novos termos ndices, em sucessivas interaes. O conjunto resposta definido atravs
desse processo e pode conter documentos que no compartilham nenhum termo- ndice
com a consulta, mas que porm tenham sido ativados durante o processo, conforme
BAEZA-YATES & RIBEIRO-NETO (1999) analisado por SOUZA (2006).

5.6.1.3 Modelo Probabilstico

uma viso importada do campo das Probabilidades, uma rea da Estatstica.


Constitui-se em um dos modelos clssicos de recuperao de informao baseado na
interpretao probabilstica da relevncia dum documento para uma dada interrogao.
O modelo parte da premissa de que existe um conjunto ideal de documentos que satisfaz
a cada uma das consultas ao sistemas e que esse conjunto pode ser recuperado. Nele os
termos indexados dos documentos e das consultas no possuem pesos pr-definidos. A
atividade de ordenao dos documentos realizada pesando-se dinamicamente os
termos da consulta relativamente aos documentos. baseado no princpio da ordenao

155

probabilstica (Probability Ranking Principle). De acordo com RIJSBERGEN (1979),


nesse modelo, buscamos determinar a probabilidade de um documento especfico ser ou
no relevante para uma consulta especfica. Tal informao pode ser obtida assumindose que a distribuio de termos na coleo seja capaz de informar a relevncia provvel
para um documento qualquer da coleo. De acordo com WIVES (2002), nesse modelo
a funo de similaridade pode se aproveitar das informaes estatsticas de distribuio
dos termos contidos no ndice. Assim sendo, determinados parmetros podem ser
ajustados de acordo com a coleo em questo, obtendo com isso resultados mais
relevantes. Conforme SOUZA (2006):
Atravs de tentativa inicial com um conjunto de documentos (para a qual se
podem utilizar tcnicas de outros modelos, como o vetorial) e do feedback do
usurio em sucessivas interaes, busca-se aproximar cada vez mais deste
conjunto ideal, por meio de anlise dos documentos considerados pertinentes
pelo usurio. O valor desse modelo est em considerar a interao contnua
com o usurio como um caminho para refinar o resultado continuamente.

Esse modelo pode ser desdobrado e aperfeioado pelas redes de inferncia e


pelas redes de crena, ambas vinculadas concepo de redes bayesianas.
a) Redes de Inferncia (ou Redes Bayesianas) 42

As redes bayesianas so estruturas para representar as dependncias entre


variveis e fornecer uma especificao concisa de qualquer distribuio ou
probabilidade conjunta total, conforme RUSSEL & NORVIG (2004), que alega que tal
rede um grafo orientado em que cada n identificado com informaes de
probabilidade quantitativa. De acordo com esse autor, a especificao completa de uma
rede bayesiana dada por:
a) Um conjunto de variveis aleatrias constitui os ns da rede e podem ser
discretas ou contnuas;
b) Um conjunto de vnculos orientados ou seta conecta pares de ns. Se houver
uma seta do n X at o n Y, X ser denominado pai de Y;
c) Cada n Xi tem uma distribuio de probabilidade condicional P que
quantifica o efeito dos pais sobre o n.

42

Outros nomes tambm so usados, tais como redes probabilsticas, redes causais, mapas de
conhecimento. Em estatstica, a expresso modelo grfico s refere a uma classe um pouco mais ampla que
inclui as redes bayesianas. Essas redes so bem descritas em RUSSEL e NORVIG, 2004, cap. 14.

156

A topologia da rede o conjunto de ns e vnculos especifica os relacionamentos de


independncia condicional que so validados no domnio. O significado in tuitivo de
uma seta em uma rede construda corretamente de que X tem uma influncia direta
sobre Y. Normalmente fcil para um especialista em domnios descobrir quais so as
influencias existentes no domnio, embora no seja fcil especificar as probabilidades
em si (p. 480).

Um exemplo de rede bayesiana simples pode ser apresentado na figura 22 a


seguir. Nela, h uma varivel t que completamente independente das demais. Poderia
ser o tempo, por exemplo. Outras trs variveis so articuladas, sendo que y e z so
condicionalmente independentes, dada a varivel x.

Figura 22: Representao de uma rede bayesiana simples


Baseado em RUSSEL & NORVIG (2004, p. 480)

Uma rede bayesiana uma representao bem desenvolvida para o


conhecimento incerto. Elas fornecem um modo conciso de representar relacionamentos
de independncia condicional no domnio. Portanto, para a recuperao da informao,
nas redes bayesianas, ou de inferncia (inference network model), so associadas
variveis aleatrias ao evento do atendimento de uma consulta especfica por um
documento especfico. Uma varivel aleatria associada com um documento especfico
representa o evento de observar o documento, sendo que esse tipo de varivel pode ser
modificada conforme os eventos futuros, de forma a estabelecer relacionamentos
baseados nos eventos observados. Este modelo leva em conta o feedback de relevncia
do usurio.

157

b) Redes de Crena

As redes de crena (belief network model) so similares ou um subconjunto das


redes inferncia. Nelas, os documentos e as consultas so definidos como subconjuntos
de um espao de conceitos. A cada documento, associa-se a probabilidade de que o
mesmo cubra os conceitos presentes no espao de conceitos. Cada consulta mapeada
no espao de conceitos, que por sua vez, est conectado ao espao de documentos.

5.6.2 Modelos Estruturados de Recuperao em Textos

Os modelos clssicos respondem a consultas, buscando em uma estrutura de


dados que representa o contedo dos documentos de uma coleo, unicamente como
lista de termos significativos. Quando uma consulta baseada numa palavra-chave, ns
assumimos que existe uniformidade nos documentos e que uma palavra qualquer tem a
mesma importncia em qualquer ponto onde aparea no documento. Assim sendo, no
se diferencia se a palavra aparece no ttulo ou no corpo do texto. Termos que apaream
no ttulo, subttulo ou indicando uma parte especfica em um formulrio que contm
vrios diferentes campos possuem a tendncia de ter maior importncia. Os modelos
que combinam as informaes contidas no texto com as estruturas dos documentos onde
se encontram so chamados de modelos estruturados de recuperao em textos.

Um modelo de recuperao de documentos estruturados utiliza a estrutura dos


mesmos, buscando melhorar o desempenho e proporcionar ao usurio servios
alternativos, como por exemplo, uso de memria visual, recuperao de elementos
multimdia, maior preciso no campo da consulta, dentre outros aspectos. Para esses
modelos, temos alguns conceitos ou elementos fundamentais, quais sejam: os pontos de
unificao, as regies do texto e os ns. Um ponto de unificao (match point) a
posio de uma seqncia de palavras que possa satisfazer ou casar com uma consulta
de um usurio. Em uma consulta simples, como ces pastores na Esccia temos trs
pontos de unificao. Regio significa um uma regio contgua de texto. J o conceito
de n se refere a um componente estrutural do documento, tais como um capitulo, seo
ou subseo, etc. (BAEZA-YATES & RIBEIRO-NETO (1999, p.63).

158

Ao considerar a descrio da parte da estrutura de um documento possvel


gerar um grafo representando-a e sobre a qual se possa navegar, sendo que ela ser til
para responder certas consultas de alguns tipos, como por exemplo:

Sobre a estrutura: quais so as sees do segundo captulo;

Sobre metadados: documentos da Eletronuclear editados em 2005;

Sobre o contedo: que possuem a palavra energia nos ttulos das sees;

Sobre elementos multimdia: imagens cercando pargrafo que contenham a


palavra usina.

Enquadram-se na categoria de modelos estruturados o modelo das listas no


sobrepostas e o modelo da proximidade de ns.

5.6.2.1 Listas No-Sobrepostas

BURKOWSKI (1992) prope dividir o texto de cada documento em regies que no


esto sobrepostas e junt-las em uma lista. Existem muitas maneiras de dividir o texto em
regies no sobrepostas. Diferentes formas de dividir o texto em regies no-sobrepostas

levam a gerao de listas mltiplas, por exemplo: uma lista para captulos, uma lista
para sees e outra para subsees, conforme figura abaixo:

Capitulo

Seo
Sub-Seo

Sub-Sub-Seo

Figura 23: Representao da estrutura em um texto de um documento


atravs de trs listas (planos) de indexao.
FONTE: BAEZA-YATES & RIBEIRO-NETO (1999 p. 63)

159

Para permitir a busca por regies de texto, especialmente por termos de


indexao, constri-se um ndice, mediante um arquivo invertido, 43 em que h uma
entrada por cada tipo de componente estrutural e associada a cada entrada h uma lista
das regies que representam ns deste tipo. Cada lista pode ser mesclada com o ndice
correspondentes dos diferentes termos. A partir do momento que as regies de texto
esto no-sobrepostas, trs questes podem ser respondidas:

selecione uma regio que contenha uma dada palavra;

selecione uma regio A que no contenha uma regio B ( A e B pertencem a


listas distintas);

selecione uma regio que no esteja contida em qualquer outra regio;

Esse modelo simples e permite uma implantao eficiente, embora o tipo de


questes que podem ser respondidas seja, at certo ponto, limitado.

5.6.2.2 Proximidade de Ns

Esse modelo foi introduzido por NAVARRO E BAEZA- YATES (1997). um


modelo que visa a recuperao de documentos, atravs de uma estrutura hierrquica de
ndices. Ento, a proposta central definir um ndice hierrquico estrito sobre o texto.
Isto enriquece o modelo anterior. Esse modelo permite a definio de estruturas de
indexao hierrquicas e independentes sobre um mesmo documento. Cada uma dessas
estruturas uma hierarquia estrita composta por ns, que podem ser captulos, sees
subsees, pargrafos e linhas. A cada n associada uma regio de texto. Assim duas
hierarquias diferentes podem fazer referncia a regies de texto que se sobrepe.

43

Tipo de mecanismo utilizado para localizar um dado termo em um texto. Um arquivo invertido um
tipo de arquivo indexado, conforme SALTON & MCGILL (1983). Em um arquivo indexado define-se
uma estrutura complementar de ndices permitindo-se que os documentos recebam parties, facilitando
assim uma recuperao ulterior. Um arquivo invertido normalmente composto de um vocabulrio um
arranjo contendo todas as palavras distintas do texto e para cada palavra do vocabulrio, uma lista de
todos osdocumentos (identificados por nmeros de documentos mos quais aquela palavra ocorre. Para
entender melhor, considere um conjunto de documentos. A cada documento atribudo um conjunto de
palavras-chave ou atributos. Um arquivo invertido constitudo de uma lista ordenada (ou ndice) de
palavras-chave (atributos), onde cada palavra-chave tem uma lista de apontadores para os documentos
que contm aquela palavra-chave. Este o tipo de ndice utilizado pela maioria dos sistemas para
recuperao em arquivos constitudos de texto (ZIVIANI, Nvio. UFMG/DCC. in:
http://homepages.dcc.ufmg.br/~nivio/cursos/ri05/tp1/ri05tp1.html . Acessado em 12 dez 2006.

160

Captulo
Sees
Subsees
Subsubsees
Figura 24: Representao da estrutura de um documento mediante o modelo de proximidade de
ns.
Fonte: BAEZA-YATES & RIBEIRO-NETO (1999 p.64)

5.6.2.3 Recuperao por Passagens

A recuperao por partes de documentos antiga e seu princpio bastante


simples: dentro dos documentos textuais as passagens so seqncias textuais de
palavras consecutivas que apresentam certa homogeneidade em sua temtica e que,
portanto, podem ser relevantes para um usu rio, entendendo-se aqui palavras
consecutivas como uma seqncia de palavras segundo uma ordem de leitura do
documento desde a primeira at a ltima pgina. Uma vez tratadas, as passagens so
consideradas documentos separados e se indexam e recuperam atravs dos modelos
clssicos j descritos. Esta abordagem mais til para documentos longos ou com
estrutura complexa.

Conforme CALLAN (1994) a recuperao por passagens procura evidncias de


relevncia em vrios nveis do documento. A busca consiste em segmentar o texto e
comparar a consulta com cada segmento. Uma diviso do documento pode ser feita com
base no discurso (pargrafos, sees, frases), na semntica (em contedo ou assunto) ou
por janela (conforme um determinado nmero de palavras prximas).

161

5.6.3 Modelos por Aglomerados e Contextual

No detalhamento dos modeles de recuperao textual WIVES (2002) enumera


os seguintes:

booleano;

espao vetorial;

probabilstico;

difuso;

busca direta;

aglomerados;

lgico;

contextual.

Comentaremos os modelos por Aglomerados e Contextual.

5.6.3.1 Modelo Por Aglomerados

De acordo com WIVES (2002, p.43-44) o conceito bsico envolvido nessa


abordagem consiste em identificar documentos de contedo similar (que tratem de
assuntos similares) e armazen-los ou indexa- los em um mesmo grupo ou aglomerado
(cluster). A identificao de documentos similares em contedo d-se pela quantidade
de palavras similares e freqentes que eles contm. Quando o usurio especifica sua
consulta e essa remetida ao sistema, que, por sua vez, identifica um documento
relevante (e isso pode ser feito atravs de tcnicas de casamento tradicionais ou
atravs de tcnicas especficas para grupos) e retorna para o usurio todos os
documentos pertencentes ao mesmo grupo. Em teoria, os documentos pertencentes a um
mesmo grupo tambm so relevantes consulta, uma vez que diz que objetos
semelhantes e relevantes a um mesmo assunto tendem a permanecer em um mesmo
grupo e possuem atributos em comum (hiptese de agrupamento).

Considerando que buscas tradicionais ignoram o co-relacionamento entre


documentos, o modelo de aglomerados tende a aumentar a qualidade dos resultados

162

(pois retorna todo o grupo coeso e relevante consulta) e o tempo de processamento (j


que os grupos de documentos tendem a ser armazenados em um mesmo bloco do
dispositivo de armazenamento). Se o agrupamento for realizado de forma hierrquica
possvel oferecer um sistema de busca por navegao, aonde o usurio vai selecionando
os ramos que considera mais adequados at encontrar o grupo de documentos mais
relevantes. Um dos maiores problemas desse modelo justamente identificar os grupos
de documentos mais coesos e mant- los assim durante a utilizao do sistema. Todo
documento inserido ou modificado deve ser re-analisado a fim de ser colocado no grupo
correto. No h muitas informaes sobre clustering como um modelo, mas sim como
tcnica de descoberta de conhecimento

5.6.3.2 Modelo Contextual

Esse modelo pode ser fortemente identificado ou acoplado Indexao


Semntica Latente, anteriormente descrita. Ele tambm descrito por WIVES (2002,
p.45-47), com base em LOH (1997) a partir do qual apresentada a descrio a seguir.
A maior parte dos modelos de SRIs considera a presena dos termos nos documentos e
fazem o casamento entre um documento e a consulta exclusivamente se as palavras
contidas no documento forem exatamente iguais (casando os padres similares) s
palavras especificadas na consulta. Assim sendo, os documentos que possuem as
palavras identificadas na consulta so considerados relevantes e os que no as possuem
(mesmo que os termos tenham o mesmo sentido) so considerados irrelevantes por
possurem uma morfologia diferente. Esse tipo de casamento muito restritivo, pois,
como j salientado, a linguagem natural possui ambigidade e incerteza inerentes,
causando problemas de sinonmia (onde vrios termos podem denotar um mesmo
objeto) e polissemia (onde um termo possui vrios significados). Esses so os
problemas do vocabulrio (ou problemas da diferena de vocabulrio). Com isso, se um
documento trata do assunto especificado pela necessidade do usurio, mas seu autor no
utiliza os mesmos termos que o usurio, esse documento no considerado relevante.

O modelo contextual (ou conceitual) desenvolvido a partir do princpio de que


todo documento possui um contexto, pois a pessoa que escreve um texto o faz
desenvolvendo um assunto especfico e utiliza frases interconectadas ou encadeadas que

163

fazem sentido dentro assunto (o contexto). A consulta do usurio tambm possui um


contexto que definido por sua necessidade de informao. Uma vez identificado o
contexto dessa necessidade de informao e os contextos dos documentos de uma
coleo (base de documentos), o processo de recuperao e de identificao de
informaes relevantes pode ser feito ao nvel de contextos e no mais ao nvel de
palavras isoladas. Espera-se com isso que os resultados em relao relevncia dos
documentos retornados sejam melhores. A princpio, tal idia parece prtica e fcil,
porm, identificar e modelar os contextos dos documentos no uma tarefa trivial. Os
processos de cognio humana ainda no so completamente compreendidos e,
portanto, no possvel saber que elementos so necessrios para modelar um contexto.
Atualmente isso feito selecionando algumas palavras que em conjunto (e estando
correlacionadas) podem definir (dar uma idia de) esse contexto. Como cada palavra
pode estar presente em mais de um contexto, deve haver um grau (peso) indicando
quanto uma palavra relevante (importante) em cada contexto. Esse conjunto de
palavras ento utilizado para representar o contexto (LOH, 1997). Os documentos so
ento indexados de acordo com os contextos existentes e definidos. Isso feito atravs
de uma espcie de classificao onde as caractersticas (palavras ou termos) que
descrevem determinado contexto so localizadas nos documentos. Cada caracterstica
encontrada ativa seu contexto correspondente (palavras com graus elevados de
relevncia podem definir um contexto pelo simples fato de aparecerem em um
documento). O valor de relevncia (importncia) dessa palavra adicionado ao grau de
pertinncia do documento aos contextos que ela representa. Logo, quanto mais palavras
localizadas (ativas) um contexto possuir, maior o grau de relao do documento com
esse contexto. Nota-se com isso que um documento pode pertencer a mais de um
contexto com graus diferentes de relevncia (relao ou pertinncia).

A identificao do contexto da consulta do usurio tambm feita da mesma


forma: as palavras existentes ativam o contexto mais relevante. Dependendo do sistema
o usurio pode navegar pelos contextos existentes e selecionar um para a busca,
encontrando assim todos os documentos que estejam relacionados com o contexto
escolhido (LOH 1997).

Esse modelo no elimina o problema do vocabulrio, mas pode minimiz- lo se o


conjunto de palavras utilizado na descrio dos contextos for bem escolhido. Vrias
164

palavras podem ser utilizadas nessa descrio. Porm, muitas delas certamente so
encontradas em vrios contextos. Devem ser escolhidas aquelas que caracterizam bem
cada contexto sem que indiquem ou apaream em outros (ou muitos outros) contextos.
Ou seja, as palavras devem ter um alto grau de discriminao. Isso induz que os
contextos sejam descritos manualmente por uma pessoa que conhea muito bem o
assunto (contexto) que est descrevendo. O ideal que essa pessoa seja um especialista
na rea (contexto) em questo. Essa pessoa deve selecionar os termos mais relevantes
do contexto, adicionando tambm sinnimos e palavras especficas. Pelo fato de muitas
dessas palavras poderem aparecer em mais de uma descrio de contexto, alm do fato
de umas poderem ser mais relevantes (descritivas ou discriminantes) do que outras, um
grau (peso) de relevncia (ou importncia) deve ser atribudo a cada palavra. Essa
descrio manual de contextos pode ser auxiliada (ou substituda, dependendo do caso)
por um processo automatizado de identificao de palavras relevantes. Existe uma srie
de tcnicas desenvolvidas com o propsito de identificar palavras importantes e
correlaes entre palavras (SALTON & MACGILL, 1983), que podem ser utilizadas.
Dicionrios de sinnimos, thesaurus e redes semnticas tambm podem ser utilizadas
nesse processo.

Um dos maiores problemas desse modelo est no fato dos descritores poderem
ser elaborados incorretamente, o que ocasionaria uma busca incorreta onde os
documentos retornados provavelmente seriam irrelevantes para a necessidade do
usurio. Ou seja, a descrio dos contextos deve ser elaborada cuidadosamente para que
a recuperao contextual funcione de forma a oferecer resultados relevantes e coerentes.

5.7 Anlise das Taxonomias dos Modelos e Perspectivas

Existem limites em modelos e mtodos da recuperao da informao que


poderamos chamar de tradicional, ou seja: quando se trabalha com palavras de um
documento de modo isolado. Nesse caso, somente se recuperam palavras por
semelhana literal, levando assim perda da informao existente no conjunto de
palavras e de documentos. Precisamos considerar que os documentos que precisamos
recuperar no precisam ter obrigatoriamente os mesmos termos utilizados para se
especificar uma consulta. Da deriva a necessidade do esforo por um processo de
recuperao que vai se revestindo, na verdade em processo de extrao de informao
165

(ou de conhecimento), considerado as interaes entre as palavras, seus conjuntos e


mesmo as estruturas de diferentes documentos em uma base. Caminha-se na direo de
um esforo por tratamento semntico dos documentos para responder s necessidades
de informao dos usurios. Esse um esforo que demanda complexidade e uso de
diferentes recursos metodolgicos e computacionais cada vez mais sofisticados e muitas
vezes mesclados. Novos mtodos, combinados com tradicionais estratgias, produzem
novos efeitos de eficincia para o usurio.

Obviamente as taxonomias apresentadas sobre modelos de recuperao da


informao podem ser questionadas sob diferentes prismas. A recuperao da
informao tornou-se hoje um campo amplo, em que se entrelaam diferentes teorias,
vises e conceitos, bem como tecnologias de informao. Por exemplo, a incluso de
lgica nebulosa (fuzzy) e redes neurais pode ser alvo de reflexo, uma vez que essas
abordagens so tratadas no campo da prospeco de conhecimento, vinculado
inteligncia

artificial.

Portanto,

essa

taxonomia

mescla

aspectos

vises

tradicionalmente consideradas no campo da recuperao da informao com outras


oriundas da Inteligncia Artificial. Uma anlise que podemos fazer para isso o fato de
que os SRIs tiveram que estender suas habilidades de lidar com a informao para
responder s crescentes necessidades dos usurios, cada vez mais complexas e exigentes
e termos de cotejamento, organizao e apresentao dessas informaes. Os SRIs j se
diferenciaram de modo consolidado dos sistemas baseados em recuperao de dados,
mas necessrio hoje que expandam ainda mais seus recursos e habilidades. Tal
expanso vem acontecendo de forma frutuosa quando caminha em direo melhoria
de tcnicas matemticas e estatsticas e, mais especialmente no rumo dos sistemas de
descoberta de conhecimento, notadamente os que possuem bases na inteligncia
artificial com as perspectivas de processamento de linguagem natural. Embora j citados
preliminarmente ao longo desse captulo, em diversos pontos, aspectos relativos
descoberta de conhecimento sero abordados no captulo 6.

166

6 SISTEMAS INTELIGENTES E PROSPECO DE CONHECIMENTO


6.1 Consideraes Iniciais
Cada vez mais os SRIs incorporam novas funcionalidades de forma a melhor
responder s necessidades dos usurios. Os Sistemas de Recuperao Textuais,
sobretudo aps a consolidao da Internet e do grande crescimento de bases textuais nas
organizaes, cresceram em complexidade e disponibilidade de recursos para os
usurios, cada vez mais sufocados pelo turbilho de documentos disponveis, com
demandas sofisticadas por informaes muitas vezes articuladas, porm sem condies
de dar saltos superiores aos permitidos por tradicionais motores de busca. Nas
organizaes, devido a um ambiente cada vez mais complexo e competitivo, grande a
necessidade de informao. Essas necessidades, de usurios individuais e de
organizaes, para serem devidamente respondidas, passaram a requerer um tratamento
semntico dos conjuntos de documentos e um processamento computacional cada vez
mais complexo, o que passou a demandar novos recursos como os providos pela
Inteligncia Artificial, com seus sistemas inteligentes voltados para o que se denomina
descoberta de conhecimento.

A idia de uso de sistemas inteligentes est vinculada pretenso do ser


humano fazer com que recursos tecnolgicos computacionais possam realizar tarefas
anlogas que o ser humano realiza, procurando reproduzir, at certo ponto, as
caractersticas comportamentais inteligentes que o homem possui. , obviamente, uma
abstrao, uma vez que o conceito de inteligncia complexo (e no ser aqui
explorado, mais tangenciado). O ser humano capaz, intelectualmente, de representar
os objetos do mundo de forma abstrata, produzir e manipular conceitos, trabalhar com
fatos que guarda na memria, cotejar esses fatos e conceitos e experincias entre si.
Atravs da cognio, o homem absorve a e analisa fatos, que se transformam e registros
e gradativamente vai definindo smbolos que sero manipulados pela linguagem e pelo
pensamento. Representa encadeamentos por uma viso lgica dos fenmenos e trabalha
com associaes, generalizaes e a criatividade. Em seu confronto com a realidade,
conforme o processo de equilibrao majorante (PIAGET, 1976), descrito no
capitulo 4, vai estabelecendo formas de se relacionar com o mundo de forma dinmica,
adaptativa e evolutiva, sempre inovando e apresentando a possibilidade de mudanas

167

continuas, seja pela realizao de novas experincias seja pela capacidade de,
continuamente elaborar e manejar novos conceitos. Enfim, o ser humano tem um
comportamento que, com tais caractersticas pode ser definido como inteligente,
utilizando conhecimento e raciocnio. O conhecimento est articulado com a idia de
dados e informaes que, de acordo com REZENDE (2003), conforme j apresentado
no capitulo 4, diz respeito habilidade de criar um modelo mental que descreva o
objeto e indique as aes a implementar e as decises a tomar. A compreenso, a
anlise e sntese, necessrias para a tomada de decises inteligentes, so realizadas a
partir do nvel do conhecimento. Conforme essa autora, a gerao de conhecimento
resultado de:
um processo no qual uma informao comparada com outra e combinada em
muitas ligaes (hiperconexes) teis e com significado. Isso implica que o
conhecimento dependente de nossos valores e nossa experincia e sujeito s
leis universalmente aceitas. (...) Uma deciso um uso explcito de
conhecimento. O conhecimento pode ser representado como uma combinao
de estruturas de dados e procedimentos interpretativos que levam a um
comportamento conhecido. Esse comportamento fornece informaes a um
sistema44 que pode, ento, planejar e decidir (p.5-6).

Ainda de acordo com REZENDE (2003) o conhecimento pode ser:

Declarativo descritivo e genrico sobre os fatos e eventos (o que )

Procedural prescritivo e resultado de encadeamentos (como funciona isto ou


aquilo)

Senso comum composto de conhecimento declarativo e procedural e


realizando uma avaliao ou julgamento do que certo ou errado

Heurstico conhecimento nico para cada indivduo ou grupos bem


especficos, que dificilmente pode ser obtido em alguma fonte, envolvendo
avaliao sistemtica e uso de regras heursticas. Est fortemente associado
idia de conhecimento tcito e tem valor importante em inteligncia artificial.

Ao solucionar problemas e interagir com o mundo o ser humano pode utilizar


cada um desses diferentes tipos de conhecimento, a partir de diferentes combinaes de
informaes. Tanto a anlise lgica, baseada num conhecimento explcito expresso por

44

Nesse caso, j considerando a idia de uma possvel aplicao de sistema informatizado.

168

dados objetivados em relatrios ou sistemas informatizados, quanto uma anlise


subjetiva ou heurstica, baseada na experincia e na intuio podem ser aplicados.

6.2 Conceito de Inteligncia Artificial e de Sistemas Inteligentes

Quando dizemos que os sistemas de informao computadorizados so


inteligentes e esto apoiados em conhecimento estamos na verdade fazendo uma
analogia com tal comportamento humano, uma vez que, por mais avanados que sejam
esses dispositivos, eles possuem limites explcitos quando confrontados com o ainda
indefinido limite do pensamento humano.

O esforo de transferir para sistemas

computadorizados os processos humanos de inteligncia, envolvendo as relaes com o


conhecimento e o raciocnio deu origem a um campo denominado inteligncia artificial.
Esse campo vasto e polmico, comportando muitas abordagens e definies. H
tambm muitas crticas a ele. De qualquer forma, ele apresentou um significativo
desenvolvimento, a partir de 1950. Foi fortemente questionamento quanto a seus
resultados nos anos 60, tendo um perodo de refluxo, mas a partir dos anos 80 assumiu
uma abordagem e uma postura mais moderna e condizente com as necessidades de
pessoas e organizaes. A reduo dos custos de processamento de dados e por outro
lado a elevao da capacidade computacional deste, criou novas perspectivas para esse
campo do conhecimento, hoje muito mais inserido na resoluo de problemas e suporte
tomada de decises para o ser humano.

De acordo com TURBAN (2003), os softwares convencionais so baseados em


algoritmos 45 e no processamento numrico. Os programas baseados em inteligncia
artificial vo alm da computao convencional ao incluir a heurstica ou normas
prticas que expressam o conhecimento. Um sistema inteligente usa tambm o
processamento simblico do conhecimento, sendo que, em inteligncia artificial, um
smbolo pode ser uma letra, palavra ou nmero que representa objetos, processos e suas
relaes. Os objetos podem ser pessoas, coisas, idias, conceitos eventos ou declaraes
de ocorrncias. Usando smbolos, possvel criar uma base de conhecimento de fatos e
conceitos e das relaes existentes entre eles.

45

Frmulas matemticas ou procedimentos seqenciais que resultam em uma soluo. Um algoritmo


convertido em um programa que informa ao computador as operaes exa tas que devem ser executadas
para solucionar problemas. TURBAN (2003, p. 403).

169

Adotando a viso de RUSSEL & NORVIG (2004)

46

podemos dizer que a

inteligncia est relacionada principalmente a uma ao racional. Ento, no caso ideal,


um agente inteligente adota a melhor ao possvel em uma situao, em resposta a
qualquer seqncia de percepes.

47

Um agente algo que percebe e age em um

ambiente. um elemento capaz de perceber seu ambiente por meio de sensores e de


agir sobre esse ambiente por meio de atuadores. A inteligncia artificial , para tais
autores, uma cincia de projeto de agentes inteligentes, ou seja: agentes bem sucedidos
para a funo que se prope e que envolvem a inteno de simular ou atuar de forma
anloga aos processos cognitivos e racionais humanos. um campo de conhecimento
que estuda a perspectiva e as possibilidades de automao de comportamento
inteligente. O comportamento inteligente dos agentes em um determinado ambiente
deve incluir as capacidades de percepo, raciocnio, aprendizado, comunicao, ao e
planejamento. Um sistema baseado em abordagens da inteligncia artificial deve ser
capaz de adaptar-se a novas situaes, raciocinar, entender relaes entre fatos,
descobrir significados, reconhecer elementos verdadeiros e falsos e aprender com base
em sua experincia acumulada.

A inteligncia artificial foi fortemente influenciada por vrios outros campos do


conhecimento humano, conforme representado no esquema abaixo e cada um desses
campos para que ela possua a sua atual configurao.

Matemtica
Filosofia

Lingstica

Sociologia

IA

Psicologia

Computao

Neuro-fisiologia
Gentica

46

Abordagem desenvolvida nos captulos 1 e 2 da obra dos autores e referencia.


Para os autores, percepo so as entradas perceptivas do agente em qualquer momento dado e
seqncia de percepes a histria completa de tudo o que o agente j percebeu. Em geral, a escolha de
ao de ao de um agente em qualquer instante dado pode depender da seqncia inteira de percepes
observadas (por ele) at o momento. Se pudermos especificar a escolha de ao do agente para toda a
seqncia de percepes possvel, ento teremos dito quase tudo o que existe a dizer sobre o agente. Em
termos matemticos, o comportamento do agente descrito pela funo de agente, que mapeia qualquer
seqncia de percepes especficas para uma ao. RUSSEL & NORVIG, 2004, p. 34-35.
47

170

Conforme TURBAN (2003), apesar dos esforos, a inteligncia artificial ainda


se encontra longe de apresentar uma inteligncia significativa, embora estejam ajudando
muito em tarefas que requerem inteligncia humana para obter uma melhoria
significativa de produtividade, qualidade e ciclo de produo. Nos ltimos anos a
inteligncia artificial evoluiu muito e suas aplicaes hoje envolvem:

Matemtica: demonstrao de teoremas, resoluo simblica de equaes,


geometria, etc.

Pesquisa operacional: otimizao e busca heurstica em geral

Jogos diversos.

Processamento de linguagem natural: traduo automtica, verificadores


ortogrficos e sintticos, anlise semntica, dentre outros.

Sistemas tutores: modelagem do aluno, escolha de estratgias pedaggicas, etc.

Simular a percepo (viso, tato, audio, olfato, paladar) em aplicaes.

Robtica (software e hardware): manipulao, navegao, monitoramento, etc.

So diferentes os paradigmas utilizados para desenvolvimento dos agentes


inteligentes pela inteligncia artificial, conforme podemos sintetizar abaixo, com
expresso sumria de alguns exemplos de modelos.

Simblico: metfora lingstica (Ex. sistemas de produo)

Conexionista: metfora cerebral (Ex. redes neurais )

Evolucionista: metfora da natureza (Ex. algoritmos genticos, vida artificial)

Estatstico/Probabilstico (Ex. Redes Bayesianas, sistemas difusos)

Diante do exposto, e ampliando a viso colocada em REZENDE (2003)


podemos dizer que os sistemas inteligentes so agentes ou conjuntos de agentes atuando
de forma harmonizada, que possuem capacidade de usar conhecimento na resoluo de
problemas e realizao de determinadas tarefas. Podem aproveitar associaes e
inferncias para trabalhar com problemas complexos que sejam parecidos com
problemas reais. Eles podem armazenar, processar e recuperar grandes conjuntos de
informaes e proceder mltiplos cotejamentos, explicitando certos resultados que

171

teramos maiores dificuldades em processar humanamente. Deve ser capaz tambm de


analisar o contexto em que se encontra e a ele se adaptar. Conforme a autora:

o comportamento inteligente de um sistema resultado de mltiplas e


encadeadas decises. A escolha da deciso, ou controle da deciso baseada
em critrios de desempenho, durao e risco. O controle de deciso um
processo pelo qual as solues de um problema e as tomadas de deciso so
seqenciadas, sincronizadas, inter-relacionadas e direcionadas para fornecer o
comportamento orientado ao objetivo de um sistema (p.7-8).

Dentro dos paradigmas acima citados, e tambm sob inspirao de REZENDE


(2003), podemos dizer que os sistemas inteligentes podem ser desenvolvidos e
implantados com base em tcnicas e metodologias as quais podem ser aplicadas isolada
ou conjuntamente para auxiliar o processo decisrio e a resposta s necessidades de
informao dos usurios. Essas abordagens, tcnicas e metodologias incluem a
aquisio de conhecimento, processos OLAP de data warehousing 48 , o aprendizado de
mquina, a induo de regras e rvores de deciso, as redes neurais, o raciocnio
baseado em casos, a lgica nebulosa, a computao evolutiva, o processamento da
linguagem natural, a descoberta de conhecimento em base de dados (minerao de
dados) e a descoberta de conhecimento em textos (minerao de textos) dentre outros.
6.3 Viso Geral de Abordagens Tcnicas Para Sistemas Inteligentes
Dentre as estratgias tecnolgicas emergentes que so utilizadas no
desenvolvimento de sistemas inteligentes podemos especificar sumariamente 49 as
seguintes, com um sumrio de sua descrio 50 .

6.3.1 Aprendizado de Mquina

A idia de aprendizagem, em inteligncia artificial significa que um agente


inteligente de software observa suas interaes com o meio em que se encontra e com
48

OLAP e data warehousing sero tratados mais detalhadamente no prximo captulo.


Considerando a amplitude do assunto, no objetivo dessa tese aprofundar estudos relativos
inteligncia artificial, mas apenas salientar sua relevncia e papel atual, bem como algumas tcnicas que
realizam um tratamento mais elaborado de dados produzindo informaes de alta representatividade para
o processo de gerao de conhecimento.
50
Definies apoiadas na anlise da obra de MEYER, M., BABER, R. e PFAFFENBERGER, B. (2000,
436-440)
49

172

seus prprios processos de tomada de deciso. O conceito de aprendizagem implica em


que as percepes devem ser usadas no s para agir, mas tambm para melhorar a
habilidade do agente para agir no futuro (RUSSEL & NORVIG, 2004). A aprendizagem
de mquina uma rea da inteligncia artificial que tem por objetivo desenvolver
tcnicas computacionais sobre o aprendizado bem como a construo de sistemas
capazes de adquirir conhecimento de forma automtica (REZENDE, 2003). De acordo
com essa autora:

um sistema de aprendizado um programa de computador que toma decises


baseado em experincias acumuladas por meio da soluo bem-sucedida de
problemas anteriores. Os diversos sistemas de aprendizagem de mquina
possuem caractersticas particulares e comuns que possibilitam sua
classificao quanto linguagem de descrio, modo, paradigma e forma de
aprendizado utilizado (p. 90).

O aprendizado de mquina procura levar os softwares a aprender com os dados


que eles estudam, de tal modo que esses softwares tomem decises diferentes baseados
em caractersticas dos dados estudados, utilizando a estatstica para os conceitos
fundamentais e adicionando mais heurstica avanada da inteligncia artificial e
algoritmos para atingir seus objetivos. (SERRA, 2002). A aprendizagem pode ser
supervisionada (indutiva) ou no-supervisionada (probabilstica, baseada, em geral, em
mtodos estatsticos).

A aprendizagem supervisionada envolve a aprendizagem de uma funo a partir


de dados de entradas e sadas. A aprendizagem supervisionada de uma funo de
valores discretos chamada de classificao, enquanto a aprendizagem de uma funo
com valores contnuos chamada de regresso. Uma aprendizagem indutiva envolve
encontrar uma hiptese consistente que concorde com os exemplos. (RUSSEL &
NORVIG, 2003). Nela, fornecido um algoritmo de aprendizado, ou indutor, um
conjunto de exemplos de treinamento para os quais o rtulo da classe associada
conhecido. O objetivo desse algoritmo construir um classificador que possa
determinar corretamente a classe de novos exemplos ainda no rotulados, ou seja:
exemplos que no tenham o rtulo da classe (REZENDE, 2003).

aprendizagem

no

supervisionada

envolve

mtodos

estatsticos

de

aprendizagem, em que visualizamos a aprendizagem como uma forma de raciocnio

173

com incerteza a partir de observaes. De acordo com RUSSEL & NORVIG (2004) tais
mtodos variam desde o clculo simples de mdias at a construo de modelos
complexos, como redes bayesianas e, segundo alguns autores, tambm redes neurais51 ,
com aplicao ampla no mundo cientfico e organizacional.
REZENDE (2003) 52 apresenta uma taxonomia para os paradigmas de
aprendizado, classificando os em:

Simblico buscam aprender construindo representaes simblicas de um


conceito atravs da anlise de exemplos e contra-exemplos desse conceito. Tais
representaes simblicas se expressam sob a forma de expresses lgicas,
rvores de deciso, induo de regras ou redes semnticas.

Estatstico a idia consiste em encontrar modelos estatsticos para


aproximaes dos conceitos tratados. Vrios desses mtodos so paramtricos,
assumindo alguma forma de modelo e encontrando valores apropriados para os
parmetros desse modelo a partir dos dados.

Baseados em Exemplos implica em classificar um exemplo com base na


considerao de outro exemplo similar cuja classe j seja conhecida, assumindo
que o novo exemplo ficar nessa mesma classe, ou seja: classificar exemplos
nunca vistos por meio de exemplos similares conhecidos. O raciocnio baseado e
casos uma tcnica desse paradigma.

Evolutivo Baseado em algoritmos genticos, descritos no tpico 6.3.2 dessa


tese.

Conexionista Est baseado na abordagem das redes neurais, descrita no tpico


6.3.4 dessa tese.

6.3.2

Algortmos Genticos

Algoritmos Genticos so algoritmos eficientes de busca probabilstica,


inspirados nos mecanismos da evoluo biolgica. Algoritmos Genticos tm produzido
excelentes solues em problemas complexos de otimizao que possuem grande
51

Embora as redes neurais possam ser vistas dentro de um paradigma conexionista e no eminentemente
estatstico.
52
REZENDE (2003, p. 93-94)

174

nmero de parmetros. reas onde esses algoritmos tm sido aplicados incluem:


otimizao de funes complexas, planejamento industrial, lay-out de circuitos, controle
e otimizao de distribuio de energia, otimizao de roteamento e trfego, etc.

O objetivo principal de um algoritmo gentico o de evoluir a partir de uma


populao de solues para um determinado problema, tentando produzir novas
geraes de solues que sejam melhores que as anteriores. Esses algoritmos operam
atravs de um ciclo simples que consiste dos seguintes passos: criao da populao
inicial, avaliao, seleo e reproduo, este ltimo envolvendo a recombinao e
mutao do material "gentico" das solues.

6.3.3

Lgica Difusa

A lgica difusa, ou nebulosa, fornece um mecanismo para computadores lidarem


com informaes imprecisas. A lgica difusa fuzzy foi projetada para manipular
conceitos imprecisos como "pequeno", "grande", "jovem", "velho", "alto", ou "baixo",
que no utilizam uma lgica binria do "branco ou preto", mas um esquema lgico que
possa manipular "tons de cinza". Sistemas baseados na lgica nebulosa tm mostrado
grande utilidade em uma variedade de operaes de controle industrial e em tarefas de
reconhecimento de padres que se estendem desde reconhecimento de texto manuscrito,
at a avaliao de crdito financeiro. Existe tambm um interesse crescente em se
utilizar lgica nebulosa em sistemas especialistas para torn-los mais flexveis.

Uma das principais potencialidades da lgica nebulosa, quando comparada com


outros esquemas que tratam com dados imprecisos como redes neurais, que suas bases
de conhecimento, as quais esto no formato de regras de produo, so fceis de
examinar e entender. Este formato de regra tambm torna fcil a manuteno e a
atualizao da base de conhecimento.

6.3.4

Redes Neurais Artificiais

Redes neurais (neural networks), ou neuronais para alguns autores, so


dispositivos computacionais, inspirados na funcionalidade dos neurnios biolgicos,
aplicados ao reconhecimento de padres. A sua habilidade em formar mapeamentos
175

no- lineares tem tornado as redes neurais prsperas na modelagem e previso de


sistemas complexos.

Redes neurais so compostas por diversas unidades computacionais paralelas


interconectadas. Cada uma dessas unidades efetua um pequeno nmero de operaes
simples e transmite seus resultados s unidades vizinhas. As redes neurais aprendem a
reconhecer padres atravs de um processo de treinamento baseado em vrios exemplos
diferentes. Elas so eficientes no reconhecimento de padres em um conjunto de dados,
quer estes representem imagens digitalizadas ou o comportamento de uma moeda no
mercado de cmbio.

Conforme TURBAN (2003) as redes neurais constituem um

mtodo diferente que usa a arquitetura que simula determinadas capacidades de


processamento do crebro humano. Os resultados so representaes do conhecimento e
processamento baseado no mtodo paralelo em massa (execuo de vrias instrues de
processamento simultaneamente). Um neurnio artificial recebe entradas anlogas aos
impulsos eletroqumicos que os neurnios biolgicos recebem de outros neurnios. Os
neurnios de uma rede neural recebem informaes de outros neurnios ou de fontes
externas, transformam as informaes e as transmitem para outros neurnios ou para
sadas externas. A figura 25 abaixo representa essa idia.

camada
de entrada

camada
escondida

camada
de sada

Figura 25: Representao Para Entendimento de uma Rede Neural

Redes neurais tambm so bastante efetivas no aprendizado de padres a partir


de dados no- lineares, incompletos, com rudos e at compostos de exemplos
contraditrios. A habilidade de manipular estes dados imprecisos faz com que as redes
neurais sejam extremamente eficazes no processamento de informaes financeiras e

176

em tarefas onde especialistas no esto disposio ou um conjunto de regras claras no


pode ser facilmente formulado. As redes neurais no so, portanto, apropriadas para as
aplicaes em que a explicao do raciocnio fundamental.

6.3.5 rvores de Deciso

rvores de deciso e induo de regras so tcnicas de aprendizagem de


mquina simblica. uma tcnica que, a partir de uma massa de dados, cria e organiza
regras de classificao e deciso em formatos de diagramas de rvores, que iro
classificar suas observaes ou predizer resultados futuros. Por exemplo, se seus dados
estiverem divididos em classes dicotmicas, tais como: bons e maus pagadores, clientes
e no-clientes, infectados e no infectados, uma rvore de deciso pode ser construda
para criar regras que classifiquem casos j existentes, ou casos novos, com preciso.
Comea-se com um nico grupo que rene todos os casos em estudo. Na medida em
que a rvore vai se expandindo, esta base divida em ndulos que representam
categorias das variveis analisadas. Cada galho da rvore formado por esses ndulos
eu vo se abrindo em subgrupos mutuamente exclusivos. Cada ndulo e cada galho
apresentam uma proporo de obteno da resposta em estudo (BARBIERI, 2001)

6.3.6 Sistemas Hbridos

Recentemente tem havido considervel interesse no desenvolvimento de


sistemas hbridos envolvendo tcnicas comp utacionais inteligentes. Sistemas hbridos
combinam tcnicas de processamento simblico e adaptativo, tais como sistemas
especialistas, lgica nebulosa, redes neurais e algoritmos genticos. Tais sistemas
apresentam diferentes caractersticas quanto funcionalidade e arquitetura.

Defensores de ambos, processamento simblico e adaptativo, argumentam que suas


tcnicas isoladamente so as mais adequadas para modelar e resolver problemas
complexos do mundo real. Um exame em detalhe dessas classes de processamento e de
suas aplicaes revela, no entanto, que ambos os procedimentos apresentam uma
combinao de vantagens e limitaes e que a integrao de diferentes tcnicas pode
ajudar a superar seus pontos fracos. Na verdade, muitos dos problemas complexos do
mundo real requerem a ao combinada dos procedimentos complementares.
177

6.3.7 Sistemas Frmicos (Ant Systems)

Conforme DORIGO & STTZLE (2006), o complexo comportamento social


das formigas est atraindo muitos estudos pela cincia. A Cincia da Computao tm
buscado nos padres desse comportamento inspirao para prover modelos de resoluo
de problemas difceis de otimizao combinatria. Sistemas frmicos, ou ant systems
so um novo mtodo heurstico para resolver problemas complexos que exigem
otimizao combinatria. A otimizao combinatria pode ser entendida nos seguintes
termos:

Partindo de um conjunto de itens existentes e de um conjunto de regras que


podem ser utilizadas para selecionar alguns itens desse conjunto, h diferentes
maneiras de escolher esses elementos e criar outros conjuntos menores
(subconjuntos).

Considerando que a cada elemento est associado um esforo ou custo, os


subconjuntos criados, tambm, tero um custo ou esforo, que dado, por
exemplo, pela soma dos custos de seus elementos.

Um problema de otimizao combinatria se resume a encontrar, dentre os


possveis conjuntos, aquele cujo custo seja o menor possvel. Um exemplo
clssico o problema do caixeiro viajante, quer precisa selecionar um roteiro
para percorrer um determinado nmero de localidades dispersas em um
territrio. Seu desafio justamente encontrar o caminho timo, ou seja, aquele
que demanda menor custo e menor esforo.

Observando o comportamento das formigas na busca pelos alimentos, percebeuse que, inicialmente, cada formiga segue um caminho aleatrio. Aps algum tempo, elas
tendiam a seguir um nico caminho, considerado timo. Cada formiga utiliza uma
comunicao indireta para indicar para as outras o quo bom foi o caminho que ela
escolheu Para isso elas espalham uma substncia chamada feromnio. Em um
experimento, colocando-se um ninho de formigas em um aqurio com uma fonte de
alimentos na outra ponta. Para chegar at esse alimento foram criados dois caminhos,
sendo um maior que o outro. Como as formigas que escolheram o menor caminho
faziam o percurso mais rapidamente que as outras, elas acabavam depositando uma
maior quantidade de feromnio nesse caminho em relao ao outro em um mesmo
178

instante de tempo. Logo, em um determinado momento a intensidade do feromnio no


caminho mais curto estar to alta que quase todas as formigas seguiro por ele
(FRANA, 2006).

DORIGO & GAMBARDELLA (1997) perceberam que as formigas resolviam


um problema muito similar ao do caixeiro viajante e, inspirado nesse comportamento,
apresentaram propostas para model- lo computacionalmente e verificar como se
comportava em algumas instncias conhecidas do problema.

Em conjunto com os algoritmos genticos e outras tcnicas, os sistemas


frmicos so classificados como meta- heursticas. Meta-heursticas so paradigmas
de desenvolvimento de algoritmos heursticos para tratar problemas considerados
complexos, tais como: roteirizao de veculos, mapeamento gentico, construo de
quadros de horrios para professores em escolas, corte de materiais, empacotamento de
produtos, escalonamento de recursos (trabalho humano e mquinas), dentre outros.

6.3.8 Minerao de Dados, OLAP e Data Warehousing

Esses assuntos sero tratados no prximo tpico e tambm no captulo 7.

6.4 Sistemas Dedicados Descoberta de Conhecimento

6.4.1 Viso Geral

Os processos de descoberta de conhecimento surgiram no mbito da rea de


inteligncia artificial, embora tenham recebido modernamente a contribuio da rea de
Banco de Dados com as estratgias de data warehousing e modelagem
multidimensional (OLAP). Possuem tambm contribuio da Estatstica. De acordo com
TURBAN (2003) a inteligncia artificial uma ramificao da cincia computacional
que lida com modos de representao do conhecimento por meio de smbolos e nmeros
e usando a heurstica (normas prticas) e no somente de algoritmos. Segundo esse
autor:

179

A IA frequentemente associada ao conceito de conhecimento . O computador


no pode ter experincias nem estudar e aprender como isso possvel para a
mente humana, mas pode utilizar o conhecimento 53 a ele fornecido por
especialistas humanos. Esse conhecimento consiste de fatos, conceitos, teorias,
mtodos heursticos, procedimentos e relacionamentos. (p. 402).

importante considerar que pessoas e organizaes acumulam, ao longo do


tempo, bases de dados ou documentos, muitas vezes perdendo a viso do que nela est
inserido e da potencialidade de gerao de conhecimento que essas bases possuem
quando consideradas para um tratamento sin rgico por recursos de software de
descoberta de conhecimento. Sistemas de Descoberta de Conhecimento so softwares
que usam o conhecimento representado explicitamente para resolver problemas e apoiar
decises, partindo do pressuposto de que bases de dados ou de documentos embutem
um conhecimento implcito, latente, escondido em suas estruturas e contedos. Grande
parte desse conhecimento escondido novo e relevante, pois fruto de correlaes entre
os objetos de informaes considerados em seu conjunto e no isoladamente. Atravs de
uma viso sintica, integrada e multidimensional dos elementos inseridos nessas bases,
descobre-se esse conhecimento latente. Portanto, so sistemas que manipulam a
informao de forma inteligente, gerando conhecimento novo.
Por descoberta de conhecimento entendemos o processo de utilizao de
diversas tecnologias integradas que nos permitem armazenar, tratar e recuperar
informaes relevantes que orientam o comportamento das pessoas, o posicionamento
estratgico e a tomada de deciso nas organizaes. No ambiente acadmico, esse
processo se consolidou sob a sigla KDD Knowledge Discovery in Database ou
Descoberta de Conhecimento em Bases de Dados, comercialmente chamado de
Minerao de Dados. A expresso minerao de dados tem origem na Estatstica, na
qual, nos anos 60, os profissionais e estudiosos da rea se referiam como pescaria ao
processo de explorao descontrolada dos dados o que j no acontece atualmente,
uma vez que os processos so bem mais definidos (PRADO, 1997). WIVES (2002)
lembra que o termo minerao de dados utilizado muitas vezes como sinnimo de
53

Conhecimento aqui tem o sentido de conhecimento explicito, codificado. a informao organizada e


analisada para torn-la compreensvel e aplicvel soluo dos problemas e tomada de decises, e para
incoroporar procedimentos, idias e experincia humana. TURBAN (2003, p. 402).

180

todo o processo de descoberta de conhecimento, mas na verdade ele apenas o ncleo


do processo, respondendo pela extrao de padres e modelos nos dados ou documentos
analisados e representando cerca de 20% do processo total de descoberta de
conhecimento, o qual possui outras etapas. Considerando a grande disponibilidade de
dados acumulados nas organizaes, os primeiros processos informatizados visando a
descoberta de conhecimento foram aplicados sobre dados em geral mais estruturados
(da a expresso KDD). Posteriormente que tais processos passaram a considerar os
documentos menos estruturados, como os textos, originando a rea de Descoberta de
Conhecimento em Textos ou Minerao de Textos ou ainda KDT Knowledge
Discovery in Text, a ser detalhada no prximo capitulo.

De acordo com FAYYAD, PIATETSKY & SMYTH (1996)

54

, extrair

conhecimento de bases de dados o processo de identificar padres vlidos, no vos,


potencialmente teis e compreensveis embutidos nos dados, sendo que todo processo
orientado em funo de seu domnio de aplicao e das bases de dados ou documentos
relativos a esse domnio. REZENDE (2003, p. 310) lembra que essa definio merece
um detalhamento do seu contedo, e que podemos ento esclarecer alguns dos conceitos
que nela aparece da seguinte forma:

Padres indica alguma abstrao de um subconjunto dos dados em alguma


linguagem descritiva de conceitos.

Processo a descoberta de conhecimento em bases de dados possui etapas


especficas a serem seguidas.

Vlidos os padres descobertos devem possuir algum grau de certeza, ou seja,


devem satisfazer funes ou limiares que garantam que os exemplos cobertos e
os casos relacionados ao padro encontrado sejam aceitveis.

Novos um padro encontrado deve fornecer novas informaes sobre os


dados. O grau de novidade serve para determinar quo novo ou indito um
padro. Pode ser medido por meio de comparaes entre as mudanas ocorridas
nos dados ou no conhecimento anterior.

54

FAYYAD, U., PIATETSKY-SHAPIRO, G. & SMYTH, P. From data mining to knowledge


discovery: na overview. In Advances in Knowledge Discovery & Data Mining. 1996, p. 1-34. Citao
apresentada em REZENDE (2003, p.309-310).

181

teis os padres descobertos devem ser incorporados para serem utilizados.

Compreensveis um dos objetos de se realizar a minerao de dados


encontrar padres descritos em alguma linguagem que pode ser compreendida
pelos usurios permitindo uma anlise mais profunda dos dados.

6.4.2 O Processo de Descoberta de Conhecimento em Bases de Dados

Analisando a obra de WESTPHAL & BLAXTON (1998), podemos dizer que a


Descoberta de Conhecimento, Minerao de Dados e mesmo a Minerao de Textos so
expresses relativas a um processo amplo que inclui o uso de uma ou mais ferramentas
(softwares) inteligentes (que se servem de um ou vrios recursos da chamada
Inteligncia Artificial, da Estatstica e da rea de Banco de Dados) e que viabiliza a
busca de dados em bases de uma empresa, procurando descobrir informaes
desconhecidas pelos tomadores de deciso. So ferramentas que atuam na descoberta de
informaes articuladas que expressam conhecimento obtido pelo cotejamento e
organizao dos dados (base de dados), centralizando-se na descoberta automtica de
novos fatos e relaes nos dados 55 .

O processo de descoberta de conhecimento em base de dados possui quatro


passos:

a) Identificao do Problema e Definio do Do mnio da Aplicao: o estudo do


domnio da aplicao e a definio de metas a serem alcanadas no processo de
minerao (REZENDE, 2003). Especialistas conhecedores do domnio a ser alvo da
descoberta do conhecimento precisam participar dessa fase para apoiar o processo.
Definem-se, alm das metas, os critrios de desempenho, os aspetos de
compreensibilidade do conhecimento extrado e as questes relativas preciso e
usabilidade desse conhecimento. tambm importante definir quais as fontes de dados
a ser usadas nas etapas seguintes.

b) Preparao ou pr-processamento: como o prprio nome sugere nesse passo que os


dados so preparados antes de serem apresentados a um agente inteligente de software.
55

Ver tambm, para uma anlise mais acurada sobre Data Mining a obra de JIAWEI, H. e KAMBER, M.
Data Mining: concepts and Tecniques. San Francisco, USA. Simon Frise University, 2001.

182

Os dados importantes so selecionados, purificados (eliminao de inconsistncias) e


pr-processados com definio de quais dados so importantes e o que fazer com eles.

c) Extrao de Padres ou Minerao (Mining) o processamento dos dados com a


minerao propriamente dita. Temos diferentes tipos de descobertas possveis a serem
realizadas aqui. Os dados so aqui transformados em informaes importantes e o foco
e conseguir gerar conhecimento novo e til. Esse passo o ncleo do processo e ser
detalhado no tpico 6.4.3

d) Anlise ou Ps-Processamento: O resultado da minerao avaliado, visando


determinar a importncia dos fatos gerados e se algum conhecimento adicional foi
descoberto. De acordo com WIVES (2002), o ps-processamento implica tambm em
aplicao de filtros de estruturao e ordenao para que o conhecimento possa ser
apresentado ao usurio da forma mais simples e compreensvel possvel.

Para GOEBEL & GRUENWALD (1999) o processo (computacional) de


descoberta de conhecimento possui as seguintes etapas:

entendimento do domnio da aplicao e definio dos objetivos do processo de


descoberta;

aquisio ou seleo do conjunto dos dados;

integrao e verificao do conjunto;

limpeza dos dados (pr-processamento e transformao);

desenvolvimento de um modelo inicial ou construo de hipteses iniciais;

escolha e aplicao de mtodos (tarefas) de minerao dos dados;

visualizao e interpretao dos resultados;

teste e validao das hipteses (pode-se refazer parte do processo;

uso e manuteno do conhecimento descoberto (tomada de deciso no domnio


da aplicao).

Detalhando as questes acima discutidas, uma viso resumida da seqncia dos


passos do processo de descoberta de conhecimento em bases de dados pode ser
apresentada na figura 26 a seguir:

183

Figura 26: O processo de Descoberta de Conhecimento em Bases de Dados


Fonte: Adaptado de PRADO (1997, p. 12)

6.4.3 Tarefas de Minerao de Dados

De acordo com GOEBEL & GRUENWALD (1999), o aspecto central dos


processos de minerao de dados a extrao de padres dos dados. Para isso diferentes
mtodos ou tarefas podem ser usados para diferentes objetivos. Inicialmente,
necessrio definir qual tarefa de minerao de dados ser usada, o que feito de acordo
com o objetivo estabelecido para o processo. Esses autores relacionam oito tarefas de
minerao de dados:

Processamento dos Dados: tarefa que tem a finalidade com o intuito de


selecionar, filtrar, agregar, exemplificar, limpar e transformar os dados.

Anlise de Dados Exploratria: a explorao interativa de dados sem modelos


ou hipteses antecipados, com objetivo de se identificar padres de
comportamento, traos e tendncias embutidos nos conjuntos de dados.

Classificao: tem por objetivo determinar a classe a que um certo dado


pertence. A classificao uma funo de aprendizado que organiza os dados
em categorias. Ele visa enquadrar em uma classe qualquer exemplo novo que
est sendo examinado.

184

Regresso: so atividades que avaliam a dependncia de valores de certos


atributos em relao a outros do mesmo item, construindo um modelo com
capacidade de prever os valores de novos registros. A tarefa de regresso
similar de classificao. A diferena central reside no fato de que o atributo a
ser predito continuo em vez de discreto.

Anlise de Associaes (ou Links): Os dados ou documentos podem possuir elos


(links) entre eles, indicando sua similaridade. Essa tarefa tem por objetivo
identificar relacionamentos entre atributos e itens, com a finalidade de perceber
se a presena de algum padro redunda na presena de outro.

Agrupamento (Clustering): dividem o conjunto de itens em exame em


subgrupos com caractersticas similares. Implica na segmentao da informao
disponvel em conjuntos definidos e homogneos com base em atributos
especficos.

Sumarizao: a gerao de descries resumidas para um subconjunto de


dados resumos automticos.

Modelo de Visualizao: objetiva tornar o conhecimento mais palatvel e


compreensvel para o usurio atravs de grficos, animaes, representaes em
mapas, desenhos tridimensionais, etc.

Esse processo pode ter carter preditivo ou descritivo, de acordo com


REZENDE (2003). A predio implica generalizar exemplos ou experincias passadas
com respostas conhecidas em uma linguagem, capaz de reconhecer a classe de um novo
exemplo. As atividades de predio englobam o uso dos atributos de um conjunto de
dados para prever o valor futuro de uma determinada varivel. Por sua vez, a descrio
um conjunto de atividades que visam descobrir padres que possam ser interpretados
pelas pessoas que descrevem os dados antes de realizar a previso. A descrio a
identificao dos comportamentos especficos do conjunto dos dados, sendo estes dados
no possuem uma classe especificada. A estrutura abaixo, adaptada de REZENDE
(2003, p. 318) e GOEBEL & GRUENWALD (1999, p. 22) aponta esses processos,
atividades ou tarefas de minerao de dados.

185

6.4.4 Estratgias de Descoberta de Conhecimento a Partir da Busca Pelo Usurio

Existem duas formas descoberta de conhecimento que podemos denominar de


reativa e proativa, baseando-se na abordagem de CHOUDHURY & SAMPLER (1997).
De acordo com esses autores, na estratgia reativa, h um problema bem delimitado do
qual o usurio tem conscincia e uma viso clara do que quer, ou, pelo menos uma idia
preliminar. A informao (ou conhecimento) obtida para solucionar um problema
especfico desse usurio, que tem uma idia de como possvel obter uma soluo para
o problema. H uma percepo do usurio de como solucionar o problema e encontrar a
informao necessria. Ento, esse usurio possui alguma hiptese inicial que vai
auxiliar a atividade de descoberta. Compreendendo o interesse do usurio possvel
limitar os espao de busca na entrada e filtrar os resultados de sada.

Por outro lado, CHOUDHURY & SAMPLER (1997) descrevem a busca


proativa como um processo exploratrio, visando a identificao de possveis problemas
ou oportunidades. Nessa estratgia, o usurio no possui um objetivo claro, mas
desenvolve algumas aes com o uso de certas ferramentas que possam estar
disponveis para ele. Pode acontecer tambm que, embora possa haver um problema ou
objetivo, o usurio no consegue identificar como lidar com eles ou de que necessita
para solucionar esse problema. Diante de uma base de dados ou acervo de documentos
esse usurio deseja identificar o que pode existir de til para ele dentro deles.
Confrontando a busca proativa com o modelo de GOEBEL & GRUENWALD (1999),
apresentado no tpico 6.4.2, podemos perceber que mudam algumas etapas:

186

Na etapa inicial, de entendimento do domnio da aplicao e definio do


objetivo do processo de descoberta, percebemos que na busca proativa pode no
haver uma definio precisa do objetivo do processo, ou seja: h um objetivo ou
problema, mas a soluo no possvel de ser prevista.

No que tange ao desenvolvimento de modelos iniciais ou construo de


hipteses iniciais, na abordagem proativa no possvel fazer isso, uma vez que
o usurio no sabe ou no quer elaborar hipteses para a soluo de um
problema.

Baseando-se em KUHLTHAU (1991), podemos dizer que em um processo


exploratrio de busca proativa, o usurio comea tentando encontrar alguma forma de
conhecimento mais geral, indo posteriormente para a busca de conhecimentos mais
restritos, com informaes mais direcionadas ou especficas. Ele ento tenta reconhecer,
identificar, formular, e reunir e complementar diferentes elementos que constituem o
conhecimento de seu interesse.

6.4.5 Abordagens Tecnolgicas Utilizadas em Descoberta de Conhecimento em


Bases de Dados

O processo de descoberta de conhecimento em bases de dados engloba vrias


abordagens tecnolgicas, tais como as descritas anteriormente, especialmente no tpico
6.3 dessa tese (aprendizagem de mquina, algoritmos genticos, lgica difusa, redes
neurais, rvores de deciso, redes bayesianas, dentre outros), bem como as estratgias
de data warehousing e modelagem multidimensional, descritas no capitulo 7 desse
trabalho.

6.5 Processamento da Linguagem Natural PLN

Esse um campo que interessa, sobretudo, aos sistemas de recuperao de


informao, ou seja: sistemas que lidam com documentos textuais. O Processamento da
Linguagem Natural PLN uma subrea da Inteligncia Artificial IA, resultado da
interseo da lingstica moderna com as tecnologias desenvolvidas no campo da IA.
De acordo com RUSSEL & NORVIG (2004), a compreenso da linguagem exige a
compreenso do assunto e do contexto, no apenas a compreenso da estrutura das
187

frases. O PLN se baseia em idias de lingstica e filosofia, alm de tcnicas de


representao do conhecimento lgico e probabilstico de raciocnio. Essa rea exige
uma investigao do comportamento humano real, o que amplia o desafio. O PLN um
conjunto de aes que engloba o estudo, planejamento e desenvolvimento de
dispositivos computacionais relativos ao uso da linguagem, ou seja: a anlise e projeto
de agentes computacionais que usam a linguagem natural para adquirir informao.
A idia de linguagem est vinculada necessidade de comunicao, que
segundo RUSSEL & NORVIG (2004) pode ser entendida como:
a troca intencional de informaes provocada pela produo e percepo de
sinais extrados de um sistema compartilhado de sinais convencionais. O que
distingue o ser humano dos outros animais o complexo sistema de mensagens
estruturadas conhecido como linguagem e que nos permite comunicar a maior
parte daquilo que sabemos sobre o mundo (p. 765).

Ainda de acordo com esses autores:


Os agentes56 enviam sinais uns aos outros para atingir certos propsitos:
informar, advertir, pedir ajuda, compartilhar conhecimento ou prometer algo.
O envio de um sinal dessa maneira chamado ato de fala. Em ltima instncia,
todos os atos da fala so tentativas de fazer outro agente acreditar em algo ou
realizar algo. A linguagem consiste em sinais convencionais que transmitem
significado. (...) Os seres humanos parecem ser os nicos animais a utilizar a
gramtica para produzir uma variedade ilimitada de mensagens estruturadas.
A comunicao envolve trs etapas seguidas pelo falante: a inteno de
transmitir uma idia, a gerao mental de palavras e sua sntese fsica. Em
seguida, o ouvinte segue quatro etapas: percepo, anlise, eliminao de
ambigidade57 e incorporao do significado. Toda utilizao de linguagem
est situada, no sentido de que o significado de uma expresso vocal pode
depender da situao em que ela produzida (p.799).

De acordo com LANCASTER (2004) considera-se a linguagem natural como


sinnimo de dis curso comum, ou seja: a linguagem usada normalmente na fala e na
56

Conforme j citado, um agente algo que percebe e age em um ambiente. Pode ser identificado com o
ser humano, em um contexto social real, ou um dispositivo computacional que tenta imitar o
comportamento humano. um elemento capaz de perceber seu ambiente por meio de sensores e de agir
sobre esse ambiente por meio de atuadores. A inteligncia artificial , para tais autores, uma cincia de
projeto de agentes inteligentes, ou seja: agentes bem sucedidos para a funo que se prope e que
envolvem a inteno de simular ou atuar de forma anloga aos processos cognitivos e racionais humanos
57
Palavras e expresses podem assumir diferentes significados e posies no discurso. A multiplicidade
conceitual ou categorial que uma palavra pode assumir (ambigidade lxica) ou a multiplicidade
estrutural na representao sinttica de uma frase (ambigidade estrutural). A superao da ambigidade
exige um conhecimento do contexto, do ambiente e das relaes de um discurso ou fala, bem como dos
textos escritos.

188

escrita. Uma linguagem natural, como a lngua portuguesa, usada por um grupo
humano especfico e normalmente concede uma liberdade muito grande de uso quando
comparada a uma linguagem inventada ou formal. Essa liberdade de uso significa que
possvel representar um conjunto muito grande de mensagens e idias. As linguagens
consistem de dois elementos bsicos: um vocabulrio e uma estrutura gramatical58 ou
sintaxe.

De acordo com RUSSEL & NORVIG (2004, p. 767), uma gramtica um


conjunto finito de regras que especificam uma linguagem (p.767).

Conforme

CANADO (2005) gramtica o conhecimento da lngua, ou o sistema de regras e


princpios que governam o uso dos signos da lngua. De acordo com essa autora:

a lingstica assume que o falante de qualquer lngua possui diferentes tipos


de conhecimento em sua gramtica: o vocabulrio adquirido, como pronunciar
as palavras, como construir as palavras, como construir as sentenas e como
entender o significado das palavras e das sentenas. Refletindo essa diviso, a
descrio lingstica tem diferentes nveis de anlise: o lxico, que o conjunto
de palavras de uma lngua; a fonologia, que o estudo dos sons de uma lngua
e de como esses sons se combinam para formar as palavras; a morfologia, que
estudo das construes das palavras; a sintaxe, que o estudo de como as
palavras podem ser combinadas em sentenas; e a semntica, que o estudo do
significado das palavras. Ao conhecimento da lngua, associa-se o uso da
lngua, ou seja, o emprego da gramtica dessa lngua nas diferentes situaes,
numa rea denominada pragmtica, que estuda a maneira pela qual a
gramtica, como um todo, pode ser usada em situaes comunicativas
concretas (p. 15-16).

Nessa citao, merece um comentrio o conceito de sentena, no s pela sua


importncia lingstica, mas tambm como elemento a ser tratado pelo processamento
computacional. De acordo com PIRES DE OLIVEIRA (2001, p. 99) uma sentena (S)
pode ser definida sintaticamente pela presena de um verbo principal conjugado e,
semanticamente, pela expresso de um pensamento completo. O processamento da
linguagem natural, portanto, implica em que processos computacionais devem
considerar todos esses aspectos lingsticos acima apontados. Um sistema clssico de
PLN pode envolver:

58

De acordo com RUSSEL & NORVIG (2004), uma gramtica um conjunto finito de regras que
especificam uma linguagem (p.767). Conforme CANADO (2005) gramtica o conhecimento da
lngua, ou o sistema de regras e princpios que governam o uso dos signos da lngua.

189

Uso de dicionrios que considere palavras e suas estruturas bases e


terminaes (raiz, prefixos e sufixos)
Uso de gramticas
Presena de analisador lxico- morfolgico
Presena de ana lisador sinttico
Presena de analisador semntico grande desafio
Presena de analisador pragmtico
Presena de analisador do discurso

SALTON (1983) 59 prope modelos matemticos para especificar os processos


lingsticos e mtodos computacionais para descrever a interao entre estes modelos.
Esse autor, em coerncia com a viso lingstica supracitada, define diferentes nveis de
processamento da linguagem natural, ou do conhecimento embutido na linguagem,
quais sejam o fontico, o morfolgico, o lxico, o sinttico, o semntico e o pragmtico.
Esses nveis so comentados a seguir, conforme as contribuies dadas por ele,
incorporando contribuies de outros autores na anlise.

Nvel Fontico lida com os sons e com a compreenso da fala.

Nvel Morfolgico analisa a forma e inflexo das palavras. Procura lidar com o
processamento de partes reconhecveis das palavras, realizando anlise e/ou
retiradas de prefixos, sufixos e razes (steams) das mesmas.

Nvel Lxico tratamento em nvel de itens lexic ais. Lida com procedimentos
sobre as palavras completas. Trata do processamento de dicionrios,
substituies de palavras por classes de tesauros, por exemplo. Lida com
informaes gramaticais, como natureza e flexo. Na anlise sinttica, identifica
caractersticas lingsticas, como substantivos, adjetivos, verbos, preposies,
etc.

Nvel Sinttico lida com as estruturas sintticas. Identifica a estrutura da frase


por meio das regras de sintaxe da lngua. Analisa a disposio dos itens lexicais
em uma sentena, e das relaes existentes entre estes. Promove a decomposio
de um perodo, e de cada orao, em seus elementos (termos ou sintagmas). Um
determinado termo corresponde a um elemento de informao (contendo itens
lexicais ou palavras) e tratado como unidade funcional da orao, participando
de sua estrutura como um de seus constituintes, chamados sintagmas (unidades
sintticas), de acordo com suas funes. Em geral, nesse nvel so verificadas

59

Abordagem detalhada em SALTON (1983, Cap. 7).

190

regras de formao impostas pela linguagem, utilizando-se das informaes


lxico- morfolgicas disponveis, tais como: concordncia nominal e verbal,
regncia nominal e verbal e posicionamento dos termos na frase. Para RUSSEL
& NORVIG (2004) a anlise sinttica o processo de construir uma rvore de
anlise para uma cadeia de entrada, sendo que os ns interiores da rvore de
anlise representam os sintagmas e os ns de folhas representam as palavras.
Essa idia representada rvore estrutural de uma sentena S (abaixo). Os
componentes envolvidos na anlise sinttica so:
a. uma representao gramatical, onde esto declarados os fatos sintticos
da linguagem, as estruturas de composio dos sintagmas;
b. um procedimento de anlise, responsvel por verificar se a frase de
entrada est de acordo com estas regras gramaticais, gerando uma
estrutura hierrquica que representa a estrutura da frase analisada.

S
SN

Artigo Substantivo

Lui

SV

Verbo

Adjetivo

est

lindo

Na representao acima, S uma sentena O Lui est lindo. SN a


indicao de um sintagma nominal e SV um sintagma verbal. Conforme
RUSSEL e NORVIG (2004), a maior parte dos formalismos gramaticais se
baseia na idia das estruturas acima, que podem ser chamadas de estruturas
sintagmticas, em que a cadeia composta por subcadeias, chamadas de
sintagmas, que so elementos semnticos naturais a partir dos quais o
significado de uma expresso vocal pode ser construdo. KURAMOTO (2002)
avaliou a limitao do uso das palavras como meio de acesso informao pelos
sistemas automatizados de recuperao de informao, afirmando que apesar de
alguns deles terem alcanado relativo sucesso na melhoria da preciso de
resultados de uma busca, a meta principal da recuperao de informao, que a
obteno de todos os documentos pertinentes a uma consulta, no foi atingida.

191

Por isso esse autor advoga a inadequao do uso das palavras nesses modelos,
propondo em seu lugar, um outro tipo de unidade de informao os sintagmas
nominais, conceito da lingstica tratado no processamento da linguagem
natural.

Nvel Semntico nvel em que os elementos da estrutura sinttica so


transportados para uma estrutura de representao de conhecimento.

preocupao principal o significado. De acordo com RUSSEL & NORVIG


(2004) a interpretao semntica o processo de extrair o significado de uma
expresso vocal (ou escrita) como uma expresso em alguma linguagem de
representao.

O tratamento semntico o processo de mapeamento das

sentenas para uma representao de seu significado.

Nvel Pragmtico lida com o contexto, ou seja, com informaes adicionais


sobre o ambiente social em que documentos textuais, procurando fazer a efetiva
identificao do que realmente se quis ou se quer dizer. Busca-se entender o real
sentido do discurso, no qual o significado capturado na frase integrado ao
contexto. De acordo com RUSSEL & NORVIG (2004),
na interpretao pragmtica leva-se em conta o fato de que as mesmas
palavras podem ter significados diferentes em situaes diferentes.
Enquanto a interpretao sinttica uma funo de um nico
argumento, a cadeia, a interpretao pragmtica uma funo de
expresso vocal e do contexto ou situao em que articulada (p.
769).

O uso do processamento de linguagem natural - PLN pode ser dividido em dois


grupos, de acordo com ALLEN (1994): uso baseado em texto e uso baseado em
dilogo. O uso baseado em texto, implica na busca de documentos num banco de dados
de textos, extrao de informao de textos, traduo de documentos, resumos de textos
e compreenso de textos. Os recursos usados para operar tais aplicaes so conhecidos
como recursos ou tcnicas de PLN, sendo que o foco de interesse dessa Tese o
processamento de documentos textuais.

192

7 TECNOLOGIA DA INFORMAO E GESTO DO CONHECIMENTO


7.1 Consideraes Preliminares

No ambiente organizacional do atual cenrio mundial, as presses por


competitividade e busca de um posicionamento estratgico adequado provoca uma
demanda por capacidades de lidar com a informao que respondida com uso cada vez
mais intenso de tecnologias baseadas em recursos computacionais. Na medida em que o
conhecimento est ficando cada vez mais importante na gerao de riqueza
(STEWART, 1998), precisamos olhar para as empresas enquanto gestoras de
conhecimento. Muitos gestores, inseridos num ambiente saturado de dados,
presenciando um ritmo acelerado para produzir, controlar e explorar rapidamente o
conhecimento, percebem que necessitam de mais informao sobre sua realidade
organizacional e o contexto ambiental e mercadolgico em que se encontram. Essa
necessidade sempre existiu, mas agora se intensifica, considerando fatores, tais como:

a complexidade tecnolgica para operao de muitas organizaes modernas;

o quanto o conhecimento especializado de muitas pessoas decisivo para o


sucesso da misso da organizao;

o aumento da concorrncia no mundo inteiro;

a facilidade de se sobrepor ao mercado do concorrente, at mesmo se ele estiver


atuando do outro lado do mundo;

o tempo de durabilidade do produto que est se tornando mais e mais reduzido.

Fazer uso tempestivo e eficaz, tanto de bases de dados relacionais dos sistemas
transacionais e gerenciais, bem como dos sistemas que lidam com documentos
portanto um desafio.A implementao das propostas, tanto dos paradigmas dos sistemas
baseados em bancos de dados como dos sistemas baseados em recuperao da
informao so implementadas em determinadas plataformas e ambientes tecnolgicos.
Hoje, e cada vez mais, tais sistemas so baseados em recursos computacionais. A
tecnologia da informao inclui um conjunto de elementos, de carter computacional e
eletrnico, que viabilizam a captura, armazenagem, organizao e tratamento dos dados
de uma organizao de forma a transform- los em informaes teis para uma
organizao. So inseridos aqui todos os componentes de hardware, categorias

193

diferentes de software e metodologias de tratamento de dados e gerao de informao


til para as organizaes, sejam elas gerenciais ou operacionais. A tecnologia da
informao inclui tambm todos os processos de recuperao e disponibilizao de
informaes para o seu destinatrio final. Obviamente possumos diferentes tipos de
computadores, categorias de software, metodologias, recursos de telecomunicaes, etc.
que se inserem na categoria de tecnologias da informao. Devemos lembrar sempre
suas muitas e diferentes configuraes em cada organizao, dependendo de seus
interesses e seu fim ltimo: gerar informao til.

Os fluxos de informao so hoje altamente dependentes da tecnologia da


informao. A Tecnologia da Informao vem impulsionando fortemente o
desenvolvimento da Cincia da Informao, ampliando suas possibilidades e
valorizando suas conquistas, o que vale obviamente para a recuperao da informao e
para a gesto do conhecimento Para SARACEVIC (1992) h uma conexo inexorvel
entre ambas. SALTON (1985) indica que construes importantes da Cincia da
Informao possuem aplicaes prticas, especialmente vinculadas a sistemas de
informao, tais como modelos booleanos na recuperao da informao, modelos de
realimentao de relevncia para recuperao, redes de citao, anlise lingstica para
indexao automtica, dentre outros. Alm disso, os campos de estudo dos tesauros, da
terminologia e da classificao apiam sistemas e atividades que se ocupam da
organizao do conhecimento em suas diferentes manifestaes como, por exemplo, os
sistemas de inteligncia artificial e hipertextos. A minerao de textos ter tambm uma
forte articulao com o desenvolvimento da Cincia da Informao, servindo-se de suas
construes e ampliando suas propostas.

Para DRUCKER (1988), as empresas no possuem outra escolha a no ser


lastrear toda sua atividade em informao. A informao adequadamente identificada
para uma necessidade especfica, produzida a partir da captura de dados em fontes
precisamente mapeadas, metodologicamente tratada para atender propsitos aos quais se
destina e disponibilizada de forma tempestiva e no contexto pertinente de interao
almejado pelo usurio um elemento importante de vantagem competitiva nas
organizaes. Para fa zer com que a informao possa ser efetivamente utilizada nas
organizaes, assegurando um processo decisrio adequado, faz-se mister o uso de

194

tecnologias da informao. Obviamente que a obteno de informaes no uma


tarefa fcil, tem custos no desprezveis.

A tecnologia uma varivel das mais importantes a proporcionar conjuntos


relevantes de transformaes nas empresas contemporneas. H uma acelerao do
processo de gerao de inovaes as quais, por sua vez, tem razes no processo de
gerao de informao e conhecimento e a tecnologia pode ser considerada um lastro
desse processo. Tecnologia da informao tambm um instrumento poderoso na
viabilizao de novas estratgias empresariais. Conforme afirmam NADLER et alli
(1994):
a tecnologia da informao comeou a revolucionar o projeto organizacional
ao proporcionar alternativas hierarquia como meio principal de
coordenao. Sistemas de informao, arquiteturas comuns, bancos de dados
compartilhados, ferramentas de apoio s decises e sistemas especialistas
facilitam a coordenao do comportamento sem controle por meio da
hierarquia, permitindo com isso a criao de unidades autnomas ligadas pela
informao. Tambm permitem um acoplamento menos rgido (em oposio ao
acoplamento rgido) sem os riscos de perda de coordenao e controle. A
combinao do grande potencial de tecnologia da informao com as grandes
exigncias do ambiente competitivo levou a inovaes no projeto
organizacional (NADLER et alli, 1994)

A tecnologia da informao um campo interdisciplinar que, apoiado na Cincia


da Computao, na Engenharia de Software, Engenharia de Computao, na
Administrao e na prpria Cincia da Informao, busca construir uma base cientfica
para assuntos diversos, tais como a teoria das decises, o estudo e soluo de problemas
com algoritmos, a elaborao de programas e desenvolvimento de sistemas, o
desenvolvimento

de

dispositivos

mquinas

computacionais

eletrnicas,

estabelecimentos de redes digitais, dentre outros. O processamento automatizado de


dados a serem convertidos em informaes, especialmente pela captura de algum nvel
de inteligncia por algoritmos traduzveis em programas de computador, fez os aspectos
computacionais merecerem papel de destaque nas ltimas dcadas.

Conforme BROOKSHEAR (2000), os algoritmos tm um papel relevante para a


computao e a tecnologia da informao. Outrora estudados pela matemtica, seu
estudo ganhou maior robustez com o advento dos computadores, visando encontrar um
conjunto de comandos que fosse capaz de descrever, de maneira unificada, a resoluo

195

de qualquer problema de determinado tipo. Em seguida, esses algoritmos precisam ser


representados computacionalmente para que possa ser executado por um software em
alguma mquina. Conforme esse autor:
uma vez encontrado um algoritmo para uma determinada tarefa, sua execuo
j no depender do conhecimento dos princpios nos quais se baseia,
restringindo-se apenas a seguir instrues estabelecidas. Em outras palavras, o
algoritmo constitui uma codificao do raciocnio necessrio resoluo do
problema. por meio dessa capacidade de captar e transferir inteligncia
mediante os algoritmos que so construdas mquinas com comportamento
inteligente. Por conseguinte, o nvel de inteligncia demonstrado pelas
mquinas fica limitado pela inteligncia que um algoritmo capaz de
transportar. Somente quando for possvel obter um algoritmo que possa
controlar a operao de uma tarefa ser vivel construir alguma mquina
capaz de execut -la. Por outro lado, se no houver algoritmo capaz de executar
a tarefa, ento sua capacidade exceder as capacidades da mquina. (...) Uma
vez descoberto um algoritmo para solucionar o problema, o passo seguinte
consiste em representa -lo de forma apropriada para que seja transmitido a
alguma mquina, ou para que seja lido por outros seres humanos. Isso significa
que se torna necessrio transformar o algoritmo conceitual em um conjunto
facilmente compreensvel de comandos que representem, sem ambigidade,
essas instrues (p16-17).

Nesse contexto, estudos fundamentados em um conhecimento lingstico e


gramatical conduziram a uma grande diversidade de esquemas para a representao de
algoritmos, as chamadas linguagens de programao, baseadas em vises variadas
(paradigmas) 60 do processo de programao.

Esses aspectos demandaram recursos

importantes para sua implementao, exigindo adequados projetos para construo de


mquinas (hoje tratados especialmente pela chamada Engenharia da Computao,
focada no projeto e desenvolvimento de equipamentos computacionais) e demandando
estratgias adequadas para desenvolvimento de grandes sistemas automatizados, o que
foi respondido pelo advento da chamada Engenharia de Software.

Destarte, assumindo uma perspectiva organizacional, podemos dizer que a


tecnologia da informao inclui um conjunto de elementos que viabilizam a captura,
armazenagem, organizao e tratamento dos dados de uma organizao de forma a
transform- los em informaes teis para uma organizao. Inclui todas as estratgias
tecnolgicas de

gerao, armazenagem recuperao e entrega de informaes (ou

dados, dependendo do ponto de vista) para o seu destinatrio ou interessado final. o


resultado da convergncia de trs vetores que se encontram em trs planos distintos:
60

Paradigmas de linguagens: imperativas, declarativas, funcionais e orientadas a objeto, por exemplo.

196

conceitual, lgico e fsico. Cada um desses planos contm seus elementos especficos e
que podem ser caracterizados conforme a seguir.
Plano Conceitual. Elementos Conceituais e Metodolgicos: abordagens e critrios
para desenho da arquitetura lgica de sistemas de informao e desenvolvimento de
software. Inclui todas as ferramentas de modelagem de dados, construo de sistemas
e desenho de seu projeto conceitual e lgico. Essas abordagens se apiam em algum
dos paradigmas descritos no s captulos anteriores. Como, por exemplo, dentre outras,
temos as diversas abordagens para lidar com a organizao de dados, como o modelo
relacional, as propostas para desenvolvimento de sistemas, tais como a Anlise
Estruturada, o Processo Unificado para a Orientao a Objetos e as abordagens de
planejamento da arquitetura da informao estratgica, tais como os Fatores Chave
de Sucesso - FCSs e o Balanced Scorecard - BSC. Tambm podemos considerar os
modelos dos sistemas de recuperao da informao, descritos no capitulo 5, dentro
dessa perspectiva.
Plano Lgico. Os Softwares: todos os sistemas desenvolvidos sob forma de
programao computacional articulada para atender a um determinado objetivo e
com um conjunto de funes previamente definidas. Na Cincia da Computao,
algoritmo um conceito fundamental e no domnio dos computadores os algoritmos
so representados atravs dos programas. Um software um conjunto de programas
que, por sua vez, expressam algoritmos, visando atender a uma determinada
finalidade. Incluem-se aqui todos os softwares desenvolvidos por uma organizao
ou adquiridos de terceiros. Esses softwares podem ser aplicativos especficos para
melhorar ou automatizar funes organizacionais, bem como softwares de suporte
essencial, como os bancos de dados, navegadores da Internet e as linguagens de
programao.
Plano Fsico. A Infra-estrutura ou Hardware: inclui todos os equipamentos e recursos
fsicos utilizados para o processamento, tratamento e disponibilizao de dados.
Computadores pessoais, servidores ou mainframes, cabos e redes de fibra ptica,
modens e impressoras so bons exemplos. Com o advento e aprofundamento do uso
da Internet importante considerar, tambm, estruturas que no passado
classicamente no se ajustavam a essa categoria agora passam a fazer parte dela cada
197

vez mais, como a infra-estrutura de telecomunicaes caracterizando o fenmeno da


convergncia digital possibilidade aberta pela interseo da Tecnologia da
Informao com as tecnologias de comunicao de dinamizar no s a oferta de
informao, mas facilitar sua publicao, proporcionando interatividade.

A tecnologia da informao nas organizaes comeou a ser utilizada nos anos


60 para melhorar o desempenho de tarefas bsicas automatizando rotinas como as de
contabilidade e folha de pagamento de pessoal. A partir de ento, muitas aplicaes para
problemas de todas as ordens esto sendo alvo do esforo computacional em aplicaes
chamadas operacionais - ou seja - problemas do dia-a-dia das organizaes. Com o
tempo, os sistemas de informao passaram a trabalhar cada vez mais integrados uns
aos outros, de forma que uma ao em um sistema de informao gerasse reflexos em
outros sistemas e esse ambiente recebe o nome de transacional. 61 Transaes so
eventos vinculados nos sistemas de informao. Por exemplo, uma venda registrada no
sistema de vendas, tem um reflexo no sistema de estoques. Por outro lado, temos
tambm os sistemas voltados para suporte deciso, com capacidade de gerar
informao com maior valor agregado. A busca por informaes estratgicas, mais
elaboradas, capazes de propiciar uma melhor tomada de decises por parte das
organizaes, foi uma primeira vertente para lidar com a tecnologia da informao
sustentando uma estratgia de uso do conhecimento nas organizaes.

A partir do final dos anos 70, ferramentas de software para apoio a deciso
gerencial comeam a se popularizar no ambiente organizacional. No que tange a
softwares, em meados dos anos 80, a tecnologia dos Sistemas de Informao Executiva
(os Executive Information Systems - EIS, softwares desenvolvidos especificamente para
o processo de tomada de deciso gerencial e baseados em Fatores Chave de Sucesso)
comeou a produzir mudanas significativas no processo de gesto da informao
estratgica nas organizaes.

No final dos anos 90, comeam a surgir softwares

baseados na viso do BSC.

61

Uma classificao que divide os sistemas de informao em duas categorias, sistemas de


processamento de transaes e sistemas de suporte deciso proposta por DHAR,V. & STEIN, R. em
Seven Methods for Transforming Corporate Data into Business Intelligence. USA, Prentice-Hall, 1997.
A primeira categoria visa o registro detalhado das operaes e fatos relevantes de todas as atividades de
negcio, tendo por nfase a validade e depurao das bases de dados. A segunda categoria apia os
gestores de negcio no processo de tomada de deciso, considerando uma viso de longo prazo.

198

Na verdade hoje, tanto o ambiente de informao transacional, quanto o


gerencial mudaram significativamente. No campo dos sistemas transacionais, o final
dos anos 90 assistiu ao crescimento dos chamados softwares de gesto integrada, os
ERPs - Enterprise Resources Planning. Conforme COLANGELO FILHO (2001), no
h uma definio precisa do que seja um sistema ERP, mas de acordo com ele uma
plataforma de software que permite:
automatizar e integrar parcela substancial de seus processos de negcios,
abrangendo finanas, controles, logstica (suprimentos, fabricao e
vendas) e recursos humanos;
compartilhar dados e uniformizar processos de negcios;
produzir e utilizar informaes em tempo real (p. 17) .

TURBAN (2003) salienta que tais sistemas esto mais vinculados atividade
fim da empresa, e que visa:
coordenar todos os recursos materiais, de produo e de economia global
existentes dentro de uma empresa, geralmente vinculando todas as reas
funcionais que contribuem de alguma maneira para a produo de determinado
produto (p. 12).

O conceito de ERPs est, portanto, fortemente vinculado idia de integrao


da empresa como um todo em uma nica plataforma de software, com mdulos plug
in

62

dedicados a cada funo, como compras, vendas e produo. O ERP demanda e

promove a criao de uma grande base de dados corporativa nas organizaes.


Conforme afirma CORRA, et alli (1999):
A tendncia parece claramente indicar que as estruturas dos ERPs sero
utilizadas pelas empresas como as fundaes (a grande base de dados
corporativa para apoio tomada de deciso, principalmente operacional) dos
sistemas de informao das empresas (CORRA, et alli, 1999:344).

Entretanto, os ERPs enfrentaram (e ainda enfrentam) muitos problemas de


implantao e precisam ainda de um esforo estratgico mais denso para consolidar seu
verdadeiro papel nas organizaes. Focam mais aspectos da operao do que da gesto
organizacional propriamente dita.

62

Em geral, adquiridos sob a forma de pacotes comerciais de software.

199

A utilizao de estratgias tecnolgicas que sustentem a viso de valorizao e


melhor aplicao do conhecimento organizacional ganha bom impulso com o uso de
tecnologias da informao, com o uso de bancos de dados, redes de computadores e
metodologias de tratamento da informao, como o Balanced Scorecard, os Fatores
Chaves de Sucesso. Da mesma forma, a construo de intranets com a mesma lgica
de liberdade da rede mundial de computadores pode estimular a gerao e
disponibilizao do conhecimento em organizaes que estimulem uma viso de
organizao em rede de pessoas e comunidades internas Pessoas, reas, atividades de
projetos podem interagir entre si compartilhando suas experincias, em sites internos
e em grupos informais. importante, entretanto, que a estratgia possua um nvel de
articulao mnimo, ou seja, uma estrutura, um framework com intencionalidade
organizacional que a permita efetivamente gerir, organizar e disseminar o
conhecimento. Podemos ento considerar a taxonomia como um elemento chave e que
tem um componente poltico e ideolgico na medida em que faz opes. Esse elemento
poltico- ideolgico est ligado natureza da organizao, s suas intenes estratgicas.
Portanto, s suas escolhas, planos e padres de atuao no ambiente. Por exemplo, a
taxonomia do conhecimento poderia se orientar por funes organizacionais, tais como
produo e marketing ou poderia se orientar por processos, tais como manufatura e
comercializao.

Poderia ainda ser organizada por assunto, tais como produtos,

pessoas, recursos financeiros.

A perspectiva do estudo da gesto do conhecimento com foco na tecnologia est


vinculada anlise dos instrumentos e ferramentas que podem mediar o processo de
gerao, reteno e reutilizao da informao que sustenta o conhecimento pela
organizao e que por isso mesmo envolvem pessoas, metodologias e tecnologias da
informao. A informao, conforme analisa CHOO (2003) matria-prima do
cotidiano do ser humano e para isso ele tem os cinco sentidos que captam as mensagens
do ambiente. Considera-se que a tecnologia da informao tem papel chave no processo,
com utilizao de estruturas web e portais corporativos, com tendncia a forte
crescimento, processos de educao distncia e estratgias de data warehousing, data
mining, web mining e text mining. No contexto da presente tese, destacaremos os
seguintes suportes gesto do conhecimento que podem ser ofertados pela tecnologia
da informao:

200

Gerao de informao estratgica atravs metodologias relativas ao tratamento da


informao gerencial e suas tecnologias de implantao, como data warehousing;
As aplicaes de software oriundas de aplicao de propostas das reas de descoberta
de conhecimento (ou sistemas inteligentes) e recuperao da informao, tais como a
minerao de dados e a minerao de textos;
As aplicaes de software oriundas do campo da computao colaborativa, tais como
as ferramentas de correio eletrnico e workflow;
As aplicaes de gesto eletrnica de documentos, uma vez que apiam a gerao e
administrao das bases de dados textuais nas organizaes e o conhecimento
humano mais fcil de ser expresso (codificado) na linguagem natural presente nos
documentos;
As aplicaes de portais corporativos, uma vez que, conforme j citado, so software
que permite configurar uma rede de computadores de uma organizao (intranet) de
forma dinmica no sentido de integrar distintos repositrios de contedos de
informao sob um mesmo ambiente de acesso a eles. Atravs de um portal, desde
que esteja devidamente credenciado, o usurio tem acesso a quantos repositrios de
dados e documentos que a sua organizao possui.

7.2 Informao Estratgica no Suporte Gesto do Conhecimento

Na medida em que evoluam os sistemas de informao, a partir dos anos 80, no


seio das organizaes, as empresas foram percebendo o potencial da tecnologia para
gerar uma viso delas mesmas e do ambiente em que se encontravam, buscando
melhorar seu posicionamento estratgico. Entretanto, as informaes que lastreavam
essa viso estratgica no eram as informaes transacionais, mas aquelas que foram
gradativamente ganhando o nome de estratgicas ou decisrias, em um primeiro
momento. Por informaes estratgicas ou decisrias entendemos aquelas informaes
que no esto diretamente vinculadas ao controle rotineiro da atividade operacional da
organizao, mas que tem por finalidade subsidiar o posicionamento ou a escolha
organizacional em decises importantes 63 . So, portanto, informaes das quais
sobremaneira emergem o conhecimento necessrio para definies estratgicas, gerao
63

Para uma anlise minuciosa dessa questo, consultar TURBAN, E. et allli. Decision Support Systems
and Intelligent Systems Upper Saddle River: Prentice Hall, 1998

201

de inovaes e mudanas em rumos, processos e produtos da organizao.

Tais

informaes podem ser, por exemplo, indicadores sobre nvel de satisfao dos clientes,
histricos sobre comportamento de vendas de grupos de produtos por regio e
segmentadas por cliente ou tipo de cliente, informaes sobre o comportamento de
variveis financeiras como custos diretos e indiretos por processo ou produto,
comportamento de mercados dentre outros. E com o tempo, novas expectativas
surgiram. Tais informaes se distinguem do que podemos chamar de informaes
operacionais, ou do dia-a-dia, como por exemplo o registro contbil de uma transao
de venda a cliente ou compra de fornecedor, muito embora essa informao operacional
possa ser embutida na informao estratgica ou decisria, ou seja: para se chegar a
uma informao estratgica sobre comportamento de vendas numa regio, por exemplo,
foi preciso considerar uma base de dados que registrou as transaes de vendas em
diversos perodos e diversas regies. Por isso as organizaes passaram a considerar
importante a adoo de metodologias e estratgias tecnolgicas que possam viabilizar a
identificao, desenho e extrao do que chamamos de informao estratgica ou
decisria das bases de dados das organizaes, informaes essas que, do nosso ponto
de vista, se constituem num dos elementos motores da gerao de conhecimentos que
interessam a uma organizao. por essa razo que voltamos nossa ateno para
Fatores Chave de Sucesso (FCSs) e Balanced Scorecard (BSC), duas abordagens que
selecionamos e consideramos relevantes nessa perspectiva no ambiente contemporneo.

Conforme descreve FURLAN (1997), os FCSs descrevem aquelas poucas


coisas que devem ocorrer de modo correto, mesmo em detrimento de outras que no
estejam indo a contento. Esse autor tambm descreve a origem dessa abordagem:
Fator Chave de Sucesso uma teoria lanada como resultado da pesquisa
pioneira de John F. Rockart do MIT - Massachusetts Institute of Technology
em 1979. Desde ento seu uso tem sido verificado em uma infinidade de
projetos em todo o mundo como parte da metodologia de planejamento
estratgico. A base dos estudos desenvolvidos pelos pesquisadores do MIT foi o
principal executivo da organizao; no entanto, estudos subseqentes
demonstraram que os fatores chaves de sucesso podem ser teis para o nvel
intermedirio de deciso, responsvel por uma ou mais reas funcionais. Os
FCSs, se satisfatoriamente atendidos, garantem o desempenho competitivo da
organizao, mesmo se outros fatores menos relevantes forem negligenciados.
Conseqentemente, tais fatores deveriam receber cuidadosa ateno por parte
da gerncia executiva. A situao atual pode ser continuamente monitorada
atravs da anlise dos indicadores de desempenho. Poderamos dizer que os
fatores chaves de sucesso apresentam uma viso estratgica que considera no

202

apenas o momento atual mas, principalmente, aspectos mais permanentes e


abrangentes do negcio. (FURLAN, 1997: 12-15).

A aplicao do mtodo implica na identificao dos fatores chave, a partir dos


objetivos da organizao, e de indicadores de performance que permitem monitorar
esses fatores chave. Esses indicadores so sustentados por sistemas que geram a
informao que lhes corresponde.

Em termos de metodologias de planejamento de sistemas de tratamento da


informao estratgica, surge na dcada de 90 o Balanced Scorecard 64 , cuja a idia
central e viabilizar mais concretamente a ao estratgica. Pode-se tentar buscar vises
que procuram conciliar aspectos das duas escolas de pensamento supra citadas.
KAPLAN e NORTON (1997) iro apresentar a metodologia BSC - Balanced
Scorecard.- ou Marcador Balanceado e que definido para cada empresa de acordo com
sua estratgia, constituindo um instrumento para gerenciar sua implantao.

Na viso

destes autores:
O BSC traduz a misso e a estratgia das empresas num conjunto
abrangente de medidas de desempenho que serve de base para um
sistema de medio e gesto estratgica. O BSC continua enfatizando a
busca de objetivos financeiros, mas tambm inclui os vetores de
desempenho destes objetivos. O scorecard mede o desempenho
organizacional sob quatro perspectivas equilibradas: financeira, do
cliente, dos processos internos da empresa e do aprendizado e
crescimento. O BSC permite que as empresas acompanhem o
desempenho financeiro, monitorando ao mesmo tempo o progresso na
construo de capacidades e na aquisi o dos ativos intangveis
necessrios para o crescimento futuro (KAPLAN e NORTON,
1997: 2).

Realmente, o desempenho de um negcio no pode ser medido em uma nica


dimenso. Por exemplo, o lucro de uma empresa um aspecto importante do seu
desempenho, mas sozinho no indica que a empresa est bem ou mal. KAPLAN E

64

O Balanced Scorecard (marcador balanceado) pode ser considerado como uma metodologia de
planejamento e definio de sistema de informao estratgica na medida em que procura apresentar uma
srie de conceitos e uma estrutura de organizao dessa informao para medir o desempenho
organizacional e subsidiar a tomada de posio da organizao. Essa viso deve ser balanceada, isto :
incluir no s a viso do resultado financeiro, mas tambm outras trs dimenses importantes, conforme
exposto nesse trabalho. claro que, visto numa perspectiva mais ampla, no se reduz a metodologia, mas
sua aplicao em conexo com sistemas de informao orienta o uso da tecnologia da informao e faz
com que seu uso seja direcionado por sua perspectiva no desenho de sistemas.

203

NORTON (1997) desenvolveram o sistema de medio supracitado, conforme


apresentado na figura abaixo.
Resultado
Financeiro

Imagem para
o cliente

DESEMPENHO
DO
NEGCIO

Processos
Internos do
Negcio

Crescimento e
Aprendizagem

Figura 27: O Balanced Scorecard fornece a estrutura necessria para a traduo da estratgia em
termos operacionais. Fonte: Adaptado de KAPLAN E NORTON (1997: 10)

Em cada uma dessas dimenses , so usados vrios indicadores, relacionados s


estratgias da organizao. As quatro dimenses do desempenho compreendem:
Resultados Financeiros: lucro, crescimento e composio da receita, reduo de
custos, melhoria da produtividade, utilizao dos ativos e estratgia de
investimentos;
Posio em relao aos clientes: participao no mercado, reteno de clientes,
aquisio de novos clientes, satisfao dos clientes, rentabilidade dos clientes,
qualidade do produto, relacionamento com clientes, imagem e reputao;
Processos internos do negcio: inovao (desenvolvimento de novos produtos e
processos), operao (produo, distribuio vendas) servios ps vendas
(assistncia tcnica , atendimento a solicitaes do cliente);
Aprendizagem e crescimento: desenvolvimento de competncias da equipe,
infraestrutura tecnolgica, cultura organizacional e clima para a ao.

204

Tanto os Fatores Chave de Sucesso quanto o Balanced Scorecard passaram a ser


utilizados como referncias conceituais para definio de sistemas de informao que
visam atender necessidades estratgicas de informao, como demonstram a
incorporao desses conceitos em produtos das empresas Microsoft, no produto SQL
Server 2000 (Banco de Dados) e SAP, no produto My SAP mesmo sendo um ERP.

No campo do tratamento tecnolgico da informao decisria ou estratgica,


especialmente nos nveis gerenciais e tcnicos mais altos na estrutura das organizaes,
as tecnologias gerenciais evoluem nos anos 90 para o conceito de data warehousing,
forada por suas crescentes necessidades de conhecimento, Por data warehousing
entendemos um conjunto de novas tecnologias de armazenagem e gerao de
informao agrupando desde novos conceitos e abordagens em bancos de dados at
novas vises de sistemas inteligentes que incorporam alguns recursos da chamada
inteligncia artificial. O uso da inteligncia artificial (ou sistemas inteligentes) no
ambiente corporativo para tratar as bases de dados j existentes nas organizaes fez
surgir o conceito de minerao de dados ou data mining. Dedicaremos o prximo tpico
ao ambiente data warehousing e ao data mining, tendo em vista sua relevncia para a
gesto do conhecimento e o crescente impacto que esse conjunto de tecnologia vem
tendo no processo decisrio das organizaes conforme analisaremos a seguir.

7.2.1 Data Warehousing , Minerao de Dados e Minerao de Textos

Dentre as tecnologias que sustentam na organizao o processo de gesto do


conhecimento, podemos salientar os processos de data warehousing, data mining e text
mining. LANCASTER (2004) faz uma critica severa ao uso das expresses data mining,
text mining e data warehouse, afirmando que as mesmas merecem ser desprezadas,
alegando que tratam-se de estratgias tecnolgicas j definidas no passado como
descoberta de conhecimento. E tem razo, pois j h mesmo linhas de pesquisa e
estudo que usam a expresso descoberta de conhecimento. O autor da presente tese
concorda com as afirmaes de LANCASTER (2004) ponderando, entretanto, que tais
expresses j se difundiram enormemente, no s no campo comercial, mas tambm
acadmico e por isso sero utilizadas, porm com tais ressalvas 65 . Muitas vezes a
65

Ver: Uma Nota Sobre Terminologia (e a redescoberta da roda) in: LANCASTER. (2004): p. x-xiv.
Esse autor afirma que a atividade de minerao, em seu sentido literal, jamais poderia ter sido usado

205

prpria pesquisa sobre tais assuntos impossvel caso no se use a terminologia


utilizada comercialmente e que foi absorvida tambm em grande extenso pela pesquisa
acadmica. Alm disso, importante salientar que, no caso da implementao de um
data warehouse no se usam, em geral, modelos e tcnicas oriundas da rea de
inteligncia artificial, como o caso dos processos tecnolgicos denominados
originalmente descoberta de conhecimento. Tambm importante salientar que, na
literatura da rea de Banco de Dados, Data warehousing e data warehouse so termos
que representam realidades diferentes: o primeiro termo representa um conjunto de
tecnologias que inclui bases de dados e softwares de tratamento e extrao de dados. O
segundo termo representa apenas um dos elementos desse conjunto que a base ou
armazm de dados, mas que isoladamente, acaba no tendo muito significado e sentido
prtico. Abordaremos nas sees 7.2.1.1 e 7.2.1.2 as idias de data warehousing e
minerao de dados, respectivamente. No que tange tecnologia de minerao de
textos, ou text mining (que pode tambm ser vista como um tipo especfico de data
mining para textos), realizaremos sua abordagem no capitulo 8. Essa viso panormica
importante uma vez que essas tecnologias so, em geral, utilizadas em torno de um
mesmo eixo: a inteligncia e o conhecimento embutido em dados e documentos. Por
isso, no final dos anos 90, um novo termo surgiu para caracterizar tal eixo nas
organizaes: o de business intelligence.

7.2.1.1 Data Warehousing Processo de Gerao de Informaes Estratgicas

Os sistemas de informaes gerenciais e/ou softwares de aplicaes estratgicas


passaram a utilizar recursos de modelagem multidimensional embutidos na viso de
data warehousing para atender adequadamente s proposies dos modelos dos fatores
chaves de sucesso e do balanced scorecard, acima descritos. Data warehousing
(literalmente: armazenagem de dados, mas com um sentido de guarda seletiva de
informaes previamente definidas como relevantes para processos decisrios) uma
estratgia tecnolgica que significa organizar de maneira inteligente bases de dados
organizacionais de forma a permitir que o processo decisrio seja otimizado por uma

como analogia aos processos tecnolgicos aqui descritos. O autor critica tambm o uso das expresses
taxonomia e ontologia as quais substituram a palavra classificao ou esquema de classificao
dependendo do trabalho em que aparecem. Lembra que alguns autores execraram a substituio de
classificao por ontologia e tambm critica o fato da palavra ter sido alvo de substituio por
categorizao.

206

adequada classificao das informaes a partir da separao entre dados estratgicos e


operacionais. Um data warehouse um banco de dados organizado de forma especfica
para atender s necessidades de informao estratgica e gerencial. Data warehousing
um ambiente de transformao dos dados em informao

66

, atravs de metodologias

especficas e utilizao de ferramentas de extrao, manipulao e explorao.


resultado de uma convergncia de diferentes tecnologias, tais como bancos de dados,
interfaces grficas, computadores com alto poder de processamento e/ou processamento
paralelo, sistemas operacionais de rede, discos rgidos com grande capacidade de
armazenamento e velocidade acesso e, especialmente, o modelo OLAP (Um Lenhe
Analytical Processing), etc. tornando vivel o melhor uso de informaes geradas nos
diversos sistemas transacionais, no ERP, ou obtidas externamente. O ponto central a
idia de armazm de informaes, ou data warehouse, uma base especfica para
informaes relevantes ou estratgicas para a organizao.

Vrios termos tcnicos

surgiram associados a esse, ganhando espao e interesse nas organizaes, tais como
OLAP, data mining, modelagem dimensional, dentre outros. Portanto, data
warehousing um processo que suportado por um nmero de diferentes produtos de
tecnologia e servios profissionais de tecnologia de informao
Conforme INMON (1996)

67

um data warehousing uma rea de

armazenamento de informao para suporte a deciso, ou, num sentido mais amplo, de
informao geradora de conhecimento sobre operao, produo, resultados, produtos,
mercados, ou quaisquer variveis consideradas estratgicas para a organizao. Ele
coleta dados a partir de diversas aplicaes em um sistema operacional de uma
organizao, integra os dados em reas lgicas de assuntos dos negcios, armazena a
informao de forma que ela fique acessvel e compreensvel a pessoas no tcnicas
responsveis por tomadas de decises e entrega informao aos tomadores de deciso
atravs da organizao e definio de vrias ferramentas de relatrio e busca.

Na

perspectiva desse autor:

66

No sentido que coleta, articula, armazena e disponibiliza dados j existentes em outros sistemas da
organizao e conferindo a eles um novo desenho, adequado ao processo de tomada de decises, processo
esse fortemente estudado por CHOO (2003).
67
Esse autor o pioneiro na definio de conceitos e metodologias nessa rea, no incio dos anos 90. Ver
INMON, William H. Buiding the data warehouse. John Wiley & Sons, Inc. USA, 1996

207

Os dados so organizados por rea de assunto: reas de assunto representam


uma coleo de todos os dados na organizao que pertenam a um tpico que
considerado importante para um tomador de deciso. Por exemplo, o assunto
"trens" pode conter toda informao disponvel a partir de diferentes sistemas
operacionais sobre a histria do movimento das mquinas locomotivas e carros
ao longo de um sistema ferrovirio.

Os dados so integrados: Os dados devem ser transformados em formatos


comuns de medida, referncia e armazenamento para que se tornem teis. Por
exemplo, uma companhia de seguros pode ter informao sobre diferentes
aplices de um mesmo agente, armazenada em diversos bancos de dados,
utilizando tecnologias radicalmente diferentes. Para tomar decises efetivas
sobre o relacionamento total com os clientes, os dados precisam ser
apresentados em um formato comum. Alm disso, se a companhia est para
tomar decises referentes a lucros, ela deve concordar em regras comuns de
negcios tais como a mensurao da lucratividade.

O "warehouse" no voltil: A informao carregada no warehouse e ento


acessada para a tomada de deciso. Isto contrasta com um sistema operacional
que atualizado to logo um novo evento ocorra. Ento, por exemplo, o
warehouse no ser modificado to logo um cheque for compensado no banco.
Essa mudana ser refletida no carregamento subseqente da informao no
data warehouse, quando ser ento detectada por um analista que estiver
procurando por todos os relatos que indiquem uma tendncia particular.

A informao orientada pelo tempo (dimenso bsica e comum em toda


modelagem): O data warehouse uma seqncia de snapshots (instantneos
como se fossem fotos de um determinado momento especfico) de
informao organizacional tiradas em intervalos de tempo pr-definidos, tais
como todos os dias ou uma vez por semana. Isso significa que, por exemplo, um
analista de vendas em uma fbrica de chocolate pode analisar trs anos de
histrico de vendas com snapshots de informao que foram coletadas no final
de cada ms ou semana.

208

Ento, por data

warehouse

podemos

entender

uma

modalidade

de

implementao de base de dados informacional computadorizada voltada ao


armazenamento de dados compartilhveis, obtidos a partir dos ambientes de base de
dados operacionais. Trata-se de uma base de dados temtica, ou por assuntos, que
permite aos usurios penetrar o vasto repositrio de dados operacionais de uma
corporao para subsidiar mais eficazmente um processo decisrio e/ou fazer frente s
tendncias de negcios, facilitando esforos de planejamento. Seu princpio
fundamental afirma que as bases de dados nos sistemas de suporte deciso ou
qualquer sistema que trate informaes estratgicas e mais refinadas, devem ser isolados
dos sistemas transacionais. Tais bases devem desenhadas especificamente para
finalidades estratgicas e de tomada de deciso. Assim, podem ser alimentadas pelos
sistemas transacionais - mas no utilizadas por eles - e seu desenho deve privilegiar o
desempenho das consultas. uma tecnologia de armazenamento estratgico de
informao e que vem ganhando cada vez mais espao dentro das organizaes e que
pode ser utilizada na construo de bases de dados de conhecimento coletivo. Essa base
de dados constituda com uma abordagem diferente dos bancos de dados relacionais,
cujo princpio fundamental o relacionamento de mltiplas tabelas entre si68 .
Diferentemente, no data warehouse a modelagem de dados chamada de
multidimensional, ou seja: ao invs de considerar tabelas, considera dimenses de
informao. Em sua obra clssica sobre o assunto, KIMBALL (1996) afirmar:

Modelagem dimensional um nome novo para uma tcnica antiga usada para criar
bancos de dados simples e compreensveis. Quando um banco de dados pode ser
visualizado como um cubo contendo trs, quatro, ou at cinco ou mais dimenses,
as pessoas conseguem fatiar esse cubo em qualquer de suas dimenses. (...)
Experimentemos um exemplo simples. Imagine um negcio em que o CEO descreva as
atividades da empresa da seguinte forma: vendemos Produtos em vrios Mercados e
avaliamos nosso desempenho ao longo do Tempo. Muitas pessoas consideram fcil
imaginar esse negcio como um cubo de dados, com legendas em cada uma das arestas
do cubo, como mostra a figura abaixo. Qualquer ponto no interior do cubo est na
interseo das coordenadas definidas pelas arestas do cubo. Para o exemplo citado,
legenda mos as margens do cubo como Produto, Mercado e Tempo ( KIMBALL,
1996:Introduo p. xviii).
68

Assunto j abordado no Capitulo 5. Na grande maioria das organizaes contemporneas, o uso de


bancos de dados vem seguindo os princpios do modelo relacional proposto por E.F CODD (1969) e que
consiste de mltiplos relacionamentos entre diversas tabelas, criadas atravs de sistemas gerenciadores
de bancos de dados e que se sevem de implementaes a partir da tcnica da anlise de entidades e
relacionamentos, a qual no objeto de estudo direto dessa dissertao. A abordagem multidimensional,
aqui especificada, uma alternativa proposta a essa tcnica, para tratar informaes gerenciais e
estratgicas, mas sem exclu-la completamente, tendo em vista que a maioria das organizaes atualmente
continua a operar com bancos de dados relacionais.

209

A figura 28 abaixo, adaptada da obra de THOMSEN (1997) e de KIMBALL


(1996) apresenta a idia desses autores sobre modelo multidimensional e o
processamento analtico em tempo real (On Line Analytical Processing - OLAP). Nessa
figura, por mercado entenda-se a regio na qual o mesmo se encontra subdividido.
Conforme lembra esse autor, Isso permite que os dados sejam separados e combinados
usando-se qualquer medio possvel do negcio.

P
R
O
D
U
T
O
TEMPO

Figura 28: O modelo multidimensional de um negcio: cada ponto do cubo contm as


medies para a combinao especfica de produto, mercado e regio.
Fonte: Adaptado de KIMBALL (1996: Introduo) e THOMSEN (1997: 83)

Entretanto, como a maioria dos bancos de dados nas organizaes relacional, a


implementao de sistemas de informao, voltados para descobrir conhecimento com
valor estratgico (para apoiar decises), com base nessa abordagem tornou-se bastante
complexa. Realmente, a maioria dos sistemas das organizaes continua no ambiente
transacional, chamado de OLTP - On-line Transaction Processing (processamento de
transaes on- line) responsvel por registrar e manipular dados de transaes cotidianas
de uma organizao. Uma transao um evento completo com uma ou mltiplas
seqncias relacionadas. Por exemplo, uma compra em um supermercado ter vrios
impactos nos sistemas e bancos de dados: registro no sistema de faturamento, registro
de retirada em estoque e contabilizao. nesse ambiente que se encontram todos os
sistemas e aplicaes direcionadas ao dia-a-dia operacional da empresa. Esse ambiente
opera com dados excessivamente detalhados, isto , organizados por transao e por

210

isso inadequado aos sistemas de apoio a deciso. Novamente KIMBALL (1996)


aponta:
a despeito de todas essas diferenas, continuamos a usar os princpios e
ferramentas OLTP para projetar nossos bancos de dados de data warehouse.
(...) As tcnicas e padres de projeto apropriados para o processamento de
transaes so inadequadas e at mesmo destrutivo para projetos de data
warehouse ( KIMBALL, 1996: Cap1).

A questo se apia basicamente na modelagem de bancos de dados relacionais,


at ento realizada no chamado modelo de entidade-relacionamento e voltada para o
ambiente OLTP. Mas o problema vem sendo solucionado no tanto com novos
softwares de gerenciamento de bancos de dados, mas com artifcios metodolgicos para
modelagem de dados69 . Como a grande maioria das organizaes possui grandes bases
de dados operacionais modeladas segundo no ambiente relacional, urgia criar-se uma
abordagem metodolgica que viabilizasse a idia da modelagem por dimenses usando,
porm o prprio SGBD relacional existente numa determinada organizao, o que se
consolidou com o modelos como o estrela star model.

O modelo estrela assume que existem apenas dois tipos de tabelas: as de


dimenso e de fatos. De acordo com NETO (1998), o diagrama estrela a principal tipo
de modelo multidimensional. Nele, h uma tabela central, dominante, com muitas
junes, conectando-se a outras tabelas, as tabelas de dimenso, as quais possuem
apenas uma juno com a tabela central. As tabelas de fatos tem caracterstica
agregadora, promovendo a articulao das dimenses. As tabelas de dimenso no
podem relacionar-se entre si, mas apenas com a tabela de fatos. Uma tabela de fatos
armazena medies numricas do negcio. Cada uma das medies obtida com a
69

Para viabilizar tecnicamente a implementao de data warehouses, numa perspectiva muldimensional,


mas considerando que a maioria das bases de dados das organizaes esto implementadas em sistemas
gerenciadores de bancos de dados SGBDs de natureza relacional, foram desenvolvidos processos
metodolgicos para evitar que as organizaes no precisassem abandonar seus SGBDs relacionais,
como por exemplo os definidos pelos uso de softwares ORACLE, SYBASE, IBM DB2 ou Microsoft
SQL SERVER. Surgiram ento, dentro da perspectiva de modelagem multidmensional, as tcnicas
modelo estrela star model (com suas variaes galaxies e constellations schemas) e modelo floco
de neve snowflake model. Para uma viso mais detalhada desse assunto, que abordaremos aqui
superficialmente, ver o artigo Mapeamento entre os modelos E/R e Star.
NETO, Roberto
DCC/NCE/UFRJ. Rio de Janeiro, 1998 e KIMBALL (1998). bom tambm pontuar que surgiram, ao
longo da dcada de 90, softwares gerenciadores de bancos de dados multidimensionais que no se
consolidaram no ambiente corporativo, justamente pelo grau intensivo de uso dos SGBDs relacionais
que deviam, ento ser ajustados para um novo fim: gerar informao gerencial atravs da implementao
de modelos como estrela e floco de neve.

211

interseo de todas as dimenses. A figura 29, abaixo, detalha um exemplo que


comeou a ser discutido na Figura 29 na apresentao da modelagem multidimensional.
O modelo estrela tem grande poder de visualizao de informaes quando comparado
com o modelo relacional. Evita redundncia de dados e campos de tabelas e promove
uma melhor capacidade de percepo e agregao de informaes. , portanto, o grande
recurso de ordem metodolgica que permitiu a expanso da rea de data warehousing
nas organizaes.

Modelo Estrela
Dimenso
Produto

Dimenso
Regio
Tabela de Fatos

Dimenso
Tempo

produto_key
tempo_key
regio_key
varivel 1
varivel 2

Dimenses: possveis formas de visualizar os dados. Por exemplo, tempo, regio, produto
Variveis: medidas numricas. Por exemplo, quantidade estocada, vendas, lucro
Tabela de Fatos: Tabela central do modelo estrela que permite a associao entre dimenses
Figura 29: Modelagem Multidimensional de Dados Para o Processo Decisrio no Modelo Estrela
Fonte: Adaptado de KIMBALL (1996: 27-29)

7.2.1.2 Minerao de Dados (Data Mining)

Alm dos sistemas de informaes gerenciais que utilizam estratgias de


modelagem multidimensional, outro recurso de prospeco em bases de dados a
descoberta de conhecimento em bases de dados ou minerao de dados, j analisada no
tpico 6.4 da presente tese. A abordagem de data mining dispe de vrias tcnicas para
a execuo dessas tarefas, tais como tratamento estatstico, algoritmos genticos, lgica
fuzzy e redes neurais (apresentadas no tpico 6.3 desse trabalho ).

212

Quando determinados padres de comportamento, como associao de produtos


durante um processo de compras, por exemplo, comeam a se repetir com freqncia, as
ferramentas data mining indicam a presena de oportunidades e "insights" em relao
quele pblico consumidor. O diferencial de processos de data mining est no fato de
que as descobertas de padres se do por uma lgica de algoritmos com base, por
exemplo, em uma rede neural. So ferramentas de descobertas matemticas feitas sobre
os registros corporativos j processados, muitas vezes em cotejo com descobertas
empricas.
Por exemplo, o estudo do perfil dos clientes de uma empresa de extrema
importncia para que os seus analistas de negcio possam desenvolver mix de novos
produtos e novas estratgias de relacionamento mais eficazes e de melhor retorno. Tal
estudo permite a identificao de padres no comportamento dos clientes,
determinando, por exemplo, sobre quais clientes determinado tipo de estratgia de
marketing possui melhores resultados, ou ento quais so os provveis compradores de
um novo produto, em que condies e em que perspectivas de fidelizao.

As tcnicas de data mining permitem que esta anlise seja realizada usando os
bancos de dados da empresa, extraindo valiosas informaes que esto presentes nos
dados mas que ficam ocultas devido ao grande volume de informao. importante
ressaltar que nenhuma alterao na plataforma de software/hardware da instituio
precisa ser feita para que se possa construir um sistema de data mining.
Independentemente da forma como estes dados esto armazenados eles podem ser
utilizados para alimentar o sistema que pode ser facilmente acoplado aos demais
sistemas da empresa.
Em recente trabalho, WEIXUAN, ZHENGXIN & YONG (2004) 70 et alli
apresentaram estudos associando o uso da minerao de dados com a gesto do
conhecimento, analisando suas metodologias, casos prticos de integrao dessa
tecnologia com a gesto do conhecimento organizacional. Tais estudos constituem uma
viso avanada desse vnculo e do processo de descoberta de conhecimento em bases de
dados. Discutem a relevncia e aplicabilidade na anlise e classificao de dados
70

Anais do Chinese Academy of Sciences Symposium on Data Mining and Knowledge Discovery
CASDMKD realizado em Pequim, na China, em 2004. Ver especificao completa nas referncias.

213

biomdicos, tcnicas de agrupamento (clustering), anlise, prospeco e visualizao


dos dados, sistemas de conhecimento empresariais e o processo de descoberta de
conhecimento como um todo a partir de bases de dados.

7.3 Computao Colaborativa em Gesto do Conhecimento: Trabalho Cooperativo


Suportado por Computador (CSCW Computer Supported Cooperative Work)

A integrao de pessoas e organizaes atravs de computadores um processo


que vem se aprofundando nos ltimos anos e ganhou novo impulso pelo crescimento do
uso das redes de computadores, mormente da Internet 71 .

Nas empresas, alm da

Internet, que tem uso crescente, as redes internas, ou intranets, tambm fornece sua
parcela de contribuio para ampliao do uso de computadores pelas pessoas. Os
sistemas computadorizados podem tambm viabilizar o trabalho colaborativo em grupos
ou comunidades virtuais groupware. A idia de groupware ganha impulso na medida
em que cria novas perspectivas de relacionamento e trabalho dentro das empresas.

De acordo com BARTHELMESS (1996):

a rea de CSCW compreende todo o software que tem por objetivo prestar
auxlio ao trabalho cooperativo. justamente este o fator que torna este tipo de
software diferente dos demais.
A noo de que este tipo de software deve mediar a interao de diversas
pessoas que buscam obter um objetivo comum introduz novos requisitos
normalmente no encontrados em outros sistemas. Se enfatiza a interao entre
usurios e no mais a interao sistema/usurio, como acontece na maioria
dos sistemas (que passaremos a chamar de convencionais, em contraposio a
esta nova classe de software cooperativo ou groupware).
A ubiqidade de estaes individuais de trabalho, ligadas por redes, cria uma
oportunidade tecnolgica de se prover suporte s atividades de grupos de
trabalho nas organizaes . O padro de utilizao dos computadores migrou
de uma centralizao representada pelas mquinas de grande porte nos CPDs
para um de utilizao individual, em que cada usurio ou grupo de usurios
possui suas ferramentas, como planilhas e editores, trabalhando normalmente
em isolamento. Estas atividades isoladas no correspondem, porm, real
necessidade das organizaes, nas quais o trabalho no realizado
costumeiramente por apenas um indivduo, mas fruto de um esforo coletivo.
71

Para um estudo aprofundado sobre redes de computadores ver: SOARES, Luiz F. G. et. al . Redes de
Computadores: Das LANs, MANs e WANs s Redes ATM. Rio de Janeiro. Campus, 2005

214

Diversas categorias de produtos procuram explorar esta nova oportunidade,


geralmente em reas especficas, como por exemplo os da lista abaixo, que est
longe de ser exaustiva:

Editores e planilhas para uso em grupo;


Vdeo-conferncia;
Bulletin -Board Systems;
Correio eletrnico;
Sistemas de Workflow (BARTHELMESS,1996: Cap 1) .

Merecem destaque no contexto do groupware o correio eletrnico e o workflow


automatizado, ou simplesmente workflow (fluxo de trabalho desenhado para ser
realizado de modo automatizado). O correio eletrnico um recurso mais antigo que j
se encontrava presente em ambientes de computao centralizada com uso de
mainframes, mas com a Internet e uso de ambiente cliente-servidor que ganhar uma
maior e mais profunda amplitude de uso nas organizaes. A troca de mensagens
eletrnicas evolui gradativamente para o conceito de workflow, ou fluxo de trabalho
computadorizado, isto , a incorporao de rotinas e processos encadeados de trabalho
por softwares em computadores ligados em rede. Podemos ter a utilizao de workflow
automatizado para gerao e reviso de documentos tcnicos

Ainda de acordo com BARTHELMESS (1996):


Sistemas de workflow podem ser definidos como sistemas cujo objetivo
"auxiliar as organizaes na especificao, execuo, monitoramento e
coordenao do fluxo de trabalho em um ambiente de escritrio distribudo"
Software especificamente desenvolvido para possibilitar a criao de sistemas
de gerenciamentos e de compartilhamento de informaes por multi-usurios,
possibilitando a consulta em rede em tempo real. Este sistema pode ser
moldado de acordo com as necessidades de cada empresa
O fluxo de trabalho corresponde tramitao de documentos e informaes
entre diversos agentes, pertencentes a unidades organizacionais
potencialmente distintas, cada qual agregando uma parcela do trabalho
necessrio para que se alcance determinado objetivo de negcio.
A observao de que por volta de 90% desta tramitao pode ser considerada
rotineira e repetitiva torna natural que se deseje suprir suporte automatizado
para estas tarefas. Aps um surto de interesse nos anos 70, associado rea de
automao de escritrios, a pesquisa relativa a sistemas de workflow ficou
estagnada durante a maior parte dos anos 80, devido ao fracasso dos sistemas
pioneiros. Verificou-se que estes sistemas apresentavam uma inflexibilidade
que inviabilizava seu uso prtico, mesmo em situaes simples e controladas
(BARTHELMESS, 1996: Cap 2).

215

Na perspectiva de aumento da produtividade e da flexibilidade nas empresas, a


idia do teletrabalho se afirma mais em meados da dcada de 90. Ressurge, portanto,
a pesquisa na rea, com o aparecimento de sistemas mais flexveis, baseados na
experincia de seus predecessores de primeira gerao. Surgem softwares que integram
as funes de fluxo eletrnico de documentos em processos empresariais e correio
eletrnico, como o Exchange, da Microsoft e o Lotus Notes, da IBM-Lotus. Na
viso dos fabricantes, o principal objetivo de softwares de workflow aumentar a
eficincia de processos de negcio e a eficincia das pessoas que trabalham em conjunto
para execut- los. As tecnologias para groupware oferecem ferramentas cooperativas
como fruns de discusso, calendrios, agendas e um sistema de distribuio de
arquivos. Os benefcios em geral ressaltados quando do uso desses recursos so:
Correio eletrnico
Gerenciamento de agenda
Possibilidade de acesso a documentos por vrios usurios simultaneamente
Velocidade de localizao de documentos
Automao relativamente fcil de rotinas administrativas e processos de
trabalho
Reduo de espao fsico devido a eliminao de papis
Anlise de projetos por diversas pessoas sem necessidade de estar fisicamente
presentes
Uso de teleconferncias.
Analisando um software voltado para o ambiente de groupware, o Lotus Notes,
percebemos que um sistema de desenvolvimento de aplicaes, personalizvel e
programvel, que apresenta uma boa integrao com a Internet. O Lotus Notes
proporciona s organizaes um interessante conjunto de servios baseados em padres
mais atuais, especialmente para correio eletrnico, grupos de discusso e uso de
calendrio partilhado.

O Notes introduz o conceito de ambiente de groupware total, em oposio a um


conjunto de funes rigidamente definidas e independentes. As aplicaes de
groupware do Ltus Notes - desde as aplicaes de workflow at s bases de dados de

216

discusso - so construdas dentro desse ambiente utilizando blocos de construo


comuns. A capacidade para especificar e desenvolver uma base de dados adequada a
uma aplicao particular de uma empresa essencial para muitos administradores de
groupware. No entanto, para instalaes mais pequenas, com menores recursos de
desenvolvimento, o Notes tambm oferece um conjunto de modelos de aplicao,
incluindo uma viso bsica de workflow com aprovao por item, bibliotecas de
documentos, um sistema de reserva de espao e uma base de dados de discusso.

Reconhecendo a importncia do conhecimento tcito, poucas posturas


tecnolgicas so to eficazes em termos de apoiar sua gerao como as estratgias de
trabalho em grupo e trabalho colaborativo por computador, visando o estmulo da
interao entre pessoas e com a realidade e faz liberar novos conhecimentos atravs da
resoluo de problemas e da relao com o trabalho compartilhado.

7.4 Gesto Eletrnica de Documentos GED

Nas organizaes em geral os documentos so gerados de forma intensa e seu


controle em geral difcil, sobretudo no que tange organizao e recuperao, tanto os
documentos fsicos quanto os digitais. Diferentes e s vezes conflitantes processos de
classificao, indexao, armazenagem e recuperao se verificam. Quando h
disperso geogrfica de uma empresa a situao piora. Muitas vezes, h dificuldade em
se recuperar um documento. A existncia de um acervo, ainda que amplo, no garante a
gerao da informao como suporte gesto do conhecimento. So problemas
constantes das organizaes:

Sistemas de recuperao de informaes ineficientes e s vezes diferentes.

Vrios ambientes

Controles paralelos departamentais.

Experincia do quadro de pessoal da equipe.

No padronizao dos dados.

Demora na pesquisa.

Pouca visibilidade/transparncia do acervo documental.

No controle do contedo.

217

De acordo com SILVA (1995), sistemas de gesto eletrnica de documentos, so


"sistemas desenvolvidos para o gerenciamento de todo o ciclo de vida de
um documento, desde a sua gerao, manuteno (alteraes, incluso
de anotaes, dentre outras), guarda, pesquisa e recuperao, at o seu
descarte" (p.9).
GED um conjunto de tecnologias que permite o gerenciamento de documentos
de forma digital. Tais documentos podem ser das mais variadas origens e mdias, como
papel, microfilme, som, imagem e mesmo arquivos j criados na forma digital.
Baseando-se nas informaes do CENADEM (2006), podemos dizer que antigamente, a
tecnologia de GED enfatizava basicamente a digitalizao de um documento gerado em
papel atravs de um scaner. Assim, ele poderia ser visualizado na tela do computador,
inclusive em rede. Hoje, entretanto, a maior parte das organizaes tem uma imensa
quantidade de documentos que j gerados eletronicamente: so os documentos de
editores de texto, planilhas eletrnicas, desenhos de engenharia, e- mails. Esse novo
acervo de documentos digitais, sem gerenciamento, implica em muitas cpias de
diversas verses, duplicao de arquivos, provocando a m utilizao de espao em
discos, e custos desnecessrios com armazenamento. Para administrar esse contexto
digital, quer sejam ou no originalmente eletrnicas, o conceito sobre o que GED
ampliou-se como que automaticamente. Gerenciar documentos hoje quase como que
cuidar de toda a vida informacional da empresa.

Conforme j afirmado, as aplicaes de gesto eletrnica de documentos apiam


a gerao e administrao das bases de dados textuais nas organizaes uma vez que o
conhecimento humano mais fcil de ser expresso (codificado) na linguagem natural
presente nos documentos textuais, sejam textos livres ou com algum tipo de estrutura. A
GED pode e deve se revelar como um instrumento vivel para dinamizar, racionalizar e
disseminar o acesso informao e a tomada de deciso no nvel estratgico das
organizaes.
A GED tem o desafio de lidar com as seguintes tarefas:
Catalogao/indexao, que implica na definio das caractersticas que identificam
cada tipo de documento/formato, e estabelecimento da estrutura do banco de dados e
criao de interfaces para entrada/atualizao de dados.

218

Pesquisa e recuperao talvez a funo mais relevante da GED e que deve


viabilizar a rpida recuperao de um documento, ou conjunto de documentos
armazenados nos bancos de dados, com o mnimo de informao especfica (parte de
nomes, descritores, datas aproximadas, dentre outras).
Gerncia do fluxo de documentos, que envolve a definio e operacionalizao de
seu fluxo ao longo das redes de computadores interna e externa da organizao,
levando-se em conta questes de sigilo, segurana, roteiros, autorizaes nveis e
autorizaes tipos, anotaes e associao de outros documentos.
Gerncia de verses dos documentos, estabelecendo controles sobre as distintas
verses de um mesmo documento, evitando-se que documentos em verses mais
antigas sejam tratados como atuais. possvel manter cpias completas de todas as
verses dos documentos, ou ento manter a verso original e o histrico das
modificaes introduzidas, dependendo do software de gerenciamento. Atualmente,
muitos editores de textos possuem mecanismos que permitem o gerenciamento de
verses.
Gerncia do uso corporativo e individual, com instalao de rotinas de backup,
mecanismos de segurana e controle de acesso (catalogao de usurios, grupos,
nveis de acesso e utilizao de recursos), manuteno de ndices, definio dos
procedimentos da rotina operacional do sistema e integrao da GED com outros
sistemas e controle estatstico de utilizao e alocao de recursos.

O conceito de GED vem evoluindo ao longo dos anos. Um conceito oriundo


dessa evoluo o de Enterprise Content Management o conjunto de tecnologias
utilizadas para captar , gerenciar , armazenar , preservar e disponibilizar contedo e
documentos relativos aos processos organizacionais. As ferramentas e estratgias de
ECM permitem o gerenciamento das informaes no-estruturadas da empresa , onde
quer que tais informaes se encontrem. O CENADEM (2006) apresenta, na figura 30,
o seguinte fluxo operacional para o processo de ECM/GED:

219

CAPTAO
o modo como o
informaes e
documentos,
eletrnicos ou em
papel, passam para
um repositrio de
contedo para
reutilizar, distribuir e
armazenar

ARMAZENAMENTO
onde se coloca o
contedo e como voc
o encontra novamente.

GERENCIAMENTO
So as ferramentas e
tcnicas para mover
contedo pela
organizao e
monitorar o
desempenho delas.

DISTRIBUIO
Como voc
consegue o
contedo certo para
o pblico certo no
dispositivo certo.
(Acesso)

PRESERVAO
As suas opes para
armazenamento a
longo-prazo do
contedo essencial
de sua empresa.

Figura 30: Fluxo operacional da Gesto Eletrnica de Documentos


Fonte: CENADEM (2006)

As tecnologias de GED so a importantes para o estabelecimento de programas


de Gesto do Conhecimento, j que elas gerenciam o conhecimento existente na
empresa que foi explicitado sob a forma de documentos. E necessrio que o
documento e a informao sejam registrados e distrib udos de fo rma adequada na
organizao para o atingimento dos objetivos que ela possui. O documento sempre
estar atrelado ao compartilhamento do conhecimento, tomada de decises,
concretizao de negcios, processos e mtodos internos e outras importantes aes.
Como as organizaes ainda geram grande quantidade de documentos em papel,
devero tambm criar estratgias para geranci- los de forma eficiente e rpida. Para a
adequada implantao de estratgias de gesto do conhecimento necessrio o registro
de todos os documentos que entram e saem da empresa, com incluses, alteraes e
contedos. E isso s possvel com o uso de tecnologias de GED.

7.5 Portais Corporativos

Com o passar do tempo, a maioria das organizaes atravessou um caminho de


crescente informatizao, criando diversas aplicaes que comearam gradativamente a
clamar por integrao recproca, uma vez que a integrao de processos e fluxos de
informaes conduz a um melhor desempenho. Esse processo de integrao, que se
amplia a cada dia na chamada economia digital hoje suportado por trs tipos de
tecnologia, cada uma com suas caractersticas e funcionalidades:

ERP Enterprise Resources Planning (j definido no incio desse captulo)

EAI Enterprise Application Integration Integradores de Aplicaes


Corporativas

EIP Enterprise Information Portals - Portais de Informaes Empresariais


220

Definiremos a seguir os conceitos de EAI e EIP.

7.5.1 Integradores de Aplicaes Corporativas

A idia de EAI pode ser compreendida como um conjunto de pontes para


interligar os vrios sistemas de informao, tanto os adquiridos de diferentes
fornecedores quanto os desenvolvidos internamente. Diante dos muitos sistemas,
inclusive o ERP, operando em uma organizao, o ideal seria que se criasse um nico
sistema que integrasse todos os outros numa interface nica que permitisse o trnsito de
usurios autorizados por eles. Este novo sistema classificado como EAI. A figura 31 a
seguir ilustra a passagem de uma integrao sem EAI e com EAI.

Conforme LINTHICUM (2000) as tecnologias de EAI so sustentadas por


elementos que permitem tanto a um banco de dados como a um software aplicativo se
comunicar com outros bancos de dados ou softwares aplicativos, eliminando os nveis
de divergncia entre o que precisa ser integrado. Esses elementos, que atuam tanto no
nvel lgico quanto fsico, so definidos por middleware 72 .

Figura 31: Processo de integrao entre aplicaes migrando para um ambiente com EAI.
Fonte: IDEAIS Consultoria www.ideais.com.br. Acessado em 22 nov. 2006

Por outro lado, vale lembrar que nos ltimos dez anos o ambiente web teve um
crescimento significativo na sociedade e percebemos uma exploso de redes internas
72

Eles incluem, por exemplo, os objetos distribudos.

221

baseadas em sua tecnologia na empresas. Constatamos tambm a ampliao de


estruturas externas de relacionamento com clientes e fornecedores, baseadas nesse
ambiente. Outros fatores, como educao distncia e entretenimento pressionam o
crescimento da Internet no mundo contemporneo e seu nmero de usurios continua
crescendo. H cada vez mais aplicaes web e o nmero de documentos nesse ambiente
difcil de calcular. Muitas vezes um potencial usurio fica perdido diante de tantas
possibilidades.

Considerando, tanto a proliferao de muitas aplicaes de software no ambiente


empresarial, a crescente disponibilidade de contedos em intranets e na Internet,
tornou-se necessrio o advento de algum tipo de recurso tecnolgico que pudesse
facilitar a vida do usurio em sua relao com a tecnologia da informao, usando a
interface do ambiente WEB e esse ambiente o portal. Em uma heterogeneidade de
plataformas de hardware e software e complexidade crescente dos ambientes
tecnolgicos das empresas, ERP e EAI permitem em geral que as aplicaes falem entre
si, mas essas aplicaes precisam falar tambm com o usurio, o que papel do EIP.

7.5.2 Os Portais

Um portal no necessariamente corporativo. Pode ser aberto, como em muitos


stios da Internet. A idia comum sempre o conceito de ponto integrado de um
conjunto de contedos, que podem ser expressos tanto por documentos textuais digitais
como por ponto de acesso a dados armazenados em bases relacionais ou de aplicativos
muito estruturados. Conforme DIAS (2001) h duas formas de classificar os portais:
uma em relao ao contexto de sua utilizao (pblico ou corporativo) e outra em
relao s suas funes (suporte deciso e/ou processamento cooperativo). No
obstante as semelhanas tecnolgicas, os portais pblicos e os portais corporativos
atendem a grupos de usurios diversos e tm propsitos completamente diferentes. De
acordo com essa autora, temos as seguintes definies:
Portal pblico: tambm denominado portal Internet, portal web ou portal de
consumidores, prov ao consumidor uma nica interface imensa rede de
servidores que compem a Internet. Sua funo atrair, para o seu site, o
pblico em geral que navega na Internet. Quanto maior o nmero de visitantes,
maior a probabilidade do estabelecimento de comunidades virtuais que

222

potencialmente compraro o que os anunciantes daquele site tm para vender.


Assim como a televiso, o rdio e a mdia impressa, o portal pblico estabelece.
Portal corporativo: no mundo institucional, o portal tem o propsito de expor e
fornecer informaes especficas de negcio, dentro de determinado conte xto,
auxiliando os usurios de sistemas informatizados corporativos a encontrar as
informaes de que precisam para fazer frente aos concorrentes . O portal
corporativo considerado por Reynolds & Koulopoulos73 como uma evoluo
do uso das Intranets, incorporando, a essa tecnologia, novas ferramentas que
possibilitam identificao, captura, armazenamento, recuperao e distribuio
de grandes quantidades de informaes de mltiplas fontes, internas e externas,
para os indivduos e equipes de uma instituio .

Os portais corporativos ou de informaes empresariais

constituem a

camada superior de integrao em uma organizao, relacionando-se muitas vezes com


EAI, ERP e outras aplicaes, mas focando, porm uma comunicao dinmica com o
usurio. DE acordo com TURBAN (2003):

um portal de informaes empresariais (enterprise information portals) so


aplicaes baseadas na tecnologia web que permitem que as empresas acessem
as informaes armazenadas interna e externamente, e fornecem aos usurios
um nico ponto de acesso s informaes personalizadas, necessrias para
tomar decises empresariais abalizadas. Os EIPs integram aplicaes de
gerenciamento de contedo, inteligncia empresarial, bancos de dados e data
warehouses (p. 233).

Os portais corporativos constituem um ambiente informacional voltado para o


usurio de forma a permitir uma viso sintica (ou seja, que pode ser visto em conjunto,
com um nico olhar) do complexo ambiente informacional de uma organizao. Ele d
uma viso integrada de aplicaes e contedos diversos dispersos nos ambientes WEB
de uma instituio, permitindo que diversos itens sejam vistos ao mesmo tempo numa
mesma tela. Um portal um padro para acesso diverso a contedos e aplicaes. So
ambientes personalizados que viabilizam o acesso a vrias informaes sobre uma dada
empresa. A princpio, o alvo so os funcionrios, mas gradativamente pode incluir
fornecedores, clientes e parceiros de uma organizao. Constitui-se pois numa moldura,
que permite acesso ao universo informacional da empresa, encapsulando dados e

73

Referncia apresentada pela autora: REYNOLDS, Hadley & KOULOPOULOS, Tom. Enterprise
knowledge has a face. Intelligent Enterprise, v. 2, n. 5, p. 29-34, Mar. 1999. [online], abril 2000.
http://www.intelligententerprise.com/993003/feat1.shtml

223

funes necessrias para que algum realize o que deseja com a conciliao de
mltiplas informaes. Cria, portanto:

um nico ponto de entrada garantindo segurana de sites e aplicaes;

um nico ponto de acesso ampliando a capacidade de navegao e busca,


limitando e organizando privilgios de acesso e a formatao e apresentao de
informaes;

um ponto nico de contato para solicitao de processamento;

um ponto nico de integrao.

Os portais esto se transformando cada vez mais no front-end da WEB, servindo


como uma plataforma que podemos chamar de auto-servio, acessando mltiplas fontes
de informao e contedo.

Dentre os fatores adversos relativos interface com o

usurio que pretende tratar e que fazem de sua importncia algo crescente podemos
citar:

Existncia de plataformas e formatos proprietrios;


Dificuldade em acessar informaes vitais
Redundncia e duplicao de informao
Dificuldade para indivduos em publicar informao para o resto da empresa
Vrios mtodos para se buscar e acessar informao
Necessidade de Intermediao de TI para acessar informao
Excesso de Informao
Ausncia de mecanismos de colaborao interna e externa
Dificuldade de integrao de dados
Aplicaes de TI focada na facilidade da estao de trabalho

Cada vez mais os portais tendem a se transformar em plataformas dinmicas,


atraentes e sofisticadas para prover acesso a mltiplos contedos, dinamizando a
criao, difuso, organizao e compartilhamento do conhecimento. Suas facilidades
agilizam a transformao do conhecimento tcito em conhecimento explcito.

224

Constituem-se em ferramentas potenciais para gerir conhecimento. Alm de tornar mais


dinmico o acesso aos contedos de informao, podem, por isso mesmo, apoiar
processos como ensino distncia, implantao de universidades corporativas ou
virtuais, treinamento e desenvolvimento de funcionrios. Podem tambm servir
ampliao da cidadania, dentro do conceito governo eletrnico, atravs do qual, rgos
pblicos prestam servios e fornecem informaes aos seus cidados.

Este captulo descreveu algumas tecnologias da informao que se articulam e


apiam o processo de gesto do conhecimento nas organizaes. No pretendeu ser
exaustivo, mas apenas apresentar algumas tecnologias importantes para tal gesto,
sendo que a minerao de textos, tecnologia central nessa tese, ser abordada no
prximo captulo.

225

8 A MINERAO DE TEXTOS

8.1 Consideraes Preliminares

A gerao de docume ntos textuais est ligada prpria escrita. Podemos dizer
que um dos tipos de registro mais simples que podem ser gerados o textual. Pessoas
produzem textos com facilidade e os editores de textos e pginas web tornaram isso
ainda mais fcil. Nos ltimos anos assistimos a um marcante crescimento da capacidade
de processamento e armazenagem dos computadores, que tiveram sucessivas
ampliaes de seus espaos em discos. Esse crescimento permitiu tambm aos usurios
um processo de crescimento da armazenagem de milhares de documentos de diversos
tipos, acumulando colees de arquivos desorganizados de difcil gerenciamento. Os
usurios colecionam imagens, vdeos, fotos, novos artigos, mensagens de correio
eletrnico, reportagens e notcias, etc. So resultados de uma variedade de buscas ou
elaborao prpria de muitos documentos texto.

Nas organizaes, esse grande volume de bases de dados textua is, a ampliao
do uso do ambiente WEB por pessoas e empresas, o crescimento de portais corporativos
e ambientes de comrcio eletrnico vem provocando uma verdadeira sobrecarga de
informaes, tambm gerando aumento do armazenamento e tornando cada vez mais
complexa a procura de informaes pelos diversos stios da Internet e pelos repositrios
das Intranets. Pessoas e organizaes podem saciar seus desejos de informao
pesquisando documentos espalhados pelas redes sobre os mais diferentes assuntos.
Entretanto, tamanho volume de documentos e informaes acaba por trazer problemas
na hora da pesquisa e frustrao dos usurios com tal sobrecarga, que ocorre quando o
usurio tem muita informao ao seu alcance, mas no tem condies de trat- la ou de
encontrar o realmente deseja ou lhe interessa.

Embora crie iluso de que se tem muita informao disponvel, a recuperao de


documentos em grandes bases de textos se converte muitas vezes em frustrao pela
dificuldade de conhecimento do usurio sobre o real teor das bases dos documentos
armazenados, pois impossvel conhecer o teor de todos eles no momento da
recuperao. Os motores de busca (search engines) foram uma soluo interessante para
lidar com essa realidade, e eles se tornaram muito importantes com a difuso da web.
226

Em muitos casos, eles eram realmente uma soluo poderosa para lidar com
grandes bases de dados e realizar o casamento instantneo entre uma consulta e os
documentos correspondentes que a atendiam, desde que as palavras-chave utilizadas
para fazer esse casamento (matching) estivessem corretas. Entretanto, os motores de
busca no resolviam todo o problema da informao.

Os Sistemas de Recuperao da Informao tem uma longa histria, marcada


especialmente a partir dos anos 60 quando os sistemas computacionais eram
principiantes para gerenciar textos no estruturados. Muitos desses sistemas estavam em
grandes computadores denominados mainframes, com softwares proprietrios e
interfaces para colees especializadas. Na dcada de 80 os computadores pessoais
fizeram o link entre esses sistemas de mainframes e interfaces intermedirias para busca
e recuperao de dados. Essa ampliao, entretanto, no significou uma melhoria
significativa para o usurio final. Isso porque a abordagem adotada passou a se
constituir da palavra-chave ou keyword. Muito usada nos dias atuais, a palavra-chave
pode ser definida como um substantivo ou frase encontrada no contedo de um
documento relevante. Usurios sofisticados, com conhecimentos de lgica booleana e
terminologia, podiam elaborar consultas melhores e assim encontrar as informaes
relevantes mais rapidamente, mas eles constituem uma exceo. A maioria dos usurios
interage de forma relativamente simples com os sistemas e faz uso simplrio da palavrachave. Entretanto, tal abordagem no suficiente para responder s necessidades mais
especficas e elaboradas de informao.

Se por um lado a minerao de textos pode ser vista como uma sub-rea da
Recuperao da Informao, uma vez que utiliza massivamente recursos desse campo
de conhecimento, por outro tambm um campo interdisciplinar, considerando que o
resultado interseo das reas de recuperao da informao, reconhecimento de
padres, banco de dados, minerao de dados, lingstica, aprendizado de mquina e
estatstica. Essa combinao visa permitir a clere extrao de informaes de grandes
bases de documentos textuais. Destarte, um software de minerao de textos, quando
implantado e sendo alvo de utilizao pelas pessoas, constituir-se- em um sistema de
informao.

227

Para SULLIVAN (2001) a rea de minerao de textos expande o escopo das


atividades de informao estratgica (business intelligence). De acordo com
KONCHADY (2006) a minerao de textos no uma substituio para a Recuperao
da Informao ou o Processamento da Linguagem Natural. Ela busca encontrar
respostas para questes que so difceis ou impossveis de responder somente com
motores de busca. Por exemplo:

Sumarizar documentos que descrevem marcas de um produto consumido em


uma regio;

Relacionar diferentes tipos de carros fabricados baseando-se em caractersticas


comuns, tais como o tamanho, o tipo de bateria utilizada, o material da carcaa,
o espao interno, dentre outras;

Identificar o mximo de comunidades de mergulhadores em uma regio do pais


e descrever algumas relaes entre elas;

Monitorar o nvel de poluio por monxido de carbono em uma cidade para o


prximo ms e notificar por correio eletrnico os dias em o nvel de poluio
exceder o limite do tolerado;

Identificar universidades que realizam pesquisas sobre o conhecimento em


energia solar e encontrar e-mails, nomes e endereos de indivduos para
contactar nessas universidades.
Encontrar respostas para tais questes requer muito mais do que submeter

algumas consultas em um motor de busca. Os resultados de uma consulta devem ser


analisados, organizados e reduzidos sob uma forma de fcil entendimento. Ferramentas
de minerao de textos podem usar os resultados dos motores de busca para encontrar
informaes escondidas, tais como tendncias e relacionamentos.

228

8.2 Necessidades de Textos do Usurio

Com a questo da sobrecarga de informaes acima relatada, ou seja, a


quantidade de documentos disponveis nas bases de dados digitais supera em muito a
capacidade das pessoas de lerem estes documentos para deles extrarem conhecimento,
passamos a nos defrontar com o problema de como extrair conhecimento de grandes
colees de textos, de forma dinmica e automtica, j que os motores de busca no
poderiam responder a essa necessidade. Quando um usurio, em uma organizao,
realiza uma busca de informaes em uma fonte de dados textuais (a web, por exemplo)
sua primeira tarefa separar aqueles documentos que foram recuperados, mas que,
claramente, no atendem s suas necessidades. A seguir, realiza uma leitura preliminar
de cada um dos outros documentos, pois muitos deles podem conter informaes
interessantes, porm relacionadas a algum outro setor da empresa, para onde podem ser
encaminhados. Ao final desta primeira leitura, o funcionrio ter identificado os
documentos que possuem informaes relevantes e pertinentes sua rea de atuao.
Passa, ento a fazer uma segunda leitura, mais cuidadosa, que lhe permita classificar os
documentos segundo sua relevncia e tema (novo ou j conhecido da empresa). Ser
interessante, ento, buscar documentos nas bases de dados da empresa, para serem
analisados em conjunto com os novos, a fim de que possam ser identificadas
correlaes entre eles. Portanto, esta uma tarefa que consome muito tempo e nem
sempre o volume de documentos envolvidos permite que certas correlaes entre
informaes sejam identificadas. Ou seja, muito conhecimento contido na coleo de
documentos pode passar desapercebido. A tecnologia de minerao de textos pode
trazer diversos benefcios neste campo.

8.3 Conceito e Benefcios

KDT Knowledge Discovery in Text Descoberta de Conhecimento em Textos,


minerao de textos, ou simplesmente text mining, uma tipo de tecnologia da
informao composta por todas as tcnicas que permitem localizar, recuperar, organizar
de forma dinmica documentos de interesse em determinadas bases textuais, articulando
seus contedos e os prprios documentos entre si, acelerando a anlise dos mesmos,
gerando resumos automticos e extraindo conhecimento deles e que, de outra
maneira, permaneceria escondido nessas mesmas bases de dados textuais. um sistema
229

inteligente de descoberta de conhecimento, que absorve os aspectos analisados no


capitulo 6, com foco em bases textuais. De acordo com FELDMAN & DAGAN (1995)
essa abordagem surgiu da necessidade de anlises automticas em textos, visto que a
sobrecarga de informaes disponveis dificultava sua anlise manual, localizao e
acesso. Em outro trabalho FELDMAN & SANGER (2006) afirma que a minerao de
textos um processo de conhecimento intensivo em que um usurio interage com uma
coleo de documentos utilizando um conjunto de recursos de anlise embutidos em
uma ferramenta de software, tendo recebido uma inspirao muito forte da rea de
minerao de dados.
FELDMAN & SANGER (2006) avaliam que o elemento chave para a minerao
de dados a coleo de documentos, desde as mais simples at as mais amplas. Essas
colees podem ser estticas ou dinmicas, ou seja: as colees estticas no recebem
novos documentos enquanto as dinmicas recebem novos documentos a uma dada
freqncia. As colees dinmicas tendem a ser maioria. Isso significa que um software
de minerao de textos dever re-processar suas bases quando houver novas adies em
suas bases de documentos. De acordo com esses autores, tambm importante
considerar que outro elemento fundamental para estudos de minerao de texto o
documento. Um documento pode ser simples ou complexo, pode ser um relatrio, um email, um artigo, um notcia, um relato. Podem estar organizados ou no dentro de uma
coleo ou dispersos de forma ad hoc. Podem tambm pertencer a diferentes colees
ou sub-colees de documentos.

Os algoritmos utilizados em minerao de textos podem operar sobre diferentes


nveis de caractersticas de representao dos documentos, devendo levar em conta
aspectos semnticos e computacionais para o processamento. Em geral, as ferramentas
de minerao de textos podem atuar sobre os caracteres, as palavras, os termos e frases
extradas do corpus dos documentos e, ainda, os conceitos (FELDMAN & SANGER,
2006).

Text mining um conjunto de tcnicas e processos que identifica conhecimento


novo nos textos. Trata-se pois, at certo ponto, de uma nova tecnologia: software para
anlise inteligente e minerao de dados textuais. No se trata de um navegador ou
simples motor de busca. A idia a de que, considerando uma base de textos

230

(documentos digitalizados), possamos ter um software que faa leituras inteligentes


desses textos, com anlise semntica, agrupamento de textos comuns e inferncias
inteligentes, usando para isso recursos computacionais avanados ligados rea de
inteligncia artificial.

tecnologia de uso recente no Brasil e serve para apoiar

atividades estratgicas de gesto do conhecimento, marketing estratgico, pesquisa de


mercado, auditoria, gesto de bases documentais, inteligncia competitiva, e
complemento s funes de gerncia do relacionamento com o consumidor (CRM). A
minerao de textos e a minerao de dados tem muito em comum, variando
basicamente o objeto a ser tratado: dados estruturados no primeiro caso e textos digitais
no segundo. A minerao de textos absorve quase todas as vises e mtodos descritos
nos itens 6.3, 6.4 e 6.5.

Dentre os principais benefcios do processo de minerao de textos, podemos


destacar alguns. Inicialmente, a anlise de documentos recuperados em uma busca fica
muito facilitada, pois os documentos j sero previamente analisados e agrupados em
clusters 74 , com a indicao de seu provvel contedo, e sero exibidas informaes
sobre a relevncia de cada documento, em relao ao tema considerado. Um outro ponto
que possvel a realizao de buscas pr-ativas, nas quais o programa analisar os
documentos sem a necessidade de uma hiptese inicial para a busca, podendo identificar
novos temas relacionados aos interesses da empresa. Um terceiro aspecto o de que os
documentos podero ser arquivados em conjunto com outros sobre o mesmo tema
automaticamente, sendo ainda possvel a identificao de informaes correlatas nas
bases de dados internas da empresa. Um quarto ponto o de que os esforos humanos
para a leitura dos documentos so menores, pois h a utilizao do recurso de gerao
automtica de resumos nesse tipo de ferramenta. Por fim, a manuteno dos dicionrios
temticos pode ocorrer de maneira contnua, a partir da anlise dos documentos.

Obviamente um software para minerao de textos no ir dizer tudo o que


importante, substituindo o especialista humano que seria encarregado da tarefa de
estudo e anlise inteligente de documentos. O que ele faz tomar seu lugar no trabalho
repetitivo e volumoso, valendo-se de algoritmos inteligentes que lhe permitem fazer

74

Cluster: agrupamento de documentos que tem pontos em comum e se articulam em uma determinada
linha. H um alinhamento entre eles ao abordar certos assuntos e conceitos, o que pode passar
desapercebido pelo usurio.

231

uma pr- leitura dos documentos, analisando-os de maneira preliminar. A tecnologia


atua realizando inferncias que resultam na separao dos dados e documentos
irrelevantes, agrupamento dos semelhantes (clusters), identificao de correlaes entre
informaes dispersas em documentos distintos e gerao automtica de resumos, a fim
de que o usurio possa ter uma idia do contedo da coleo, antes mesmo de ler os
documentos. O especialista poder, ento, selecionar para estudo apenas aquilo que
considerar relevante, com ganho precioso de tempo e produtividade, uma vez ir o texto
integral apenas do que for realmente importante, aproveitado em atividades mais
especficas. Interagindo com o programa, o especialista pode direcion-lo para obter
resultados cada vez mais de acordo com seus interesses, o que contribui para que atinja
seus objetivos com um esforo bastante reduzido.

Um software de minerao de textos pode armazenar informaes sobre os


temas que interessam a diversos setores da empresa e, se for configurado para isso,
realizar anlise inteligente dos resultados das buscas na web, automaticamente (web
mining), monitorando os documentos recuperados, para agrup- los e encaminh- los aos
setores correspondentes, alm de enviar alertas para avisar da chegada de novas
informaes. Aquelas informaes que interessarem a mais de um usurio podem
tambm ser armazenadas em um nico local, sendo um alerta enviado a cada um desses.
Evidentemente,

para

que

software

funcione

adequadamente,

devem

ser

providenciadas a criao e manuteno de dicionrios (contendo informaes sobre os


idiomas suportados e os temas de interesse) e devem ser estabelecidas regras
criteriosamente escolhidas para a anlise dos documentos (criao de clusters, gerao
de resumo e atribuio de grau de relevncia) e para sua distribuio.

8.4 Implementao de Software de Minerao de Textos

Os algoritmos computacionais que tornam isso possvel esto baseados em


recursos matemticos e estatsticos, em agentes inteligentes apoiados por tcnicas de
inteligncia artificial e em novas e inteligentes maneiras de fazer uso do poder de
processamento do computador (ZANASI, 1997). Para SULLIVAN (2001), Text Mining
uma disciplina nova, envolvendo diferentes reas, cujos fundamentos so a
recuperao da informao, a lingstica computacional e o processamento da
linguagem natural, j descritos nessa tese no captulo 6.
232

A minerao de textos implica na extrao de padres ou conhecimentos


interessantes e no-triviais a partir de documentos textuais. A tecnologia de text mining
pode ser aplicada para formalizar e explorar conhecimento tcito. O conhecimento
disponvel com pessoas pode ser em grande parte convertido em textos, os quais sero
analisados para se entender seu significado, ou seja, do que tratam os textos. Depois,
possvel explorar o conhecimento extrado dos textos para gerar novos conhecimentos.
Tambm se pode combinar este conhecimento com o conhecimento explcito
armazenado em bancos de dados estruturados. Hoje em dia, o problema encontrar a
informao til entre os dados disponveis. Por exemplo, Inteligncia Competitiva
atravs do Text Mining pode ser definida como o processo de descoberta ou predio
das decises estratgicas dos concorrentes e/ou o entendimento das caractersticas do
negcio pela utilizao de tcnicas quantitativas de anlise aplicadas em bases de dados
abertas (pblicas).
FELDMAN & SANGER (2006) sugerem que deve haver um relacionamento
entre o usurio e o software de minerao de textos. Na medida em que h entradas de
documentos e seu respectivo processamento, temos as sadas de anlises, padres,
tendncias e relacionamentos existentes nessa base. O usurio interage com essas
sadas, avaliando os resultados, adicionando ou subtraindo elementos e mesmo
sugerindo outras consultas, conforme sugere a figura 32 abaixo:

Figura 32: Relacionamento Interativo do Usurio Com Entradas e Sadas


Fonte: Adaptado de FELDMAN & SANGER (2006, p. 14)

233

8.5 Facilitadores e propiciadores da expanso da Minerao de Texto.

De acordo com ZANASI (2005), conforme j visto, o primeiro deflagrador a


exploso de dados, com o crescimento acelerado de dados textuais nas organizaes.
Muitas empresas consideram o crescimento dos dados textuais como uma interessante
oportunidade para detectar novas oportunidades e realizar novos negcios. Usar esses
dados corretamente como desenvolver uma poderosa ferramenta de resultados
operacionais. Um segundo deflagrador o valor dado por empresas e governos a
busca de uma extrao precisa e pertinente de informao crtica, seja para fins de
segurana nacional seja visando a sobrevivncia corporativa. O desenvolvimento, na
ltima dcada, do campo da minerao de texto tem simplificado significativamente
recuperao da informao documental para uso pessoal e profissional.

O mais importante deflagrador o desenvolvimento tecnolgico e novas


pesquisas relacionadas recuperao da informao, ao processamento da linguagem
natural e tratamento semntico de textos, bem como a aprendizagem de mquina.
Pesquisa e desenvolvimento recente de novas descobertas que criam novas aplicaes
para a tecnologia de minerao de textos nas empresas e organizaes governamentais
estimulam novas iniciativas. Completando os esforos e iniciativas, temos que empresas
de software e universidades vem se dedicando ao desenvolvimento do campo de novas e
significativas tecnologias de minerao de textos, e isso pode ser classificado em trs
categorias:

a) Reconhecimento inteligente de texto: a habilidade de conhecer o contexto


gramatical e relacionamentos lgicos entre conceitos dentro dos textos;
b) Classificao inteligente de texto: a habilidade de classificar documentos entre
um ou outro conjunto pr-definido ou de gerar categorias automticas.
c) Manejo e processamento de mltiplos idiomas: a habilidade de trabalhar
simultaneamente com documentos escritos em diferentes lnguas ou que contem
diferentes lnguas.
ZANASI (2005) apresenta uma discusso que pode ser sintetizada na figura 33 a
seguir e que compara certas questes colocadas pelos usurios em confronto com
problemas relatados e exemplos a serem discutidos.
234

QUESTO

PROBLEMA RELATADO

EXEMPLO

Entender o contexto
gramatical

Avaliao da satisfao do
consumidor

Entender
relacionamentos
lgicos entre conceitos

Extrao e entendimento de
ligaes
entre
conceitos,
pessoas ou organizaes,
expressas
dentro
dos
documentos.

Um e-mail que contm Eu


estou insatisfeito ser
classificado como e-mail de
cliente insatisfeito.
No campo da Inteligncia
Competitiva, uma empresa
ser
constantemente
informada sobre sua imagem
em reputao, e aqueles
competidores
que
tem
sinalizado uma nova parceria
ou anunciado o lanamento
de um novo produto. No
campo
da
Inteligncia
Governamental,
conexes
entre
pessoas
e
organizaes so exibidas
em alguns segundos.

Representao
informaes chave

Representao automtica
de
e-mails
recebidos
atravs do servio de
atendimento
ao
consumidor
Gerao automtica de
relatrios
inteligentes
sobre
todos
os
documentos recebidos (ex.
nmero
de
e-mails
contendo
um
mesmo
conceito:
observaes
negativas
sobre
um
determinado produto, ou
ameaas
de
aes
terroristas)
Anlise de uma coleo de Anlise do feedback dos
documentos em diferentes clientes ou declaraes
lnguas em uma base de polticas de competidores
dados
chave sobre um mesmo
tpico
ou
assunto
realizadas em diferentes
lnguas
Identificao de autor
Deteco
de
caractersticas pessoais do
autor
que
est
em
anonimato nos textos
Deteco
de
redes Deteco
de
ligaes
terroristas
entre indivduos

de Explorao dos resultados


de
uma
consulta,
especialmente se ela gerar
mais
do
que
100
documentos diferentes
Taxonomias: organizao Armazenamento
de
documentos automtico
de
um
recuperados dentro de documento
em
uma
categorias pr-definidas.
categoria pr-definida

Extrao de informaes
simultneas
de
documentos em diferentes
lnguas

Extrao de identificadores
pessoais chave

Deteco de pessoas com


antecedentes
e
experincias
pessoais
similares ou estilos de
escrita parecidos

Figura 33: Questes solucionadas por minerao de textos.


Fonte: ZANASI (2005)

235

8.6 Abordagens da Minerao de Textos

Podemos reconhecer duas abordagens em minerao de textos: a primeira a


abordagem da interpretao inteligente e semntica, resultado da mesclagem das
estratgias de data mining com anlise semntica e a segunda a estatstica. As
abordagens estatsticas esto vinculadas anlise da importncia dos termos em funo
da quantidade de vezes que ele aparece em um documento. As aplicaes estatsticas
(mostrando a distribuio dos dados e de suas varveis) permitem que sejam detectados
os elementos que vo orientar a anlise. Exemplos:

Anlise de Freqncia: contando o nmero de referncias sobre a informao


procurada os tpicos que esto sendo trabalhados (muito freqente); - novas
metodologias (bastante freqente); - rudos (muito raramente). Pode ser til em
algumas situaes.

Tcnica de formao de pares: Realam as conexes entre documentos.

As abordagens de inteligncia e semnticas de minerao de textos vinculam-se


a questes como a avaliao da seqncia de termos no contexto da frase, para a correta
identificao da funo de cada termo, utilizando fundamentos e tcnicas baseadas no
processamento da linguagem natural (REZENDE, 2003), descritos no tpico 6.5 da
presente Tese. REZENDE (2003) salienta o aspecto da anlise da estrutura semntica
dos textos:

A anlise semntica dos textos feita para tentar identificar a importncia das
palavras dentro da estrutura da orao. Quando se utiliza um nico texto,
algumas funes podem ser identificadas e pela funo identifica um grau de
importncia. Por exemplo, um nome tem grande chance de representar
informao relevante na estrutura de uma sentena. Porm, para algumas
tarefas esse tipo de anlise no suficiente. Para tarefas como a categorizao,
o interessante seria analisar um documento comparando-o com bases de
conhecimento de diferentes assuntos para descobrir a qual categoria ele
pertence (p. 342).

Essa abordagem tambm inclui as tcnicas de minerao de dados. A minerao


de textos um processo semelhante minerao de dados. A diferena est no objeto:

236

documentos X dados. O processo descrito no tpico 6.4 se aplica minerao de textos.


Algumas tcnicas foram aplicadas e melhoradas nos ltimos anos: redes neurais,
algoritmos genticos, associao de algoritmos, anlise de grupo, arvores de deciso. Os
dados de entrada so os extrados de bases, que em seguida so tratados e analisados. As
variveis escolhidas entre as reas de referncia levantadas, sero usadas, para fins de
anlise, como por exemplo, descritores de documentos.
8.7 Etapas de Minerao de Textos75

H diferentes abordagens possveis para implementao de text mining mas que,


em geral, seguem etapas mais ou menos comuns. As etapas da minerao de textos, a
partir de SULLIVAN (2001) e REZENDE (2003) englobam as atividades de prprocessamento dos dados, execuo das tarefas de processamento dos dados e anlise
dos resultados. Segue-se ento uma atividade de avaliao das descobertas e validao
dos resultados. Esse esquema apresentado na figura a seguir.

Base de
Textos

Recuperao da
Informao

Usurio:
Necessidade de
Informao

Uso de
Tesauro

Sumarizao
Categorizao
Clustering

Steaming

Retirada de
Stopwords

Avaliao da
descoberta e
validao dos
resultados

Tarefas de
Minerao de
Textos

Figura 34: Modelo Genrico das Etapas de Minerao de Textos


Fonte: SULLIVAN, 2001

A partir da Figura 34 podemos entender o processo. Inicialmente, a partir de


uma base dedos textuais disponvel, deflagra-se a recuperao da informao em uma
fase de pr-processamento. De certa maneira, a recuperao da informao a primeira
fase da minerao de textos, uma vez que eles atuam como um filtro preliminar sobre as
75

Realizada com base em REZENDE, 2003; ZANASI, 2005 e KONCHADY, 2006.

237

colees de documentos digitais. No pr-processamento se aplicam vrios modelos


descritos no capitulo 5, especialmente os modelos booleano e do espao vetorial.

Na etapa seguinte, temos a anlise dos dados, que visa facilitar a identificao de
similaridade de significado entre as palavras, no obstante suas variaes morfolgicas.
Assim sendo, o processo de minerao de textos deve inicialmente identificar e remover
as stopwords (palavras desnecessrias ao contexto de busca e pouco relevante para
anlise de textos, tais como preposies, pronomes, artigos, etc.). Outro aspecto
importante da anlise de dados o processo de stemming (identificao da raiz de
palavras) com vista a apoiar uma anlise semntica 76 . Tambm para anlise dos dados
possvel utilizar um tesauro (dicionrio) como um vocabulrio controlado que
representa sinnimos, hierarquias e relacionamentos associativos entre termos para
apoiar usurios na descoberta de informao que eles necessitam. Ele ajuda a solucionar
certos problemas da linguagem natural, uma vez que usurios diferentes podem usar
termos diferentes para uma consulta equivalente. Por isso, um dicionrio controlado
define termos variantes (sinnimos, abreviaes, acrnimos, siglas, escritas alternativas,
etc.) para um termo preferido e nico para cada conceito.

Em seguida temos, a etapa de processamento dos dados, em que realizado o


processo de indexao e realizadas as tarefas de descoberta de conhecimento em textos.
A indexao permite a procura eficiente em textos por documentos relevantes a uma
consulta sem a necessidade de exame dos documentos por inteiro. Os tipos de
indexao mais comuns, conforme REZENDE (2003), so:

Por texto completo ocorre automaticamente em vrias ferramentas de


minerao de textos quando os documentos so carregados.

Temtica realizada com apoio de um dicionrio controlado (tesauro) que


fornece uma estrutura hierrquica que permite ao software de minerao de
textos encontrar rapidamente generalizaes e especializaes de termos
especficos

Indexao Semntica Latente j descrita no capitulo 5.

76

H diferentes algoritmos para realizar essa tarefa, tais como os mtodos de Stemmer, de Porter de
Lovins (REZENDE, 2003, p. 348).

238

Indexao por tags algumas partes do documento so selecionadas para fazer


parte do ndice.
As tarefas de descoberta de conhecimento so apresentadas na seo 8.7.
A ltima etapa da minerao de textos o ps-processamento ou avaliao de

resultados, que pode ser feita com base em mtricas 77 , processos de visualizao e
analise qualitativa dos resultados por especialistas.

8.8 Formas de Descoberta do Conhecimento em Minerao de Textos

As tarefas de minerao de dados descritas no tpico 6.4.3 se aplicam tambm


minerao de textos, podendo ser vistas como formas de descoberta de conhecimento
em textos. H uma convergncia entre diferentes autores do campo da minerao de
textos em descrever essas tarefas ou formas de descoberta (SULLIVAN, 2001; WIVES,
2002; REZENDE, 2003; ZANASI, 2005; KONCHADY, 2006; FELDMAN &
SANGER, 2006), quais sejam: sumarizao, categorizao, clusterizao (clustering),
extrao de caractersticas ou de informaes. Por se tratar de um campo emergente da
pesquisa, no h ainda um consenso quanto melhor forma de se classificar suas
possveis abordagens. Mltiplos procedimentos so possveis e diferentes abordagens
tambm, as quais esto sendo propostas por diferentes autores. Podemos citar alguns
procedimentos utilizados, em conjunto ou isoladamente.

Extrao de caractersticas: procura extrair de um texto ou conjunto de textos


somente informaes mais relevantes para o usurio, uma vez que se no fossem
extradas provavelmente passariam despercebidas. Esto vinculadas ao
processamento da linguagem natural.

Clusterizao ou agrupamento: agrupar em classes elementos que possuem


alguma articulao ou elementos similares. Inicialmente cria-se

uma

representao simplificada de cada texto a ser adicionado aos agrupamentos. Em


seguida, determina-se a proximidade de dois documentos com base em seus
vetores de caractersticas. Os documentos so agrupados com base em alguma
77

ndices de preciso e revocao, por exemplo.

239

medida de similaridade (REZENDE, 2003). um mtodo de descoberta de


conhecimento utilizado para identificar correlaes entre e associaes entre
objetos, facilitando assim a identificao de classes. Esse processo usado
geralmente usado anteriormente classificao, ajudando a definir classes, pois
um usurio especialista capaz de analisar correlaes entre os elementos de
uma coleo de documentos e identificar uma melhor distribuio de classes
para os objetos em questo. Os clusters podem ser isolados ou hierrquicos. No
primeiro caso, criam-se grupos distintos de documentos agregados. No segundo
caso, cria-se uma estrutura de relacionamento ou ligao entre os grupos, o que
pode permitir um processo de navegao, como em uma rvore (WIVES, 2002).

Categorizao: implica em estabelecer classes e definir a qual classe ou


categoria um documento pertence. Visa identificar caractersticas principais de
um documento e inseri- lo em categorias pr-definidas. Isso feito com base em
anlise de modelos lingsticos, como afinidades lxicas e freqncia de
palavras. Conforme WIVES (2002), pode tambm usar regras de inferncia,
modelos cone xionistas (redes neurais artificiais) ou similaridade de vetores ou
de centrides, em que as classes so representadas por vetores (conjuntos) de
palavras (denominados centrides).

Sumarizao: reduzir a quantidade de texto em um documento sem perda de


seus significados mais importantes. Identifica palavras, frases e muitas vezes
conceitos mais importantes de um documento para permitir uma viso geral e
preliminar de um documento ou conjuntos de documentos, permitindo ao
usurio maior agilidade em seu trabalho. Extrair sentenas e palavras-chave
ajuda o processo (ZANASI, 2005). A extrao de caractersticas e tcnica do
centride so teis a esse processo.

Anlise de trechos: descobrir conhecimento por resgate de trechos permite aos


usurios encontrar detalhes de informao, sem que necessitar ler todo texto.
Entretanto, ainda assim, preciso que o usurio leia e interprete as partes do
texto que forem recuperadas para extrair a informao desejada.

240

Anlise lingstica e de contedo: informaes e regras podem ser descobertas


atravs de anlises lingsticas em nvel lxico, morfolgico, sinttico e
semntico;

Associao de trechos: busca encontrar automaticamente conhecimento e


informaes relacionadas no mesmo texto ou em textos diferentes;

Uso de estruturas de textos: segundo MORRIS (1991), determinar a estrutura de


um texto ajuda a entender seu significado. Um texto no um conjunto aleatrio
de frases, mas deve haver uma unidade e tambm coeso, com as frases
funcionando juntas para a funo do todo. Um thesaurus utilizado para
determinar as relaes que so significativas entre termos prximos, sendo
analisadas associaes diretas, indiretas (transitivas s em primeiro grau) e
categorias comuns de termos.

8.9 Funcionalidades de um Software Text Mining

Um software de Text Mining visa oferecer suporte informatizado ao usurio para


recuperao, tratamento e anlise de informaes textuais, atravs um processo de
anlise inteligente de conjuntos de documentos, possuindo trs objetivos bsicos:
Propor um modelo que possa ser utilizado no tratamento de documentos textuais
especializados como dados semnticos disponveis em um sistema de informao,
que permitam gerar informaes aos profissionais de uma rea especializada sem
a necessidade de convert- los em dados estruturados tradicionais.
Propor os elementos necessrios para a definio e manipulao de bases de dados
semi-estruturadas que possam ser utilizados em reas especializadas do
conhecimento, tais como, medicina e outras, onde seja necessrio algum tipo de
classificao taxonmica para recuperao de informao.
Servir de base para a definio e implementao de um sistema que possua a
capacidade de auxiliar os usurios (especialistas e no especialistas) na navegao

241

sobre documentos relevantes, permitindo uma interao ampla na construo de


consultas necessrias gerao da informao.

Podemos colocar como grandes requisitos de um software de minerao de textos,


com base em ZANASI (2005):

Primeiro, o aplicativo deve ser capaz de realizar buscas reativas em bases de


dados textuais, recuperando arquivos a partir de palavras ou expresses de
entrada, ordenando os resultados com base na contagem de palavras,
organizando esses arquivos em clusters e fornecendo o resumo dos arquivos
solicitados.

Segundo, o aplicativo deve ser capaz de realizar buscas pr-ativas em


subconjuntos especficos dessa base de dados, identificando quais so as idias
centrais de um documento, quais delas so comuns a todo o conjunto e quais so
particulares a um ou mais documentos e, se possvel, encontrar relaes entre
estas idias na forma de "a idia A normalmente aparece junto com a idia B" .

Exemplos de funcionalidades presentes em softwares de minerao de textos


podem ser:

a Gesto de Bases de Dados Textuais Text Warehousing

Gerencia a organizao e o acesso aos dados da base de forma organizada. Visa


manter a base de dados atualizada sem a necessidade de interveno constante por parte
do usurio. A gerencia dessas bases textuais amplamente discutida por SULLIVAN
(2001).

b Pr-Processamento dos Textos

Prepara documentos para serem processados por outras funes (descritas a


seguir). Automatiza o processo de adequao dos documentos, liberando o usurio para
tarefas mais especializadas e adequadas ao seu contexto de trabalho.

242

c Gerao Automtica de Resumo

Diminui a quantidade de texto a ser lido pelo usurio, reduzindo o tempo de


anlise de um documento.

d Criao de Clusters

Promove o agrupamento de documentos afins, permitindo a visualizao de


relaes recprocas entre os documentos e sua anlise numa perspectiva sinptica, o que
no seria facilmente perceptvel numa postura de anlise ad hoc dos documentos. A
anlise de clusters uma funo poderosa que permite ao usurio ext rapolar seus
horizontes de anlise, identificando possibilidades e perspectivas no imaginadas
anteriormente, analisando, conceitos, tendncias, comportamentos, relaes entre
diferentes fatos e realidades que sejam relevantes em seu contexto de trabalho.

e Busca Pr-ativa

Descobre novidades e aspectos relevantes em textos, agilizando a percepo de


tendncias e o comportamento de um fenmeno ao longo do tempo, apresentando ao
usurio informaes tempestivas e significativas.

f Armazenamento

Mantm em arquivos cpias integras dos textos analisados, tendo como


benefcio relevante o arquivamento, na base de documentos local, dos resultados
obtidos com a anlise e acrescentando informaes que facilitem a recuperao dos
documentos.

g Busca Reativa

Recuperao de informaes, promovida diretamente pelo usurio, a partir de


critrios de busca. Tem como benefcio a recuperao dos documentos de forma

243

organizada, agrupando-os e classificando-os de acordo com critrios informados pelos


usurios.

h Dicionrios e Parmetros

Contempla a necessidade de definio de conhecimento das palavras e dos temas


relevantes. Oferece suporte para a criao e manuteno de dicionrios de idiomas e
temticos.

i Regras Para Anlise e Distribuio

Gerencia dados de parmetros para a definio das funes de resumo, cluster,


armazenamento e relatrio. Oferece suporte criao e manuteno de regras para
gerao automtica de resumo, agrupamento de documentos, classificao em termos de
relevncia e distribuio dos mesmos em diferentes setores da organizao.

j Categorizao Automtica

Possibilidade de direcionar documentos a classes previamente estabelecidas por


usurios.

k Gerao de Relatrio

Informa aos usurios sobre a chegada de novos documentos nas bases. O usurio
recebe informaes sobre os novos documentos de forma organizada, facilitando sua
seleo para uma anlise mais aprofundada.

8.10 Minerao de Textos e Inteligncia


A informao relevante est, cada vez mais, articulada a uma perspectiva de
inteligncia. O conceito de inteligncia est inflacionado em nossa cultura possuindo
mltiplas interpretaes. Portanto, requer aqui uma definio que pode ser expressa
num ponto de vista organizacional. Sob este ponto de vista, inteligncia vincula-se

244

definio da postura estratgica da organizao, ao pensar executivo sobre o conjunto


articulado de aes que deve uma corporao realizar para atuar em um ambiente dado,
considerando seu pblico alvo, players, produtos e intentos de participao em seu
mercado de atuao. Ou seja: considerando a misso organizacional, a funo de
inteligncia questiona a realidade, procura interpret- la, compreender o jogo de foras
sob o qual est submetido uma corporao, as fragilidades e potencialidades de todos os
entes envolvidos e, uma vez entendida a configurao desse jogo e os eventos
contextualizados, define o comportamento adequado da organizao.

Podemos,

portanto, falar de uma inteligncia organizacional que considera o desafio da corporao


de decidir posturas estratgicas e definir aes sobre a realidade que tornem efetivas a
sua misso. Essa inteligncia deve ser capaz de prospectar o ambiente, captando sinais
que indiquem qual o seu estado num dado momento e imediatamente disparando
comandos que alterem o comportamento corporativo para se ajustar a condies que
mudam continuamente.

A minerao de textos visa a explorao de informao em documentos e uma


atividade estratgica que nasceu do desafio de acessar de modo inteligente a
informao existente em acervos nas organizaes e bases pblicas na web . Por
inteligente queremos dizer que os sistemas que possibilitam esse acesso devem ter
capacidade para auxiliar o usurio que est analisando informao, interagindo com ele,
mostrando-lhe os contedos relacionados com aquele(s) que ele busca, permitindo- lhe
expandir de modo controlado o seu pedido de informao e reduzir, em seguida, rpida
e interativamente, o leque de documentos encontrados e relevantes. Durante a busca e a
anlise, gradativamente pode sugerir ainda outros documentos relacionados com aqueles
que este usurio est procurando, embora no contendo nenhuma das palavras ou
expresses anteriormente utilizadas, permitindo tamb m novas selees desses
documentos.

Uma ferramenta de minerao de textos permite a explorao de grandes


quantidades de texto para da extrarem automaticamente diversos tipos de
conhecimento que esses textos encerram. A explorao de informao que realiza visa
no essencial extrair contedos e descriminar os significados das palavras (e unidades
textuais mais complexas) recorrendo aos contextos sintticos em que elas ocorrem.
Pode recorrer tambm a uma anlise estatstica dos conjuntos de documentos e dos
245

termos que neles figuram. A avaliao da qualidade da informao extrada ser outro
aspecto que ser enfatizado, tendo em vista as aplicaes a que aquela informao se
destine. Minerao de textos um esforo significativo de decodificao automtica de
segredos guardados pelas colees de textos, segredos que muitas vezes pode significar
maiores lucros ou melhores resultados pela identificao em tempo hbil de
oportunidades e ameaas, pela evidncia de fatos relevantes em processos internos e
aprimoramentos dos controles organizacionais e pela adequada anlise do mercado e
das relaes com os clientes.

8.11 Aplicaes de Softwares de Minerao de Textos

H um conjunto de possibilidades para aplicao do processo da Minerao de


Textos,

envolvendo

inteligncia

organizacional,

inteligncia

governamental,

relacionamento com pessoas, gesto pblica, desenvolvimento cientfico e tecnolgico,


gesto do conhecimento e gesto de operaes organizacionais.

Em todos esses

campos, temos grandes bases de dados textuais, a maioria de crescimento rpido pelo
acelerado desenvolvimento da tecnologia da informao e pela facilidade da gerao da
informao textual nos dias atuais. Podemos avaliar sumariamente alguns desses
campos.

Um primeiro campo de aplicao a Inteligncia Competitiva, que pode ser


definido como um programa tico e sistemtico para capturar, reunir, analisar e
gerenciar informao externa que podem afetar as organizaes, seus planos, decises e
operaes. (SCIP Society of Competitive Intelligence Professionals). Sob o ponto de
vista da Inteligncia Competitiva, possvel aplicar as estratgias de minerao de
textos com objetivo de entender as variveis relativas aos consumidores, aos
competidores, fornecedores, desenvolvimento tecnolgico e desenvolvimento de novos
produtos e servios.

Um segundo campo de aplicao a inteligncia governamental vinculada


gesto pblica. Governos so cada vez mais demandados em termos de eficincia e
competncia em suas aes pelos cidados de seus pases e regies, especialmente os
democraticamente eleitos. Precisam responder com celeridade e efetividade no campo

246

das tarefas que lhes so atribudas constitucionalmente. Temos ento uma gama de
aplicaes para Minerao de Textos, envolvendo a melhoria da inteligncia
governamental, no sentido de atuar em tarefas como: deteco de fraudes e atentados
contra o patrimnio e a receita pblicos, gerenciamento e coordenao de aes de
segurana nacional, previso de aes terroristas, aplicao de regras de direito pblico,
dentre outras. As organizaes pblicas lidam com gigantescos acervos de textos e as
atividades de regulao e monitoramento conduzidas pelo Estado podem muito se
beneficiar de Text Mining.

Um terceiro ponto importante a ser citado o relacionamento com pessoas,


inseridas em diferentes contextos e comunidades cujo monitoramento inteligente seja
justificvel. Temos ento duas frentes importantes: o CRM Customer Relationship
Management (Gerencia do Relacionamento com o Consumidor), o CZRM Citizens
Relationship Management (Gerncia do Relacionamento com os Cidados). Tanto
enquanto consumidores de bens e servios como enquanto cidados de um determinado
estado, as atitudes, pensamentos e comportamentos das pessoas interessam a empresas e
governo. A Minerao de Textos pode ser usada para capturar, portanto, seus
comportamentos, reaes, sentimentos, atravs da extrao de informaes de e- mails,
chats, fruns de discusso, comunidades virtuais, etc.

Um quarto campo de aplicao muito importante a Gesto do Conhecimento.


A experincia operacional de muitas organizaes frequentemente traduzida em
documentos textuais, produzidos por profissionais de diferentes matizes, grande parte
deles com elevada competncia e formao. Documentos em formato de editores de
texto, planilhas eletrnicas e pginas da Web so produzidos de modo intenso,
diariamente. Com o passar do tempo, a base de documentos textuais cresce e
necessrio saber como explor- la para finalidades estratgicas, sob pena de, por maior
que ela seja, nada servir organizao que a gerou. Muitas pesquisas para responder
perguntas do presente podem basear-se em questes j tratadas no passado. A
reconfigurao e nova combinao de assuntos e, consequentemente de documentos
anteriormente armazenados diversos ajuda a responder desafios do presente. Bases de
dados externas adquiridas ou simplesmente acessadas pela organizao podem tambm
compor o universo de interesse. Enfim, temos uma coleo de textos, a que podemos

247

chamar de document warehouse, produzida de diferentes formas pela organizao que


ser ento alvo do processo de minerao de textos.

Se a web e outros repositrios internos so as fontes ou minas de onde se


extrai material bruto, documenent warehouses so as usinas e refinarias que tornam as
pesquisas com textos usveis em um processo de gesto do conhecimento e business
intelligence e distribuio do mesmo ao consumidor final. Document warehouses so
repositrios dinmicos, constantemente adaptados diante das necessidades de mudanas
apresentadas pelos usurios finais de informao. SULLIVAN, 2001
8.12 O Software DifBrain

Entre 2004 e 2006, foi desenvolvido o software DifBrain, pela Diferencial


Consultores Associados,

78

empresa de Tecnologia da Informao, especializada em

desenvolvimento de sistemas de informaes, com foco em softwares gerenciais, e


sediada em Belo Horizonte, desde 1996. O software DifBrain aplicativo destinado a
realizar o processo de minerao de textos. Ele realiza todas as funcionalidades
descritas no item 8.9. Esse desenvolvimento foi conduzido por um grupo de trabalho
composto por trs profissionais, incluindo o autor da tese, que trabalhou em conjunto
com um analista de sistemas e uma professora doutora da rea de engenharia eltrica79
com atuao na rea de inteligncia artificial.

DifBrain foi desenvolvido de acordo com o Processo Interativo de Desenvolvimento


de Software e a Orientao a Objetos, apresentado no tpico 3.5, dessa Tese, em
ambiente SUN Java J2EE incorporando tambm recursos em PROLOG80 para

78

Maiores informaes em www.difnet.com.br. Desde de 1996 a empresa atua com o desenvolvimento


de softwares gerenciais, especialmente os que fazem uso de recursos tecnolgicos da rea de Inteligncia
Artificial em estratgias de minerao de dados. Atuou tambm em projetos de gesto do capital
intelectual de organizaes entre 2000 e 2004 e outros projetos diversos vinculados aos campos da
tecnologia da informao, gesto de talentos humanos e mapeamento e anlise de processos.
79
Alm do autor, compuseram e equipe de desenvolvimento o Analista de Sistemas Marcelo Gibson de
Castro Gonalves, Cientista da Computao e a Professora Doutora Regina Ftima Gibson Gonalves,
Engenheira Eletricista, especialista na rea de Inteligncia Artificial.
80
Linguagem de programao PROLOG PROgramming in LOGic ou programao em lgica. Essa
linguagem amplamente usada em aplicaes da rea de Inteligncia Artificial. Ela usada
principalmente como uma linguagem de prototipao rpida e para tarefas de manipualao de smbolos e

248

as rotinas que demandaram recursos de inteligncia artificial. A ferramenta passou por


uma srie de verses, tendo iniciado seus primeiros testes com a avaliao de noticias
sobre poltica de dois jornais brasileiros. Posteriormente foi aplicada base de
documentos da experincia operacional interna da ELETRONUCLEAR. Incorpora de
forma mesclada e integrada recursos descritos para recuperao da informao (capitulo
5) e sistemas inteligentes (capitulo 6), dentre os quais podemos citar:

modelo vetorial;

modelo de indexao semntica latente;

modelo das listas no sobrepostas

modelo da proximidade de ns

modelo da recuperao por passagens

modelo fuzzy

modelo contextual

processamento da linguagem natural.

O software em questo, utilizando modelos de RI e IA procede o tratamento do texto


quebrando-o em palavras, apurando freqncia das mesmas e ordenando-as por
nmero de ocorrncias. Realiza a separao por sentenas e executa o tratamento das
mesmas Identifica tambm a estrutura e segmentos do texto. Antes de seu uso na
ELETRONUCLEAR, foi utilizado em testes com noticias extradas da Internet de
jornais brasileiros com stios na Web. Essa ferramenta foi desenvolvida para tratar
documentos em diferentes idiomas, sendo que hoje j incorporou a anlise de
documentos em portugus, ingls e alemo. Possui tambm as funcionalidades de
buscas proativas e reativas e procede o controle de clusters, procedendo cruzamento
entre critrios de elaborao. Cria clusters hierrquicos de modo a permitir a
visualizao por parte do usurio dos conjuntos de documentos e de seus
relacionamentos criando uma perspectiva sinptica de anlise. Apresenta informaes
estatsticas sobre o documento. Na gerao do resumo, permite que o usurio
especifique o nmero de palavras que deseja no resumo, at o total de 200 palavras.
Possui interface interativa e amigvel e auxilia o usurio a realizar buscas inteligentes e
cleres.
anlise de linguagem natural. Muitos sistemas especialistas foram escritos em PROLOG para domnios
jurdicos, mdicos, financeiros e outros (RUSSEL & NORVIG, 2004).

249

PARTE III DESENVOLVIMENTO DA PESQUISA

250

9 O CONTEXTO DA ENERGIA NUCLEAR E A ELETRONUCLEAR

O presente captulo tem por finalidade apenas apresentar uma viso panormica
sobre a energia nuclear para que se possa perceber a dimenso do conhecimento
humano envolvido no mbito da Eletronuclear, nos processos de projeto, construo,
operao e manuteno de usinas nucleares e, por conseguinte, a importncia dos
conhecimentos tcitos, que esto embutidos nas mentes dos funcionrios da empresa, e
explcitos, que esto inseridos em suas bases documentais e de dados. Por conseqncia,
infere-se uma viso preliminar sobre os desafios relativos gesto desse conhecimento
em um contexto organizacional. Em hiptese alguma pretende ser uma viso exaustiva
de assunto to vasto e complexo. A Engenharia Nuclear um campo de conhecimento
especfico e a operao de usinas tem uma dimenso muito ampla que no inteno da
presente tese aprofundar. Procuramos apenas tangenciar o assunto, pontuando sua
relevncia para se justifique ainda mais as prticas de gesto do conhecimento e a
tecnologia de minerao de textos a ela vinculada. Para uma viso mais ampla e
profunda dos conceitos e processos relativos energia nuclear consultar na Internet, por
exemplo, o stio www.nucleartourist.com, cujas informaes tambm contriburam para
a viso aqui apresentada.

9.1 Histrico da Energia Nuclear


Um marco importante na histria do conhecimento humano a descoberta do
tomo, que fruto do desenvolvimento intelectual do homem na sua relao com a
natureza e trouxe muitos bene fcios ao homem em diferentes campos da cincia. Um
passo adicional foi dado ao se descobrir que se poderia usufruir das caractersticas desse
tomo na gerao de energia. As usinas nucleares de operao comercial produzem
energia eltrica a partir da energia nuclear. Por energia nuclear entendemos a fora que
mantm os componentes do ncleo de um tomo integrados. Portanto, quando h o
romper desta fora produz-se energia trmica. Em um reator, portanto, o objetivo
romper esta fora e usar a enorme quantidade de energia trmica liberada para gerar
vapor, que produzir movimento e por fim, eletricidade. Assim, a energia eltrica, em
usinas nucleares, no gerada diretamente dos tomos que se dividem.

251

A partir da evoluo do conhecimento da estrutura atmica constatou-se a


possibilidade do ncleo de um tomo poder perder massa. E verificando-se ento uma
perda de massa, tal perda ir ser transformada em energia. No ano de 1938, os alemes
Hahn e Strassmann conseguiram fissionar o urnio. Quando um ncleo pesado sofre
fisso, obtm-se tomos de massa mediana e grande quantidade de energia.
Posteriormente novos experimentos constataram a quebra do ncleo do urnio por
meio de nutrons. Em tal quebra, muitos produtos da fisso podem ser gerados, ou seja,
temos uma sucesso de reaes nucleares ocorrendo ao mesmo tempo. Nas quebras
ocorrem liberaes de 2 ou 3 nutrons que, como elementos desencadeadores da fisso
provocam outras sucessivas cises nucleares (reaes em cadeia). H dois tipos de
reaes nucleares: a fisso e a fuso.
Na fisso, o ncleo de algum elemento qumico pesado (urnio, plutnio ou
trio) recebe o bombardeio de um nutron e subdivide-se em duas partes maiores e
alguns nutrons, sendo ento alvo de uma ciso que chamada de fisso nuclear (Figura
35 a). Nela, a soma das massas resultantes tem massa inferior soma das massas do
ncleo bombardeado e do nutron.

Figura 35 (a): Fisso Nuclear

252

O outro tipo de reao nuclear denominado fuso. Nela, juntam dois ncleos
atmicos para formar um, o que requer uma quantidade muito elevada de energia para
vencer a repulso eletromagntica inerente entre estes ncleos. O ncleo de um
elemento qumico leve [istopos do H2 (deutrio e trtio)] recebe um nutron ou dois
ncleos de elementos leves [istopos do H2 (deutrio e trtio), He e Li], que se fundem,
produzindo, em ambos os casos, um elemento qumico mais pesado, mas as partes
resultantes da fuso tm massa inferior soma dos elementos iniciais. As reaes por
fisso nuclear presidem os processos de gerao comercial de energia eltrica
atualmente no mundo, atravs da tecnologia dos reatores de fisso.
9.2 O Combustvel Nuclear

Um elemento combustvel (urnio, trio ou plutnio) necessrio operao de


usinas nucleares. Esse elemento combustvel, em geral o urnio, precisa passar por um
processo de enriquecimento, uma vez que o urnio natural no usado para gerar
energia. necessrio usar urnio-235 (U-235) que altamente fissionvel, misturado ao
urnio-238 (U-238) bem mais estvel, o que permite controlar a energia produzida na
reao em cadeia atravs da proporo entre eles. Usinas nucleares usam uma proporo
de 3% de U-235 e 97% de U-238. Os reatores nucleares de Angra I e II utilizam como
elemento combustvel pastilhas slidas, contendo dois tipos de tomos de urnio. Um
deles, o Urnio U-235, constitui menos de 1% do urnio natural, mas fissiona
facilmente. O outro tipo, o Urnio U-238, constitui os outros 99%, sendo, entretanto,
praticamente no- fissionvel. O urnio natural ento enriquecido, de modo que a
concentrao de U-235 seja aumentada para 2 a 5%. Isto perfaz uma quantidade
suficiente de urnio fssil para operar satisfatoriamente uma usina nuclear.

No caso brasileiro, a opo pelo uso da energia nuclear torna-se ainda mais
atraente quando se considera que o Brasil possui a 6 maior reserva mundial de urnio e
instalaes industriais do Ciclo do Combustvel, operadas pela INB Indstrias
Nucleares Brasileiras, o que garante ao pas independncia no suprimento de
combustvel nuclear. Para ir da mina at a usina, o urnio brasileiro percorre as
seguintes etapas:

253

a) Minerao: prospeco, extrao e o beneficiamento do minrio de urnio at


a produo do concentrado ou torta de urnio, tambm conhecido como yellow
cake (U3O8).

b) Converso: o yellow cake transformado no gs UF 6 - hexafluoreto de urnio,


forma qumica apropriada para utilizao no processo seguinte.

c) Enriquecimento Isotpico: - O UF6 passa por um processo em que se torna


radioativo, uma vez que tomos do U-238 so retirados do urnio natural,
obtendo-se um produto final com maior concentrao de istopo fssil, ou seja,
enriquecido em U-235.

d) Reconverso: O UF6 reduzido a xido de urnio (UO 2 ), na forma de p.

e) Fabricao de pastilhas: O p de xido de urnio (UO 2 ) aquecido e


compactado em pastilhas de 10 mm de dimetro que tm a forma de um cilindro
de cerca de 1 cm de comprimento e de dimetro, acomodadas no interior de
varetas de 4,40 m de comprimento e 10,76 mm de dimetro de zircaloy (uma
liga de zircnio), hermeticamente fechadas e que suportam temperaturas at
1.852 C. Para produzir uma pastilha necessrio processar 250 g de
yellowcake.

f) Montagem do Elemento Combustvel: As pastilhas so colocadas no interior


de varetas metlicas tubulares. As varetas estanques so soldadas e montadas em
grades estruturais, formando o elemento combustvel.

Cada vareta possui

aproximadamente 2kg de urnio. Uma vareta garante fornecimento de energia a


uma cidade de 20.000 habitantes, durante 24 horas. So necessrias 235 dessas
varetas para formar um conjunto, o elemento combustvel.

g) Gerao de Energia: Um determinado nmero de elementos combustveis


colocado no interior do reator. Neles ocorre a reao em cadeia, resultando na
produo de calor. Em meio ao combustvel, composto de pastilhas de dixido
de urnio, so inseridas pastilhas de califrnio, elemento qumico que emite
nutrons naturalmente e que ir deflagrar a reao de fisso. Na fisso, um
254

nutron atinge o tomo de U235 e usualmente divide-o em dois tomos menores.


Esta diviso libera no apenas calor, mas tambm dois ou trs nutrons, que, por
sua vez, atingem e dividem outros tomos. Assim, ocorre uma reao em cadeia
de fisso nuclear (Figura 35 b). Aps a sua queima, o combustvel pode ser
armazenado em um depsito especial ou ento reprocessado.

Figura 35 (b): A reao em Cadeia

9.3 A Operao de Usinas e Reatores


As Usinas Nucleares so centrais de gerao de energia eltrica que utilizam a
reao nuclear como fonte para gerao de energia.

As usinas so estruturas

complexas por lidar com a gerao de energia, o manejo de questes ambientais e


rejeitos nucleares, alm de demandar um nvel elevado de conhecimento humano e
recursos financeiros e materiais para oper- las. Em geral so complexos que lidam com
estruturas de conteno de concreto e ao, reatores, geradores de vapor, piscinas de
armazenamento de combustvel, turbinas vapor, geradores de eletricidade,
condensadores, torres de refrigerao, torres de transmisso de energia, dentre outros
elementos.

255

O reator nuclear um elemento chave. Um reator uma mquina trmica que


gera energia a partir do calor. Um elemento combustvel (urnio, trio ou plutnio)
ativado para produzir calor, que produz vapor e que por sua vez produz energia eltrica.
Ativar deflagrar a reao de fisso nuclear, que a "quebra" dos tomos de U235
atravs do choque de nutrons nestes tomos de urnio.
O ncleo de um reator consiste de um conjunto de vrios tubos longos com
pastilhas de dixido de urnio, substncia que contm tomos de urnio. No urnio
ocorre uma reao em cadeia causada pelas fisses do urnio-235, e a energia liberada
absorvida pelo material do reator na forma de calor - a energia nuclear contida nos
ncleos atmicos transformada em energia trmica. O combustvel produz o calor
pela fisso e necessita de um refrigerante (gua, gua pesada, gs, hlio, etc).

refrigerante conduz o calor produzido durante o processo at a turbina geradora de


eletricidade ou ao propulsor.
Nos reatores de gua pressurizada, por exemplo, o calor retirado do reator de
modo a aquecer a gua e transform- la no vapor, que acionar a turbina. Ao passar pelas
ps de uma turbina, e gir-la, a energia trmica transformada em energia mecnica de
rotao. O eixo da turbina vincula-se com um gerador que transforma a energia
mecnica em energia eltrica. A energia eltrica ento conduzida, atravs de torres de
transmisso e malhas de distribuio at residncias e outros consumidores.
Alm do combustvel e do refrigerante, merecem meno alguns outros
componentes importantes, tais como o moderador que serve para diminuir a velocidade
dos nutrons que intervm na reao nuclear, tornando-os lentos a fim de aumentar a
probabilidade de ocorrncia de fisso. A moderao pode ser feita pela injeo de boro
no circuito primrio ou pelo uso de barras de controle. Outro item significativo o
refletor, que impede o escapamento de nutrons aumentando a eficincia do reator. H
ainda a blindagem, os materiais de controle e os elementos de segurana.
Uma blindagem de concreto, chumbo ou ao evita o escapamento de radiao
gama e neutrons. Cdmio e boro so usados na forma de barras ou dissolvidos no
refrigerante como elementos de controle para finalizar uma reao em cadeia

256

Atualmente existem vrios tipos de reatores nucleares de fisso, conforme


descritos a seguir:

LWR - Light Water Reactors: Utilizam como refrigerante e moderador a gua e


como combustvel o urnio enriquecido. Os mais utilizados so os BWR
(Boiling Water Reactor ou Reator de gua em ebulio ) e os PWR (Pressure
Water Reactor ou Reatores de gua pressurizada), estes ltimos considerados
atualmente como padro. Havia, em 2001, 345 dessses reatores no mundo em
funcionamento.

CANDU - Canada Deuterium Uranium: Utilizam como moderador gua pesada


(cuja molcula composta por dois tomos de deutrio e um tomo de oxignio)
usando como refrigerante gua comum. Como combustvel usam urnio comum.
Em 2001 havia 34 deles em operao no mundo.

FBR - Fast Breeder Reactors: Utilizam nutrons velozes no lugar de trmicos


para o processo da fisso. Como combustvel utilizam plutnio e como
refrigerante sdio lquido. Este reator no necessita de moderador. Havia apenas
4 deles em operao em 2001.

HTGR - High Temperature Gas-cooled Reactor: Usa uma mistura de trio e


urnio como combustvel, utilizando hlio como refrigerante e grafite como
moderador. Existiam 34 em funcionamento em 2001.

RBMK - Reactor Bolshoy Moshchnosty Kanalny: O objetivo principal desse tipo


de reator a produo de plutnio, gerando eletricidade como subproduto. O
grafite usado como moderador, a gua como refrigerante e o urnio
enriquecido como combustvel. Pode recarregar-se durante o funcionamento.
Existiam 14 em funcionamento em 2001.

ADS - Accelerator Driven System: Utiliza uma massa de trio, sendo a fisso
produzida pela introduo de nutrons no reator de partculas atravs de um
acelerador de particulas. Encontra-se ainda em fase de experimentao, e uma
de suas funes fundamentais ser a eliminao de resduos nucleares
produzidos em outros reatores de fisso.
Portanto, uma forma de classificar as usinas nucleares em funo do fluido

que resfria o reator. H reatores refrigerados a gs, reatores refrigerados a gua fervente,
reatores refrigerados a gua leve moderado a grafite, reatores refrigerados a gua

257

pressurizada, reatores refrigerados a gua pesada. H tambm processos operacionais


com reatores a gua leve fervente, reatores regeneradores refrigerado a metal lquido,
reatores regeneradores rpidos refrigerados a gs e outros.
9.4 A Gerao de Energia Atravs do Reator gua Pressurizada (PWR)
O princpio de funcionamento das usinas PWR - Pressurized Water Reactor
(Reator a gua Pressurizada) se baseia no resfriamento do ncleo do reator atravs de
um circuito fechado de gua da alta presso chamado circuito primrio. Nelas, a gua
aquecida sob alta presso do circuito primrio passa por um trocador de calor (gerador
de vapor) onde aquece e transforma em vapor a gua do circuito secundrio. Esse vapor
movimenta uma turbina que aciona um gerador eltrico. A condensao do vapor que
trabalha na turbina se faz num trocador de calor (condensador) que resfriado por outro
circuito dotado de uma torre de refrigerao. A energia gerada chega aos consumidores
finais atravs de redes de distribuio. A figura abaixo mostra planta tpica de uma
usina nuclear:

1. CONTENO DE CONCRETO ARMADO


2. CONTENO DE AO
3. REATOR NUCLEAR
4. GERADOR DE VAPOR
5. PISCINA DE ARMAZENAMENTO DE COMBUSTVEL

6. TURBINAS VAPOR
7. GERADOR DE ELETRICIDADE
8. CONDENSADORES
9. TORRE DE REFRIGERAO
10. ADMINISTRAO

Figura 36: Planta de Usina Ncleo-Eltrica


Fonte: CTMSP

258

Explicando melhor, em usinas com reatores de gua Pressurizada (PWR)


utilizado o chamado ciclo indireto: a gua lquida que se encontra sob presso no tonel
do reator circula num circuito (o circuito primrio) distinto do circuito onde circula a
gua que depois de vaporizada atravessa a turbina (circuito secundrio). A formao de
vapor de gua no circuito secundrio obtida no gerador de vapor atravs da troca do
calor com a gua do circuito primrio. O processo de gerao de energia eltrica a partir
da energia nuclear, ento, pode ser esquematizado em trs passos:
1 - No reator: transformao da energia nuclear em energia trmica, atravs da reao
nuclear em cadeia;
2 - Na turbina: transformao da energia trmica em energia mecnica, atravs da ao
do vapor d'gua aquecido;
3 - No gerador: transformao da energia mecnica em energia eltrica.
Na figura 37 a seguir, temos outro detalhamento:

Circuito Primrio

Circuito Secundrio

Edifcio do Reator
Turbina
E
n
vo
lt
r
io
d
e
C
o
nt

Condensador

gua de
Circulao

Gerador de

Tanque de gua
de Alimentao

Figura 37: Gerao de energia eltrica a partir de um reator PWR


Fonte: Eletronuclear

259

Diante do acima exposto, podemos inferir que as organizaes responsveis por


planejar, imp lantar e gerir plantas industriais voltadas para a gerao de energia so
organizaes que lidam com considervel base de informaes sobre suas operaes e
tecnologias empregadas, demandando conhecimentos especficos e estratgicos cujo
desenvolvimento no simples e precisa, portanto, ser objeto de uma poltica de
gerao, manuteno e utilizao.

9.5. Uso e Perspectivas da Energia Nuclear

De acordo com a WNA World Nuclear Association (Associao Nuclear


Mundial), em dados apresentados na Revista Carta Capital de 13.09.2006, podemos
afirmar que o mundo j tem hoje uma significativa dependncia da energia nuclear, que,
conforme citado anteriormente, representa 16% da matriz energtica mundial, com
gerao de 2,626 trilhes de KWh, e consumo de 65.478 toneladas anuais de urnio.
Apresentamos a seguir o quadro com dados relevantes da WNA.

260

DEPENDENCIA ATMICA
10 maiores produtores (bilhes de 10 maiores consumidores (em % da
KWh)

matriz energtica)

EUA

780,5

Frana

79

Frana

430,9

Litunia

70

Japo

280,7

Blgica

56

Alemanha

154,6

Eslovquia

56

Coria do Sul

139,3

Ucrnia

49

Rssia

137,3

Coria do Sul

45

Canad

86,8

Sucia

45

Ucrnia

83,3

Bulgria

44

Inglaterra

75,2

Armnia

43

Sucia

69,5

Eslovnia

42

PANORAMA DA ENERGIA NUCLEAR NO MUNDO


Gerao de Eletricidade

2,626 trilhes de KWh

Participao na Matriz Energtica

16%

Consumo anual de urnio

65.478 toneladas

Reatores

Em funcionamento 442
Em construo

28

Planejados

52

Propostos

152

Fonte: WNA Word Nuclear Association (Associao Nuclear Mundial)


Publicado na Revista Carta Capital, So Paulo, (410) pg 16, 13.09.2006
Fonte: SIQUEIRA, Andr. Potncia Nuclear? Revista Carta Capital, So Paulo (410) set 2006

Considerando questes geolgicas, ecolgicas e econmicas, produzir petrleo e


outros combustveis fsseis no ser mais possvel no mesmo ritmo do consumo
mundial de energia. Como o carvo, o petrleo e o gs natural, a energia nuclear uma
das formas de obteno de eletricidade em larga escala. Entretanto, nas prximas
dcadas, os combustveis fsseis tendem a se exaurir, ou se tornar excessivamente
danosos ao meio ambiente. Observa-se que a oposio utilizao de energia nuclear

261

est comeando a diminuir. Na Sucia, j existe um grupo ambientalista que defende o


uso de energia nuclear, denominado Environmentalists for Nuclear Energy 81 . Devido
presso de ambientalistas contra a utilizao de combustveis fsseis, assiste-se a uma
crescente considerao da utilizao da energia nuclear como uma opo energtica
plausvel. Esta transformao ntida em pases de grande influncia no cenrio
mundial, como os Estados Unidos, o Japo e a Frana. Esta tendncia, muito
provavelmente se manifestar tambm no Brasil.

J temos hoje pases em que a dependncia da energia nuclear muito alta, com
essa fonte representando um percentual alto em suas matrizes energticas. De acordo
com a WNA Word Nuclear Association (Associao Nuclear Mundial) na Frana esse
percentual chega a 79%, na Litunia 70%, na Blgica 56% e na Sucia 45%. H fatores
macroeconmicos que hoje favorecem o uso da energia nuclear. O crescimento da
economia mundial demanda mais energia de fontes cada vez mais escassas. Por
conseqncia, temos aumento dos preos de varias commodities energticas. As fontes
fsseis esto cada vez mais caras. Os sucessivos aumentos no preo do barril indicam
uma perspectiva de aumento sustentado do preo do petrleo. A crescente demanda
mundial pressiona os preos do gs natural. Temos tambm a diminuio da
possibilidade da gerao de energia eltrica por recursos hdricos, uma vez que a maior
parte da malha hdrica do pas, prxima aos principais centros consumidores encontra-se
prxima do esgotamento, alm do fato de termos hoje dificuldade de aprovao de obras
para novas hidreltricas diante do alto custo de enquadramento ambiental. H tambm
dificuldades na explorao em grande escala de fontes alternativas como a energia solar
e a elica. Esses aspectos apontam no futuro para um aumento do uso mundial da
energia nuclear, tornando remotas as possibilidades de recuo em programas de gerao
dessa energia no Brasil e no mundo. Isso implica em um aprofundamento do processo
de busca de excelncia em gesto e operao de usinas nucleares, fazendo da prtica de
gesto do conhecimento um recurso poderoso para o melhor funcionamento das
mesmas.

81

Fonte: www.eletronuclear.gov.br

262

9.6 Descrio da Eletronuclear

82

No ano de 1968, o Estado brasileiro tomou a deciso de ingressar no campo da


produo de energia nuclear, visando permitir ao pas a possibilidade de desenvolver
conhecimento com tal tecnologia e adquirir experincia para fazer frente s possveis
necessidades futuras.

Assim sendo, em 1969, realizou-se uma concorrncia

internacional, vencida pela empresa norte-americana Westinghouse e, em 1972, iniciouse a construo da Usina de Angra I, com uso de reator do tipo Reator a gua
Pressurizada PWR (Presssurized Water Reactor).

A usina entrou em operao

comercial em 1985.

Em junho de 1975, o Governo do Brasil assinou com a ento Repb lica Federal
da Alemanha o Acordo de Cooperao para Uso Pacfico da Energia Nuclear. No
mbito desse acordo, foi concretizada, em julho de 1975, a aquisio das usinas de
Angra II e III empresa alem Kraftwerk Union A.G. KWU, ento subsidiria da
Siemens. A Usina de Angra II, aps atrasos de cronograma devido a restries de
recursos financeiros disponveis, entrou em operao em 2000, sendo sincronizada
rede em julho desse mesmo ano.

Atualmente, de acordo com a WNA Word Nuclear Association (Associao


Nuclear Mundial), a energia nuclear responde por 16% da produo de energia eltrica
total no mundo. Devido ao seu baixo custo ambiental, evita a emisso anula de
aproximadamente 2 bilhes de toneladas de CO2. Em 2001, Angra I e II evitaram a
emisso de 14 milhes de toneladas de CO2 que seriam produzidos caso a energia
produzida fosse gerada pela queima de leo combustvel ou carvo, como estava
previsto nos anos 60 para o Rio de Janeiro, que receberia complementao termeltrica
naquela poca.

A ELETRONUCLEAR uma empresa de controle estatal e foi criada em 1 de


agosto de 1997, proveniente da fuso da rea nuclear de FURNAS Centrais Eltricas
S.A., responsvel pela operao de Angra 1 e pela construo de Angra 2, com a
82

As informaes a seguir sobre a empresa foram obtidas em seu endereo eletrnico da Eletronuclear
(www.eletronuclear.gov.br) e em documento de apresentao da Central Nuclear Almirante lvaro
Alberto fornecido pelo Centro de Informaes mantido pela Empresa em Angra dos Reis RJ. Inclui
tambm os relatos apresentados ao autor por ocasio das diversas visitas realizadas na Eletronuclear.

263

NUCLEN, empresa de enge nharia detentora da tecnologia de projeto de Angra 2 e 3.


Sua misso produzir energia eltrica de origem nuclear com elevados padres de
segurana e eficincia e custos competitivos, preservando a capacidade de projetar,
construir e gerenciar seus empreendimentos. A empresa possui competncia e
capacidade tcnica nas reas de projeto, construo e operao de usinas
termonucleares. As atividades da Empresa compreendem hoje a operao da Usina
Nuclear Angra 1, com 657 Mw e Angra 2, com 1309 Mw. Tais usinas, em conjunto
com Angra 3, tambm com 1309 Mw e que no momento passa por uma fase de
reavaliao do projeto, constituem a Central Nuclear Almirante lvaro Alberto
CNAAA, situada na praia de Itaorna, no Municpio de Angra dos Reis, Estado do Rio
de Janeiro.

Em 2001, Angra II apresentou um desempenho significativo, gerando 10,5


milhes de MWh, o que a colocou em 16. Lugar no ranking mundial das usinas
nucleares com maior volume de gerao de energia. Melhorias tecnolgicas
introduzidas em vrios sistemas e componentes conduziram a um aumento do valor
nominal da potncia para 1350 MW disponveis para operao em regime contnuo,
valor este posteriormente homologado, em 2002, pela agncia reguladora do setor
eltrico, ANEEL Agncia Nacional de Energia Eltrica.

A Central Nuclear de Angra est prxima dos principais centros consumidores


de energia do pas. A escolha do local envolveu uma srie de condicionantes, todos
ligados s caractersticas do sistema de gerao nuclear, tais como abundncia de gua
de refrigerao e facilidade de transporte e montagem de equipamentos pesados, sendo
precedida de inmeros estudos desenvolvidos com o apoio de empresas de consultoria
internacionais, com ampla experincia em seleo de stios para a construo de usinas
nucleares. A proximidade dos grandes centros de consumo evita a construo de
dispendiosos sistemas de linhas de transmisso e a conseqente elevao do custo da
energia produzida.

Est prevista a Construo da Usina Nuclear de Angra III, que ser praticamente
uma rplica de Angra II, com exceo de suas fundaes, assentadas diretamente sobre
a rocha, e da modernizao do sistema de instrumentalizao e controle, que ser
inteiramente digital. Os componentes dos circuitos primrios e secundrio de Angra III,
264

fornecidos nos anos 80, juntamente com os de Angra II, esto armazenados sob
rigorosas condies de preservao que asseguram seu perfeito estado, mas com custos
com relevantes, o que deve ser um fator importante para a rpida retomada da
implantao da Usina. Os procedimentos para o licenciamento nuclear e ambiental de
Angra III esto em andamento e sua operao est prevista para 2013, de acordo com o
Plano Decenal da Empresa de Planejamento Energtico (EPE) do Ministrio das Minas
e Energia. A usina est includa entre as fontes de energia brasileiras previstas para o
pas, portanto. A concluso da Usina Nuclear Angra III representar uma valiosa
contribuio para o abastecimento de energia do Estado do Rio de Janeiro e da Regio
Sudeste. Neste novo mercado, altamente competitivo e que a principal razo da
reformulao do setor eltrico, meta primordial da Empresa minimizar o custo de
produo da energia eltrica de origem nuclear, mantendo os mais elevados padres de
segurana no projeto, construo e operao das usinas que integram a CNAAA. A
retomada da construo de Angra III implica em um futuro crescimento do uso da
energia nuclear no Brasil, que hoje responde por cerca de 4,3% do total da energia
consumida no pas.

As questes de segurana so relevantes na operao de usinas nucleares e


obedecem a especificaes internacionais. O licenciamento das usinas da CNAAA est
a cargo da CNEN Comisso Nacional de Energia Nuclear, obedecendo ainda de forma
rigorosa legislao ambiental vigente no Brasil. As usinas so tambm avaliadas
periodicamente por organismos internacionais como a IAEA (International Atomic
Energy Agency), WANO (Word Association of Nuclear Operators) e INPO (Institute of
Nuclear Power Operators).

Outra questo importante e sempre considerada na operao de usinas nucleares


o tratamento de rejeitos. Os rejeitos lquidos e slidos, de mdia e baixa atividade,
gerados durante a operao das usinas da CNAAA so processados e acondicionados
em tambores testados e qualificados segundo as normas da CNEN e requisitos
internacionais. Aps devidamente lacrados e identificados, esses tambores so
armazenados no Depsito Provisrio de Rejeitos, especialmente construdo para esse
fim e localizado na rea central. Os tambores esto sob fiscalizao permanente e so
periodicamente inspecionados e monitorados. Em 2001 a Eletronuclear e a CNEN
firmaram acordo para construo de um Depsito Final de Rejeitos de baixa e mdia
265

atividade gerados pelas usinas. Esse local ainda est em fase de escolha, sendo o
trmino previsto para sua construo em 2009.

So objetivos estratgicos da Eletronuclear:

Otimizar a produo de Angra 1 e Angra 2, apresentando padres de segurana e


desempenho acima da mdia;

Implementar um programa de gerenciamento de rejeitos, com foco na reduo


dos volumes produzidos no armazenamento em carter intermedirio e na
obteno de soluo para o armazenamento definitivo;

Retomar a construo de Angra III;

Atuar, ativamente, na conduo do Programa Nuclear Brasileiro e na divulgao


dos benefcios da energia nuclear para o pas;

Dotar a empresa de instrumentos que permitam, continuamente, a realizao


profissional de seus empregados, o desenvolvimento de seus processos
corporativos, o seu equilbrio econmico- financeiro e o gerenciamento do seu
conhecimento.

A Eletronuclear, sendo uma empresa que atua na rea da energia nuclear, tem
como um de seus objetivos principais dominar a respectiva tecnologia, conforme
OLIVEIRA (2) (2002) 83 . Ainda segundo esse autor, Tal tecnologia foi absorvida e
consolidada ao longo dos ltimos 30 anos, pelas empresas que passaram a constituir a
ELETRONUCLEAR: a NUCLEN e a Diretoria Nuclear de FURNAS. Aps 1997, pela
83

O Sr. Luiz Celso Oliveira, funcionrio da Gerncia de Engenharia de Apoio da Eletronuclear, sendo
Coordenador de Experincia Operacional Externa - EOE, autor do trabalho Gesto do Conhecimento
na Eletronuclear e foi o principal interlocutor da empresa com o autor da presente tese no que tange ao
levantamento das informaes imprescindveis para sua realizao, bem como facilitador do processo de
interao com demais pessoas e reas tcnicas e operacionais da organizao. Atuou tambm no
fornecimento de dados e informaes que apoiaram a especificao do software de minerao de textos
DifBrain, usado nos experimentos realizados na Eletronuclear com suas bases de documentos
digitalizados, sendo, juntamente com sua equipe de trabalho, um dos principais usurios potenciais de tal
tecnologia dentro da Empresa. O trabalho citado foi gentilmente apresentado ao autor dessa tese, muito
contribuindo para a melhor compreenso da realidade organizacional a ser pesquisada e facilitando a
busca de solues para problemas apresentados, dentro do escopo da metodologia de pesquisa do presente
trabalho, que implica em uma construo coletiva de propostas e alternativas para desafios que se
apresentam na situao em anlise.

266

prpria ELETRONUCLEAR. A NUCLEN, como parte do Acordo Nuclear Brasil


Alemanha, assimilou a tecnologia para projeto, construo e gerenciamento do
empreendimento de usinas nucleares tipo PWR, atravs de um processo planejado e
monitorado. FURNAS absorveu da Siemens e da Westinghouse, atravs de treinamento
e licenciamento de operadores, os conhecimentos necessrios para operar o mesmo tipo
de usina. Uma condio de fixao da tecno logia a sua prtica constante, mas com o
enorme espaamento entre a construo das usinas nucleares brasileiras (duas usinas em
30 anos, no lugar de nove usinas em 20 anos, originalmente planejadas pela
ELETROBRS), a manuteno da tecnologia ficou ameaada. Isto principalmente pela
no renovao suficiente das equipes tcnicas, o que no era requerido pelo ritmo lento
da construo das usinas. operao e de apoio de engenharia com o melhor domnio
possvel das respectivas tecnologias. Ainda de acordo com OLIVEIRA (2) (2002), da
anlise da estratgia da Eletronuclear, e de seu mercado de atuao, podem ser os
seguintes os seus fatores crticos de sucesso:

Baixo custo de operao

Alta disponibilidade das Usinas

Atingir os indicadores de performance da WANO (Word Association of Nuclear


Operators)

Performance qumica

Exposio coletiva a radiao

Razo de segurana industrial

Volume de resduos slidos

Desempenho dos sistemas de segurana

Performance Trmica

Fator de perda de disponibilidade no planejada

Pelos aspectos descritos, podemos perceber que a questo da gesto do


conhecimento na Eletronuclear se apresenta com status de objetivo estratgico, devido a
peculiaridade e relevncia de sua misso organizacional, objetivos estratgicos e fatores
crticos de sucesso, enfim para sua sustentabilidade no curso da histria e dentro do
mercado de energia nuclear.

267

10 INFORMAO E CONHECIMENTO NA ELETRONUCLEAR

10.1 Histrico

A partir da descrio do captulo anterior, podemos perceber que a gesto de


usinas nucleares deve ser entendida com um sistema sociotcnico complexo. Uma
estrutura operacional de gerao de energia a partir de fonte nuclear, demandando um
conjunto amplo de equipamentos, materiais e servios ponto de partida. A operao
de usinas nucleares uma atividade estratgica e que deve ser conduzida por
profissionais srios, competentes, ticos e capazes de alocar um volume significativo de
conhecimento. Por sua vez, esse conhecimento possui especificidade e complexidade tal
que dificulta a disponibilidade de grandes contingentes de mo-de-obra qualificada.
Alm disso, h variveis estratgicas e de segurana, relacionadas ao processo de
gerao energia nuclear que ampliam ainda mais o aporte de conhecimento necessrio
gesto das usinas. Portanto, baseando-se na anlise de OLIVEIRA (2) (2002), que um
marco importante para o processo de gesto do conhecimento da ELETRONUCLEAR,
podemos dizer que o uso da tecnologia nuclear demanda uma grande amplitude de
conhecimento concernente a projeto, construo, operao e manuteno de usinas
nucleares. Tal demanda envolve produo, acesso, uso e recuperao de informaes
associadas a esse conhecimento e que esto embutidas em pesquisa cientfica, estudos e
anlises das diversas especialidades da engenharia, documentao de projeto,
informaes de operao, registros de manuteno, inspees regulatrias e outros
diversos documentos relativos informao tcnica. Tudo isso mesclado e imbricado
na cognio e na expertise das pessoas que trabalham com tais conhecimentos e que so
capazes de fazer uso adequado desses objetos de informao, deles produzindo novos
conhecimentos a cada dia e/ou aplicando-os nos processos de trabalho. Cientistas,
engenheiros, gestores, profissionais de diversas disciplinas com formao educacional e
a percia requeridas devem ser capazes de aplicar esse conjunto de conhecimentos de
modo seguro e eficiente. Ainda de acordo com OLIVEIRA (2) (2002):
O efetivo gerenciamento do conhecimento nuclear inclui assegurar a contnua
disponibilidade deste reservatrio essencial de pessoal qualificado. O
gerenciamento do conhecimento nuclear crtico para garantir a certeza de
segurana, encorajando a inovao, criando a certeza que os benefcios da
energia nuclear relacionados com a sade humana, alimentos e agricultura,

268

tratamento da gua, suprimento de energia eltrica, e uma gama de outras


aplicaes, permaneam disponveis para geraes futuras (p. 2).

Em 2000, a Resoluo da Conferncia Geral (44)/RES/21 da AIEA Agncia


Internacional de Energia Atmica valorizou as prticas de gesto do conhecimento em
usinas nucleares.

Salientou a importncia de itens como implantao de plano de

sucesso para pessoal detentor do conhecimento, preservao da memria institucional


e do conhecimento operacional sobre plantas nucleares. A partir de tais prticas,
reconheceu-se j por tal Agncia que nos Estados Unidos as usinas puderam aumentar a
vida til, sua potncia e melhora da imagem. Conforme a referida resoluo, IAEA
(2002):
o desenvolvimento e o gerenciamento seguro da gerao nucleoeltrica, e da
cincia e suas aplicaes, nos pases membros que decidiram ou iro decidir
pela opo nuclear, requer a preservao do conhecimento e da experincia,
bem como a manuteno de potencial de recursos humanos tecnolgica e
cientificamente competentes na esfera nuclear.

RINTALA & KURONEN (2006) afirmam que as organizaes nucleares esto


lutando para preservar sua experincia e conhecimento apesar da difundida previso de
aposentadoria de muitos profissionais capacitados em um futuro prximo. As operaes
da plantas nucleares esto sentindo, manifestando e noticiando que a aposentadoria de
profis sionais experientes tem levado perda do conhecimento nuclear tcito, devido
dificuldade de codificar e/ou compartilha- lo durante o treinamento formal. O
compartilhamento de conhecimento tcito, especialmente com a amplitude e
complexidade dos relacionados operao de plantas nucleares, demandam mtodos
baseados em interao social, considerando situao por situao ou cada grupo
envolvido.

Portanto, necessrio adotar mtodos de compartilhamento de

conhecimento tcito para preservar o conhecimento nuclear ao longo do tempo.

Para RINTALA & KURONEN (2006), h uma preocupao generalizada entre


as organizaes nucleares, agentes reguladores e empresas operadoras de plantas
nucleares, no que tange preservao do conhecimento nuclear. Hoje h menos
estudantes de cincia nuclear, bem como declinou a pesquisa e desenvolvimento na
rea. Alm disso, temos muitas aposentadorias, sendo que os que se aposentam possuem

269

tanto o conhecimento explicito quanto o conhecimento tcito, acumulado em muitos


anos de trabalho a partir de situaes, experincias e vivencias de execuo de tarefas.

Em 2001, alm de colocar a gesto do conhecimento como pr-requisito para a


retomada da construo da usina nuclear de Angra 3, a Eletronuclear constatou risco de
perda de conhecimento devido ao ndice elevado de funcionrios com idade superior a
45 anos (Figura 38), estando muitos deles prximos aposentadoria. Isso est associado
a uma tendncia, em nvel mundial, em que a fora de trabalho est envelhecendo, ou
seja, mais e mais trabalhadores da rea nuclear esto se aproximando da idade de
aposentadoria, sem o correspondente influxo de pessoal jovem adequadamente
qualificado para substitu- los. A questo que passou a se apresentar, portanto, a de
como gerenciar o conhecimento estratgico da empresa, identificando seus componentes
tcitos e explcitos, avaliando as possibilidades de explicitao atravs do uso de
tecnologias da informao de forma a manter o patrimnio intelectual da organizao.
Ao comentar, em recente ent revista, sobre os equipamentos j adquiridos pelo Governo
Brasileiro e a necessidade do Brasil chegar a uma concluso sobre Angra III, o
presidente da Associao Brasileira de Energia Nuclear (Aben), Edson Kuramoto,
alertou para o risco crescente de a baga gem tecnolgica acumulada pelo Pas se perder
com o tempo:

No s o uso dos equipamentos que est em jogo. A mdia de idade


dos especialistas de 50 anos e dentro de mais dez anos a maioria
deles vai se aposentar. Pelo menos 200 engenheiros brasileiros foram
enviados para a Alemanha, nas dcadas de 70 e 80, para receber
treinamento 84

84

SIQUEIRA, Andr. Potncia Nuclear? In Revista Carta Capital, So Paulo (410) 10-13, set. 2006

270

AGE DISTRIBUTION IN ELETRONUCLEAR

Distribuio de idade do pessoal tcnico


120

100

FREQUENCY

80

60

40

20

0
19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 68 70

AGE

Figura 38: Distribuio dos Empregados por Idade na ELETRONUCLEAR (reas tcnicas)
Fonte: LEPECKI, 2002

OLIVEIRA (2) (2002) colocou como dois grandes desafios para a


ELETRONUCLEAR a necessidade de um Plano de Sucesso e a preservao da
memria organizacional, ao afirmar:
Uma questo fundamental est relacionada ao Plano de Sucesso para a
fora de trabalho da rea nuclear, assegurar que quando cientistas,
engenheiros e tcnicos se aposentarem, uma nova gerao com formao
apropriada e aspiraes de carreira esteja disponvel para ocupar seus
lugares. Renovar a fora de trabalho uma questo com implicaes potenciais
em segurana e confiabilidade das instalaes. Competncia tcnica para a
operao segura das instalaes nucleares j existentes, bem como para
salvaguarda de material nuclear, pesquisa e desenvolvimento, gerenciamento e
transporte de resduos e descomissionamento de instalaes, sero necessrias
por dcadas, indiferentemente da ocorrncia ou no de expanso no uso da
energia nuclear. Outra questo importante envolve a potencial perda da
memria institucional com a sada de pessoal. Baseado em sua experincia
de trabalho estas pessoas podem possuir conhecimento de fatos e
procedimentos essenciais no documentados que podem ser perdidos. Isto
passa a ser extremamente importante com o envelhecimento das instalaes e
quando so necessrias modificaes de projeto. Isto exige aes gerenciais
para preservao do conhecimento (explicitar e transferir conhecimentos

271

antes da sada de pessoal). Para um encaminhamento adequado das questes


apresentadas, a Gesto do Conhecimento pode contribuir com ferramentas
eficientes para a transferncia de conhecimento de um indivduo para outro e
para explicitar conhecimento tcito. Depreende-se do acima exposto, que para
a Eletronuclear , e as demais empresas da mesma indstria, a gesto do
conhecimento no s uma grande oportunidade de desenvolvimento
estratgico, uma necessidade vital. (p. 4).

Diante disso, para evitar a perda de conhecimento e evitar a manifestao de


suas conseqncias, tornou-se necessria uma ao corporativa consistente. Assim, a
questo da preservao da tecno logia existente se tornou uma prioridade e a
ELETRONUCLEAR tomou a iniciativa de instituir em 01/01/2001, o Projeto
"Determinao do Know-How Tecnolgico da ELETRONUCLEAR" (LEPECKI, 2002)
com o objetivo de inventariar o know- how existente, identificar as lacunas de
conhecimento nas atividades essenciais, e propor solues para sanar tais lacunas.

10.2 O Projeto de Gesto do Conhecimento da Eletronuclear.

10.2.1 Consideraes Iniciais

Com o trabalho de LEPECKI (2002) deflagrou-se uma srie de iniciativas e


aes organizadas que deram origem ao Projeto de Gesto do Conhecimento da
Eletronuclear. Foi elaborada uma taxonomia do negcio da empresa, e feito um
diagnstico da situao atual e para os prximos cinco anos com todos os gerentes,
quanto ao conhecimento (entenda-se know-how) necessrio para as atividades
diretamente relacionadas com o negcio da empresa

Com

projeto

"Determinao

do

Know-How

Tecnolgico

da

ELETRONUCLEAR" conduzido por LEPECKI (2002) foi elaborada uma taxonomia do


conhecimento requerido pelo negcio da empresa, dando incio busca de uma forma
de classificar o seu know-how. Foi feito, poca, um diagnstico da situao atual e
para os prximos cinco anos com todos os executivos, quanto questo do
conhecimento empresarial. Existiam ento vrias sistemticas de classificao de
know-how na ELETRONUCLEAR, mas cada uma com uma finalidade especfica.
Em particular, elas estavam fortemente vinculadas usina considerada (Angra 1 ou
Angra 2). Assim, decidiu-se por criar uma sistemtica nova, adaptada realidade da

272

empresa. Para tanto, foram consultados Diretores, Superintendentes, Gerentes e


especialistas, sendo o produto obtido fruto de uma atividade interativa ocorrida ao longo
de sete meses (maro a outubro de 2001). A Sistemtica de Classificao de KnowHow Tecnolgico da ELETRONUCLEAR, assim obtida, est dividida em quatro
grandes conjuntos:

Engenharia de Projeto e Apoio Operao,

Realizao Fsica do Empreendimento,

Operao

Atividades de Sustentao da Empresa.

Estes grandes temas foram sendo subdivididos em nveis sucessivos de


detalhamento. O nmero de nveis foi deixado a critrio de cada rea, no havendo
uniformidade quanto a este aspecto, e tendo-se chegado a um total de 557 itens,
conforme relatado por LEPECKI (2002) e mostrado no ANEXO I Resumo do
Relatrio Projeto Determinao do Know-How Tecnolgico da Eletronuclear.

Gerou-se ento uma lista das atividades da empresa mais intensivas em


conhecimento, j que ela foi produzida pela resposta seguinte pergunta colocada para
os gerentes: Que know-how sua rea necessita para desenvolver suas atividades?
As respostas
apresentadas tiveram o formato: necessrio know-how para .......... Desta forma
no se obteve diretamente um mapa do conhecimento, mas sim uma lista de atividades
para as quais o conhecimento um insumo essencial. Esta lista de 557 atividades
transformou-se no ponto de partida para o mapeamento do conhecimento da empresa.

De acordo com OLIVEIRA (2) (2002), com base neste levantamento foram
definidas, juntamente com a diretoria da empresa, as atividades crticas, aquelas que
necessitam de aes imediatas. Foi deflagrado um mapeamento detalhado do
conhecimento destas reas, com o objetivo de se desenvolver um plano de ao. O passo
seguinte ser definir uma estrutura e um plano de ao para transformar a gesto do
conhecimento de um projeto, em uma atividade contnua integrada aos processos de
negcio da Eletronuclear, atendendo assim a resoluo da 4 Reunio Ordinria do

273

CNPE Conselho Nacional de Poltica Energtica, de 05/12/2001, e satisfazendo uma


das condies para a retomada da construo da Usina Angra 3.

10.2.2 Metodologia Proposta

A ELETRONUCLEAR identificou oportunidades para vrias iniciativas


vinculadas ao processo de Gesto do Conhecimento, considerando o porte da empresa e
muitas de suas atividades operacionais serem intensivas em conhecimento. Tal processo
constituir-se- ia em um projeto mais amplo, sob o qual estariam vrios outros projetos
subordinados e integrados. Por exemplo, a reavaliao dos processos de gerao de
energia nuclear com relao experincia e boas prticas internacionais, quanto a
gerao de rejeitos slidos indica um projeto de Melhores Prticas. Por outro lado,
desenvolver um programa de transferncia de conhecimento, planejar a substituio de
pessoal com maior antecedncia indicavam a relevncia de um projeto de Pginas
Amarelas. De igual forma, fazia-se necessrio avaliar os aspectos relacionados
tecnologia da informao para sustentar as atividades de conhecimento da empresa.

OLIVEIRA (2) (2002) props iniciar o projeto de Gesto do Conhecimento da


Eletronuclear com a aplicao da metodologia desenvolvida pelo CRIE Centro de
Referncia

em

Inteligncia

Empresarial

COPPE/UFRJ,

baseando-se

em

CAVALCANTE & GOMES (2002) para desenvolvimento de um projeto de gesto do


conhecimento, com as necessrias adaptaes para o caso especfico da empresa. Esta
metodologia composta das seguintes etapas (Figura 39):

Etapa I: Anlise da Empresa e do Ambiente de Negcios

Etapa II: Identificao do Projeto

Etapa III - Plano de Ao

Etapa IV Avaliao

274

Anlise da
empresa e do
ambiente de
negcios

Identificao
do Projeto

Plano de Ao

Avaliao

Figura 39: Etapas da Metodologia de Gesto do Conhecimento do CRIE


Fonte: CAVALCANTE & GOMES (2002)

10.2.3 O Projeto de Mapeamento do Conhecimento da Eletronuclear

Muitas oportunidades de projeto foram identificadas, mas era necessrio


priorizar. Essa metodologia foi, ento, inicialmente aplicada em um projeto de
Mapeamento do Conhecimento da Eletronuclear, do tipo construo de Pginas
Amarelas. Esse tipo de projeto visa mapear o conhecimento interno da organizao,
descrevendo e avaliando os capitais humano, estrutural e de relacionamento, baseandose na perspectiva de STEWART (1998) em que:

Capital intelectual (ou humano): inclui conhecimento e competncias


individuais dos funcionrios;

Capital estrutural: inclui conhecimento ou competncia coletiva, como


processos, know-how, marcas e patentes, documentos;

Capital de relacionamento: inclui o conhecimento e vantagens advindas dos


relacionamentos entre funcionrios com clientes, fornecedores, provedores de
tecnologias, etc.

Foram identificados motivos para esse projeto, quais sejam:

Dar continuidade natural ao que vinha sendo desenvolvido;

Permitir criar a possibilidade de explicitar conhecimento tcito, atravs de


ferramentas adequadas como, por exemplo, os Mapas Conceituais;

Facilitar a captura de conhecimento explcito no documentado;

Facilitar a criao de regras de busca para ferramentas de Minerao de Dados


e Minerao de Textos, que seriam implementados em seqncia;

275

Identificar a correlao entre especialistas, dentro e fora da empresa, com as


atividades dos processos empresariais, facilitando a busca e o compartilhamento
de conhecimento;

Facilitar a aplicao de outros projetos de gesto do conhecimento, uma vez que


os Mapas do Conhecimento j foram elaborados, e estaro sendo mantidos
atualizados.
Para realizar o mapeamento do conhecimento com o projeto de pginas

amarelas, foi estabelecida uma metodologia com o seguinte fluxo:

Identificar os processos a serem mapeados e suas atividades;

Identificar as pessoas chave e relacionar as mesmas s atividades;

Identificar os capitais humano, estrutural e de relacionamento necessrios para


realizar as atividades;

Identificar os capitais humano, estrutural e de relacionamento existentes para


realizar as atividades;

Desenvolver mecanismos de atualizao e nivelamentos dos referidos capitais.


Os 5 passos dessa metodologia deve ser percorridos para cada uma das 557

atividades identificadas para a ELETRONUCLEAR no projeto "Determinao do


Know-How Tecnolgico da ELETRONUCLEAR" (LEPECKI, 2002), o que obviamente
consome bastante tempo e est em curso na empresa. Para o levantamento do Capital
Intelectual, procura-se responder a pergunta: Qual ou quais habilidades/competncias
so necessrias para realizar a atividade? Devem ser coletadas as seguintes
informaes por atividade:

Capital intelectual habilidades/competncias necessrias

Nmero de pessoas necessrias

Nvel de experincia requerido

De acordo com OLIVEIRA (2) (2002), para obter as informaes acima, se faz
necessrio definir quais so os perfis profissionais necessrios a execuo da atividade,
e quantas pessoas com cada perfil so necessrias. Para auxiliar nesta tarefa utiliza-se o
modelo de classificao de competncias que define habilidades bsicas, especficas,

276

globais e universais, conforme mostrado na Figura 40, baseada na estrutura utilizada


pela Microsoft e apresentada por DAVENPORT (1997) .

Habilidades
Universais
. Habilidades Globais

Habilidades Especficas / nicas

Habilidades Bsicas
Figura 40: Estrutura genrica de competncias de uma atividade
Fonte: DAVENPORT (1997)

Nesse modelo, conforme DAVENPORT (1997), temos as seguintes definies:

As Habilidades Bsicas so as chamadas competncias bsicas, ou seja: aquelas


necessria para entrar neste tipo de atividade.

As Habilidades Especficas / nicas so competncias avanadas aplicveis a


um tipo particular de tarefa.

As Habilidades Globais so aquelas que todos os funcionrios de uma


determinada funo, ou organizao devem ter.

As Habilidades Universais. so aquelas que todos os funcionrios da empresa


precisam ter.

Aplicando concretamente tais idias em um exemplo para a atividade de um


Engenheiro de Materiais termos, conforme OLIVEIRA (2) (2002) a Figura 41 abaixo:

277

Perfil: Engenheiro de Materiais - Primrio

Habilidades
Universais

Noes de Proteo Radilgica / Instrues


Normativas / (REG Retreinamento de
Empregados em Geral)

.Habilidades Globais

Habilidades Especficas / nicas

Garantia da Qualidade / Testes de Materiais /


Preparao de Especificaes / Cultura de
Segurana / etc....
Efeito de radiaes sobre os materiais /
Breack Preclusion Concept / 20 Mn Mo Ni55 /
etc..

Habilidades Bsicas

Engenheiro Metalurgista com Mestrado/


Ingls obrigatrio / Alemo desejvel

Figura 41: Estrutura de competncias da atividade de Engenharia de Materiais


Fonte: OLIVEIRA (2) (2002)

Para o levantamento do Capital Estrutural, procura-se responder a pergunta:


Qual ou quais estruturas/sistemas/mtodos so necessrios para realizar a
atividade? Devem ser coletadas as seguintes informaes por atividade:

Especificao e intensidade requerida de cada estrutura, sistema, procedimento;


documento, programa de computador, computador, rotina, etc;

Nvel de prioridade requerido.

Para o levantamento do Capital de Relacionamento, procura-se responder a


pergunta: Qual ou quais relacionamentos so necessrios para realizar a
atividade?A metodologia do CRIE adotada como referncia para este projeto
estabelece que deve ser feito o mapeamento dos relacionamentos internos, e externos,
estes ltimos tanto com pessoas de fora da organizao como com outras instituies.
No caso da Eletronuclear entendemos ser conveniente no momento proceder apenas o
levantamento dos relacionamentos externos, pelas seguintes razes:

Existem muitos processos de alta complexidade gerando um alto nmero de


interfaces, o que geraria uma rede de relacionamentos de difcil administrao,
pelo menos neste primeiro momento, e:

278

As barreiras culturais a este levantamento, pelo menos no incio do processo,


podem prejudicar o andamento do projeto como um todo.

O Mapa de Relacionamentos poder ser gradativamente construdo, com um


processo de transformao cultural voltado para a gesto do conhecimento, j em curso.
Para o Mapeamento do Capital de Relacionamento foram coletadas as seguintes
informaes sobre os relacionamentos com pessoas e entidades externas, importantes
para a execuo da atividade:

Pessoa ou Instituio com quem h o relacionamento;

Tipo de relacionamento com pessoas (pessoal ou profissional), e nvel atual do


relacionamento (excelente, bom, indiferente, ruim, pssimo);

Tipo de relacionamento com instituies (formal existe uma parceria com


documentos formalizados ou informal existe uma parceria de trabalho sem
documentos formalizados), e nvel atual do relacionamento (excelente, bom,
indiferente, ruim, pssimo).

Por exemplo, podemos a apresentar a seguinte estrutura na Figura 42:

Atividade
Elaborao de Conceito de Materiais e Especificaes para os Componentes do Circuito primrio
Relacionamento Externo (Instituies)
Tipo
Nvel
Westinghouse
2
4
Siemens
2
4
EPRI
2
4
TV
2
4
Figura 42: Exemplo de Mapeamento do Capital de Relacionamento Externo da Eletronuclear.
Fonte: OLIVEIRA (2) (2002)

Uma vez que se tenham os Mapas dos Capitais do Conhecimento devidamente


armazenados em planilhas eletrnicas e bancos de dados, possvel uma srie de
consultas, conforme listado abaixo e de acordo com CAVALCANTE & GOMES
(2002) na metodologia CRIE:

Relatrio do capital estrutural existente;

Relatrio do capital intelectual existente;

279

Relatrio do capital de relacionamento existente (atravs das pessoas-chave);

Relatrio do capital de relacionamento existente (atravs da organizao);

Buscas por pessoas-chave X atividade;

Buscas por pessoas-chave X habilidade/relacionamento;

Buscas por atividades X pessoa-chave;

Relatrio das lacunas de uma atividade;

Relatrio das pessoas-chave x lacunas/atividade;

Relatrio de capitais do conhecimento de uma pessoa-chave no aproveitados


pela empresa;

Relatrio das lacunas do capital estrutural da organizao;

Relatrio das lacunas do capital de relacionamento da organizao.

10.2.4 Desafios Decorrentes do Mapeamento do Conhecimento da Eletronuclear


10.2.4.1 Fundamentos e Propostas
O processo de mapeamento do conhecimento deflagrou na Eletronuclear um
conjunto subseqente de aes no campo da gesto do conhecimento. Essas aes esto
fortemente ancoradas nas perspectivas de STEWART (1998), que trata dos capitais
intelectual, estrutural e de relacionamento, e mais especialmente na de NOVINS &
ARMSTRONG (2002), descrita no item 4.3.2.2 da presente tese, que aborda a aplicao
e transferncia do conhecimento.

Tambm merece meno a perspectiva de diviso

entre conhecimento tcito e explcito, proposta por POLANYI (1966) e que permeia
toda a discusso relativa aos papeis das reas da empresa, especialmente as de recursos
humanos (mais voltadas para o conhecimento intelectual / tcito) e de tecnologia da
informao (mais voltada para o conhecimento estrutural / explicito).
OLIVEIRA (2) (2002), partindo da viso do conhecimento em termos de
aplicabilidade e transferncia de NOVINS & ARMSTRONG (2002), identificou e
props para a ELETRONUCLEAR aes a serem tomadas para permitir, ou facilitar o
processo de gesto do conhecimento. Essas aes so complementares elaborao dos
Mapas dos Capitais do Conhecimento. Tais aes so candidatas a entrarem no plano de
ao para implementao da gesto do conhecimento na Eletronuclear. Com base no

280

trabalho Choosing Your Spots for Knowledge Management, dos referenciados autores,
foi sugerido por OLIVEIRA (2) (2002):

a) Para gerenciar Conhecimento de Acesso Rpido:

Aplicao de ferramentas tecnolgicas de minerao de textos e minerao de


dados com ponto forte nas primeiras, j que nos repositrios de conhecimento
explcito da ELETRONUCLEAR predominam os documentos textuais. A
ELETRONUCLEAR tem a sua disposio grandes repositrios de conhecimento
explcito, internos e externos a organizao, que no so aproveitados em todo o
seu potencial. O modelo proposto tambm deve apresentar mecanismos para
melhorar o aproveitamento dos conhecimentos contidos nestes repositrios.
Quanto mais poderosa for a ferramenta (de minerao de textos) na busca de
conhecimento em repositrios no estruturados melhor ser para a empresa. A
chave para o sucesso neste caso uma boa taxonomia. Os motores de busca
disponveis hoje so poderosos, mas s acessam documentos eletrnicos
obviamente. Ento tambm fundamental a continuidade da implantao do
processo de Gerenciamento Eletrnico de Documentos, praticamente concludo.
Alm disso, muitos dados importantes da operao e engenharia j se encontram
em bancos de dados estruturados, j sendo de fcil captura.

b) Para gerenciar Conhecimento Geral

Uma ferramenta tecnolgica importante na misso de gerenciar conhecimento


um portal corporativo com recursos de controle de documentos, para garantir
que no sero acessadas informaes obsoletas, principalmente com recurso de
assinatura de documentos, ou seja: com disparo automtico de e-mail para todos
os assinantes da informao / conhecimento, sempre que surgir algo novo, ou
houver excluso de documentos importantes.

c) Para gerenciar Conhecimento Complexo

Devem ser desenvolvidos programas de treinamento com base nos gaps atuais
e futuros identificados no mapeamento do conhecimento. Desenvolvimento de
281

planos de sucesso. A utilizao do mentoring parece se mostrar uma forma


bastante adequada por ser aceito na cultura empresarial. A maioria do pessoal
mais experiente foi preparado desta forma, j que foi um mtodo amplamente
utilizado nos acordos de transferncia de tecnologia. Aplicar tcnicas avanadas
de captura do conhecimento desenvolvido em uma atividade, como os mapas
conceituais 85 . Esta ao pode ser desenvolvida em conjunto com o EPRI 86 e
outras empresas de energia eltrica dos Estados Unidos que esto fortemente
engajados no aperfeioamento do uso destes mapas 87 . O resultado obtido
explicitao de conhecimento tcito e troca mais eficiente deste tipo de
conhecimento.

d) Para gerenciar o compartilhamento do conhecimento um-para-um, e umpara-muitos.

Este tipo de compartilhamento de conhecimento j est embutido nas aes


tomadas nos itens anteriores.

e) Para gerenciar o compartilhamento do conhecimento muitos-para- um.

As aes que necessitam ser realizadas para gerenciar o compartilhamento do


conhecimento muitos-para- muitos tambm atendero este caso, que se
transforma em um caso particular daquele.
85

Mapa conceitual uma ferramenta para organizar e representar conhecimento. Um mapa conceitual
deve representar as relaes significativas entre conceitos, na forma de proposies. Proposies so dois
ou mais conceitos, relacionados por palavras de modo a formar uma unidade semntica. Ele representa
conceitos, organiza pensamentos, observa matizes de significados, resumir reas de estudo, estimula o
aprender como aprender e explicita a estruturas cognitivas. A sua teoria de fundo construtivista.
Representao grfica em duas dimenses de um conjunto de conceitos construdos de tal forma que as
relaes entre eles sejam evidentes. Os conceitos aparecem dentro de caixas nos ns do grafo enquanto
que as relaes entre os conceitos so especificadas atravs de frases de ligao nos arcos que unem os
conceitos. A dois ou mais conceitos, conectados por frases de ligao criando uma unidade semntica. As
proposies so uma caracterstica particular dos mapas conceituais se comparados a outros fatos
similares como os mapas mentais. Os mapas atualmente tem sido implementados por softwares
destinados a tal fim. O CMap, um exemplo e usado tanto por cientistas da NASA, que neles registram
conhecimentos atuais sobre determinado planeta, quanto por crianas em escolas pblicas dos EUA. Um
bom detalhamento e apresentao de ferramenta feito no site do Institute for Human and Machine
Cognition (IHMC)/University of West Florida - http://cmap.ihmc.us. Acesso em 22.09.2006.
86
Energy Power Research Institute. Instituto de referncia na rea de energia eltrica que realiza
pesquisas e estudos, elabora propostas e cria marcos de referncia tcnica para o setor e ao qual a
ELETRONUCLEAR filiada. uma cooperativa de pesquisa e desenvolvimento na rea nuclear.
87
Viso apoiada no documento: Capturing Undocumented Worker Job-Knowledge Overview an
2000 Status Report, September 2001. EPRI, Palo Alto, C:2001

282

f) Para gerenciar o compartilhamento do conhecimento muitos-para-muitos.


Nesse ponto o foco principal sai da tecnologia da informao e passa para as
pessoas. A forma de compartilhamento proposta no usual ainda e as
ferramentas que podem ser usadas para tal fim no possuem, por enquanto,
grande histrico de sucesso, pelo menos no meio empresarial. Urge necessrio
atuar na cultura da empresa e preparar o pessoal para ver o compartilhamento de
conhecimento por um outro prisma. Campanhas de comunicao devem ser
empreendidas para que o processo flua com transparncia desde o comeo. Se a
troca de conhecimento tcito pessoa a pessoa j encontra resistncia, a troca
coletiva tende a ser ainda mais complexa. Ser, portanto, necessrio planejar um
processo de adaptao cultural da empresa conduzido por pessoal experiente e
capaz. preciso, alm da transformao cultural, criar uma estrutura
metodolgica e tecnolgica que propicie a troca de conhecimento complexo, na
modalidade muitos para muitos. Uma ferramenta que vem sendo testada para
esta finalidade o mapa conceitual desenvolvido coletivamente, com apoio da
tecnologia da informao. Na Eletronuclear h um projeto adequado para
aplicao de mapas conceituais para compartilhamento de conhecimento que o
levantamento detalhado das bases de projeto das usinas, tarefa que s possvel
atravs de uma troca coletiva de conhecimento sobre como as usinas foram
projetadas e construdas.

A proposta de OLIVEIRA (2) (2002) redundou numa definio clara dos papis
a serem assumidos por diferentes instncias na organizao. Foram propostas quatro
instncias de atuao no processo de gesto do conhecimento, com papeis descritos a
seguir.

a) Papel da Coordenao de Gesto do Conhecimento: (duas a trs pessoas)

Criar infra-estrutura tecnolgica e cultural adequada

Emitir Programa de Gesto do Conhecimento a cada ciclo de Planejamento


Estratgico e coordenar sua implantao

Zelar pelo alinhamento estratgico das aes de gesto do conhecimento

283

b) Papel da Administrao de Recursos Humanos:

Estabelecer juntamente com as reas tcnicas e operacionais os perfis


necessrios a execu o das diversas atividades;

Coordenar um processo de mudana cultural para criar um ambiente adequado a


criao e o compartilhamento de conhecimento;

Providenciar programa de treinamento para reduzir as lacunas identificadas no


mapeamento dos capitais do conhecimento;

Organizar plano de substituio do pessoal (plano de sucesso), e programas de


treinamento no trabalho (mentoring);

Desenvolver e implementar uma poltica de adequada de Recursos Humanos.

c) Papel das Relaes Institucionais:

Desenvo lver um processo de comunicao e endomarketing, que mantenha o


pessoal envolvido com os projetos de gesto do conhecimento;

Desenvolver atividades que promovam a socializao, reduzindo as barreiras de


comunicao entre as pessoas.

Poder vir a empreender atividades de monitorao social e poltica, em futuros


projetos de inteligncia empresarial.

d) Papel de Tecnologia da Informao:

Preparao de planilhas eletrnicas e banco de dados para organizao dos


Mapas dos Capitais do Conhecimento

Suporte na escolha e aquisio de softwares para minerao de textos, para


elaborao de mapas conceituais e para gerenciamento eletrnico documentos;

Prover a empresa de um portal corporativo;

10.2.4.2 Plano de Ao Para Mapeamento dos Capitais do Conhecimento Projeto


Piloto da Eletronuclear
O descrito no item 10.2.4.1 um projeto amplo. Um plano de ao para o incio
do projeto, ou seja, o mapeamento dos capitais do conhecimento de um primeiro grupo

284

de atividades, em situao mais crtica (em seqncia ao descrito no ANEXO I) foi


ento proposto. O objetivo central foi o de realizar o mapeamento dos capitais do
conhecimento de um primeiro conjunto de atividades, consideradas essenciais, ou seja
de alta relevncia estratgica e intensivas em conhecimento. O Plano de Ao props:

Campanha de endomarketing

Preparao das pessoas chave

Elaborao dos perfis profissionais das atividades consideradas

Preparao das planilhas e banco de dados a serem usados para registrar e


trabalhar os dados coletados

Mapeamento dos capitais do conhecimento necessrios, e dos capitais estrutural


e de relacionamento existentes

Mapeamento dos capital intelectual existente

Elaborao do plano de ao para os gaps juntamente com as reas envolvidas

Anlise crtica do processo visando sua melhoria

Conforme OLIVEIRA (2) (2002), para avaliar o resultado obtido na implantao


da gesto do conhecimento, a questo essencial de ser respondida : qual o retorno
esperado com os projetos? J que difcil quantificar os retornos provenientes do
conhecimento, preciso basear-se nos indicadores mais gerais de sucesso. Os
indicadores de sucesso de projetos de Gesto do Conhecimento no so to diferentes
dos critrios que as empresas usam para medir o sucesso de outros tipos de projetos de
mudana corporativa. Assim, segundo ou autor, poder-se-ia adotar os seguintes
indicadores para avaliao de nosso processo:

Resultados de melhoria de indicadores da WANO para o qual exista um projeto


de gesto do conhecimento (Ex. - Volume de rejeitos slidos benchmarking)

Nmero de atividades mapeadas por ms;

Efetiva implementao do plano para eliminar gaps de conhecimento

Nmero de consultas aos repositrios de conhecimento explcito

Pesquisa de clima organizacional

Efetivo cumprimento do Programa de Gesto do Conhecimento de cada ciclo de


Planejamento Estratgico

285

10.2.4.3 Aes Empresariais Realizadas

Alm do trabalho realizado e descrito em LEPECKI, 2002, j citado, a


ELETRONUCLEAR deflagrou e vem conduzindo desde 2001 uma srie de aes
relativas ao processo de Gesto do Conhecimento, sendo que algumas merecem especial
destaque e podem ser descritas e comentadas.

a) Execuo de uma srie de iniciativas relacionadas Administrao de Recursos


Humanos, tais como:

Feedback Tcnico da Usina de Angra 2 para Angra 3.

Desenho da rvore de Competncias para reas tcnicas.

Projeto Determinao do Know How Tecnolgico da ETN-2002 a 2004 para


reas tcnicas e operacionais.

Formao e retreinamento no Centro de Treinamento de Mambucaba (Angra dos


Reis).

b) Execuo de uma srie de iniciativas relacionadas Tecnologia da Informao,


em consonncia com o descrito no item anterior, quais sejam:

Implantao da ferramenta Sincronia de GED Gerenciamento Eletrnico de


Documentao Tcnica (Programa de Gesto de Documentao);

Implantao de ferramenta de portal corporativo, com aquisio da ferramenta


Verity para viabilizar o Portal de Experincia Operacional de Usinas;

Implantao de Automao de Processos Workflow;

Busca e classificao e uso de contedo em documentos no estruturados (textos


nos mais diversos formatos) ou Unstructured Document Management (UDM).
Num primeiro momento, uma resposta preliminar e significativa poderia ser
gerada pela combinao das solues de GED e de Portal, mas em um segundo
momento, considerando a dimenso da base de dados e multiplicidade de
usurios com diferentes interesses e necessidades, foi necessrio deflagrar
tambm os estudos necessrios para implantao da tecnologia de minerao de
textos, o que subsidia os estudos da presente tese.

286

c) Institucionalizao do Processo de Gesto do Conhecimento na empresa, com a


criao, em 2004, do Comit de Gesto do Conhecimento. Isso foi realizado atravs dos
normativos internos oficiais 88 . So objetivos desse comit:

Definir polticas e diretrizes para a implantao de projetos relativos gesto do


conhecimento - GC, no mbito da empresa, como uma atividade permanente,
com a participao de todas as u.o.s envolvidas, bem como, transferncia das
atividades implantadas, em carter permanente, para as reas gestoras;

Fazer um planejamento bianual, com revises trimestrais, das atividades de GC


planejamento bianual de Gesto do Conhecimento;

Promover campanhas internas de esclarecimento e de mobilizao com o


objetivo de equalizar conceitos e divulgar internamente a Gesto do
Conhecimento.

Esse Comit, composto por 6 integrantes de diferentes reas da empresa e um


consultor externo, realizou 27 reunies entre dezembro de 2004 e agosto de 2005.
Realizou a reviso de atividades j realizadas anteriormente sua criao, fez contatos e
reunies com entidades externas, conduziu levantamento de aes normativas e
organizacionais para suporte Gesto do Conhecimento e desenhou proposta de
programas e aes, dentre os quais se incluem:

Programa de Sensibilizao e Divulgao e criao da Semana da Gesto do


Conhecimento;

88

Projeto Know How para toda ELETRONUCLEAR;

rvore de Competncia para toda ELETRONUCLEAR;

Extenso das atividades do Centro de Treinamento para a Sede;

Avaliao Know How em outras empresas;

Estabelecimento de Aes Normativas e Organizacionais;

Reviso dos Macro- Processos da ELETRONUCLEAR;

Programa de Gesto do Conhecimento Implcito;

RDE N 711.005/04, de 26 de outubro de 2004 e Circular Geral N 041/04, de 23 de novembro de 2004

287

Desenvolvimento

do

Portal

de

Gesto

do

Conhecimento

na

ELETRONUCLEAR;

Aprimoramento dos programas de Gesto de Documentao e Experincia


Operacional redundando em demanda por ferramenta de minerao de textos.

10.3 A Experincia Operacional na Eletronuclear

A expresso conhecimento organizacional aplicada sobre todo o domnio de


conhecimentos da organizao, isto , sobre todas as reas e processos, incluindo
tambm o conhecimento sobre o ambiente em que a organizao est inserida. Muitas
vezes, em processos de gesto do conhecimento, uma organizao define prioridades e
quais os domnios de conhecimento que pretende dar foco em suas aes.

experincia operacional um subconjunto desse conhecimento organizacional. Como


nome indica, tem foco definido: a dimenso operacional da organizao os aspectos
vinculados sua atividade fim. Na ELETRONUCLEAR, e em qualquer empresa
responsvel por gerar energia eltrica com fonte nuclear, a experincia operacional
engloba os aspectos relacionados operao, manuteno, comissionamento89 ,
paradas 90 , segurana91 e monitoramento de uma usina nucleoeltrica. Ela inclui fontes
da prpria organizao e de fora dela, podendo ento ter uma subdiviso entre externa e
interna, que, porm, se complementam para viabilizar adequada gesto do processo de
operao e controle dos processos operacionais das usinas, com foco especial para
89

Processo durante o qual componentes e sistemas da usina nucleoeltrica, tendo sido construdos e
montados, so tornados operacionais, procedendo-se verificao de sua conformidade com as
caractersticas de projeto e com os critrios de desempenho e de aceitao (CNEN -NN-1.14. Resoluo
N016 29/11/2001).
90
Uma Parada definida como um desligamento programado da usina para troca de combustvel
nuclear. Mas pode haver uma paralisao forada que a retirada de servio da usina aps a ocorrncia
de um evento, retirada essa necessria para adoo de ao corretiva conseqente desse evento. Entendese por paralisao forada no apenas aquela que ocorre imediatamente aps, mas tambm aquela que
ocorre at o fim da semana seguinte ocorrncia do evento. (CNEN-NN-1.14. Resoluo N016
29/11/2001).
91
Segurana tcnica nuclear (ou simplesmente segurana) - conjunto de medidas de carter tcnico,
includas no projeto, na construo, no comissionamento, na manuteno e na operao da usina, visando
evitar a ocorrncia de incidentes e acidentes ou minimizar suas conseqncias. Um Incidente um evento
sem dano significante usina e/ou aos trabalhadores e ao pblico, mas significante em relao
segurana da usina. Pode incluir desligamentos no planejados, paralisaes foradas e violao de
condies limites para operao. Um Acidente - desvio inesperado e significativo das condies normais
de operao de uma instalao, incluindo ocorrncias previstas, acidentes postulados ou acidentes
severos, tais que possam resultar em danos propriedade ou ao meio ambiente ou ainda em exposies de
trabalhadores ou de indivduos do pblico acima dos limites primrios de dose equivalente estabelecidos.
(CNEN-NN-1.14. Resoluo N016 29/11/2001).

288

apoiar as atividades de monitoramento e controle de eventos 92 . Informaes e


conhecimentos providos por fornecedores de equipamentos insumos e tecnologias para
uma empresa operadora, bem como as informaes de avaliaes e testes diversos
tambm so considerados. Uma representao desse processo, conforme indicado pela
IAEA International Atomic Energy Agency apresentada na Figura 43. Portanto,
temos uma Experincia Operacional Interna EOI e uma Experincia Operaciona l
Externa EOE. O desejvel para uma empresa como a ELETRONUCLEAR procurar
manter as usinas em funcionando em operao normal - (ou condio normal de
operao) operao que inclui todas as condies e eventos que so previstos ocorrer
no curso da operao pretendida, quando realizada sob controles administrativos e de
acordo com procedimentos especificados, dentro das condies limites para operao.

Uma forte motivao para o adequado gerenciamento do conhecimento, tanto no


nvel da EOI quanto da EOE a minimizao de riscos na operao, uma vez que um
indesejado acidente nuclear, caso ocorra, poderia colocar em risco a credibilidade de
todas as indstrias espalhadas no mundo todo. Por isso, as organizaes operadoras de
usinas ao redor do mundo, agncias reguladoras, centros de pesquisas e de capacitao
buscam promover o compartilhamento de conhecimentos sobre todos os aspectos da
operao. Esse compartilhamento, concretamente significa no s um relacionamento
entre profissionais das empresas que atuam no setor, mas, especialmente, o
compartilhamento de informaes, sobretudo sob a forma de documentos textuais. A
base de conhecimento resultado, portanto da contribuio de diversas empresas. O
foco

principal

da

presente

tese

sobre

experincia

operacional

da

ELETRONUCLEAR, em consonncia com as prioridades que a empresa assumiu,


desde 2001, pelos motivos e conjuntura j explanados no item 10.1 do presente
trabalho.

92

Evento operacional (ou simplesmente evento) uma falha ou uma seqncia de falhas relacionadas
entre si. (CNEN-NN-1.14. Resoluo N016 29/11/2001).

289

Figura 43: Processo de experincia operacional como recomendado pela IAEA


Fonte: OLIVEIRA (2) 2006

A experincia operacional, como um segmento do conhecimento organizacional


da ELETRONUCLEAR tem, baseando-se na an lise de POLANYI (1966) uma
dimenso tcita e uma dimenso explicita, tanto para a EOI quanto para a EOE. A
dimenso tcita caracterizada pela experincia acumulada na prtica de anos de
operao das usinas de Angra I e II e pelos contatos e trocas de experincias, pesquisas
e estudos que a empresa conduziu desde a dcada de 70 com profissionais, empresas
operadoras, organismos reguladores e centros de pesquisa em todo o mundo. A
dimenso explicita da experincia operacional est embutida dados diversos registrados
em sistemas transacionais da empresa, em normas, procedimentos, relatrios diversos,
documentos de projeto, engenharia, operao, manuteno e segurana das usinas todos
gerados internamente. Inclui tambm, no caso da EOE, grandes bases de documentos
(em sua maioria textuais) importados/recebidos de bases de outras empresas
operadoras, organismos reguladores e centros de pesquisa no Brasil e em todo o mundo,
tais como:
290

AIEA Agncia Internacional de Energia Atmica

CNEN - Comisso Nacional de Energia Nuclear

WNA Word Nuclear Association (Associao Nuclear Mundial)

WANO (Word Association of Nuclear Operators)

INPO (Institute of Nuclear Power Operators).

NRC United States Nuclear Regulatory Commission

VGB Instituio europia, sediada em Essen, na Alemanha e que atua na rea


nuclear.
Exemplificando e detalhando um pouco os domnios da EOI e da EOE, com

base em OLIVEIRA, FILHO & SOUZA (2004) podemos dizer que eles dizem respeito
a:

a) Operao de Plantas Termonucleares (ANGRA 1 ANGRA 2) envolvendo


EOI e EOE em:

Conduo do fluxo de Operao para Gerao de Energia;

Manuteno;

Engenharia de Sistemas;

Engenharia de Apoio Operao

Segurana Ambiental

Segurana Nuclear

Treinamento

Experincia Operacional Interna e Externa

Materiais

Planejamento (paradas, testes, etc)

Comercializao

Qualidade e Licenciamento

291

b) Engenharia, Construo e Suprimentos (Engineering, Procurement &


Construction EPC) implicando atualmente nos desafios de modificaes de
projetos das plantas em operao e modernizae, troca do gerador de vapor da
usina de Angra 1, construo do depsito definitivo de rejeitos e construo da
Usina de angra 3. Tais conhecimentos envolvem, EOI e EOE:

Projeto Bsico

Projeto de Detalhamento

Gerenciamento

Licenciamento

Planejmanto e Controle

Suprimentos

Contruo

Montagem

Comissionamento

Garantia e Controle da Qualidade.

Para concluir, devemos lembrar que relatrios diversos de operao, gerados no


fluxo das atividades e do funcionamento das usinas so tambm considerados como
experincia operacional, no caso, interna. Muitos relatrios so de confeco
obrigatria, conforme determinao de agentes reguladores do setor, havendo normas
para gerao dos mesmos, tais como na Norma CNEN (2001)93 , apresentada no
ANEXO II do presente trabalho. H dois grandes grupos desses relatrios, quais sejam:
as notificaes de eventos e os relatrios rotineiros, todos regulados pela citada norma.

As notificaes de eventos ocorrem com base na relevncia do mesmo, classes


de significncia e suas conseqncias, grau de segurana, prazos de comunicao,
dentre outros aspectos. Tais relatrios so gerados, sob a forma de documentos textuais
eletrnicos e comunicados s instncias competentes, internas ou externas empresa,

93

Relatrios de Operao de Usinas Nucleares. Norma tem por objetivo estabelecer os requisitos do
programa de notificaes de eventos significativos e dos relatrios de operao de usinas nucleoeltricas
exigidos pela Comisso Nacional de Energia Nuclear (CNEN). Os relatrios decorrentes de disposies
desta Norma devem ser endereados CNEN.

292

conforme o caso. A Eletronuclear tem hoje uma base significativa dos seguintes
relatrios, cada um com sua respectiva estrutura:

Relatrios de Evento RE

Relatrios de Desvio Operacional RDO

Relatrios de Evento Significante RES

Relatrios ORO Ocorrncia de Relato Obrigatrio

H tambm os chamados Relatrios Rotineiros, especificados em CNEN (2001),


quais sejam:

Relatrio Anual de Operao (RAO) - relatrio rotineiro, abrangendo a operao


da usina durante o ano civil recm- findo.

Relatrio Final de Anlise de Segurana (RFAS) - relatrio que deve ser


submetido CNEN a cada pedido de Autorizao para Operao Inicial,
conforme previsto na norma CNEN-NE-1.04.

Relatrio de Parada (RP) relatrio emitido aps cada parada da usina,


abrangendo as atividades previstas e aquelas desenvolvidas durante esse
perodo, assim como sua preparao e a experincia adquirida.

Relatrio Mensal de Operao (RMO) - relatrio rotineiro de operao,


abrangendo a operao da usina durante o ms civil recm- findo.

Relatrio de Operaes Iniciais (ROI) - relatrio resumido sobre o programa de


testes de partida, incluindo testes de criticalidade, operao a baixa potncia e
elevao de potncia at atingir o valor nominal.

Relatrio do Programa de Monitorao Ambiental Radiolgico Operacional


apresenta os resultados dos parmetros indicados no PMARO, no perodo a que
se relaciona, por meio de amostras ambientais e com base nos caminhos crticos
de transferncia de radionucldeos para o ser humano.

Relatrio do Projeto Nuclear e Termohidrulico (RPNT) - relatrio que contm


o projeto nuclear e termohidrulico, com sua respectiva anlise de segurana,
correspondente a cada configurao do ncleo do reator.
Diante do exposto, podemos concluir que a Experincia Operacional Interna e

Externa, constituem, de certa forma, o cerne do conhecimento relativo atividade fim

293

da ELETRONUCLEAR, justificando, portanto, esforos e investimentos no sentido de


valoriza-lo, organiza- lo e dinamizar sua aplicao no contexto da empresa.

10.4 Sistemas e Tecnologias da Informao em Gesto do Conhecimento na


Eletronuclear

10.4.1 Viso Geral

Um projeto de Gesto do Conhecimento, a partir do exposto na reviso de


literatura, pode assumir diferentes matizes, focos, objetivos e prioridades. Pode tambm
estar vinculado a diferentes estratgias e pblicos organizacionais. Em um projeto como
esse, coloca-se o imperativo da interao do capital intelectual da empresa com as
solues de tecnologia da informao adotadas. H realmente esforos institucionais,
humanos e tecnolgicos envolvidos em um programa de Gesto do Conhecimento,
como o da ELETRONUCLEAR. A presente tese procura enfocar as questes de ordem
tecnolgica, no campo da minerao de textos aplicada s bases documentais da
empresa. Antes de entrar especificamente no foco principal, relevante mapear o
contexto tecnolgico da empresa, sobretudo nos campos adjacentes aos de estudo do
presente trabalho.

A ELETRONUCLEAR tem sede no Rio de Janeiro, sendo proprietria e


operadora da Central Nuclear Almirante lvaro Alberto, em Angra dos Reis, onde esto
situadas as usinas de Angra I e II. Possui uma infraestrutura ampla, para suportar os
desafios empresariais a que se prope, com sistemas transacionais para administrao da
empresa e controle da operao de gerao de energia. Opera com um modelo de
computao distribuda, com redes internas de comunicao. Adota tecnologias
contemporneas para seu modelo de gesto tal como a aplicao ERP baseado no
aplicativo R3 da SAP. Os dados transacionais so, como em qualquer outra empresa,
muito importantes para a gesto financeira, contbil e de pessoal, dentre outras reas.
Entretanto, pela natureza da atividade, as bases documentais exercem particular
importncia na empresa e passaram a merecer tratamento cada vez mais avanado na
organizao em que a Gesto Eletrnica de Documentos o uso de Portais Corporativos
e, mais recentemente, a tecnologia de Minerao de Textos passaram gozar de especial
ateno da ELETRONUCLEAR.
294

Na perspectiva de OLIVEIRA, FILHO & SOUZA (2004) a interao entre


Gesto do Conhecimento e Tecnologia da Informao na Eletronuclear pode ser
representada pela figura 44 abaixo apresentada, em que dados geram informao, que
por sua vez sustentam a gesto do conhecimento, alimentando as competncias.

Contribuies
Tecnologia Capital Intelectual
Competncias
Compatveis

Conhecimento
Informao
Dados estruturados e no
estruturados
Feedback & Melhorias

Figura 44: Interao do Capital Intelectual com Solues de TI


Fonte: OLIVEIRA, FILHO & SOUZA (2004)

10.4.2 Gesto Eletrnica de Documentos, Automao de Processos e Portal


Corporativo em Gesto do Conhecimento na Eletronuclear

Sendo o foco principal de ateno para a gesto do conhecimento os documentos


textuais, sob as mais diversos formatos, como objetos portadores de informao
potencial para diferentes grupos de usurios, foi necessrio adotar vises do paradigma
da recuperao da informao, descrito no capitulo 5 da presente tese. Em LEPECKI
(2002) e no item 10.2.4.3 acima descritos foram relatadas as iniciativas, as aes
empresariais realizadas para a Gesto do Conhecimento na empresa. No campo da
Tecnologia da Informao e no mbito de um projeto amplo de gesto do conhecimento,
portanto, foi deflagrado na empresa, a partir de 2003, um processo englobando uma
295

srie de aes integradas, focadas no tratamento e manejo da informao para apoio


gesto do know-how tecnolgico da Eletronuclear, quais sejam:

Gerenciamento Eletrnico de Documentao Tcnica - GEDT

Automao de Processos - Workflow

Busca e classificao de contedo no estruturado - Unstructured Document


Management (UDM)

Cumpre salientar que esse processo visa, sobretudo contemplar a imperativa


necessidade de gerencia da Experincia Operacional da ELETRONUCLEAR. A
Gerncia de Engenharia de Apoio GEA.T assumiu a responsabilidade pelo processo94 .
De acordo com ela, os desafios atuais relacionados a gesto

do conhecimento

englobam:

Melhor utilizao dos repositrios de conhecimento disponveis Experincia


Operacional

Disponibilizar os documentos de engenharia e operao em meio eletrnico sem


perda do Controle da Configurao da Planta

Captura do conhecimento tcito de especialistas

Levantamento de rvore de Competncias

O ambiente pr-projeto revelou problemas a serem superados. Em primeiro


lugar, os sistemas esto preparados para processar dados, mas no para gerir
conhecimento. Em segundo lugar, a Informao encontra-se dispersa por inmeros
computadores e sistemas. Em terceiro lugar, multiplicam-se as fontes de informao
com contedos e formatos diversificados. Por fim, constata-se que uma grande
quantidade de conhecimento disponvel no utilizado de forma eficaz devido a
dificuldade de acesso. A Eletronuclear tem, no seu conjunto, uma significativa base de

94

Equipe composta por Luiz Celso Oliveira, Coordenador de Experincia Operacional Externa - EOE,
Darcy dos Santos Filho, Coordenao da Implantao do GEDT; Marcos Roberto Vieira de Souza,
Suporte em TI. Essa equipe apresentou esse trabalho no V Seminrio Nacional da Gesto da Informao e
do Conhecimento no Setor de Energia Eltrica - SINCONEE, realizado em 30/06/2004 em Belo
Horizonte MG. Tal trabalho fonte das informaes internas da empresa sobre o presente programa,
descrito no presente item.

296

dados relacionais, bem como um grande acervo de documentos textuais, envolvendo


documentao tcnica, relatrios, projetos, dentre outros.

Considerando o contexto acima descrito, de acordo com OLIVEIRA, FILHO &


SOUZA (2004), a opo da Eletronuclear foi a de implantar uma soluo de GEDT
(Gerenciamento Eletrnico de Documentos Tcnicos) com dispositivo de Workflow
(automao de processos), integrada com uma ferramenta de busca e classificao de
contedo estruturado e no-estruturado, encapsulada em ambiente de Portal. Assim
sendo, os usurios consumidores de contedo poderiam ter o atendimento dinamizado
s suas necessidades de informao pela proposta da soluo integrada GEDTWorkflow-Portal. Esse trabalho encontra-se em fase avanada de desenvolvimento na
Empresa, podendo ser representado pela figura 45.

CONSUMIDORES DE CONTEDO

SOLUCO CORPORATIVA DE BUSCA E CLASSIFICAO DE CONTEDO


PORTAL Unificao de Contedo

Outros
Aplicativos

ERP

Gesto Eletrnica de
Documentos Tcnicos +
Workflow

Aplicativos de
Gerncia de Projetos

Enterprise Application Integration / Web Services / Processo de Integrao

Figura 45: Gesto Eletrnica de Documentos, Automao de Processos e Portal Corporativo em


Gesto do Conhecimento na Eletronuclear
Fonte: OLIVEIRA, FILHO & SOUZA (2004)

Inicialmente foram adotadas diretrizes e mtodos para captura de conhecimento


de grande valor ainda no-documentado. Isso envolveu os seguintes passos:

297

Identificao de experts e de conhecimento de valor

Compartilhamento, armazenagem, recuperao e apresentao do conhecimento


concernente.

Identificar e levar em considerao a infra-estrutura existente ou planejada.

Implantao do plano.

A lgica da definio da soluo adotada a implantao de estratgias


tecnolgicas de recuperao da informao, com busca e classificao de contedo
estruturado e no-estruturado e que oferece tecnologia diferenciada em escalabilidade95
e velocidade de consulta. Realmente, a especializao tcnica da rea nuclear gera
inevitavelmente um legado de sistemas especialistas com repositrios isolados. Este tipo
de ferramenta capacita usurios descobrirem conhecimento, antes isolado em tais
repositrios, oferecendo um mecanismo de knowledge delivery, evitando re-trabalho
e reduzindo erros. Diante disso, entende-se que uma soluo GEDT oferece
funcionalidades especialistas no controle de documentao de engenharia em todo seu
ciclo de vida, prevendo integrao com ferramentas de gerenciamento de projetos,
aplicativos CAD, gesto de referncias, entre outras, que so essenciais para garantir a
configurao da planta. A integrao do GEDT com a ferramenta de busca e
classificao de contedo (Portal) possibilita a consulta e visualizao da ultima reviso
(aprovada) de um documento tcnico, sem necessitar que o usurio seja capacitado na
utilizao do GEDT para exercer esta funo. Os custos de licenciamento para simples
consultas a base documental so reduzidos significativamente, por no exigirem
obrigatoriamente licenas do GEDT, que normalmente apresentam um custo maior de
licenciamento do que adotar uma soluo corporativa de busca e classificao de
contedo.

O intuito principal da presente proposta viabilizar a difuso do conhecimento


em usinas nucleares a partir da implementao do conceito do EPRI de PIM - Plant
Information Management, representado na figura 46. Por essa perspectiva, a tecnologia
de portal corporativo o agente de difuso do conhecimento, na medida em que articula
diferentes blocos de contedos de informaes entre mltiplos usurios que so
95

Em Tecnologia da Informao, a expresso indica a possibilidade de crescimento de uma aplicao de


acordo com a necessidade de um ou de uma comunidade de usurios.

298

consumidores de conhecimento.

Assim, as estruturas de dados podem ser

Interao das Aplicaes

consolidadas e partilhadas.

Banco de Dados de
Sistemas
Especialistas

Aplicativos de
Gerenciamento e
Controle de Projetos

GEDT

Monitorao de
Desempenho de
Equipamentos

Portal
Agente de Difuso
do Conhecimento

Repositrios de
conhecimento
No-estruturado

Simulador

Anlise Probabilstica
de Risco

(Aplicativo de Gerenciamento de
Manuteno)

Oramento, Finanas
e Patrimnio (E R P)

Workflow

As estruturas de dados podem ser


consolidadas e partilhadas

Figura 46: Conceito do EPRI : PIM - Plant Information Management


Fonte: OLIVEIRA, FILHO & SOUZA (2004)

10.4.2.1 Portal de Experincia Operacional e Informao Tecnolgica

Um projeto de Gesto do Conhecimento, a partir do exposto na reviso de


literatura, pode assumir diferentes matizes, focos, objetivos e prioridades. Pode tambm
estar vinculado a diferentes estratgias e pblicos organizacionais. Em um projeto como
esse, coloca-se o imperativo da interao do capital intelectual da empresa com as
solues de tecnologia da informao adotadas. Na seqncia do item anterior,
importante apontar o uso de tecnologia da informao como suporte ao processo de
Gesto do Conhecimento, com a implantao da ferramenta de busca e classificao de
contedo, ou seja: um portal corporativo que permita o compartilhamento de
conhecimento. A anlise do uso de portais deve estar alinhada s estratgias
organizacionais e tambm ao tipo de portal implantado. Cada vez mais est difcil

299

dissociar Portal Corporativo da Gesto de Conhecimento, j que o portal no somente


uma

implementao

tecnolgica.

Assim,

sua

adoo

deve

considerar

os

direcionamentos tecnolgicos e de negcios que so de interesse para a organizao.


De acordo com OLIVEIRA (2) (2006), o Portal realiza um processo de coleta e
indexao e executa uma classificao a partir dos ndices, criando taxonomias e
categorias, com uso de rvores de conhecimento e desenvolve um processo para busca e
navegao a partir desses ndices criados, com uso de filtros e metadados. O processo de
busca e navegao bsicas da soluo de portal apresentado na figura 47 abaixo.

Usurio
Camada de
Apresentao

Pedido de Chave/Doc.

Servidor de
Aplicao

Query

Processo de
Busca/Browse

Query

Locales

Dados
Brutos

Filtros

Gateway

Dados

Dados/Docs.
Filtrados/Convertidos
(opt.)

Query

Casamento (Chaves &


Meta Dados &/ou
SubCategorias)

Casamento (Chaves &


Meta Dados, &/o u
SubCategorias )

ndices

Knowledge
Tree(s)

Figura 47: Processo de Busca e Navegao Bsicas da Soluo de Portal


Fonte: OLIVEIRA (2) (2006)

Possui recursos para pesquisas estruturadas e em texto completo, refinamento da


seleo atravs de pesquisa paramtrica, operadores avanados e baseados em regras,
navegao em documentos grandes e complexos com suporte para mais de 200 tipos de
documentos diferentes, permitindo a visualizao dinmica dos documentos. Admite
possibilidade de personalizao no uso, com interface web customizvel.

A ferramenta de portal permite lidar com diferentes comunidades de usurios


com personalizao baseada em papis, direitos de acesso e preferncias. O ranking
permite que os usurios encontrem primeiro as informaes que mais desejam. H uso
de agentes pessoais para receber notificao das modificaes ocorridas no contedo do
portal. O alcance corporativo com a possibilidade de milhares de usurios simutneos

300

que acessam centenas de milhares de documentos. Portanto, de acordo com a


especificao previamente definida, essa ferramenta deve:

Possibilitar buscas simultneas em repositrios com contedos estruturados e


no-estruturados;

Oferecer mecanismo drill-down para navegar entre as categorizaes de


contedo.

Apresentar resultados de busca relevantes para o perfil do usurio;

Viabilizar o ambiente colaborativo atravs de redes sociais possibilitando


recomendao de contedo entre usurios;

Busca paramtrica atravs das categorizaes de contedo, possibilitando


selecionar filtros compostos de valores numricos e perodos determinados por
intervalos de datas;

Busca federada: consolidar resultados de busca e categorizao em portais


externos que tem seus prprios mecanismos de busca;

Possibilitar a definio de regras de negcio para automaticamente categorizar


novos contedos, sem necessitar redefinir as taxonomias configuradas;

Respeitar as permisses de acesso, definidas nos repositrios estruturados e noestruturados.

Tal soluo a ser adotada deve atuar em trs camadas: apresentao,


infraestrutura (ou fundao do portal) e agregao de contedo. Na Eletronuclear, a
ferramenta escolhida para implementao foi o Verity, atualmente pertencente
empresa Autonomy (EUA) 96 . Essa ferramenta encontra-se em fase final de
implantao na empresa e as bases que agrega j se encontram disponveis para os
usurios internos da empresa. O ANEXO III transcreve uma pgina web da empresa
Autonomy com relato do caso da ELETRONUCLEAR.

96

A empresa Verity, fornecedora de tecnologia de portais para a Eletronuclear, foi adquirida pela
Autonomy em dezembro de 2005. Maiores informaes em www.autonomy.com.

301

10.4.2.2 Implantao da Gesto Eletrnica de Documentao Tcnica e Workflow

A utilizao de tecnologia de Gesto Eletrnica de Documentao Tcnica


GEDT, integrada ao Workflow tem como objetivos:

Gerenciamento de 700.000 documentos de engenharia.

Gerenciamento

controle

automtico

dos

processos

que

envolvem

documentao tcnica;

Velocidade e preciso na localizao de documentos;

Aumento de produtividade;

Otimizao dos procedimentos para tomada de decises

Possibilidade de customizao de indexao para acesso a documentos;

Reduo de custos com cpias;

Otimizao na utilizao de outras ferramentas, tais como: ERP, Aplicativos de


Gerenciamento de Projetos, Aplicativos de gerenciamento de manuteno e
parada de plantas industriais, dentre out ras solues de mbito corporativo.

Na Eletronuclear a ferramenta escolhida para implementao da Gesto


Eletrnica de Documentao Tcnica, agregada ao Workflow foi o software brasileiro da
empresa Sincronia, que leva o mesmo nome. O Sincronia publica documentos
para indexao por ferramentas de busca e categorizao de contedo, possibilitando
consultas da base documental em toda organizao. Na Eletronuclear esse software
realiza o gerenciamento da documentao tcnica das Usinas de Angra 1 e Angra 2, faz
a automao dos processos utilizados no controle da configurao da planta e viabiliza a
integrao com soluo de busca e categorizao de contedo (Enterprise Search and
Content Categorization - ESCC) em ambiente de portal.

As funcionalidades da ferramenta a ser adotada, englobam:

Oferecer facilidades para integrao com ferramenta de busca e classificao de


contedo.

Padronizao de contedo para formato Adobe PDF.

Acervo documental protegido contra acessos no-autorizados.

302

Notificao antecipada de atrasos na emisso dos documentos.

Integrao com ferramentas de planejamento.

Definio dos estados de um documento e permisses de acesso por nvel


funcional

Modelagem grfica e otimizao contnua dos fluxos documentais.

Acesso via browser (thin-client) em ambiente Web

Gerenciamento das dependncias de contedo entre documentos (plant


configuration management)

10.4.2.3 Resultados Almejados com Portais, GEDT e Workflow

Dentre os benefcios esperados com a adoo de tais solues tecnolgicas,


podemos citar alguns, sendo os principais vinculados ao processo de integrao de
processos informaes e melhoria da disponibilidade da informao ao usurio. Essa
considerao deve ser feita no mbito da Gesto da Experincia Operacional da
empresa. Do ponto de vista estratgico, temos: melhorar a identificao de
oportunidades, adequar melhor as respostas dos sistemas de informaes, controlar
situaes e otimizar recursos expressam benefcios gerados. Isso vem acrescido de
outros ganhos, tais como: possuir contedos articulados, possuir eventos referenciados e
informaes consolidadas, alm de garantir bons processos de interao entre
conhecimentos, informaes, pessoas e unidades organizacionais. So aspectos que
melhoram as respostas da organizao s suas necessidades.

303

11 MINERAO DE TEXTOS NA ELETRONUCLEAR

11.1 Consideraes Preliminares

Inicialmente, embora a Eletronuclear tenha considerado a possibilidade de uso


da minerao de textos como tecnologia de ponta para empresas de gerao de energia e
a partir de propostas de seu Projeto de Gesto do Conhecimento, conforme descrito no
Captulo 10, tal proposta havia sido postergada tendo em vista seus elevados custos para
aquisio de ferramenta especfica e no deteno de know-how tecnolgico nessa rea
por parte da empresa. O presente trabalho de doutorado mudou esse quadro ao acenar
com a possibilidade de introduo de software brasileiro de minerao de textos na
empresa. Os primeiros contatos do autor da presente Tese com a Eletronuclear
aconteceram a partir do V SINCONEE Simpsio de Gesto do Conhecimento do
Setor de Energia Eltrica, realizado em Belo Horizonte, em meados de 2004, a partir da
interlocuo com o Sr. Luiz Celso Oliveira, j citado nesse trabalho. A partir da, e do
estudo do documento elaborado por OLIVEIRA, FILHO & SOUZA (2004) vrias
visitas aconteceram Central Nuclear Almirante lvaro Alberto, em Angra dos Reis
RJ, para realizao da Tese em questo.

A proposta de uso da tecnologia de minerao de textos na ELETRONUCLEAR


j tinha sido identificada por OLIVEIRA (2) (2002) e sugerida por organismos de
pesquisa da rea de energia eltrica, como o EPRI para aplicao sobre a Experincia
Operacional. Para esse contexto de aplicao, visa ampliar aind a mais os resultados e
possibilidades do projeto Portal-GEDT-Workflow j deflagrado e descrito no captulo
anterior, criando novas possibilidades para os usurios na utilizao das bases de
documentos textuais relativas Experincia Operacional da Empresa e existentes na
empresa. Tais bases incluem documentos gerados por ela prpria (Experincia
Operacional Interna) ou documentos importados de outras bases externas,
especialmente no caso da Experincia Operacional Externa. Podemos considerar que
tais bases configuram o conhecimento explcito da ELETRONUCLEAR sobre
atividades operacionais da empresa e sobre o qual o uso de tecnologias de informao
pode apresentar bons resultados. As atividades administrativas e de apoio (como
marketing, finanas e recursos humanos) tambm poderiam ser alvo de processo de
descoberta de conhecimentos em suas bases textuais.
304

11.2 Caracterizao da Necessidade de Minerao de Textos

projeto

Portal- GEDT-Workflow

possui

grande

relevncia

para

ELETRONUCLEAR e recebeu investimentos importantes por parte da empresa.


Entretanto, como toda tecnologia, possui seus limites e algumas importantes
necessidades de informao no puderam ser contempladas por ele, mesmo atuando
dentro do paradigma da recuperao da informao. Pretende-se com o uso de
minerao de textos a realizao do tratamento inteligente dos textos digitalizados,
melhorando significativamente consultas, pesquisas, estudos tcnicos e qualquer
trabalho que venha a exigir um tratamento e anlise avanada da informao, como
suporte gesto do conhecimento.

A ELETRONUCLEAR uma empresa de grande porte e possui internamente


diferentes comunidades de usurios de informao, em reas administrativas e
operacionais, cada uma com interesses e necessidades especficas. Opera duas usinas
nucleares e vislumbra a construo da terceira. Alm das usinas, com suas estruturas
operacionais, temos tambm todas as reas de suporte administrativo da empresa.
Portanto, h na empresa um grande nmero de usurios em potencial para utilizar a
tecnologia de minerao de textos. Cada usurio ou comunidade interna de usurios tem
suas necessidades e interesses especficos, lidando tambm com diferentes tipos de
documentos. Na ELETRONUCLEAR h bases internas de documentos de natureza
administrativa e natureza operacional a experincia operacional.

No que tange Experincia Operacional, muitas bases de documentos se


encontram hoje disponveis, especialmente aps a implantao da Gesto Eletrnica de
Documentos e do Portal Corporativo. H bases internas e bases externas acessadas sob
contratos, convnios, acordos ou aquisio do direito de acesso.

A Experincia Operacional Externa constituda por bases englobando um


grande nmero de documentos oriundos de instncias como:

AIEA Agnc ia Internacional de Energia Atmica

CNEN - Comisso Nacional de Energia Nuclear

305

WNA Word Nuclear Association (Associao Nuclear Mundial)

WANO (Word Association of Nuclear Operators)

INPO (Institute of Nuclear Power Operators).

NRC United States Nuclear Regulatory Commission

VGB Instituio europia, sediada em Essen, na Alemanha e que atua na rea


nuclear.

Instituies Nacionais de Pesquisa

Instituies Estrangeiras de Pesquisa

Fornecedores

Outras empresas da rea de energia nuclear.

No que concerne Experincia Operacional Interna, ela encontra-se subdivida


por usina. H que se considerar o fato de que esto em operao duas usinas nucleares
para gerao de energia, construdas em momentos diferentes a partir de fornecedores
diferentes. Isso implica que temos estruturas gerenciais, processos e bases de
documentos separadas para cada uma das duas usinas. Conforme apresentado no
captulo 9, Angra I foi construda com tecnologia da empresa Westinghouse (EUA) e
iniciou sua operao em 1985. J Angra II, iniciou sua operao em 2000 e foi
construda com tecnologia da empresa alem Kraftwerk Union A.G. KWU, ento
subsidiria da Siemens . H ainda o projeto de construo de Angra III. Portanto, hoje,
h bases consolidadas de documentos relativos Experincia Operacional separadas
para as Usinas de Angra I e Angra II.

Diante dos aspectos acima relacionados, no mbito do presente trabalho,


considerou-se necessrio uma pesquisa com duas vertentes:

Estudar aspectos relevantes concerne ntes Experincia Operacional da


ELETRONUCLEAR que deveriam ter prioridade para investigao e anlise,
para implantao de um processo de descoberta de conhecimento em bases
textuais (minerao de textos), especialmente no contexto do projeto PortalGEDT-Workflow, anteriormente implantado.

306

Identificar, adequar e aplicar o processo de descoberta de conhecimento em


bases textuais com o software de minerao de textos em um conjunto de
experimentos, avaliando os resultados dessa aplicao quanto relevnc ia dos
resultados e grau de aderncia s necessidades dos usurios e da prpria
organizao.

Para a primeira vertente, estabeleceu-se a conduo uma pesquisa-ao para


responder s questes nela colocadas e, em seguida, para a segunda vertente,
deveramos aplicar software de minerao de textos em um projeto de experimentos
com bases documentais selecionadas pela empresa.

11.3 A Pesquisa-Ao na Eletronuclear

11.3.1 Viso Geral e Escolha da Questo-Alvo do Processo de Minerao de Textos

A Pesquisa-Ao um mtodo ou abordagem qualitativa de pesquisa, conforme


discutido no captulo 3 da presente Tese. Portanto, o primeiro desafio do autor dessa
Tese foi entender a ELETRONUCLEAR, o setor nuclear, suas caractersticas, histria,
situao atual, perspectivas futuras, etc., bem como aprofundar a percepo sobre a
adequao do uso da tecnologia de minerao de textos na empresa. Em seguida tornouse necessrio estudar e entender os aspectos relativos ao conhecimento tcito e
explcito da Empresa e aprofundar o conhecimento das necessidades de informao
existentes junto s diferentes comunidades de profissionais em diferentes reas, para
inferir respostas que seriam adequadas.

A relao principal do autor da Tese com a ELETRONUCLEAR deu-se com a


Gerncia de Engenharia de Apoio, que tem por misso fornecer o apoio de Engenharia
necessrio operao, visando maior segurana e melhor desempenho das usinas de
Angra I e II. A seguir, apresentamos a Figura 48 com uma viso geral da GEA.T.

307

Gernc ia de
Engenharia de Apoio
GEA.T

Grupo de
Engenharia
de Materiais
(GEM)

Grupo de
Equipamentos
e Estruturas
(GEE)

Centro de
Documenta
o Tcnica
(CEDOT)

Experincia
Operacional
Externa
(EOE)

Figura 48: Estrutura Geral da GEA.T


Fonte: ELETRONUCLEAR.

A Gerncia de Engenharia de Apoio GEA.T est subordinada


Superintendncia de Engenharia de Apoio, a qual por sua vez,

est vinculada

Diretoria Tcnica da ELETRONUCLEAR. A GEA.T atua principalmente no apoio de


engenharia s usinas Angra 1 e Angra 2, com as seguintes atribuies:

Prestar apoio de engenharia s usinas abrangendo Sistemas, Estruturas,


Componentes e Confiabilidade de Materiais.

Prestar suporte imediato de engenharia s usinas em operao.

Gerenciar o Centro de Documentao Tcnica (CEDOT) abrangendo os


arquivos de originais de Engenharia de Angra 1 e 2, e os arquivos de registros
da qualidade e modificaes de projeto de Angra 1, 2 e 3.

Coordenar o Gerenciamento Eletrnico da Documentao de Engenharia.

Gerenciar os processos de acompanhamento, avaliao e disseminao e


implementao da Experincia Operacional Externa.

Prestar servios de inspees peridicas, instrumentao e reparos de estruturas


civis das usinas em operao.

308

Prover suporte tcnico s usinas em atendimento a solicitaes de


Esclarecimentos Tcnicos da Operao (ETO).

Prestar apoio de engenharia s usinas durante as paradas e nas inspees em


servio.

Prestar servios em engenharia de componentes e em projeto nas reas


mecnica, eltrica e civil.

Desenvolver e coordenar programas de longo prazo tais como o Programa de


Gerenciamento da Obsolescncia, o Programa de Liga 600, o Programa de
Controle da Corroso por cido Brico, o Programa de Dedicao e o Programa
de Monitoramento de Mecanismos de Degradao.

Prestar apoio tcnico s usinas na elaborao do oramento de investimento e na


avaliao de propostas tcnicas e de contratos.

Planejar atividades para o Plano de Metas da DT.

Prestar apoio na elaborao dos oramentos de investimento e estrutural.

importante salientar que um aspecto que atravessa todas as discusses sobre


aplicao da minerao de textos em bases de documentos justamente o valor e a
utilizao do conhecimento tcito dentro da organizao, conhecimento esse embutido
nas mentes e na expertise dos profissionais da rea nuclear e, no caso em questo, da
ELETRONUCLEAR. O conhecimento tcito pode migrar, com alguma facilidade, para
os textos, pela flexibilidade e facilidade de elaborao que este possui hoje, j em
formatos digitais, ou seja: a elaborao de textos pode ser uma forma de converso de
parcelas de conhecimento tcito em conhecimento explicito. Conforme RINTALA &
KURONEN (2006) o conhecimento tcito altamente subjetivo e dependente de um
nmero grande de fatores intangveis, tais como cultura, opinies pessoais, valores,
perspectivas, insights, intuies e emoes do indivduo. Ele construdo atravs do
esforo para construo de um sentido de mundo. O conhecimento tcito individual e
subjetivo. De acordo com esses autores, h diferentes vises sobre como o
conhecimento tcito pode ser convertido em conhecimento explicito. H pesquisadores
que afirmam que esse conhecimento nem pode ser convertido (JOHANNESSEN et alli
2001)mas pode somente ser compartilhado em interaes sociais entre os profissionais

309

experientes e os iniciantes atravs de uma vivncia e aprendizagem quase artesanal


destes com aqueles.

Outros pesquisadores acham que o conhecimento pode ser

parcialmente codificado. Isso pode ser feito em um nvel conceitual, mas no com
grande detalhamento. Por fim, h tambm os pesquisadores que afirmam que esse
conhecimento pode e deve ser compreendido e codificado para compartilhamento. A
codificao pode ser alcanada atravs de alguns caminhos, tais como codificao de
conhecimento em frmulas, cdigos, relatrios, polticas e incorporado em objetos
fsicos como os prottipos.

Essa codificao do conhecimento tcito tem claras vantagens: mais itens de


conhecimento podem ser codificados, gerando mais economia e eficincia e pode ser
compartilhado. Entretanto, essa codificao pode criar novos custos para a organizao,
como com tecnologia da informao e documentao excessiva. necessrio refletir,
portanto, sobre a parcela de conhecimento tcito que deve ser explicitado e codificado
de forma equilibrada. Estudos prvios indicam que essa proporo pode variar de uma
organizao para outra.

RINTALA & KURONEN (2006) prope a utilizao de 23 mtodos de


compartilhamento de conhecimento tcito e que podem ser adotados pela
ELETRONUCLEAR. Tais mtodos so:

1)

Aprendizagem Individual Com Especialista provavelmente o mais antigo


mtodo de partilhar conhecimento tcito e que envolve a consultoria assistida
de um profissional experiente para guiar o aprendiz em situaes da vida real,
sendo que este pode observar gradualmente a responsabilidade na performance
de tarefas de trabalho.

2)

Aprendizagem em Grupo com Especialistas

3)

Mentoring individual

4)

Mentoring em Grupo

5)

Visitas tcnicas a locais de operao e produo, com acompanhamento de


especialistas

6)

Observao

7)

Discusso de Casos

310

8)

Implantao de salas de jogos, utilizando conversas informais, uso de jogos e


processos ldicos de aprendizagem, considerando a premissa de que o
relaxamento dos participantes leva a uma maior socializao do conhecimento.

9)

Reunies em grupos multifuncionais, com realizao de cruzamentos das


experincias de diferentes matizes e reas que podem se complementar.

10) Reunies em grupos de especialistas com anlise em profundidade de


problemas e questes especficas
11) Trabalho em conjunto de novatos e experts em um time com oportunidade de
observar e conceituar situaes, abordar problemas, generalizar e avaliar
solues.
12) Reviso de rotinas organizacionais existentes com desenvolvimento de novos
modelos para novas situaes a partir de discusses em grupos de questes
diversas relativas aos processos organizacionais existentes.
13) Grupos de aprendizagem focada, em que aprendizes formalmente sustentam
posies de aprendizagem, participando de reunies em trocam contribuies
com seus colegas relativas aos estudos e atividades desenvolvidas.
14) Comunidades de prtica, processo de interao em grupo em que comunidades
emergem informalmente, construindo redes de conhecimento de especialistas e
podem envolver pessoas de dentro e de fora da organizao no sentido de
resolver problemas complexos para os quais solues desafiadoras so
necessrias, porm, difceis de serem individua lmente construdas. So
constitudos usando reunies, trocas de mensagens eletrnicas, uso de
videoconferncias sobre tpicos de interesse de seus membros.
15) Jogo de simulao em que especialistas jogam e aprendizes observam. Os
observadores colocam situaes problemticas de trabalho. Durante o processo
de soluo, os especialistas colocam suas experincias em palavras e os novatos
podem aprender sobre aspectos relativos tomada de deciso. Aps os
participantes terem colocado suas vises, desenvolvem em conjunto a soluo
do problema.
16) Relatos de histrias em que narrativas so apresentadas, mostrando um
contexto, a trajetria de situaes, eventos e problemas e quais os desfechos
ocorridos.
17) Grupos de relatos de histrias. Neles, mais pessoas so envolvidas no processo
e contribuem na criao de histrias, interagindo com opinies, vises e
311

interpretaes de eventos passados. Esses grupos exigem que especialistas


invistam boa parte do seu tempo na estruturao e composio das histrias a
serem discutidas.
18) Uso de entrevistas estruturadas
19) Uso de entrevistas semi-estruturadas
20) Realizao de estudos sistematizados, com levantamento e agrupamento de
dados sobre um determinado tema para posterior anlise, visualizao das
abordagens

existentes

sobre

determinada

questo

ou

fenmeno

estabelecimento de teorias ou pressupostos sobre ela e suas possveis


abordagens.
21) Escrita e redesenho de padres
22) Uso de rvores de deciso
23) Implantao de times de melhores prticas.

Podemos observar que o mtodo proposto no item 20 se alinha de modo forte


com a tecnologia de minerao de textos.

Para realizao da Pesquisa-Ao na ELETRONUCLEAR, visando entender,


avaliar e introduzir o uso da tecnologia de minerao de textos na organizao, foi
constitudo um grupo focal, de acordo com o descrito no tpico 3.3 da presente tese com
seis integrantes para participao do processo, sob conduo do autor da Tese. Tal
grupo incluiu, alm do autor, dois componentes da equipe de desenvolvimento do
software DifBrain97 , e trs profissionais 98 da Gerncia de Engenharia de Apoio
EOE Experincia Operacional Externa, rea subordinada Diretoria Tcnica da
ELETRONUCLEAR e que foi a responsvel pelo Projeto Portal GEDT Workflow ,
sendo hoje a rea executiva responsvel pela articulao dos processos relativos
Gesto do Conhecimento na Empresa. Portanto, em anlise conjunta com a Gerncia de
Engenharia de Apoio procurou-se avaliar em que campo do conhecimento sobre energia

97

Analista de Sis temas Marcelo Gibson de Castro Gonalves e a Professora Doutora Regina Ftima
Gibson Gonalves, Engenheira Eletricista, especialista na rea de Inteligncia Artificial.
98
O Sr. Luiz Celso Oliveira, Coordenador de Experincia Operacional Externa - EOE e j citado nessa
Tese, e os Srs. Carlos Maurcio Cruz Belo e Ricardo Lowe Stukart, Engenheiros de Experincia
Operacional. Nesta funo executam anlise da experincia operacional externa, e do suporte de
engenharia s usinas na anlise de experincia operacional interna. Esses profissionais so experientes no
campo da Engenharia Nuclear, possuidores de competncia no campo na anlise de documentos da
Experincia Operacional das duas usinas em operao em Angra dos Reis.

312

nuclear seria mais adequado desenvolver o processo de minerao de textos, numa


perspectiva de envolvimento com a busca de soluo para problemas crticos e
necessidades relevantes que a ELETRONUCLEAR atualmente possui. Sendo interesse
da Empresa o uso da tecnologia de minerao de textos, procurou-se identificar em
quais aspectos da realidade organizacional seria possvel constatar maior aderncia entre
as necessidades de potenciais usurios e o uso da tecnologia proposta.

Embora em vrias reas da ELETRONUCLEAR, em conformidade com as


perspectivas descritas na literatura, seja possvel visualizar vrias possib ilidades de
aplicao, tornou-se necessrio delimitar o foco de aplicao da minerao de textos,
pelo menos em sua fase inicial e experimental. O foco recaiu sobre a Experincia
Operacional, que possui um considervel acervo de documentos digitais. Em seguida,
optou-se tambm por tratar as bases de documentos da Experincia Operacional Interna
das usinas de Angra I e Angra II. Um extrato da Guideline da WANO (World
Association of Nuclear Operators) usada como resumo de referncia bsica para
atividades de gesto da Experincia Operacional apresentada no ANEXO IV da
presente Tese.

11.3.2 Anlise de Eventos em Suporte ao Monitoramento de Usinas Nucleares

O grupo constitudo examinou diferentes possibilidades de problemas que


poderiam ser abordados, todos envolvendo a necessidade de descoberta de
conhecimento embutido em bases de documentos da organizao. A Anlise de
Eventos em Suporte ao Monitoramento de Usinas Nucleares foi o problema escolhido
para estudo e entendimento pelo grupo e para posterior aplicao da tecnologia de
minerao de textos. Essa uma questo fortemente inserida no mbito da Experincia
Operacional, tanto Externa quanto Interna, embora para o uso da ferramenta de
minerao de textos, em um primeiro momento e para o conjunto de experimentos
realizados, foram utilizadas apenas bases de documentos digitais da Experincia
Operacional Interna.

A Experincia Operacional constitui um conjunto de conhecimentos de alta


relevncia sob o ponto de vista gerencial das usinas nucleares. Ela configura um
contexto bsico e um parmetro fundamental para a tomada de decises relacionadas
313

gesto de operao. A gesto da operao deve buscar aderncia e alinhamento entre


aes de otimizao de desempenho e zelo pela segurana. A inteno da empresa
sempre procurar gerar o mximo possvel de energia com as plantas em operao, mas
isso deve ser alcanado observando sempre as melhores prticas de operao e
segurana. Gerenciar a operao das usinas implica em um processo de monitoramento
que demanda conhecimento sobre o status, a condio da usina no presente, mas a
interpretao de tais estados pode ser sempre subsidiada pela histria passada, pela
anlise e interpretao de eventos anteriores e que foram fatores de aprend izagem para
os gestores e empregados responsveis pela operao. Gerenciar uma usina
nucleoeltrica de modo a garantir uma operao otimizada e segura o ideal a ser
buscado, especialmente quando se considera a complexidade do processo, pela
quantidade de fatores intervenientes envolvidos. Conciliar segurana e produo hoje
algo imprescindvel e o acmulo da experincia operacional vem contribuindo para que
se possa melhor entender os parmetros relativos ao que seja uma boa performance e
uma adequada segurana para operao de usinas nucleares. Atualmente, identificar,
monitorar, mensurar e avaliar esses parmetros tornou-se um imperativo para todos os
operadores de usinas ao redor do mundo, o que levou entidades relacionadas rea
nuclear a incorporar tal preocupao e desenvolvessem a tarefa de especificar
referenciais para a operao, avaliando nveis de segurana e desempenho das plantas
nucleares.

Destarte, instncias como AIEA, INPO, WANO e NRC vem

desenvolvendo trabalhos concernentes definio de indicadores de desempenho e


segurana.

De acordo com SOUTO (2005) a AIEA, desenvolveu o Operational safety


performance indicators for nuclear power plants (IAEA, 2000) 99 , que apresenta um
guia geral de indicadores de desempenho e segurana. Tal guia de relevante
importncia pelo fato de estabelecer uma nova viso no que tange ao tratamento de
aspectos relacionados a desempenho e segurana de usinas nucleares. Ele sugere aes,
condies e procedimentos para se atingir os requisitos de segurana, bem como
garantir um alto ndice de desempenho, propondo que problemas relacionados a
desempenho e segurana sejam tratados de forma macro e no simplesmente atravs de
indicadores especficos isoladamente. A Agncia afirma que um alto nvel de segurana
99

IAEA 2000, Operational Safety Performance Indicators for Nuclear Power Plants TECDOC-1141,
www.iaea.org,. Citado por SOUTO (2005).

314

resultado de uma interao complexa de uma segurana operacional, projeto e


desempenho humano. O autor afirma:

A Experincia tem demonstrado que a concentrao em um nico aspecto do


desempenho ineficiente e pode ser ilusrio. O que mais vlido, portanto, a
figura total apresentada por um conjunto completo de indicadores projetado
para monitorar todos os aspectos do desempenho de segurana operacional.
Destarte, tal guia geral de indicadores fornece uma estrutura genrica para a
identificao e organizao dos indicadores de desempenho que tm uma
relao direta com os atributos de segurana desejados. O trabalho da Agncia
mostra ainda que as tendncias de um indicador especfico em um perodo de
tempo podem fornecer um aviso para que se possam investigar as causas por
trs das alteraes observadas. Alm claro de servir como instrumento de
comparao dos indicadores com as metas e objetivos identificados para
avaliar pontos positivos e negativos de desempenho (p. 2-3).

SOUTO (2005) tambm comenta sobre outros rgos e institutos e descreve que
o INPO tambm traz alguns trabalhos relacionados aos indicadores de desempenho, dos
quais merece destaque o Indicators of changing performance (INPO, 2001)100 ,
destacando a importncia de se estabelecer uma estruturao eficiente de indicadores de
desempenho e segurana operacional, para monitorar aspectos da planta, organizacional
e de desempenho humano, alm de identificar um conjunto valioso desses indicadores.
J a WANO, de acordo com esse autor, desenvo lve um programa de padronizao
mundial dos indicadores de desempenho de usinas nucleares, enquanto que a NRC
possui larga experincia sob indicadores de desempenho, resultado da implementao
do primeiro programa oficial desses ndices em usinas nucleares (NRC, 2002) 101 .

A anlise de eventos uma atividade de relevncia no sentido de melhorar os


indicadores e subsidiar aes de melhoria para segurana e desempenho. A anlise de
eventos, realizada com o suporte da tecnologia de minerao de textos, permite a
emergncia de certos conhecimentos que so fruto do tratamento inteligente realizado
por ferramenta de software sobre esses mesmos textos. Conforme apresentado no
capitulo 10, as notificaes de eventos ocorrem com base na relevncia do mesmo,
classes de significncia e suas conseqncias, grau de segurana, prazos de
100

INPO 2001, 01-005, Indicators of Changing Performance, www.eh.doe.gov/inpo, Citado por


SOUTO (2005).
101
NRC 2002, 0030, Summary Report on NRCs Historical Effots to Develop and Use Performance
Indicators,
www.nrc.gov/reading-rm/doc-collections/comission/secys/2002/secy
2002-0030/20020030.html Citado por SOUTO (2005).

315

comunicao, dentre outros aspectos. Tais relatrios so gerados, sob a forma de


documentos textuais eletrnicos e comunicados s instncias competentes, internas ou
externas empresa, conforme o caso. A Eletronuclear tem hoje uma base significativa
dos seguintes relatrios 102 , cada um com sua respectiva estrutura, tanto para Angra I
quanto para Angra II:

Relatrios de Evento RE

Relatrios de Desvio Operacional RDO

Relatrios de Evento Significante RES

Relatrios ORO Ocorrncia de Relato Obrigatrio

Na medida em que esses documentos pudessem no somente ser alvo de uma boa
recuperao por parte dos diversos usurios (o que foi alcanado com o uso do Portal de
Experincia Operacional), mas tambm se transformassem em alvo de um processo de
anlise e de um tratamento computacional que rastreasse e identificasse o seu real
contedo, realizando-se sobre eles uma anlise semntica e sinptica103 eles poderiam se
transformar em fonte valiosa para profissionais envolvidos na operao das usinas no
sentido de identificar e visualizar mltiplos fatores intervenientes em performance e
segurana.

11.4 O Projeto de Experimentos na Eletronuclear

11.4.1 Proposta do Projeto

Partindo das necessidades de informao e de conhecimento da Eletronuclear, j


caracterizadas, a partir do seu projeto de Gesto do Conhecimento, tambm j
apresentado e que indicou a pertinncia e adequao do uso da tecnologia de minerao
102

Contedo e desenho desses relatrios no sero aqui apresentados por fora de acordo de no
divulgao de informaes relevantes e estratgicas da ELETRONUCLEAR pelo autor dessa Tese. Esses
relatrios envolvem informaes sobre ocorrncias diversas em vrias reas da usina: envolvendo a
operao do reator, gerador, processo de resfriamento nos diferentes circuitos primrio e secundrio,
dentre outros processos e sub-processos operacionais. Ver tambm no ANEXO II sobre relatrios.
103
Por anlise sinptica entende-se um olhar nico sobre um mesmo conjunto. Um acervo de documentos
possui muitos itens. Ao recuperar esses itens, o usurio procede uma anlise individual de cada item, mas
tem dificuldade em estabelecer correlaes entre os documentos e entre os diferentes contedos possveis
de existir em cada um dos documentos. A anlise sinptica implica em ver a totalidade, encontrando
significado ou sentido semntico no apenas em um documento especfico, mas no conjunto objeto de
anlise.

316

de textos j discutida, foi definido um projeto de experimentos para uso dessa


tecno logia no mbito da organizao, visando abordar a Anlise de Eventos em Suporte
ao Monitoramento de Usinas Nucleares, conforme acima citado.

O projeto de experimentos assumiu os seguintes objetivos:

a) Identificao de necessidades de informaes especficas de subgrupos de


usurios, funcionrios da Eletronuclear, com demanda de informao relevante
que se encontrava inserida em documentos textuais, no caso em questo para
abordar o problema: Anlise de Eventos em Suporte ao Monitoramento de
Usinas Nucleares;
b) Determinao de bases dados textuais de interesse de um determinado subgrupo
de usurios que deveriam conter as informaes textuais relevantes a serem
recuperadas;
c) Determinao dos tipos de anlises e conhecimento a serem descobertos que
deveriam ser alvo do processamento dos textos pelo software DifBrain
d) Uso do software DifBrain, na recuperao da informao textual nas funes
propostas para o mesmo, com o processamento dos textos em computador;
e) Avaliao dos resultados em conjunto com o usurio.

No que tange aos tipos de anlises e conhecimento a serem descobertos que


deveriam ser alvo do processamento dos textos, foi estabelecido pelo Grupo Focal os
seguintes objetivos finais para a Minerao de Textos:

Descobrir conhecimento embutido nos textos dos relatrios citados e que no


estavam evidentes ou claros para uma anlise tradicional ou busca convencional;

Realizar buscas proativas e reativas (conforme descrito no tpico 6.4.4) de


forma a identificar possveis relaes expressivas de conhecimento relevante a
ser apresentado aps a execuo das tarefas de minerao (conforme descrito no
item 8.7).

Identificar possveis tendncias nos relacionamentos de conceitos e termos


presentes nos contextos dos documentos.

317

Promover o tratamento semntico de colees em que havia ambigidade de


palavras presentes em relatrios.

O software DifBrain comeou ento a ser utilizado no processamento das


bases textuais da ELETRONUCLEAR.

11.4.2 Execuo dos Experimentos

Entre 2004 e 2007, foi desenvolvido o software DifBrain, j caracterizado,


pela Diferencial Consultores Associados. O software DifBrain:

Gerencia e processa bases de textos com tcnicas de minerao de dados

Opera em 3 idiomas (portugus, ingls e alemo)

Gerencia de idiomas, eliminando stopwords, aplicando delimitadores de


sentenas, alfabeto especial e sinais de pontuao

Implementa buscas pro-ativas

Implementa buscas reativas

Gera resumos automticos

Cria clusters de documentos, implementando diferentes algoritmos

Gera estatsticas com freqncia de termos em bases de documentos processados

Em cumprimento a tal especificao do tpico anterior, foram identificadas as


bases textuais armazenadas no computador servidor Natrium da Eletronuclear, dedicado
Experincia Operacional Interna 104 . Elas incluem os documentos RE, RDO, RES e
ORO para as usinas de Angra I e II. Esses documentos se encontravam no formato .doc
e .pdf. O interesse imediato de estudo dessas bases foi a anlise sintica estudo dos
relacionamentos no contexto dos documentos, com a pergunta do que poderia ser
descoberto com mltiplos cruzamentos.
Inicialmente foi realizada a etapa de pr-processamento, converso das bases
para tipos de documentos comuns, visando facilitar e permitir a atividade posterior de
minerao. Assim, todos os documentos foram convertidos ou para arquivos .pdf, .rtf ou
104

O usurio poderia escolher a base de textos que desejasse.

318

.txt formatos mais adequados atividade proposta para o software DifBrain. Figura
49

Base de
Textos Indexada

RES

ORO

RE

RDO

DifBrain

Natrium
Figura 49: Representao do Processamento Software de Minerao de Textos

Em um segundo momento, houve a etapa de indexao automtica, ou seja: o


software DifBrain criou as representaes dos documentos a serem tratados em suas
prprias bases, basicamente compostas de documentos .txt para facilitar o
processamento ulterior. A base utilizada para o processo experimental continha 2000
documentos, sendo cerca de 2/3 relacionados usina de Angra I, que mais antiga, e o
restante de Angra II.

Em seguida o software DifBrain realizou as tarefas de:

Categorizao

Agrupamento (ou Clustering)

Gerao de Resumos Automticos

Tratamento Estatstico do Documento

319

Os resultados dessas tarefas que so examinados para avaliao da capacidade


da mesma na descoberta de conhecimento em bases textuais. Aconteceram dezenas de
rodadas de processamento sobre as bases textuais da ELETRONUCLEAR cada
uma delas podendo ser considerada um experimento, at a identificao dos resultados
satisfatrios, o que fo i obtido pela adequao da ferramenta (customizao) s
necessidades e desafios da organizao pesquisada. O Grupo Focal sugeriu a mesclagem
de critrios para elaborao de clusters e categorizao de documentos. Assim, por
exemplo, poderamos ter categorizaes e agrupamentos que levassem em conta o
cruzamento de critrios, tais como: estudar eventos dos RESs e RDOs com base na
interseo das vises de potencia do reator, data e ocorrncia de eventos semelhantes.
Isso significou buscar nos documentos processados vises como: que tipos de eventos
com alguma similaridade acontecem quando o reator opera em uma determinada
potencia?

Outras perguntas sobre os resultados e a atuao do software poderiam ser:

Quais as principais falhas humanas esto acontecendo quando o gerador opera a


uma determinada capacidade?

Quais as correes de falhas foram recomendadas em 2005 e que ocorreram de


novo em 2006, quando o reator operava a uma potencia de x% ?

Qual a causa raiz latente de um evento cujo relatrio indica uma coisa em seu
cabealho e outra em seu corpo de texto?

Para todos os documentos processados, foram definidos parmetros linhas


orientadoras para o processo de descoberta nos textos, tais como: potncia do reator,
potencia do gerador, modo de operao, suspeita de falha humana, correo de falha
humana recomendada, perodo (dia, ms, ano, etc). Isso implica que o usurio pode
escolher qual desses critrios ele quer que seja levado em conta para uma anlise
sinptica do acervo de documentos que lhe interessa. Isso indicado nas Figuras 50 e
51 abaixo.

320

Escolhendo tipo
de cluster

Figura 50: Tela DifBrain Escolhendo os tipos de cluster a ser utilizado no processamento (a).

Figura 51: Tela DifBrain Escolhendo os tipos de cluster a ser utilizado no processamento (b).

Os textos so processados e h gerao do resumo automtico, feita a


clusterizao e a categorizao. A figura 52 apresenta a tela de gerao de resumo
automtico.
321

Apresenta os clusters que


so formados e que podem
ser explorados pelo usurio.

Exibe dinamicamente o
resumo automtico
do documento ao
passar com o mouse
sobre ele.

Figura 52: DifBrain gera resumo automtico de um documento.

11.4.3 Avaliao dos Experimentos

A avaliao dos experimentos levou, sobretudo em conta, as tarefas de


descoberta de conhecimento em bases de textos realizadas pelo software DifBrain. No
processo de avaliao, os primeiros aspectos considerados foram a seleo de bases de
dados considerada fcil e interativa, portanto, adequada para o usurio e a gerao do
resumo. A gerao automtica do resumo um processo sujeito a um constante
aprimoramento. Ele leva em conta aspectos semnticos (significado e relevncia de
termos e frases no documento) e estatsticos (freqncia desses elementos no
documento). Pode levar tambm em conta a estrutura do documento ou mesmo se j
existe algum resumo ou sntese preliminar. Os resumos automticos gerados foram
considerados pelos profissionais da ELETRONUCLEAR como adequados, portando
significados que expressam o real sentido do documento.

Um segundo aspecto avaliado foi a gerao de clusters dos documentos.


DifBrain mostrou-se uma ferramenta poderosa no s por clusterizar, mas por

322

agregar diferentes vises nos clusters e realizar a mesclagem (combinao) de diferentes


critrios para sua gerao. Assim possvel construir uma matriz de combinao desses
diferentes critrios, cujos resultados para o usurio foram considerados expressivos. As
vises passveis de extrao dos clusters representam conhecimento novo, antes no
percebido numa determinada perspectiva. Por exemplo, como comprovar que a
incidncia de certos eventos aumenta ou diminui com as variaes de potncia do
gerador ou do reator? A partir dessa descoberta, que aes corretivas podem ser
propostas? E a partir dessa constatao, ficou comprovado que possvel fazer outras e
sucessivas combinaes, como por exemplo, com suspeita de falha humana. A
ferramenta cumpriu o papel de realizar tambm pesquisas sucessivas dentro dos clusters
gerados, seja por tipo de evento ou por palavra.

No que tange categorizao, foi tambm constatada sua adequao,


demandando

apenas alguma melhora na visualizao, uma vez que as categorias

aparecem na mesma estrutura do cluster, o que pode confundir um pouco o usurio.


Entretanto, seus resultados so bons, como demonstra o breve caso narrado a seguir.

11.4.4 Minerao de Textos Aplicada ao Problema da Analise de Falhas Humanas.

De acordo com estimativa dos profissionais da ELETRONUCLEAR envolvidos


no presente trabalho, cerca de 60% das falhas relatadas nos relatrios de desvio
operacional e nos relatrios de evento significante so causados por falha humana.
Dentro da idia de monitoramento e de uma ao gerencial que visa conciliar
desempenho e segurana, tal fato precisa ser minimizado. E somente o ser se suas
causas forem devidamente exploradas. necessrio sempre estudar os eventos de modo
a se chegar a uma compreenso efetiva de sua causa-raiz. 105 Isso vale para todos os
eventos, mas tem ainda maior relevncia na anlise de falhas humanas.
Em muitos relatrios internos RES, RDO e ORO, no so explicitadas como
causa de falha as falhas humanas. Os motivos so, sobretudo, tcnicos ou de outra
ordem. Oculta sobre um motivo tcnico, entretanto, encontra-se uma falha humana.
Muitas vezes, portanto, para evitar uma explicitao forte, a causa tcnica exp licita,
105

Causa-raiz - a causa fundamental de um determinado evento que, se eliminada, evitar a sua


ocorrncia ou repetio, ou seja: se no tivesse acontecido isso, no teria acontecido aquilo.

323

mas a humana no aparece objetivamente. Entretanto, analisando os textos dos


documentos, percebe-se que h uma falha humana subjacente. A deteco desse
fenmeno complexa e pressupe, do ponto de vista humano, a leitura minuciosa e
individual de cada documento. Para tratar essa questo, a ferramenta DifBrain
mostrou-se adequada, por elucidar aspectos ocultos desses relatrios. Isso foi
conseguido com o uso da Indexao Semntica Latente (descrita no capitulo 5). Na ISL
temos um espao conceitual foco de ateno e anlise. Temos tambm os termos que
representam esse conceito ou evento de interesse a ser buscado, mas muitas vezes ele
no aparece nas consultas, pois os usurios usam termos diferentes para falar a mesma
coisa. Palavras e frases podem estar nos documentos de modo muito diferente dos
termos representativos, embora estejam dentro do mesmo espao conceitual Figura 21
abaixo, j apresentada no capitulo 5.

D1
D2
T1

Espao
Espao
Conceitual
Conceitual

D3
D4
D5

T2

T3
Termos que representam
um conceito ou evento de
interesse a ser buscado

Espao
Conceitual
Documentos

Figura 21: Uma representao da Indexao Semntica Latente

No caso da anlise de falhas humanas, esse processo foi aplicado sobre os


relatrios da ELETRONUCLEAR. Eles foram tratados pela ferramenta de minerao de
textos e categorizados sob trs grupos:

324

Documentos que diziam no ter ocorrido falha humana, mas que possuam
realmente falha humana embutida;

Documentos que diziam ter falha humana;

Documentos de diziam no ter ocorrido falha humana e realmente no ocorreu.

Atravs do uso da ISL, foi possvel rastrear e analisar frases e expresses


indicativas da presena de tais falhas para o primeiro grupo de documentos. A figura 53
abaixo mostra o processo, indicando possveis frases nos documentos ( direita) que
indicaram essa presena no processamento dos textos. Concluindo: independentemente
de haver ou no a indicao formal de falha humana, a indexao semntica latente
detectou a presena da mesma atravs das frases presentes nos documentos D1, D2, D3,
D4, D5 e D6, dentre outras.

Comunicar falha a
equipe

D1

D2
Falha

Falha
Falha
Humana
Humana

No aderncia
a
procedimentos

D3
D4
D5

Erro

D6
Impercia

Termos que representam


um conceito ou evento de
interesse a ser buscado

Espao
Conceitual

Feriu

Esqueceu

Retreinamento

Erro do operador

Documentos

Figura 53: Aplicao de Indexao Semntica Latente em Minerao


de Textos na Anlise de Falha Humana na ELETRONUCLEAR

325

12 CONSIDERAES FINAIS

12.1 Avaliao da Trajetria da Pesquisa

Os documentos textuais so objetos portadores de informao e conhecimento


facilmente elaborados por diferentes pessoas. A escrita uma construo humana
importante e hoje de acesso fcil maioria das organizaes em formato digital.
Documentos digitais de texto so criados com facilidade atualmente, seja em editores de
textos seja no ambiente Web. um modo relativamente fcil e pouco formal para se
converter parcelas de conhecimento tcito em conhecimento explicito. Obviamente a
capacidade de expresso escrita possui suas limitaes, como a da educao formal
recebida por uma pessoa que lhe confere uma habilidade maior ou menor de escrever.
Alm disso, os pensamentos e reflexes do indivduo circulam em sua mente a uma
velocidade e intensidade bem maior do que a velocidade com que suas mos digitam
um texto em computador ou transcrevem palavras em um papel. Ainda assim, no
difcil para parcelas significativas das reflexes, insights, pensamentos e vises de uma
pessoa saltem de sua mente para um texto, seja ele bem ou mal elaborado, grande ou
pequeno, de carter cientifico ou informal, estruturado ou em pequenos trechos de
registro em formulrios.

Por sua vez, conhecimento tcito de uma organizao se constitui, por um lado,
desafio gerencial e, por outro, em diferencial estratgico. No se questiona m o valor e a
importncia crescente desse conhecimento, especialmente nos ambientes que lidam com
produtos e servios de alto valor agregado ou dependentes do uso de tecnologia
intensiva que demanda aplicao de avanos da cincia. Entretanto, sua captura e
tratamento so complexos e onerosos para a organizao, nunca ocorrendo em sua
totalidade, uma vez que o conhecimento passvel de ser expresso por um indivduo
sempre inferior ao que ele efetivamente detm. Por outro lado, algumas aes so
passveis de implantao.

Em ambientes complexos, como os estudados na ELETRONUCLEAR, lidar


com o conhecimento tcito no caso em questo, a Experincia Operacional se
constitui em um desafio que pode ser respondido com a conciliao de estratgias
relacionadas s pessoas, conforme descrito por RINTALA & KURONEN (2006) em
326

seus 23 mtodos de compartilhamento de conhecimento tcito, bem como com a


tecnologia de minerao de textos discutida nessa Tese. O resultado do emprego
simultneo dessas abordagens um ao organizacional eficaz, sob o ponto de vista do
emprego do conhecimento na ao empreendedora da organizao, para que cumpra
suas atividades- fim.

No obstante o presente trabalho tenha sido realizado em uma organizao


especfica, os aspectos estudados so comuns a muitas outras organizaes com
caractersticas semelhantes, ou seja: complexidade operacional, dependncia de
conhecimento e presena de muitas bases documentais digitais. A maior parte do aporte
conceitual e tecnolgico com recursos de inteligncia artificial e mtodos da rea de
recuperao da informao que esto embutidos no processo de descoberta de
conhecimento em bases de textos so aplicveis a colees digitais de outras
organizaes. A variedade de mtodos e tcnicas disponveis para serem embutidas em
um software que realizar a minerao de depender tambm do domnio da aplicao e
da populao de usurios a ser atingida.

A descoberta de conhecimento em bases de textos, embora relevante enquanto


estratgia e recurso tecnolgico para a gesto do conhecimento, conforme cons tatado
nessa tese, possui ainda muitas limitaes. Em primeiro lugar, preciso salientar que
no se trata de tecnologia para venda em escala, ou seja: no permite gerar a oferta
comercial de softwares de prateleira, facilmente disponibilizados e consumveis por
usurios. Ao contrrio: seu emprego depende fortemente do domnio da aplicao, que
merece ser estudado para que recursos metodolgicos e computacionais possam ser
alinhados visando o alcance da tarefa maior de descoberta de conhecimento.

Por outro lado, so realmente poderosos os recursos de certas tarefas de


minerao de textos, especialmente a sumarizao, categorizao e clusterizao, e
atividades de refinamento das bases textuais, so potencialmente significativos para um
grande nmero de organizaes, desde que sintonizadas adequadamente com o domnio
da aplicao, considerando as especificidades do conhecimento envolvido.

A ELETRONUCLEAR uma organizao que j avanou de modo


significativo no processo de Gesto do Conhecimento, com aes concretas j tendo
327

sido implantadas, tais como a Gesto Eletrnica de Documentos e o Portal Corporativo


de Experincia Operacional. So conquistas importantes no campo do uso de recursos
para apoiar a Gesto do Conhecimento. A introduo da tecnologia de minerao de
textos promover um salto qualitativo ainda maior para a organizao. Seus
profissionais, especialmente os detentores de experincia acumulada e alto nvel de
formao, com experincia operacional na conduo de usinas nucleares podero se
beneficiar em larga escala dessa tecnologia, economizando parcelas de tempo em
pesquisas e estudos sobre conhecimento nuclear conforme suas necessidades e
realizando novas anlises a partir de inferncias permitidas pela anlise sinptica dos
conjuntos de textos tratados pelo software DifBrain.

A abordagem de minerao de textos uma estratgia de tecnologia da


informao, articulada com a recuperao da informao e uso de sistemas inteligentes
que tem por objetivo ajudar e no substituir as pessoas na relao com o conhecimento.
A prpria expresso descoberta de conhecimento em textos poderia ser questionada,
sob o ponto de vista de que se realmente possvel a uma ferramenta de software
descobrir conhecimento seja em textos seja em dados. No entanto, a expresso uma
abstrao, uma figura de linguagem para expressar a idia de que um conjunto de
recursos tecnolgicos pode atuar de forma to competente e precisa, articulando
mltiplas tarefas de forma a simular uma habilidade que exclusivamente humana que
lidar com o conhecimento, empregando-o conforme seus objetivos e seus valores.
Uma ferramenta faz emergir certas percepes que seriam muito difceis para um ser
humano construir (como o faz a minerao de textos na categorizao clusterizao),
mas conhecimento e sabedoria so caractersticas e virtudes eminentemente humanas.

Os pressupostos adotados no contexto dessa tese podem ser considerados


confirmados, uma vez que:

Os textos podem ser confirmados como reais expresses do pensamento


humano, com grande flexibilidade e grau de liberdade para elaborao por parte
das pessoas, tornando-se assim um modo acessvel de converso de
conhecimento tcito para conhecimento explcito em muitos contextos
organizacionais. Isso foi indicado na grande base de documentos possuda pela

328

ELETRONUCLEAR, em que h grande variao de estilos, formas, estruturas e


grau de liberdade conferido ao usurio externo para elaborao dos textos. Por
outro lado, a minerao de textos realmente confere s colees textuais digitais
armazenadas nas organizaes um novo e significativo potencial de gerao da
informao e conhecimento, como foi demonstrado pelos experimentos
realizados dos quais se constatou eclodir vises, percepes e conscincia de
novos conhecimentos no to facilmente percebidos.

Utilizou-se abordagens semnticas e estatsticas para responder de forma


inovadora e eficaz as necessidades de gerao de informao til para o usurio.
Nas colees de textos digitais da ELETRONUCLEAR, as informaes geradas
pela ferramenta de minerao de textos, por sua capacidade de anlise semntica
e possibilidade de construo de vises sinpticas de grupos de documentos
(derivadas especialmente dos processos de sumarizao, categorizao e
clustering) se mostraram relevantes para a gerao de conhecimento novo para o
usurio, satisfazendo-o em suas necessidades. Por fim, o uso de recursos de
inteligncia artificial, revelou sua potencialidade e seus ganhos visveis em
ambientes complexos que incluam a necessidade de manipular grandes volumes
de informao textual, uma vez que a ferramenta utilizada incorporou tais
recursos.

Em sntese podemos afirmar que a presente Tese procurou entender, subsidiar e


aprimorar o processo de gesto do conhecimento em organizaes com o aporte da
tecnologia de minerao de textos, e props a implantao de um

modelo de

recuperao automtica da informao textual digital , ou descoberta de conhecimento


em bases textuais digitais para a Experincia Operacional da ELETRONUCLEAR.
Foram estudadas, refletidas/aperfeioadas e incorporadas, ao longo do tempo, as
diversas contribuies tericas e proposies de modelos e arquiteturas para sistemas
informatizados de minerao de textos, com destaque para as de FELDMAN &
SANGER (2006), KONCHADY (2006), ZANASI (2005), SULLIVAN (2001),
REZENDE (2003) e WIVES (2002) que permitiram a definio de modelos conceituais,
identificao e estudo de recursos de minerao de textos a serem implementados em
uma ferramenta computacional e que foi construda e aprimorada ao longo de dois anos
e meio de trabalho de desenvolvimento. Estudando as caractersticas das necessidades
329

de informao e gerao e uso de conhecimento relativo operao de usinas


nucleoeltricas, concluiu-se pela pertinncia e adequao da tecnologia de minerao de
textos e do software desenvolvido que a embute: o DifBrain .

12.2 Perspectivas Futuras

A presente Tese abre algumas perspectivas que podemos relacionar.


Inicialmente, a indicao do valor e potencialidade da tecnologia de minerao de textos
como suporte gesto do conhecimento indica sua ampliao de aplicao. No campo
da Experincia Operacional Interna, foi j identificado um outro foco de estudo que
sua utilizao sobre a base de documentos concernente aos procedimentos operacionais
e normas tcnicas da ELETRONUCLEAR, que extensa e demanda um trabalho
constante de atualizao, anlise e disponibilizao, exigindo avaliaes de
relacionamentos entre muitos documentos em geral articulados entre si, ou seja: a
alterao em um documento implica em modificaes em vrios outros, por exemplo.

Um outro aspecto importante a ser considerado ampliao de uso de modelos


de Recuperao da Informao e dos Sistemas Inteligentes no processamento de textos
(descritos nos captulos 5 e 6 e que podem ampliar ainda mais a potencialidade da
ferramenta de minerao de textos. A incorporao de um tesauro j foi considerada
(existe um tesauro de termos para a rea nuclear ) para aprimorar o tratamento dos
documentos.

Migrando da Experincia Operacional Interna para a Experincia Operacional


Externa da ELETRONUCLEAR, cujas bases textuais tendem a crescer a taxas ainda
maiores do que as bases internas de documentos, novos focos de anlise inteligente
podem ser desenvolvidos, englobando inteligncia organizacional, monitoramento de
tendncias relativas a desempenho e segurana das usinas, acompanhamento de
tendncias internacionais, dentre outros aspectos. O uso de minerao de textos na
Experincia Operacional Externa (que possui uma base de cerca de 20 mil documentos)
pode contribuir para a anlise de melhores prticas da organizao. A tecnologia
tambm pode ser estendida para s reas administrativas da Empresa, tais como,
marketing, recursos humanos, planejamento estratgico, dentre outras. Outras

330

organizaes tambm podem se beneficiar profundamente da tecnologia de minerao


de textos, conforme discutido por ZANASI (2005) e apresentado no captulo 8 da
presente Tese.
Outro campo potencial de crescimento da tecnologia estudada, o que
normalmente vem sendo denominado de web mining, ou seja: aplicao do processo de
descoberta de conhecimento em bases de documentos digitais presentes na Web,
envolvendo a anlise de contedo, da estrutura e do uso da Web (REZENDE, 2003).
Web mining de contedo o processo de descoberta de conhecimento relativo ao
contedo das pginas e de suas descries. Web mining de estrutura o esforo por
descobrir conhecimento a partir da organizao da Web e da referncia cruzada de
ligaes. Por fim, Web mining de uso o processo de gerao de padres interessantes
com o uso dos registros de acesso da Web.
Nos prximos anos, devem se intensificar os esforos pelo uso dessa tecnologia,
que dever ser alavancada ainda mais pelas contribuies do desenvolvimento e
pesquisa na rea de processamento da linguagem natural PLN. Partindo da idia de
que o conhecimento a ser utilizado em um sistema inteligente, (como o caso da
minerao de textos), se encontra disponvel em modo texto, a questo est em capturar
e mapear tal conhecimento sob algum tipo de formalismo para representao neste
sistema. A extrao de informao de textos uma questo abordada em grande parte
na rea de PLN. Extrao de taxonomias semnticas, estudos sobre relaes lxicas para
representaes de texto, categorizao de mensagens de correio eletrnico, tratamento
de ambigidade lxico- morfolgica, interpretao de estruturas implcitas no texto esto
entre as contribuies dessa rea para a tecnologia de minerao de textos
(MONTOYO, MUOZ & MTAIS, 2005). O esforo para um tratamento semntico de
bases textuais hoje tnica de muitas pesquisas e ir contribuir muito para novos
aperfeioamentos e uma nova gerao de ferramentas para minerao de textos.
Portanto, as pesquisas relacionando text mining com processamento de linguagem
natural esto na essncia de um processo de recuperao inteligente de informaes e
descoberta de conhecimento em textos, devendo crescer em relevncia nos prximos
anos.

331

REFERNCIAS
AAKER, D. Marketing research. New York: Wiley, 1990.
ALLEN, J. Natural Language Understanding. The Benjamin/Cummings Publishing
Company, Inc., 1994.
ABITEBOUL, S., P. BUNEMAN, et alli. Data on the Web: from relations to
Semistructured Data and XML. Delphi. San Francisco, 2000
ANDERSON, J. D., PREZ-CARBALLO, J. The nature of indexing: how humans and
machines anayze messages and texts for retrieval. Information Processing &
Management, 37, 2001, 231-237
ARAJO, V.M.R.H. Sistemas de Recuperao da Informao: nova abordagem terico
conceitual. Tese de Doutorado. CFCH. Universidade Federal do Rio de Janeiro. Rio de
Janeiro, 1994
BAEZA-YATES, R.; RIBEIRO-NETO, B. Modern Information Retrieval. New York:
ACM Press, 1999.
BARBIERI, Carlos Business Intelligence: modelagem e tecnologia. Rio de Janeiro.
Axcel Books, 2001
BELKIN E ROBERTSON Information science and the phenomenon of information.
JASIS, v. 27, p.197-204, 1976
BERTALANFFY, Ludvig von. General Systems Theory. Nova York, George Brasilier,
1968
BRIET, Suzanne. Qu`est-ce que la documentation. Paris [s.n.] 1951
BRAGA, G. M. & CHRISTOVO, H. T. Cincia da Informao e Sociologia do
Conhecimento Cientfico: a intertematicidade plural (sobre A cincia e seu pblico,
de Lea Velho: um ponto de vista da Cincia da Informao). Transinformao,
Campinas, v. 9, n. 3, p. 33-45, set./dez. 1997.
BOOCH, G., RUMBAUGH, J & JACOBSON, I. UML: Guia do Usurio. Rio de
Janeiro. Campus, 2000
BORKO,H. Information science: what is it? American Documentation v.19,n.1,p.35,1968.
BROOKSHEAR, J.G. Cincia da Computao: uma viso abrangente. Porto Alegre,
Bookman, 2000
BRYMAN, A. Research methods and organization studies. Unwin Hyman. London,
1989
BUCKLAND, Michael Information as a thing. Journal of the American Society for
Information Science, v. 42, n.5, p. 351-360, 1991

332

BUCKLAND, Michael What is this a document? Journal of the American Society for
Information Science, New York: John Wiley & Sons. v.48, n.9, p.804-809, 1997
BURKE, P. Uma histria social do conhecimento: de Gutemberg a Diderot. Rio de
Janeiro, Jorge Zahar Editor, 2003
BURNETT, Kathleen; McKINLEY, E. Graham. Modelling information seeking.
Interacting with computers, London, n. 10, p. 285-302, 1998.
BURKOWSKI, F. Retrieval activities in a database consisting of heterogeneous
collections of structured text. In: Proc of the 15th Annual International ACM/SIGIR
Conference on Research and Development in Information Retrieval, p 112-125.
Copenhagen, Denmark, 1992.
BUSH, Vannevar As We May Think Atlantic Monthly, 1945
CALDER, B. Focus group and the nature of qualitative marketing research. Journal of
Marketing Research, n. 14, p. 353-64, Aug. 1977.
CALLAN, James P. Passage-level evidence in document retrieval. In: CROFT, W.
Bruce; RIJSBERGEN, C. J. van (eds). VII International ACM-SIGIR Conference on
Research and Development in Information Retrieval. London: Springer-Verlag. 1994.
CANADO, Mrcia. Manual de Semntica: noes bsicas e exerccios. Belo
Horizonte. Editora da UFMG, 2005.
CAPLAN, S. Using focus group methodology for ergonomic design. Ergonomics, v. 33,
n. 5, p. 527-533, 1990.
CAVALCANTE, M., GOMES, E. Caderno de Projeto do curso de ps-graduao.latu
senso em Gesto do Conhecimento e Inteligncia Empresarial(MBKM). Rio de Janeiro.
Centro de Referncia em Inteligncia Empresarial da COPPE/UFRJ, 2002.
CELLRIER, G. El pensamiento de Piaget Barcelona, Pennsula, 1976
CENDON, Beatriz V. Sistemas e Redes de Informao in OLIVEIRA, Marlene, et alli.
Cincia da Informao e Biblioteconomia : novos contedos e espaos de atuao. Belo
Horizonte. Editora UFMG, 2005
CHIAVENATO Idalberto. Introduo Teoria Geral da Administrao. 5a. ed. So
Paulo, Makron Books, 1976
CHOO, Chun W. A Organizao do Conhecimento: como as organizaes usam a
informao para criar significado, construir conhecimento e tomar decises. So Paulo:
SENAC Editora, 2003
CHOUDHURY, V. e SAMPLER, J. L. Information specificity and enviromental
scanning: an economic perspective. MIS Quartely. Maro de 1997

333

CLAYBROOK, Billy G. Tcnicas de gerenciamento de arquivos. 2a ed. Rio de Janeiro.


Campus, 1987
CNEN (2001) - Comisso Nacional de Energia Nuclear. Relatrios de Operao e
Usinas Nucleoeltricas. CNEN-NN-1.14. Resoluo N016 de 29/11/2001. Disponvel
em http://www.cnen.gov.br/seguranca/normas/nn_114.doc. Acesso em 02 fe v. 2007.
Publicado no D.OU. em 10/01/2002.
CODD, Edgar F. A Relational Model of Data for Large Shared Data Banks.
Communications of the ACM Association for Computing Machinery, New York, v.13,
n.6, p.377-387, jun. 1970.
COLANGELO FILHO, Lucio. Implantao de Sistemas ERP: um enfoque de longo
prazo. So Paulo. Atlas, 2001
COVE, J.F., WALSH, B.C. On line text retrieval via browsing. Information Processing
& Management, v.24, n. 1, p 31-37, 1988
DAVENPORT, T, Knowledge Management Case Study Knowledge Management at
Microsoft, Boston. Mc Combs School of Business, 1997
DAVENPORT, T. & PRUSAK, L Conhecimento empresarial: como as organizaes
gerenciam o seu capital intelectual. Traduo de Lenke Peres. Rio de Janeiro: Campus,
1998
DIAS, Cludia A. Portal corporativo: conceitos e caractersticas. Ci. Inf., Braslia, v.
30, n. 1, 2001. Disponvel em:
<http://www.scielo.br/scielo.php?script=sci_arttext&pid=S010019652001000100007&lng=pt&nrm=iso>. Acesso em: 20 Dez 2006.
DILTHEY, W. Das Wesen der Philosophie, in: Kultur der Gerenwart I, VI: 3a. ed. 1921
DORIGO M. & GAMBARDELLA, L. M. Ant Colonies for the Traveling Salesman
Problem. BioSystems, 43:73-81. Also Tecnical Report TR/IRIDIA/1996-3, IRIDIA,
Universit Libre de Bruxelles, 1997
DORIGO, M.; STTZLE, T. Ant Colony Optimization The MIT Press, 2006
DRUCKER, Peter F. The coming of the new organization. Boston, Harvard Business
Review. V.28, n.1, p.45-53, 1988
ELETRONUCLEAR. Informaes gerais sobre a empresa e a energia nuclear no
endereo eletrnico: www.eletronuclear.gov.br. Acessos diversos entre fevereiro de
2004 e fevereiro de 2007.
FELDMAN, R.; DAGAN, I. Knowledge Discovery in Textual Databases (KDT). In
First International Conference on KnowledgeDiscovery (KDD95). Montreal, l995.
FELDMAN, R., SANGER, J. The Text Mining Handbook: Advanced Approachs in
Analyzing Unstructured Data. New York. Cambridge University Press, 2006
334

FLEURY, A . & FLEURY, M. Aprendizagem e Inovao Organizacional: as


experincias de Japo, Coria e Brasil So Paulo: Atlas, 1997
FORONDA, Diego A. H. Estudo exploratrio da indexao semntica latente e das
funes peso. Dissertao de Mestrado. Porto Alegre. Faculdade de Informtica.
PUC-RS, 2005.
FOSKETT, A. C. The Subject Approach to Information. 5. ed. Londres: Library
Association Publishing, 1997.
FRAKES, William B. Introduction to information storage and retrieval systems. In
FRAKES, William B.; BAEZA-Yates, Ricardo A. Information Retrieval: Data
Structures & Algorithms. Upper Saddle River, New Jersey: Prentice Hall PTR, 1992. p
1-12.
FRANA, Fabrcio Ant Colony Optmization e Swarm Intelligence. Apresentao.
Faculdade de Engenharia Eltrica e Computao. UNICAMP. 2006. Disponvel em:
www.dca.fee.unicamp.br/~olivetti. Acessado em: 20 jan. 2007
GARCIA MARCO, F.J.. On some contributions of the cognitive sciences and
epistemology to a theory of classification. Knowledge Organizatio n, v.20, n.3, 1993.
GIUSTA, Agnela. Concepes de Aprendizagem e Prticas Pedaggicas Revista de
Educao, Belo Horizonte (1985: 24-31)
GOEBEL, Michael e GRUENWALD, Le. A survey of data mining and knowledge
discovery software tools. ACM SIGKDD Explorations, v.1, n. 1, 1999. Disponvel em:
http://www.acm.org/sigs/sigkdd/exp lorations/issues/1-1-1999-06/survey.pdf. Acessado
em 12/09/2006.
GORDON, M.D., DUMAIS, S. Using latent semantic indexing for literature based
discovery. Journal of the American Society for Information Science, 49, 1998, 674-685.
HABERMAS, G. Conhecimento e interesse. Rio de Janeiro: Zahar, 1982.
HESSEN, J. Teoria do Conhecimento . Trad. Joo Virglio Cuter. So Paulo. Martins
Fontes 1999
HUSSERL, E. Logische Untersuchungen. Halle. Niemeyer, 1913
IAEA International Atomic Energy Agency. Senior Level Meeting on Managing
Nuclear Knowledge Introductory Discussion. Paper, 2002
IANNI, O. A sociedade global. Rio de Janeiro: Civilizao Brasileira, 1992.
INMON, William H. Buiding the data warehouse. John Wiley & Sons, Inc. USA, 1996
JARVENPAA, Sirkka L. TANRIVERDI, Huseyin. Leadin virtual konwledge networks.
Creativity and Innovation Management, v.8, n.2 p. 70-76, Jun. 1999

335

JOHANNESSEN, J.A., OLAISSEN, J., & OLSEN, B. Mismanagement of tacit


knowledge: the importance of tacit knowledge, the danger of information technology an
what to do about it. International Journal of Information Management. Vol 28. p. 3-20.
KIMBALL, Ralph. The Data Warehouse Toolkit. John Wiley & Sons, Inc. USA, 1996
KIMBALL, Ralph. The Data Warehouse Lifecycle Toolkit. New York J. Wiley & Sons,
1998
KONCHADY, M. Text Mining application programming Boston, MA, USA. Thomson
Learning Inc., 2006
KORTH, H. SILBERSCHATZ, A. & SUDARSHAN, S. Sistema de Banco de Dados.
3. Edio Brasileira. So Paulo. Makron Books, 1999.
KUHLTHAU, Carol Inside the search process: information seeking from the users
perspective. Journal of the American Society for Information Science, v. 42, n. 5, junho
de 1991.
KURAMOTO, Hlio. Sintagmas Nominais: uma Nova Proposta para a Recuperao de
Informao. em DataGramaZero - Revista de Cincia da Informao - v.3 n.1
fevereiro 2002
KURZ, R. O colapso da modernizao: da derrocada do socialismo de caserna crise da
economia mundial. Rio de Janeiro. Paz e Terra, 1993.
KURZ, R. A ignorncia na sociedade do conhecimento. Folha de So Paulo. Caderno
Mais. 20 de maio de 2002.
LANCASTER, F. Wilfrid. Information Retrieval Systems: Characteristics, Testing and
Evaluation. New York: John Wiley & Sons, 1968.
LANCASTER, F. W. O currculo da Cincia da Informao. Revista de iblioteconomia
de Braslia, Braslia, v. 17, n.1, p. 01-05, jan./jun. 1989.
LANCASTER, F. Wilfrid Indexao e Resumo: teoria e prtica. 2. Edio Brasileira.
Briquet de Lemos, Braslia, 2004.
LANCASTER, F. W. e WARNER, A. J. Information Retrieval Today. Information
Resources Press, 1993.
LARMAN, Craig. Utilizando UML e Padres: uma introduo anlise e ao projeto
orientados a objetos. Porto Alegre. Bookman, 2000.
LE COADIC, Yves-Franois A Cincia da Informao. Braslia. Briquet de Lemos,
2004.

336

LE GUERN, Michel. Traitement automatique et variation linguistique : la syntaxe des


titres. In: OPRATEURS et Constructions Syntaxiques : volutions des marques et des
distributions du Xvme sicle. Paris : Presses de l'Ecole Normale Suprieure, 1994. p.
75-81.
LEPECKI, W. P. Determinao do Know-How Tecnolgico da Eletronuclear.. Angra
dos Reis RJ. ELETRONUCLEAR, 2002.
LIEBSCHER, P. Quantity with quality ? Teaching quantitative and qualitative methods
in a LIS Masters program. Library Trends, v. 46, n. 4, p. 668-680, Spring, 1998.
LINTHICUM, David S. Enterprise Application Integration. Information technology
series. Addison Wesley, 2000.
LOH, Stanley. Uma abordagem para busca contextual de documentos na Internet. Porto
Alegre. Revista de Informtica Terica e Aplicada (RITA), v.4, n.2, p. 79-92, 1997
MACHADO, A. M. N. Informao e controle bibliogrfico: um olhar sobre a
ciberntica. Tese (Doutorado em Educao) Faculdade de Filosofia e Cincias,
Universidade Estadual Paulista, Marlia. 2001
MARTINS, J.C. Gerenciando projetos de desenvolvimento de software com PMI, RUP
e UML. Rio de Janeiro: Brasport, 2004
MARX, K. O capital, Livro I. Trad. port., Rio de Janeiro: Civilizao Brasileira, 1968.
MCDANIEL, Carl & GATES, Roger. Pesquisa de Marketing. So Paulo. PioneiraThomson, 2003.
MEADOWS, Charles Text Information retrieval systems. San Diego. Academic Press,
1992
MERLEAU-PONTY, M. Phnomnologie de la perception. Gallimar. Paris, 1945.
MESSIAS, L.C.S. & MORAES, J.B.M. Informao: conceitos e terminologias na rea
de Cincia da Informao. ENANCIB, Anais. Belo Horizonte, 2003
MEYER, M., BABER, R. e PFAFFENBERGER, B. Nosso Futuro e o Computador
Porto Alegre, Bookman: 2000
MIZZARO, Stefano. A Cognitive Analysis of Information Retrieval. In: Information
Science: integration in perspective - CoLIS2, 1996, Copenhagem, Denmark.
Proceedings... The Royal School of Librarianship, 1996. p.233-250. Disponvel em:
http://ten.dimi.uniud.it/~mizzaro/papers/colis.pdf. Acesso em: 01.set.2006
MIZZARO, Stefano. Relevance: The Whole History. Journal of the American Society
for Information Science, New York, v.48, n.9, p. 810-832, 1997.
MIZZARO, Stefano. How many relevances in information retrieval? Interacting with
Computers, London, n. 10, p. 303-320, 1998.

337

MONTGOMERY, Douglas C. Design and Analysis of Experiments. 5 th Ed.: New


York. John Wiley, 1997.
MONEY, Raymond J. Course CS 371R: Information Retrieval and Web Search - Slides.
Austin, TX, USA. University of Texas at Austin. 2006. Disponvel em
http://www.cs.utexas.edu/~ mooney. Acesso em 01. fev. 2007
MONTOYO, A. , MUOZ, R. & MTAIS, E. et alli. Natural Language Processing
and Information Systems. 10th International Conference on Applications of Natural
Language to Information Systems, NLDB. Alicante, Spain, June 2005, Proceedings.
Berlin, Germany. Springer-Verlag, 2005.
MOORES, Calvin N. Datacoding applied to Mechanical Organization of Knowledge.
American Documentation, USA . v.2, p.20-32. 1951.
MORAES NETO, B.R. A organizao do trabalho sob o capitalismo e a redoma de
vidro. Revista de Administrao de Empresas da FGV. 27 (4) 19-30 Rio de Janeiro,
FGV, 1987.
MORRIS, J; Hirst, Graeme. Lexical Cohesion Computed By Thesaural Relations As An
Indicator Of Th Structure Of Text. Computationallinguistics, V.17, N.1, Maro de 1991.
MORSE, P.M. Browsing and search theory. In: RAWSKI, C.H. Toward a theory of
librarianship; paper in honor of Jesse Hank Shera. Melachen, N.J.: The Scarecrow
Press, 1973. 564 p., p.246-261.
NADLER, David et alli. Arquitetura Organizacional: a chave para a mudana
empresarial. Rio de Janeiro. Editora Campus, 1994
NEHMY, R.Q. O ideal do conhecimento codificado na era da informao: o programa
de gesto do conhecimento. Tese de Doutorado. Belo Horizonte. Escola de Cincia da
Informao da Universidade Federal de Minas Gerais, 2001.
NETO, Roberto. Mapeamento entre os modelos E/R e Star Paper. Rio de Janeiro,
DCC/NCE/UFRJ 1998.
NEVES, Jorge T.R e NASCIMENTO, Niraldo J.N. A Gesto do Conhecimento na
Word Wide Web: reflexes sobre a pesquisa de informaes na rede. In. Perspectivas
em Cincia da Informao, v.4, n. 1, p. 29-48, jan./jun.1999.
NONAKA, I. e TAKEUCHI, H. Criao do Conhecimento na Empresa: como as
empresas japonesas geram a dinmica da inovao. Traduo de Ana Beatriz Rodrigues
e Priscilla Martins Celeste. Rio de Janeiro. Editora Campus, 1997.
NOVINS, P., ARMSTRONG, R., Choosing Your Spots for Knowledge Management.
New York. Ernst & Young Center of Business Innovation, Innovation Journal, Issue 1,
v. 8, pp 45-52, 2002. Disponvel em:
http://www.providersedge.com/docs/km_articles/Choosing_Your_Spots_for_KM.pdf.
Acessado em 31.10.2006

338

O'BRIEN, A. J. Sistemas de Informao e as Decises Gerenciais na Era da Internet.


So Paulo, Saraiva, 2001
OLIVEIRA (1), Marlene, Origens e Evoluo da Cincia da Informao. in OLIVEIRA,
Marlene et alli. Cincia da Informao e Biblioteconomia : novos contedos e espaos
de atuao. Belo Horizonte. Editora UFMG, 2005
OLIVEIRA (2), Luiz C. Gesto do Conhecimento na Eletronuclear. Projeto Final.
Especializao. Rio de Janeiro. COPPE-Universidade Federal do Rio de Janeiro, 2002
OLIVEIRA (2), Luiz C. Portal de Experiencia Operacional e Informao Tecnolgica
da Eletronuclear. Slides. Angra dos Reis. Eletronuclear, 2006
OLIVEIRA, L, FILHO, D e SOUZA, M. Gerenciamento Eletrnico de Documentos:
Caso prtico da Eletronuclear. Belo Horizonte. V SINCONEE Simpsio de Gesto do
Conhecimento do Setor de Energia Eltrica. Apresentao. 2004
PAO, M.L. Concepts of information retrieval. Englewood, Cols.: Libraries Unlimited.
1985, p. 65
PIAGET, Jean. Le structuralism. Paris. Presses Universitaires de France, 1968
PIAGET, Jean. A equilibrao das estruturas cognitivas. So Paulo. Zahar, 1976
PIRES DE OLIVEIRA, R. Semntica Formal: uma breve introduo. Campinas.
Mercado de Letras, 2001
POLANYI, M Knowing and Being. Chicago University Press, 1969
POLANYI, M. Personal Knowledge: towards a post-critical philosophy. Chicago, The
University of Chicago Press, 1962.
POLANYI, M. The tacit dimension. London: Routledge & Kegan Paul, 1966.
PORTER, Michael. Vantagem Competitiva: criando e sustentando um desempenho
superior. Rio de Janeiro: Campus, 2000
PRADO, H. A. Conceitos de Descoberta de Conhecimento em Banco de Dados.
Trabalho Individual. Porto Alegre. CPGCC UFRGS, 1997
REES, A. & SARACEVIC, T. Conceptual analysis of questions in information retrieval
systems. Procedings of the Annual meeting of the American Documentation Institute,
1963, p. 175-177
REZENDE, S. et alli. Sistema