Escolar Documentos
Profissional Documentos
Cultura Documentos
arquitetura da informação
Cláudio Gnoli, Vittorio Marino, Luca Rosati
INTRODUÇÃO
1
A QUEM SE DESTINA
Este livro se destina a todos aqueles que, não só no âmbito da Web, lidam com a
organização da informação: dirigentes de empresas, da administração pública, de
instituições, operadores nos setores da documentação, das bibliotecas, dos
arquivos, responsáveis por projetos Internet e intranet, projetistas de aplicações e
interface, webmasters; mas também estudantes, pesquisadores, docentes que por
vários motivos se veem envolvidos com as temáticas da classificação e da
arquitetura da informação.
OS AUTORES
O livro é fruto do trabalho integrado de seus três autores. Mas Cláudio Gnoli redigiu
os capítulos 1-4 e o Glossário, Vittorio Marino os capítulos 5 e 7; Luca Rosati a
Seção “Em síntese: Algumas regras práticas” do capítulo 5, e os capítulos 6, 8 e 9. A
primeira parte do capítulo 9 (o modelo monodimensional italiano e o modelo
multidimensional anglo saxônico em paralelo) é de Simone Fuchs. As seções sobre
tesauros e cabeçalhos de assunto nos capítulos 1 e 3 valeram-se da colaboração de
Emanuela Casson. Os desenhos são de Belinda Worsley.
AGRADECIMENTOS
2
Por seus conselhos e ajuda recebidos, os autores agradecem a Paolo Ciancarini,
Viviana Doldi, Franco Federici, Benedetta Gizzi, Alejandro Marcaccio, Rosana
Masiola, Fulvio Mazzocchi, Alberto Monteverdi, Hans-Peter Ohly, Riccardo Ridi, Aldo
Stella, Federico Venier, Giulia Visintin, aos estudantes da graduação em
comunicação internacional e em Técnica publicitária da Università per Stranieri de
Perugia, aos serviços bibliográficos da Biblioteca da Região Toscana.
3
Capítulo 1
A ORGANIZAÇÃO DO CONHECIMENTO
Esta reflexão foi escrita por um famoso autor, cuja identidade pode-se tentar
adivinhar antes de ser revelada ao final deste capítulo (não por acaso, trata-se de
um bibliotecário).
4
se com a evolução do conhecimento um sistema específico se destine a modificar-
se ou a ser absolutamente desmontado.
5
A CLASSIFICAÇÃO DE PLANTAS E ANIMAIS
Entretanto, quem se interessou muito pela sistemática foram os botânicos,
empenhados em descrever e catalogar as espécies de plantas cada vez mais
numerosas levadas aos museus pelos viajantes de retorno das colônias de todas as
partes do mundo. Um dos mais importantes foi o suíço Konrad Gesner, que viveu
por volta do século XVI, e catalogou plantas e animais utilizando como critério
principal seus órgãos reprodutores. Gesner devia ter mesmo mania de organizar o
conhecimento, visto que também redigiu uma monumental bibliografia dos livros
então conhecidos no mundo, intitulada “Bibliotheca universalis sive Catalogus
omnium scriptorum locupletissimus in tribus linguis, latina, graeca et hebraica”.
Lineu pensava que as espécies tivessem sido criadas por Deus com o aspecto que
ele as observava, então classificar era um modo de descrever a criação, quase uma
oração. Um século depois, com a introdução da idéia de evolução biológica com a
obra de Lamarck e de Darwin, parece natural considerar que a árvore hierárquica de
Lineu seja de fato uma árvore genealógica: todo organismo se assemelha a outro
porque deriva deles ou é seu parente de algum modo. A biologia sistemática de
hoje é filogenética¸ isto é, busca individuar grupos que correspondam às relações
evolutivas entre uma forma viva e outra e não apenas por sua semelhança.
6
A taxonomia numérica, introduzida pelos estatísticos R.R. Sokal e P. H. A. Sneatth
[1973], oferece uma série de técnicas matemáticas para criar grupos de organismos
(ou de qualquer outro tipo de objetos: no Capítulo 4 veremos sua aplicação na
classificação de textos) com base no número de características comuns. Os
agrupamentos são representados em forma de árvores chamadas dendrogramas
que não são necessariamente árvores genealógicas. De fato, algumas semelhanças
podem ser enganosas.
De outra parte, se usamos a origem comum como critério único, acontecem coisas
estranhas. O entomólogo alemão Willi Hennig introduz na metade do século XX um
método muito rigoroso chamado taxonomia cladística para agrupar os organismos
exclusivamente com base em suas características comuns. Um grupo pode de fato
ser formado somente por organismos que tenham em comum caracteres que
nenhum outro organismo possui, portanto presentes pela primeira vez na Terra em
seus antepassados comuns. Deste modo se obtém árvores genealógicas muito fiéis
àquela que deve ter sido a história evolutiva real daqueles organismos. Todavia
estas árvores nem sempre são satisfatórias: por exemplo, as aves, segundo os
critérios da cladística, fazem parte dos répteis! No sentido genealógico de fato as
aves são parentes mais próximos dos lagartos tanto quanto os crocodilos. Só que as
aves, quando se separaram dos lagartos, também se modificaram para adaptar-se
aos novos ambientes, aéreos. O método cladístico não dá conta desta diversidade.
Segundo o grande evolucionista Ernst Mayr, portanto, a classificação mais
equilibrada é aquela que leva em consideração seja a origem comum, seja a
diversidade: as aves serão enumeradas próximo aos répteis, visto que descendem
delas, mas constituirão uma classe distinta, porquanto se diferenciaram muito.
7
A CLASSIFICAÇÃO DE LIVROS
A idade moderna se caracteriza por uma enorme quantidade de conhecimento
produzido no curso do tempo pelas ciências e escolas de pensamento e difundido
graças às técnicas de comunicação, sobretudo a partir da invenção da imprensa.
8
assuntos muito específicos. Para indicar cada classe, Dewey utilizou números,
inicialmente com três dígitos: assim, 800 significava literatura em geral, mas 810
significava literatura americana, 850 literatura italiana, etc. Especificando ainda, a
literatura italiana podia ser discriminada em poesia italiana 851, dramaturgia italiana
852, narrativa italiana 853, etc.
Como se pode observar, este sistema permite distinguir até mil classes diversas, de
000 (que, para Dewey significa generalidades) até 999 (que indica a história dos
mundos extraterrestres). Mas mil classes se esgotam rapidamente! Por exemplo,
535 significa luz e ótica, mas como marcar os livros que tratam apenas dos
fenômenos de dispersão da luz? Continuando a dividir por dez podemos expressar
as dez subclasses de um número inteiro com números decimais: 535.1 indicará em
particular as teorias sobre a luz, 535.2 a ótica física e 535.4 a dispersão da luz.
Estas subclassses por sua vez poderão ser divididas, indicando, por exemplo, com
535.84 a espectroscopia, com 535.844 a espectroscopia no ultravioleta e assim por
diante, potencialmente ao infinito, visto que os dígitos decimais de um número
podem ser infinitos! O novo sistema toma então o nome de Classificação Decimal
de Dewey (CDD, em inglês DDC).
Se vocês derem um pulo na biblioteca pública mais próxima, poderão observar que
os livros estão etiquetados com números como estes: três dígitos seguidos
eventualmente de um ponto e por um número variável de outros dígitos. Na verdade,
a classificação decimal de Dewey teve extraordinário sucesso e por mais de um
século é usada por muitas bibliotecas de todo o mundo para dispor os livros nas
estantes. Poderão assim observar as vantagens deste sistema: visto que os livros
estão dispostos em ordem progressiva de classe, livros de assuntos semelhantes se
encontram próximos. Mesmo que não conheçam o significado dos dígitos, uma vez
localizado um livro procurado, em suas vizinhanças imediatas poderão encontrar
algum outro de seu interesse.
9
similares) ainda para organizar os textos de uma bibliografia ou de um repertório de
sítios Web.
Animados por este propósito de longo alcance, Otlet e Lafontaine fundaram o Institut
International de Bibliographie (que mais tarde se torna a Fédération Internationale de
la Documentation) obtendo de Dewey a permissão para utilizar sua tabela e, em
seguida, modificá-la adaptando-a a todas as suas necessidades específicas. Nasce
assim uma prima da CDD, a Classificação Decimal Universal (CDU, em inglês
UDC), que continuou a se desenvolver de modo independente até hoje. Os códigos
da CDU têm um aspecto semelhante ao da CDD, mas além dos dígitos e do ponto
contém outros sinais de pontuação que permitem combinar as classes de maneira
mais flexível. A CDU é utilizada também em muitas partes do mundo, sobretudo na
Europa central e oriental, especialmente em repertórios bibliográficos e bibliotecas
científicas.
10
Sem o mesmo sucesso estariam outras tabelas de classificação elaboradas pelos
bibliotecários anglo-saxões nas primeiras décadas do século XX, como a Expansive
Classification de Charles Ammi Cutter, a Subjetc Classification de James Duff Brown
e a Bibliographic Classification de Henry Evelyn Bliss. Este último autor ocupa um
lugar importante na história da organização do conhecimento: escreveu dois livros
intitulados The organization of knowledge and the system of the sciences e The
organization of knowledge in libraries and the subject approach to books.
CABEÇALHOS DE ASSUNTO
Além de sua tabela de classificação, a Biblioteca do Congresso dos Estados Unidos
tem divulgado em todo o mundo seu sistema alfabético para indexar os assuntos
tratados nos livros. Ele nasce por obra de seu ilustre bibliotecário Charles Ammi
Cutter, lá pelo final do século XIX, quando a biblioteca é transferida para sua nova
sede. Muito conhecido e importante para a história da profissão bibliotecária, Cutter
se desentendeu muitas vezes com seu conterrâneo Dewey, detalhe que não impediu
que colaborassem para fundar a associação dos bibliotecários americanos.
11
formalizados, enriquecendo-se de remissivas para as formas preferidas de um termo
ou para suas variantes. Deste modo, quando os usuários procuram um termo não
utilizado pelo catálogo são então reenviados ao termo corrente. Na verdade,
enquanto a identificação de autores e de títulos na maior parte dos casos é bastante
imediata, para os assuntos é necessário seguir algumas regras convencionais para
se assegurar que:
DESENVOLVIMENTOS MODERNOS
Enquanto a CDD, a CDU, a LCC e as LCSH continuavam a se difundir, nos anos
trinta surge no cenário um indiano com o difícil nome de Shiyali Ramamrita
Ranganathan. Era um matemático que havia sido encarregado de gerenciar a
biblioteca universitária de Madras. Para adquirir uma boa formação em
12
biblioteconomia foi estudar na Inglaterra no University College London, importante
centro de estudos neste setor. Enquanto estava em Londres, concebeu uma nova
técnica para descrever o conteúdo de um documento: a análise de faceta. Tal
método consiste em decompor o tema num conjunto de aspectos que o compõem,
segundo determinadas regras, para recompô-lo num código combinado. Ele mesmo
escreve que teve essa idéia observando uma caixa de jogos Meccano enquanto
estava numa grande loja da famosa cadeia Selfridges: os diversos aspectos tratados
num livro poderiam ser combinados como as partes de um Meccano!
Voltando à India, por todo o resto da vida Ranganathan trabalhou muitíssimo para
desenvolver a biblioteconomia em seu país (criou ainda uma fundação dedicada à
sua mulher Sarada). Era um homem de caráter disponível e muito dedicado a seu
trabalho, com hábitos muito frugais [Gnoli 2000] e concebia a biblioteca como um
serviço útil para toda a Humanidade, basilar para o desenvolvimento da cultura e do
conhecimento. Formulou cinco “leis da biblioteconomia” de tom nada acadêmico,
voltadas ao contrário para a idéia que um biblioteca, além de burocracias e
tecnicismos, não deve nunca perder de vista seu objetivo, o de ser útil às pessoas:
Mas como se pode fazer encontrar “a todo leitor seu livro” e vice-versa?
Classificando todos os livros! A técnica da análise de faceta, que consiste em
especificar os assuntos de maneira muito precisa e detalhista, deve permitir
encontros mais frutuosos entre os leitores que buscam determinados conhecimentos
e livros que melhor satisfaçam suas necessidades [Gatto 2006].
13
e eficazes. Assim ele deu uma grande contribuição à teoria da classificação, ainda
que a tabela na qual experimentou as técnicas que inventou, a Colon
Classification, tenha divulgação muito limitada. Quem percebeu o valor de sua obra
foram, sobretudo, alguns ingleses que trabalharam quase sempre em bibliotecas
especializadas de grandes empresas e organizações, como a refinaria de açúcar
Tate & Lyle e a RAF, a aviação militar britânica. Eles estiveram em contato com
Ranganathan e o encontraram em diversos congressos. Os estudiosos ingleses
reconheceram que a análise de faceta era mesmo o que se queria para indexar de
modo cuidadoso e eficiente também os documentos muito especializados [CRG
1955]. Em 1952 formaram uma espécie de círculo dedicado à pesquisa sobre a
classificação bibliográfica, com sede em Londres: o Classification Research Group
(CRG). O grupo existe ainda hoje, mas foi sobretudo nos anos cinqüenta e sessenta
que seus mais eminentes representantes estiveram ativos: Derek Austin, Eric
Coates, Jason Farradane, Robert Fairthorne, Douglas Foskett, Barbara Kyle, Jack
Mills, Brian Vickery etc.
14
Bibliográfica de Bliss (BC2). Assim, a BC2 é a mais avançada das tabelas de
classificação geral disponíveis atualmente.
NA ERA DIGITAL
Nos últimos decênios, a divulgação crescente da informática e da telemática atraiu a
maior parte das energias nesta direção, mais do que desenvolvimentos teóricos
posteriores. Por outro lado, os estudos de Ranganathan e do CRG já oferecem
estruturas conceituais bastante ricas e refinadas, que ainda não foram exploradas a
fundo. As grandes bibliotecas, seus catálogos em rede, os repertórios gerais dos
15
recursos Internet etc. utilizam tabelas de elaboração mais antigas, como LCSH e
CDD, ou tabelas domésticas idiossincráticas. Apenas alguns projetos recentes, que
ilustraremos na segunda parte deste livro, experimentam uma aplicação mais
completa da análise facetada em ambiente digital, uma técnica que atualmente
desperta um forte interesse entre os especialistas da arquitetura da informação e da
gestão do conhecimento (knowledge management).
16