Você está na página 1de 125

Como se faz um

banco de dados
(em Histria)

Tiago Gil
Laboratrio de Histria Social
Universidade de Braslia
ndice

Prefcio .............................................................................................. 7
Introduo .......................................................................................... 7
Algumas questes tericas e metodolgicas ................................... 11
Um artesanato, uma operao .................................................... 14
Desmontando as coisas em ordem .......................................... 21
Em ombros de gigantes................................................................ 31
Algumas questes prprias da informtica ..................................... 50
Estrutura de dados ....................................................................... 50
Modelos conceituais, lgicos e fsicos ......................................... 58
Aspectos visuais sobre as bases ................................................... 63
Entre a tcnica e a teoria: problemas cotidianos e decises prticas 71
Engenharia de pesquisa ................................................................... 83
Levantamento inicial .................................................................... 83
Coletando os dados e abastecendo a base .................................. 87
Administrao da base ................................................................. 95
Montando bases: alguns exemplos concretos ................................. 98
Bases centradas na fonte ........................................................... 100
Bases centradas no mtodo ....................................................... 112
Concluso ....................................................................................... 122
Bibliografia ..................................................................................... 123
Prefcio

Este livro foi fruto de um ps-doutorado realizado na


cole des Hautes tudes en Sciences Sociales (EHESS) entre
agosto de 2013 e janeiro de 2014. Para tanto, li centenas de
artigos, livros e captulos sobre o tema, alm de dezenas de
manuais de informtica. Os resultados desta pesquisa tambm
foram aproveitados em cursos presenciais sobre bancos de
dados, realizados na UFRJ em outubro de 2014 e na UFRGS em
dezembro do mesmo ano, quando as ideias aqui apresentadas
foram alvo de debates. Os dados obtidos nesta pesquisa foram
utilizados em outras publicaes, a saber: Storici e informatica:
luso dei database (1968-2013), publicado na revista Memoria e
ricerca (Itlia, 2015) e "Our own in-house software: una
historia de historiadores programadores na obra Historiografa,
giro digital y globalizacin. Reflexiones tericas y prcticas
investigativas de Juan Andrs Bresciano (Uruguay, 2015).
Agradeo aos colegas do Departamento de Histria da UnB,
Marcelo Balaban, Neuma Brilhante, Teresa Marques, Luiz
Noguerl e Marcos Pereira pela leitura atenta, assim como aos
estudantes do Laboratrio de Histria Social da UnB, que
discutiram animadamente seu contedo. No poderia deixar de
agradecer aos professores Joo Fragoso, Roberto Guedes
Ferreira, Antonio Carlos Juc de Sampaio, Thiago Krause, Hlida
Conceio, Helen Osrio e Lus Augusto Farinatti, que igualmente
leram e comentaram o original. O material tambm foi avaliado
pelo mestre em computao Cssio Couto, que fez diversas
sugestes.
[7]

Introduo

Este um livro voltado para estudantes de Histria


e para quem quer informatizar sua pesquisa desde o comeo.
Por informatizar quero dizer criar uma base de dados, ou, como
se diria em ingls to database something. Seu objetivo de
ajudar o leitor a incrementar sua pesquisa em Histria, com
algumas aplicaes possveis para as cincias sociais em geral.
No se trata de um manual tcnico. A proposta aqui contribuir
para o leitor pensar como alguns recursos prprios do universo
das bases de dados e da informtica podem melhorar a
investigao, desde a proposio do problema at a escrita do
trabalho, passando pela coleta e anlise das informaes que
daro suporte s concluses. A ateno, contudo, ficar nas
formas de organizar os materiais.

temerrio escrever um livro como este. Tratando-


se de informtica, ele estar datado em poucos anos. Todavia,
tentei escrev-lo pensando em questes clssicas, de longo
prazo, inclusive tomando auxlio de debates entre Histria e
Informtica que existem desde os anos 1960. Estes debates
apresentam alguns problemas estruturais na organizao das
informaes que prpria do trabalho do historiador, com a
chegada cada vez mais avassaladora das mquinas. E como
defensor do planejamento, tentei pensar o texto para alm do
seu consumo imediato, de modo a prolongar seu uso no tempo,
no tema e no espao. Veremos que conveniente fazer a
mesma coisa com as bases de dados.

O perigo da rpida obsolescncia desse tipo de


publicao se agrava devido necessidade quase direta de
referncia ao uso de certos programas. Amanh os programas
deixaro de existir e outros (melhores ou no) sero lanados.
Para tentar amenizar isso, o texto todo foi escrito levando em
[8]

conta aspectos mais gerais dos programas, sem referncia a um


pacote especfico. Fiz isso no apenas pelo problema da
obsolescncia: geralmente as pessoas acham que construir
bancos de dados ou fazer anlise de redes sociais, para dar um
exemplo, resume-se a usar um programa, minimizando a mo do
historiador em seu trabalho. Aqui quero o trabalho humano, para
o bem e para o mal, mostrando as opes por trs desse
personagem que faz pesquisa usando (ou no) bases de dados.

Muitas vezes, utilizarei metforas relacionadas ao


universo da cozinha, no apenas por uma questo didtica, mas
tambm por acreditar que de fato so campos que tm alguma
semelhana. E vou comear com um exemplo claro. A proposta
aqui no de criar sistemas que faam todo o trabalho, com
uma completa mecanizao. No quero propor uma mquina
onde voc coloca todos os produtos, como leite, batatas,
manteiga, alho e sal, para na ponta dela sair um belo pur.
preciso conhecer as engrenagens da base de dados. Nesse
caso, a ideia de um meio termo entre o artesanato simples,
amassando as batatas com a mo, e aquela nefasta mquina
que faz tudo sozinha. Garfos, facas, descascadores e
multiprocessadores podem ser teis. Proponho, assim, um
artesanato automatizado, com o uso pontual e deliberado de
recursos informticos. E como artesanato que , convm ao
historiador saber construir suas prprias ferramentas ou saber
adapt-las para usos inusitados, como quase tudo em Histria.

Ao leitor ctico ou desconfiado das bases de dados


ou das possibilidades que a informtica oferece na produo do
conhecimento histrico, j aviso que este ser um livro de
Histria. Vamos falar de alguns problemas prprios do universo
da pesquisa, desde a proposio do problema at a redao
final. Ao leitor que acredita que as bases de dados so um
problema exclusivamente tcnico, lembro que existem milhares
de bases de dados tecnicamente perfeitas, mas que se tornaram
[9]

obsoletas e inutilizveis diante de problema prprios do universo


do historiador. H bases que foram feitas para um tipo de uso e,
por opes mal feitas na sua origem, no permitem nada alm. E
h aquelas que sequer conseguiram responder pergunta
original. Sim, porque as bases tm relao direta com nossas
perguntas, ou deveriam ter. E preciso planejar para tirar
proveito delas. Quanto mais planejadas, por mais tempo sero
teis.

Um banco de dados pode servir para escancarar


nossas posies tericas mais ocultas e at algumas indesejadas.
Quando somos obrigados a racionalizar nosso objeto a ponto de
faz-lo caber em registros de uma tabela, precisamos expor mais
as nossas posies. No h espao para um pensamento como
nosso tema muito complexo (como se alguns temas fossem
simples). preciso saber como dar vazo a essa complexidade e
precisamos fazer isso de modo claro, de tal maneira que at um
computador entenda. S tiramos da mquina aquilo que
colocamos l dentro.
1

Em 1996, um livro interessante, do qual pretendi


tirar bastante proveito, foi lanado na Inglaterra. Databases in
historical research, de Harvey e Press, tinha tudo para ser uma
obra de referncia entre os historiadores. Pensava a histria no
meio da evidente encruzilhada a que a humanidade estava
chegando, representada pela informtica. O livro parece antever
que, no futuro prximo, cada vez mais os historiadores
utilizariam as bases de dados para incrementar suas pesquisas.
Mas no foi assim e nem Harvey e Press foram os primeiros a
errar com essa mesma previso. Contudo, o caso deles
especial. Quando escreveram sua obra, as databases estavam se

1
CHARLE, Christophe, Problemes de traitement informatique dune enquete
sur trois lites en 1901, in: MILLET, Hlne (Org.), Informatique et
prosopographie, [s.l.]: CNRS, 1985.
[10]

consolidando na informtica, em todos os campos do


conhecimento e pareciam mesmo estar se tornando um tema
hegemnico na relao entre histria e informtica.
2

Este livro no pretende rememorar os velhos


tempos em que as bases de dados podiam ser vistas como o
futuro da histria. Entendo que desde meados dos anos 1990 os
historiadores que dialogavam com a tecnologia da informao j
no so os mesmos que constroem bancos de dados para suas
pesquisas. Esses ltimos me parecem o pblico mais direto
dessas linhas. Se no a maioria dos historiadores, este l
outro problema. O nosso, aqui, consiste em discutir sobre boas
formas de fazer pesquisa histrica centrada em bancos de dados,
como diziam Harvey e Press em meados dos 1990. Ento,
convido o leitor a uma breve aventura pela tecnologia, mas sem
sair do nosso cho de historiador.

2
HARVEY, Charles; PRESS, Jon, Databases in Historical Research. Theory,
Methods and Applications, London: Macmillan Press, 1996.
[11]

Algumas questes tericas e


metodolgicas

Um banco de dados quase uma forma de narrativa


histrica. Ele obedece, perfeita ou imperfeitamente, aos
3

preceitos e s concepes de mundo (e, dentro desses, das


opinies sobre o problema de pesquisa) do pesquisador. A
primeira posio terica acreditar que seja possvel reduzir a
complexidade do social a ponto de faz-la caber na forma de
registros de uma tabela, tal como os historiadores acreditam ser
possvel fazer nas linhas de um texto. Mas essa no a nica
posio terica possvel no trabalho com bases de dados. No
quero dizer que marxistas vo produzir bases de um tipo e que
os liberais produziro, necessariamente, de outro, ainda que isso
seja perceptvel e bastante provvel. Nossas posies tericas
podem ser variadas, heterogneas, eclticas, mas esto l, no
cantinho delas, esperando a hora de aparecer para organizar o
mundo dentro dos nossos produtos. No caso da pesquisa em
Histria, isso inclui a escolha de objetos, de conjuntos de fontes,
de metodologias e de interlocutores. E na montagem da base de
dados no diferente.

Para ser mais claro, apresentarei aqui diversas


formas de abordar o problema. Posso dizer que existem dois
tipos de bases, as analticas (orientadas pelo mtodo, como

3
No vou discutir o significado terico de narrativa histrica, j
exaustivamente abordado por centenas de historiadores ao longo dos ltimos
40 anos. Apenas para tomar um referencial, apresentarei aqui uma definio
retirada de Lawrence Stone, que ao apontar a volta narrativa, destaca
algumas de suas caractersticas no discurso histrico: ser descritiva, focada
mais ao homem do que s circunstncias, atenta mais ao particular e ao
especfico que aos conjuntos e marcada pela retrica. STONE, Lawrence, The
revival of narrative: reflections on a new old history, Past and Present, n. 85,
p. 324, 1979.
[12]

preferem alguns autores), voltadas para um problema de


pesquisa, e as empricas (orientadas pela fonte) que procuram
dar conta de um corpus documental, como uma base de
registros paroquiais, de batismos, por exemplo. Isso tem relao
com uma concepo de histria que prev o trabalho do
historiador como um passo importante para o acesso ao
conhecimento do passado, uma vez que as bases analticas
estariam orientadas por um problema de pesquisa. As bases
empricas, por seu turno, organizariam o material de trabalho,
sem um acesso direto ao passado, porquanto foram organizadas
por um historiador de modo diverso ao estado original da fonte.

Tambm poderia dizer que h dois tipos de bases


de dados: as annimas e as com referncia nominal. Existem as
pesquisa que demandam ateno s histrias pessoais e aquelas
para as quais isso no afeta o resultado. Poderia colocar, de um
lado, as bases de dados dos micro-historiadores, dos demgrafos
historiadores de Cambridge e de algumas cepas de demgrafos
franceses. No outro extremo, colocaramos os cliometristas e
dezenas de demgrafos franceses to tributrios de Louis Henry
como os primeiros, mais interessados, contudo, em calcular o
intervalo intergensico dos camponeses do Sculo XVII do que
mapear as opes de casamento de um ncleo familiar
especfico ao longo do mesmo sculo.

Entre aqueles que fazem bases no annimas,


dando nfase aos agentes histricos e aos seus nomes, podemos
apontar outra diviso: os que fazem bases individuais
(biogrficas), os que fazem bases ao-por-ao e aqueles que
criam sistemas para recolher, em outras bases, informaes
sobre os agentes. No h aqui uma hierarquia de qualidade de
base nem o melhor jeito de fazer o trabalho. H trs ideias de
como deve ser feito o trabalho do historiador.

A primeira enfatiza as trajetrias individuais,


[13]

atomizando os personagens e dando pouco espao para


dinmicas sociais e situaes inusitadas. Por exemplo, se criamos
um campo para profisso, teremos que colocar ali toda a
informao de uma vida de atividades ou escolher uma mais
importante, varrendo debaixo do tapete outras informaes que
poderiam se revelar fundamentais no andamento da pesquisa.
Mas podemos inserir vrios campos de profisso: profisso1,
profisso2, etc. Quantos seriam necessrios? Depende do
personagem. E qual seria a profisso1 quando nosso heri
mantm duas paralelas? Estamos sempre fazendo opes,
orientados por nossos problemas de pesquisa. At a, tudo
epistemologicamente timo, ajuda em um estudo
prosopogrfico. O problema que nossos problemas de pesquisa
mudam ao longo da pesquisa.

A segunda opo, registrar em tabelas ao-por-


ao parece muito melhor nesse sentido. Ao invs de
registrarmos "pessoas", registraramos "atos". Ela elimina os
problemas apresentados acima, mas no nada neutra. Faz
parte de uma concepo de histria muito em voga no atual
estgio dos estudos, que enfatiza a interao social e as redes
de relacionamento. Talvez no seja indicada para outros temas
de pesquisa. Por outro lado, o que so aes ou atos? Um
espirro e um homicdio tm o mesmo significado? Uma conversa
tem semelhante estatuto e deve ser desmembrada no mesmo
formulrio de um arranjo matrimonial? Esse arranjo matrimonial
significaria apenas um registro na tabela ou dezenas deles
(considerando a cerimnia oficial, as testemunhas, a festa)?

A terceira alternativa pode ser tomada em


diferentes contextos. Pode ter sido uma opo segura, devido
incerteza sobre qual procedimento metodolgico seria mais
adequado para o problema de pesquisa adotado. Mas pode ser
igualmente uma soluo de convenincia, diante de informaes
de fontes diversas e desorganizadas. De modo geral, todas
[14]

envolvem aspectos tericos, metodolgicos e tcnicos e fazem


isso ao mesmo tempo, de tal maneira que no podemos dissociar
estes trs elementos durante o trabalho.

Um artesanato, uma operao

J vimos que h muito do historiador por trs dessa


aparente deciso tcnica de construir um banco de dados . Mas
isso no ocorre por causa dos bancos. O mesmo poderia ser dito
do trabalho do historiador com seus recortes, suas notas, seus
instrumentos de organizao dos materiais dirios de trabalho,
fichas, cadernos, canetas ou laptops. Em texto clssico de 1974,
Michel de Certeau dizia:

Em histria, tudo comea com o gesto de selecionar, de


reunir, de, dessa forma, transformar em "documentos"
determinados objetos distribudos de outra forma. Essa
nova repartio cultural o primeiro trabalho. Na
realidade ela consiste em produzir tais documentos, pelo
fato de recopiar, transcrever ou fotografar esses objetos,
mudando, ao mesmo tempo, seu lugar e seu estatuto.
Esse gesto consiste em "isolar" um corpo, como se faz em
fsica. Forma a "coleo". [...] O material criado por
aes combinadas que o repartem no universo do uso,
que tambm vo procur-lo fora das fronteiras do uso e
que fazem com que seja destinado a um reemprego
coerente. a marca dos atos que modificam uma ordem
recebida e uma viso social. Instauradora de signos
oferecidos a tratamentos especficos, essa ruptura no ,
portanto, nem apenas, nem primeira vista, o efeito de
um "olhar". necessria uma operao tcnica.
4

A tcnica, geralmente desprezada pelos

4
DE CERTEAU, Michel, A operao histrica, in: LE GOFF, Jacques; NORA,
Pierre (Orgs.), Histria: novos problemas, So Paulo: Livraria Francisco Alves
Editora, 1978, p. 30.
[15]

historiadores, assume no texto de Certeau, um lugar


fundamental: Se verdade que a organizao da histria
relativa a um lugar e a um tempo, inicialmente o por suas
tcnicas de produo [...] a histria mediada pela tcnica.
5

Isso significa exatamente aquele conjunto de operaes que


comea com o gesto de selecionar e de reunir, para em seguida
criar o material por aes combinadas que vo reparti-lo no
universo do uso para um reemprego coerente. Graficamente,
poderamos apresentar o raciocnio da seguinte forma:

Figura 1 - Esquema ilustrativo de uma afirmao de Michel de Certeau

Em um texto de 1986, Jean-Phillipe Genet apresenta


um modelo aproximado do de Certeau, numa tentativa mais
clara de produzir conhecimento histrico com o uso de bancos
de dados. Para ele, tudo comea com o Real Passado, um
abstrato mundo real do qual no temos todos os indcios,
devido perda ou ao desconhecimento desses traos, ou seja,
por um dficit positivo. Com um processo de seleo e busca,
montamos um Real Histrico, composto pelas fontes conhecidas.
Uma vez coletadas e interpretadas, elas se transformam em uma
coleo (palavra que tambm utilizada e reforada por
Certeau) de dados, que Genet denominou de metasoures
(metafontes). Graficamente, o argumento do autor poderia ser
expresso da seguinte maneira.

5
Ibid., p. 28.
[16]

Figura 2 - Esquema ilustrativo de uma afirmao de Jean-Phillipe Genet

Poderamos antepor um elemento diante desses


dois modelos: um problema de pesquisa. A seleo das fontes,
mencionada por Certeau, s faz sentido diante de um
problema/questo que oriente essa seleo. bem verdade que
o problema pode se apresentar no contato com alguma
documentao, e no, apenas, com a leitura de outros estudos
(muito menos por um crebro genial ou pela intercesso divina).
No importa de onde surgiu a ideia. Importa que colocado um
problema, mesmo que frgil, ele demanda o passo seguinte - a
seleo das fontes. O esquema ficaria um pouco alterado, mas
coerente com as posies acima apresentadas, comeando com
um problema, que tem origem na experincia do historiador,
seja com fontes, com sua vida pessoal, com suas leituras, ele
seleciona e rene suas fontes para desmont-las com aes
combinadas, criando um material ou "metafontes" que sero
reordenadas na anlise e descritas em um texto, mediado pelas
opes tericas e metodolgicas do autor e pelo problema de
pesquisa original.

Figura 3 - Esquema das etapas da produo do conhecimento histrico


[17]

Essa descrio de procedimentos, que enfatiza as


tcnicas prprias do historiador, , agora, nosso foco no debate
sobre a informatizao. H dcadas os historiadores buscam
automatizar seus procedimentos. E como foi dito antes, no h
como criar um software em que, utilizando as tcnicas do
conhecimento histrico, coloquemos o problema e obtenhamos a
resposta. O que possvel (e bastante vivel) automatizar
alguns procedimentos do historiador em cada uma dessas
etapas, para que o pesquisador possa fazer tantas aes
combinadas quanto pretenda de modo eficiente e criar uma
ferramenta com a qual ele possa reunir os materiais, os dados,
ou as "metafontes", em um ambiente que permita selees,
buscas e ordenamentos variados sem a perda da informao
original. Em suma, trata-se de organizar o trabalho de modo a
permitir experincias. Como disse o mesmo Certeau:

A utilizao de tcnicas atuais de informao conduz o


historiador a separar o que at agora se encontrava em
seu trabalho: a construo dos objetos de pesquisa e,
portanto, tambm as unidades de compreenso; a
acumulao de "dados" (informao secundria, ou
material refinado) e seu arranjo em lugares onde possam
ser classificados e deslocados; a explorao tornada
possvel pelas diversas operaes a que esse material
6
suscetvel.

Ressalte-se, contudo que esta tarefa tem suas


dificuldades. Se for correto que podemos administrar muito
melhor nossos dados com o uso de uma boa base, igualmente
certo que uma base mal feita v gerar problemas de toda ordem.
Criar uma tabela para coletar os dados de uma fonte pode
parecer muito simples, em alguns casos, mas no . Novamente
Genet nos apresenta um problema crucial: a necessidade de
conhecer profundamente as fontes que utilizamos, antes de
montar um banco de dados com elas. Conforme o autor:

6
Ibid., p. 34.
[18]

O dado [...] um artefato, no sentido que os arquelogos


empregam este termo, um objeto construdo em funo
de alguns objetivos bem precisos. De uma mesma fonte
dois historiadores extraem dados completamente
diferentes. A operao de constituio e de
estabelecimento do dado depende, assim, de trs
parmetros complementares. O primeiro, que preciso
manter no seu devido lugar a crtica das fontes [...]
justamente por causa das imensas possibilidades
oferecidas pelo computador, me parece que a crtica das
fontes sobre todas as suas formas se impe com um rigor
maior...
7

preciso saber o modo como a fonte foi construda,


seu pblico, seus autores, seus limites, seus objetivos e que
interesses agiram para que aquele documento chegasse quela
forma (que finalmente teve mas que diferentes projetos
desejavam alterar). Alm dessa erudio documental, Genet
destaca a importncia do conhecimento tcnico sobre as bases e
seu dilogo com o fazer histrico e com a erudio das fontes.
Ao escolher campos que acolhero nossos dados , estaremos
escolhendo que informaes vamos privilegiar e quais as que
sero consideradas menos importantes ou que sero menos
desdobradas.

Podemos criar um campo data, mas tambm


preparar um para dia, outro para ms e finalmente um para o
ano. Se a opo for pelo primeiro, importa elaborar um campo
do tipo data (como veremos adiante). Caso contrrio, podemos
estabelecer campos numricos para dias, meses e anos. Mas
interessa fazer esse desdobramento? Nossa pergunta demanda
padres que envolvam atividades regulares dentro de um ms
(como o pagamento de aluguis)? Ou dentro de um ano

7
GENET, Jean-Philippe, Histoire, informatique, mesure, Histoire & Mesure,
v. 01, n. 01, p. 0718, 1986, p. 10 e 11(Traduo nossa. O original est em
francs).
[19]

(aniversrios ou safras)? E se nossas atividades tiverem uma


regularidade semestral ou quinquenal? Saber escolher os campos
certos tecnicamente importante, no somente pela tcnica da
informtica, mas tambm por nossas tcnicas de historiador.

O mesmo Certeau que discutia sobre o que faz o


historiador quando faz Histria falava, naquele ano de 1974, do
uso do computador em nossa disciplina. No o fazia com a
maestria do programador, mas com a do estudioso do tempo. E
ao fazer isso, ressaltava exatamente a mo do pesquisador nesta
empreitada e seu lugar no tempo. Na pgina 33, ele afirma:

A especificao de seu papel [da histria] no


determinada pelo prprio aparelho (o computador, por
exemplo) que coloca a histria no conjunto de opresses
e possibilidades nascidas da instituio cientfica presente.
A elucidao do prprio da histria descentrada em
relao a esse aparelho: reflui no tempo preparatrio de
programao que a passagem pelo aparelho torna
necessria, e rejeitada [no sentido de um resultado,
expelida] no outro extremo, no tempo de explorao
aberto pelos resultados obtidos. Elabora-se, em funo
dos interditos fixados pela mquina, por objetos de
pesquisa a serem construdos, e, em funo do que
permite essa mquina, por uma maneira de tratar os
produtos standart da informtica.
8

Novamente aqui o foco est nas decises do


historiador, ao planejar a programao sobre os materiais que
utiliza. Ele tambm enfoca os limites da mquina, que acabam
entrando no que possvel obter de resposta. Como j dissemos,
isso pode ser matizado atravs do conhecimento tcnico de
informtica. Veremos isso mais adiante.

8
DE CERTEAU, A operao histrica, p. 33. Grifo nosso.
[20]

Nos anos de 1960 e 1970, o desejo pela


informatizao era justificado pela dificuldade de contar grandes
sries e de analisar regularidades de longos textos. Na Frana,
na Inglaterra, na Alemanha e nos Estados Unidos, o foco do uso
destas mquinas se justificava na contagem de grandes massas
documentais de fontes homogneas. Era o momento de
concepo de muitos trabalhos que ficariam prontos nos anos de
1970 e 1980. Esse interesse profundo pelas sries no foi apenas
um modismo ou febre, mas fruto de uma mudana de
concepes que teve consequncias profundas na forma de fazer
histria. As sries se tornaram importantes diante da crescente
preocupao com a definio de modelos.

As sries agora abriam o flanco de um debate at


ento interdito, devido impossibilidade fsica de observar
grandes regularidades sociais e, consequentemente, seus limites,
suas rupturas e seus casos excepcionais. Foi nesse contexto em
que certos objetos se tornaram possveis, encontrados nas
margens daquilo que se encaixava nos modelos de muitos
historiadores. Foi nesse contexto que a incluso do computador
como uma ferramenta do historiador se tornou relevante. E isso,
especialmente para a constituio de grandes bancos de dados
de sries manejveis e no apenas para flutuaes demogrficas
e econmicas, mas igualmente para o estudo de regularidades
nos textos, alm das hierarquias sociais, o que visvel na
preocupao com os estudos das categorias scio-profissionais.

Se for correto que ns historiadores temos nossa


forma e nossas tcnicas de organizar a informao, que nos so
to caras devido s especificidades do conhecimento histrico,
nada nos impede de dialogar com nossos vizinhos da
informtica, para observar como organizam as informaes,
como dispem de meios eficazes e criativos de organizar o
mundo entre tabelas e registros. Uma das demandas
fundamentais desse esforo passa pelo desafio de classificar as
[21]

coisas, no caso da informtica, atribuindo-lhe uma codificao.


Classificar parte do trabalho do historiador. Pode-se perguntar
se possvel fazer histria sem classificar. Chamar um ser
humano de agente histrico j uma classificao, assim como
cham-lo de ser humano. Do ponto de vista da Qumica, um
amontoado de tomos, maiormente de carbono. E posso dividir
esses amontoados de carbono entre os que detm os meios de
produo e os que vendem sua fora de trabalho; ou entre o
prncipe e o povo.

E no se trata apenas de usar de instrumentos de


comparao, mas de formalizar com a clareza necessria para o
processamento com os nossos critrios de anlise manifestos na
escolha dos campos, por exemplo. Se estudo uma obra literria,
como sei se o gnero que tenho em mos (romance, poesia, etc)
era comum na poca ou um formato marginal? As coisas s so
o que so em sua relao com as outras. Digo que uma obra
de fico pois sei que existem outras disponveis que no o so.
certo que posso definir o contexto a partir do texto e que isso
9

me ajuda a compreender diversos aspectos daquela sociedade


que gerou o texto. Mas sem comparar, classificar ou contar,
ficarei privado de qualquer afirmao que inclua expresses
como a maioria, a menor parte, um bom nmero, poucos,
melhores e piores. Nesse sentido, formalizar nossos critrios
em um banco de dados facilita a comparao e permite uma
clareza maior do universo que estamos estudando.

Desmontando as coisas em ordem

Colocar a histria dentro de um banco de dados


uma simplificao, mas nosso trabalho sempre uma
simplificao. A complexidade da vida social no cabe no texto,

9
Como querem os contextualistas ingleses.
[22]

tanto que precisamos de conceitos para nos aproximar dela,


como tampouco cabe nos campos de uma base. Resta simplificar
menos, ou, como disse Jean-Philippe Genet, admitir a obrigao
de consentir um empobrecimento fundamentado que estabelece
o trabalho cientfico.10

A criao de base de dados tem como pressuposto a


possibilidade de tomar um papel velho , que a pesquisa
11

transformar em fonte, de modo a produzir um desmonte. Em


outras palavras, vamos tomar um documento e desfaz-lo em
pedacinhos. Mas esse procedimento s ter sentido se os
pedacinhos forem reorganizveis depois, se pudermos
apresentar diferentes problemas para transformar aquele
conjunto de pedacinhos em uma narrativa clara. E o mais
importante: nesse processo todo de desmonte, o historiador
que deve estar coordenando tudo, decidindo, optando e
remontando as coisas segundo critrios do nosso mtier. E
preciso muito planejamento para que as bases sejam teis nesse
processo.

H diferentes formas de construir bases de dados,


como j argumentei, e cada uma delas fruto de uma forma de
pensar a histria. Da mesma maneira, cada uma dessas opes
vai envolver formas diferentes de desmontar os materiais,
tanto os empricos como com os interlocutores (bibliografia).
Contudo, a construo de bancos de dados no to subjetiva
como pode parecer. H certos procedimentos que so
importantes e regulares em qualquer pesquisa. Adiante, veremos
que as partes integrantes de uma base so as tabelas,
compostas por campos e registros. Criamos campos como

10
GENET, Histoire, informatique, mesure(Grifo nosso. O original est em
francs).
11
Faz referncia aos documentos, que podem ser orais, imagticos ou de
qualquer outra natureza.
[23]

caixinhas onde colocamos certas informaes que nos parecem


iguais. Essa simplificao, importante dizer, no privilgio de
quem usa bases de dados. Dizemos que todas as datas so
datas, tanto o dia de hoje quanto o 14/07/1789, mesmo que
tenham significados simblicos muito diferentes. Dizemos que
Joo e Pedro so nomes de pessoas, e no, simples conjuntos de
letras.

Faz-se o mesmo em bases de dados. Contudo,


dependendo do problema de pesquisa e das caractersticas de
cada fonte, podemos dizer que para fins de criao de bancos de
dados, h dois tipos de fontes: aquelas para as quais a forma
muito importante e aquelas em que a forma no to
importante.12 Por forma, estou entendendo aqui a regularidade
linear de certos fragmentos dentro de um documento. Na frase
Eu sou professor de Histria, h uma ordem linear importante,
sujeito, verbo e complemento. Se eu alterar os fragmentos, o
sentido ser igualmente alterado. Algo semelhante acontece, por
exemplo, com registros de batismo. Desde que comearam a ser
feitos de modo sistemtico (e preservados), na Itlia do Sculo
XIV, eles seguem um modelo muito particular, como no
13

exemplo abaixo:

Aos quatro do ms de novembro de mil oitocentos e


dezoito anos, nessa Igreja Matriz do Patrocnio de So
Jos, batizei e pus os santos leos ao inocente Francisco
filho de Manoel Roberto, e Maria Izabel, naturais dessa
freguesia. Padrinhos o Capito Francisco da Silva, e
Leucadia Maria, sua mulher, todos fregueses dessa
freguesia. Fiz e assinei. O Vigrio Colado, Theodoro Jos

12
Agradeo ao Professor Jean-Pierre Dedieu por chamar a ateno para este
ponto.
13
DE VRIES, Jan, Population, in: BRADY JR., Thomas; OBERMAN, Heiko; TRACY,
James (Orgs.), Handbook of European History 1400-1600. Late Middle Ages,
Renaissance and Reformation., Leiden / New York / Koln: E. J. Brill, 1994.
[24]
14
de Freitas Costa

A forma importantssima em um registro de


batismo que, dificilmente, comear com o nome dos padrinhos.
Esse modelo ser igual, na ordem dos fatores, em milhes de
registros no mundo todo: data; local; ato (batismo e leos);
nome do batizando; pais e padrinhos (com as respectivas
informaes pessoais); assinatura. claro que h muitssimas
nuances e variaes e j falaremos delas, mas h uma longa e
constante regularidade para a maior parte dos casos, ou melhor,
h uma expectativa, da poca e nossa, de que essas
informaes apaream. Deveriam aparecer.

O outro tipo de fonte aquela em que a forma, no


sentido j expresso, de sequncia linear de informaes, no
importante e nem esperada. Para um texto ficcional, por
exemplo, no h expectativa de formato, salvo uma ligeira ideia
de que eles so, geralmente, divididos em captulos, mas nem
isso to srio. O mesmo ocorre com as correspondncias. Elas
tm algumas regularidades, como os livros tm suas editoras e
autores: remetente, destinatrio, data e local. Mas seu contedo
interno, a carta propriamente dita, no formalizvel. Podemos
criar campos para destacar as pessoas e os locais mencionados,
mas essas informaes no so partes necessrias de uma carta
nem so esperadas pelo leitor ou pelo pesquisador.

Se for correto que preciso planejar para criar uma


boa base de dados, igualmente importante ter uma boa
quantidade de informaes prvias para iniciar o planejamento.
Saber diferenciar as potencialidades diversas de cada conjunto
documental fundamental para iniciar os trabalhos. E o carter
mais ou menos formal dos documentos um bom critrio de

14
Livro de Batismos 02, So Jos. 1818. Arquivo da Cria de So Jos dos
Pinhais.
[25]

avaliao. preciso conhecer a fonte para prever problemas.


Eles sempre estaro presentes, os problemas, mas o
planejamento nos livrar daqueles mais estpidos, dos quais
crtico nenhum nos poupar.

Saber identificar a forma em um documento no


algo simples. Continuemos planejando a informatizao dos
nossos registros de batismo. Para eles basta uma tabela que
tenha poucos campos:

Figura 4 - Modelo de tabela para batismos

J temos pronto nosso banco de dados. Vamos


comear a preench-lo. O prximo registro que vamos incluir
ser este:

Aos vinte de maro de mil oitocentos e dezoito anos nesta


Igreja Matriz do Patrocnio de So Jos, batizei e pus os
santos leos ao inocente Joo, filho legitimo de Joaquim
lvares e Maria dos Anjos, naturais dessa freguesia.
Padrinhos, Joo de Bastos e Ana lvares, sua mulher,
todos fregueses dessa freguesia. Fiz e assinei O Vigrio
Colado Theodoro Jos de Freitas Costa

Vamos preenchendo tudo: data, local, nome do


batizando, e... filho legtimo? Essa informao no estava no
registro anterior, que orientou meu modelo, por essa razo a
[26]

"legitimidade" no foi includa na minha base. Que tipo de campo


devo criar para dar conta disso? Que variveis posso encontrar
nesta observao antes do nome dos pais que trata da
legitimidade da criana? E por que alguns registros simplesmente
omitem esse dado? Como dizia Certeau, a formalizao da
pesquisa tem precisamente por objetivo a produo de "erros" -
insuficincias, faltas - cientificamente utilizveis. No nosso caso,
a simples tentativa de organizar a informao j nos trouxe
questes fundamentais para compreender a fonte e o universo
cultural que estamos observando. Criar um campo pode parecer
absolutamente tcnico, e , mas muito mais do que isso.
Segundo Dedieu, ao encontrar o inesperado que produzimos
15

conhecimento, e formalizar dados em uma base pode ser um


meio para isso.

Poderamos encontrar outros tantos exemplos que


nos mostrariam que criar uma base de dados para registros de
batismo no tarefa fcil. E a afirmao inicial de que bastaria
uma nica tabela tampouco correta ( possvel, mas seria
melhor desdobrar em vrias). Podemos falar, apenas para dar
algum exemplo, dos avs sobre os quais frequentemente h
informao. Tambm podemos lembrar o que normalmente
aparece sobre cada um dos participantes, dos pais e padrinhos:
sua origem, residncia, condio social, posio poltica e suas
relaes sociais. No mesmo livro de onde retirei aqueles
registros, comum, por exemplo, encontrar que o padrinho
filho de um capito. Ento devemos inserir um campo posio
militar do pai do padrinho?

Em sua tese de doutorado, Martha Hameister nos


16

15
JEAN-PIERRE DEDIEU, Entrevista.
16
HAMEISTER, Martha Daisson, Para dar calor nova povoao: Estudo sobre
estratgias sociais e familiares a partir dos registros batismais da Vila do Rio
Grande (1738-1763), UFRJ, Rio de Janeiro, 2006.
[27]

conta de um registro de batismo singular. No batizado de Felcia,


filha de escravos alforriada na pia batismal (do que se esperava
a liberdade sem interferncia do senhor, j que o valor dela fora
entregue no ato do batismo, segundo o costume da poca),
havia, alm dos dados do batismo, um longo texto explicativo
que narrava uma tentativa de interferncia do senhor da me
sobre a liberdade da menina, que fora inibida pelo proco, que
justificava, detalhadamente, as motivaes que orientaram sua
ao. certo que tal documento nico. Mas qual deveria ser o
tratamento dado para ele? Ignoraramos tal maravilha por falta
de um campo justificativa da insistncia do padre em alforriar o
batizando? Certamente no. Tampouco me parece boa a ideia
de apenas mencion-lo no famoso campo Observaes, onde
costuma cair tudo aquilo que no fomos capazes de planejar. H
muitas formas de contar uma histria, assim como h muitas
formas de montar uma base de dados . Mas a proposta aqui no
de apresentar uma base voltada para batismos. No nesse
momento.

Se bem que os registros de batismo parecem muito


mais complexos do que o primeiro olhar nos permite supor.
Ainda assim, h uma regularidade em sua produo. No Sculo
XX, encontraremos at mesmo formulrios previamente prontos,
feitos em grfica para o registro de batizados pelos padres.
Outro tipo de fonte bastante regular so os inventrios post-
mortem, feitos para identificar os bens dos falecidos para
promover a partilha entre os herdeiros. Difusos por boa parte do
17
Ocidente, eles tm uma estrutura bastante semelhante.
Embora muitos dos disponveis pelo mundo no correspondam
ao esperado, h certa lgica da fonte que permite, entre outras

17
VAN DER WOUDE, A.M.; SCHUURMAN, A., Probate inventories: a new
source for the historical study of wealth, material culture, and agricultural
development: papers presented at the Leeuwenborch conference
(Wageningen, 5-7 May 1980), [s.l.]: Hes, 1980.
[28]

coisas, a comparao. E se, algumas vezes, encontraremos


inventrios completamente fora da curva, que nos traro
muitas dvidas sobre como devem ser inseridos na base de
dados, o simples questionamento de suas diferenas em relao
ao padro de sua feitura (que inclusive regulado por Lei) j nos
d muitas ideias sobre a sociedade que o criou. A simples
constatao da diferena j nos ajuda a fazer boa Histria.

Talvez o mais interessante de trabalhar com


inventrios seja perceber seu carter plural, digamos assim.
Eles tm uma sequncia linear para a sua produo: abertura,
avaliao dos bens, apresentao dos documentos
comprobatrios e partilha. comum encontrar dados da famlia
18

do falecido, assim como informaes sobre as famlias dos


escravos que eram propriedade do falecido, quando em
sociedades escravistas. Contudo, possvel encontrar uma
diversidade de fontes no previstas, como recibos de compra de
medicamentos e atendimento mdico (geralmente devido a
alguma doena que levou morte o inventariado), assim como
testamentos e comprovantes de pagamento de servios
fnebres. Esses papis eram includos, pois tudo deveria ser
pago antes da partilha.

Eis a sua pluralidade, que se agua quando


pensamos que a abertura, a avaliao, os documentos e a
partilha so, igualmente, quatro fontes com estruturas muito
diversas. Se pensarmos em incluir os testamentos, teremos mais
elementos para estruturar dentro de uma base de inventrios.
Isso porque os testamentos, apesar de lembrarem as cartas por
sua aparncia (narrativa linear e o tamanho), so documentos
absolutamente estruturados, seguindo um cnone que pouco se

18
FRAGOSO, Joo; PITZER, Renato Rocha, Bares, homens livres pobres e
escravos - notas sobre uma fonte mltipla. Os Inventrios Post-mortem,
Revista Arrabaldes, v. 1, n. 2, p. 2952, 1988.
[29]

alterou em sculos. Havia uma frmula, que informava sobre o


19

contexto da redao do documento, geralmente uma


enfermidade aliada a dvidas sobre o que deus guardava para o
testador. Pedia-se clemncia Santssima Trindade, aos santos e
s santas da corte dos cus, ao santo do nome da pessoa e
ao(s) santo(s) de devoo, em especial, e ao seu anjo da
guarda. Na sequncia, uma lista dos ltimos desejos.

Todas essas fontes tm uma forma importante, uma


sequncia de fragmentos esperada tanto por ns quanto por
seus criadores. Isso no faz delas objetos fceis de informatizar.
Como vimos, h sempre espao para surpresas e isso muito
positivo para a produo do conhecimento histrico. Contudo,
grande parte dessas surpresas no exatamente
surpreendente. muito normal, nas fontes que tenho, encontrar
descries sobre a naturalidade dos avs do batizando, mas no
surpreendente que sejam omitidas em muitos casos. Da
mesma forma ser comum encontrar informaes as mais
diversas sobre os padrinhos. O padre no tinha em mente
apontar a patente militar de todos os padrinhos, mas
mencionava a de alguns. Ser melhor colocar um campo
patente militar para os padrinhos ou criar uma tabela associada
em que colocaremos todas as informaes que surgirem, as mais
diversas e imprevisveis, sobre os participantes do
acontecimento?

A soluo no simples e devemos pensar ainda


mais longe. Uma vez abastecida a base, devemos ter acesso fcil
e possibilidade de fazer buscas complexas nos nossos dados.
Isso ser mais ou menos possvel de acordo com a base que
montamos, da forma como dispomos os dados uns em relao
aos outros. O sistema de busca varia de software para software,
mas ele ser mais ou menos eficaz de acordo com a estrutura de

19
VOVELLE, Michel, Ideologias e mentalidades, So Paulo: Brasiliense, 1987.
[30]

campos que criamos para acolher os dados. Da mesma forma,


conveniente pensar na longevidade da nossa base. Para alm de
usar sistemas que sejam fceis de converter para formatos
futuros, fazendo essa migrao de tempos em tempos, j que a
rpida obsolescncia algo comum no universo digital,
precisamos pensar em bases que atendam a mais de uma
pesquisa ou que estejam preparadas para pesquisas futuras. Os
debates sobre a reusability, ou reusabilidade, numa
desaconselhada traduo para o portugus, so bastante
comuns e ainda no bem resolvidos. Contudo, manter o foco
20

na estrutura da fonte ainda a sada mais conveniente. E isso


requer alguma erudio, tcnica famosa no Sculo XIX e que
ainda tem sua importncia na programao do Sculo XXI.

20
SCHRER, Kevin, Historical demography, social structure and the computer,
in: DENLEY, Peter; HOPKIN, Deian (Orgs.), History and Computing,
Manchester: Manchester University Press, 1987; THALLER, Manfred, Methods
and techniques of historical computation, in: DENLEY, Peter; HOPKIN, Deian
(Orgs.), History and Computing, Manchester: Manchester University Press,
1987.
[31]

Em ombros de gigantes

Fazer bases de dados em histria tem sua prpria


histria. E ela no pequena. Vamos apresentar um
levantamento seletivo de experincias com esta perspectiva. Ele
no apresenta todas as experincias com bases, que foram
centenas no campo da histria, mas traz algumas que podem
ajudar a pensar problemas crnicos deste tipo de abordagem.
Muitas das questes que nos colocamos hoje j foram muito
discutidas antes, por grandes nomes da historiografia. Vamos
conhecer suas experincias e aproveitar a viagem para
apresentar alguns problemas importantes no desenvolvimento
das bases de dados.

A experincia do Padre Busa, em 1949

Quando em 1946 o padre jesuta italiano Roberto


Busa acabou sua tese sobre o conceito de presena em S.
Toms de Aquino, ele se deu conta que as expresses
geralmente tomadas na obra do santo, praesens e
praesentia, no eram as melhores para o seu estudo. Aquele
conceito se manifestava melhor na forma da partcula in, que
nunca fora organizada nos ndices de que dispunha para o
estudo. Busa no se acovardou e comeou um lento trabalho de
organizao dos textos tomsticos em fichas de frases e de
palavras. Neste momento surgiu a ideia de mecanizar o
trabalho. Anos depois, em 1949, em uma viagem aos Estados
Unidos, ele investigou as possibilidades existentes em dezenas
de universidades, encontrando dilogo junto IBM. Como ele
mesmo conta, a primeira resposta foi negativa: no seria
possvel fazer um ndice daquele porte com os equipamentos da
IBM. Diante da negativa, Busa teria invocado o prprio slogan da
companhia na poca: The difficult we do right away; the
impossible takes a little longer (O difcil ns fazemos agora; o
[32]

impossvel demora um pouco mais). Ganhou o apoio da IBM,


mesmo sem ter dinheiro.
21

Toda a preocupao de Busa, naquele momento,


estava no processamento da informao e no nas formas de
estocagem dos dados. A forma de fazer isso j estava definida
de antemo e seguia os mesmos pressupostos usados por ele na
confeco de fichas manuais, que continham palavras, frases e
suas localizaes nos textos tomistas. A palavra database (base
de dados) no aparece no seu texto, ainda que a expresso data
bank (banco de dados) seja utilizada uma nica vez, justamente
quando ele narra as dvidas que surgiram no momento de
publicar os resultados, se seriam publicados em um livro, na
forma de um enorme catlogo, ou se somente seria oferecido o
banco gerado no processo. A opo final foi pela publicao de
quinhentos exemplares de um grande catlogo, possvel graas
ao uso da linguagem binria em cartes e fitas magnticas.
A primeira questo que me parece pertinente com
este caso a forma com Busa criou uma demanda de pesquisa e
foi em busca da tcnica para solucion-la. E mesmo uma sada
cara e que levaria anos (neste caso, 30 anos), envolvendo o
treinamento de dezenas de ajudantes no processamento dos
cartes perfurados e fitas, foi pacientemente aceita tendo em
vista o ganho maior ao longo prazo. Esta a segunda concluso
que podemos tirar desta empreitada: o custo de
desenvolvimento e abastecimento de bancos de dados parece
alto, e certamente . Contudo, a capacidade de recuperar os
registros de forma automtica, rpida e fcil aps a concluso do
trabalho bastante compensadora. Os materiais organizados por
Busa ficaram disponveis para os pesquisadores da obra de Santo
Toms, que poderiam agora, com qualquer problema de

21
BUSA, Roberto, The Annals of Humanities Computing: The Index
Thomisticus, Computers and the Humanities, v. 14, p. 8390, 1980.
[33]

pesquisa, atingir seus objetivos com grande velocidade.


22

Por fim, temos o ausente presente, o conceito de


banco de dados, no apresentado por Busa em seu texto por ser
demasiado evidente para quem passou dcadas criando um.
Justamente naquilo que o projeto de Busa tinha de melhor:
armazenar conhecimento de modo organizado, de modo a
permitir rpida consulta posterior. Sendo assim, podemos definir
um banco de dados como um lugar onde podemos estocar a
integralidade das informaes relativas a um assunto ,
23

entendendo que este ltimo pode ser um tema ou um problema


de pesquisa. Outros acrescentariam que as informaes de um
database deveriam estar estruturadas e interligadas entre si a
partir de um modelo lgico especfico. Enfim, podemos resumir
dizendo tratar-se de uma coleo organizada de dados. Toda
24

esta discusso, contudo, passava longe da cabea de Busa e s


se tornou central a partir dos anos 1970. At ento, a grande
promessa da informtica no estava no armazenamento, mas no
seu grande potencial de processamento das informaes. Por
outro lado, um data bank seria o conjunto dos cartes,
simplesmente.

O Colquio da cole Normale Suprieure de Saint-Cloud,


de 1965

Em 1965 um grupo de historiadores tambm

22
Disponvel na web no endereo: Index Thomisticus, disponvel em:
<http://www.corpusthomisticum.org/it/index.age>, acesso em: 27 set. 2013.
23
Base de donnes - Wikipdia, disponvel em:
<http://fr.wikipedia.org/wiki/Base_de_donn%C3%A9es>, acesso em:
27 set. 2013.
24
Database - Wikipedia, disponvel em:
<http://it.wikipedia.org/wiki/Database>, acesso em: 27 set. 2013; Database -
Wikipedia, the free encyclopedia, disponvel em:
<http://en.wikipedia.org/wiki/Database>, acesso em: 27 set. 2013.
[34]

deixava registrado seu debate sobre o uso de mquinas IBM e


Bull. No se tratava de um debate tcnico, ainda que estas
questes estivessem sendo discutidas. Foi durante um colquio
realizado na cole Normale Suprieure de Saint-Cloud, em maio
de 1965. O evento reunia alguns dos nomes mais expressivos da
historiografia francesa de ento, como Ernest Labrousse e
Adeline Daumard. Ainda estvamos no tempo do carto
perfurado e das fitas magnticas, e estes foram alguns dos
pontos tratados na apresentao de Robert Faure, Machines et
programmes. Quelques vues sur l'utilisation des machines
traiter l'information en histoire sociale.25 A interveno de Faure
indica qual era o pensamento da poca: a automatizao das
fontes, ou seja, a passagens dos dados dos documentos
histricos para cartes ou fitas magnticas, que seria possvel
atravs do uso de codificaes bem feitas, a partir de um
vocabulrio ou thesaurus.
Apesar do tom predominantemente tcnico da
apresentao de Faure, bem como do debate subsequente ,
26

entre cartes perfurados e fitas magnticas, ali j estavam


colocadas algumas questes importantes do ponto de vista do
historiador e que tem relao direta com a mesma questo
tcnica. Em primeiro lugar, o uso de um vocabulrio um
elemento que vai seguir atual para a construo de bancos de
dados. Hoje os programadores chamam isso de Dicionrio de
dados. Veremos sobre isso mais adiante, no h pressa.
Outro ponto, este ainda mais fundamental,
introduzido na apresentao de Faure e discutido com maior

25
FAURE, Robert, Machines et programmes. Quelques vues sur lutilisation des
machines traiter linformation en histoire sociale, in: Lhistoire sociale:
sources et mthodes, Paris: Presses Universitaires de France, 1967; FAURE,
Robert, Mquinas e programas. Pontos de vista sobre a utilizao das
mquinas destinadas a elaborar a informao em histria social, in: A Histria
Social: problemas, fontes e mtodos, Lisboa: Edies Cosmos, 1973.
26
Os debates e comentrios posteriores s apresentaes foram todos
publicados na verso original francesa, bem como na edio lusa de 1973.
[35]

profundidade em outra comunicao, de Jacques Dupaquier: o


problema da classificao e consequente uso de codificaes.
Faure ingenuamente acreditava na possibilidade de uma
codificao perfeita, que mantivesse as caractersticas da fonte.
Contudo, um dos comentaristas, Claude Mazauric, destacava
que:

...a determinao do cdigo a questo mais delicada


para o historiador [...] pois de acordo com as datas, de
acordo com as pocas, com os tipos de documentos, as
27
informaes no so equivalentes.

Dupaquier, neste mesmo evento, apresenta o texto


Problmes de la codification socio-professionelle.28 Sua
apresentao volta ao tema das classificaes, mas de modo
sutil. no comentrio de Adeline Daumard que o tema ressurge
de modo expressivo. Daumard respondia aos crticos de seu
trabalho sobre as classificaes scio-profissionais, que era
acusado de estabelecer uma grade a priori . Concordando com
seus crticos, ela dizia que

...estabelecer esta classificao, estabelecer claramente


uma hierarquia, quase, no fundo, resolver o problema.

Tratava-se de um problema clssico em histria. Ao


propor uma pergunta, estamos enquadrando agentes e
processos dentro de certos parmetros que nos parecem certos,
mas ao chegar ao final da pesquisa, descobrimos os limites de
nossos conceitos:

27
Mazauric, em comentrio ao texto de FAURE, Machines et programmes.
Quelques vues sur lutilisation des machines traiter linformation en histoire
sociale(Traduo nossa. O original est em francs).
28
JACQUES DUPAQUIER, Problmes de la codification socio-professionelle, in:
Lhistoire sociale: sources et mthodes, Paris: Presses Universitaires de
France, 1967.
[36]

Se tivssemos um cdigo perfeito seria quase intil de


estudar o que quero, a burguesia, pois saberamos de
imediato o que ela . Diante deste paradoxo que est o
paradoxo da histria: precisamos de uma classificao
para poder trabalhar; mas ao mesmo tempo, precisamos
nos resguardar de prejulgar o resultado. Esta a razo
pela qual, na minha opinio, a soluo deve ser a busca
de modo emprico, a fim de traduzir a realidade.29

Neste debate, classificao e codificao eram


sinnimos. E codificar significava transferir as classificaes para
dentro da lgica da computao da poca. Codificar era a forma
disponvel de manifestar formalmente as concepes terico-
metodolgicas do pesquisador, atravs de procedimentos claros
e transparentes. A partir de um estudo preliminar, foi elaborada
uma lista de classificaes prprias para as sociedades francesas
do sculo XVIII, XIX e XX, dividindo as pessoas entre agrupaes
profissionais, de renda e de hierarquia social.
Em 1962, Daumard publicou um artigo com seu
projeto de classificao scio-profissional. Era uma proposta
30

de concepo, uma forma de entender a hierarquia social


naquela sociedade. Podemos dizer que tal texto correspondia ao
que os programadores chamam hoje de Modelo conceitual.
Era isso que fazia Daumard ao criar uma lista de
identificadores possveis para o universo que estudava. E isso
no era um privilgio do tipo de histria que ela fazia, prprio
do trabalho do historiador. Estamos sempre escolhendo palavras
que identificam e caracterizam nossos objetos. Um banco de
dados exige isso na hora de seu desenvolvimento. A

29
Ibid.
30
ADELINE DAUMARD, Une rfrence pour ltude des socites urbaines en
France aux XVIIIe et XIXe sicles projet de code socio-professionnel, Revue
dHistoire Moderne et contemporaine, v. X, p. 185210, 1963; ADELINE
DAUMARD, Structures sociales et classement socio-professionnel. Lapport des
archives notariales au XVIIIe et au XIXe sicle., Revue Historique, v. 86,
n. CCXXVII, 1962.
[37]

complexidade do mundo social ser sempre maior que nossa


capacidade de compreend-la. Ou melhor, compreender
demanda simplificao. Resta-nos simplificar com a maior
complexidade possvel. E, para isso, devemos estar atentos no
desenvolvimento destes modelos conceituais. A mquina no vai
entender coisas como meu agentes se comportam de um modo
difcil de entender. preciso incluir esta complexidade no
modelo, de modo claro.

Lawrence Stone, no incio dos anos 1970

Vejamos agora um diagnstico, feito em 1971, por


Lawrence Stone, em seu clebre Prosopography, publicado
naquele inverno na revista Daedalus. Em um texto direto, ele
apresentava a metodologia que havia consagrado seu clssico
livro The Crisis of the Aristocracy. O uso do computador era
31

ainda considerado uma novidade, uma vez que os


historiadores...

lenta e timidamente comeam a explorar as


potencialidades da nova ferramenta tecnolgica, eles
comeam a perceber sua quase ilimitada capacidade de
lidar precisamente com o tipo de material que a
prosopografia apura.32

Stone nos apresenta o cenrio do uso destes


equipamentos no meio acadmico anglo-saxo da poca. Apesar
de considerar a Inglaterra e os Estados Unidos como o primeiro
e o segundo centros de pesquisa em histria do mundo, ele
admite que seus colegas americanos e franceses estavam na
frente no mundo da informtica:

31
STONE, Lawrence, The Crisis of the Aristocracy, 1558-1641, Oxford: Oxford
University Press, 1965.
32
STONE, Lawrence, Prosopografia, Revista de Sociologia e Poltica,
v. 19, n. 39, p. 115137, 2011.
[38]

...h fortes traos nacionais para essa diviso de


perspectivas - pois os estadunidenses e os franceses tm
muito mais acesso a e confiana nos computadores que
seus colegas ingleses -, fortes traos culturais - com
ameaas de uma nova guerra entre os antigos e os
modernos, entre as humanidades e as cincias...33

Havia motivos para tanto receio. O prprio Stone


apontava alguns dos problemas advindos com o uso do
computador. Ao comentar uma possvel tendncia de separao
entre a prosopografia das massas (foco nos grupos) com a das
elites (foco nos grandes homens), ele destacava o papel do
computador neste perigo:

O perigo foi bastante aumentado pelo advento do


computador, que foi adotado pelos pesquisadores mais
estatisticamente orientados com todo o entusiasmo
indiscriminado dos ninfomanacos e rejeitado pelos menos
cientficos, em parte devido a melindres intelectuais, em
parte devido a uma complacncia ignorante dos prazeres
que esto perdendo. 34

O uso de grandes computadores ainda era privilgio


dos cientistas polticos, dentro das humanidades. Naquele
contexto, eram os estudos de eleies uma das principais
aplicaes das novas tecnologias. Para Stone, o maior trunfo do
computador era...

A correlao de numerosas variveis afetando grandes


massas de dados , reunidas em uma base uniforme,
precisamente o que o computador pode fazer melhor;
tambm o que h de mais laborioso e, em vrios casos,
virtualmente impossvel de trabalhar sem auxlios
eletrnicos, mesmo para os historiadores com orientao
mais matemtica. doloroso admitir que o advento de
um aparato tcnico poderia ditar o tipo de questes
histricas formuladas e os mtodos utilizados para

33
Ibid.
34
Ibid.
[39]
35
solucion-los

Mas Stone era otimista ao considerar que:

A disponibilidade do computador crescentemente seduzir


os historiadores a concentrar suas energias nos
problemas que podem ser solucionados pela
quantificao, problemas que s vezes - mas de maneira
nenhuma sempre - so os mais importantes ou
interessantes.36

Tal como para Busa e Faure, era o processamento


de grandes quantidades de registros que importava. Ainda no
estava claro o uso de bancos de dados que permitissem
consultas sistemticas. Mas algo mais fica sugerido no texto de
Stone. a demanda por materiais uniformes. Tanto Faure
como Busa esto, o tempo todo, pensando em processar uma
nica fonte. Para Busa, o texto de Santo Toms, para Faure, as
fontes devem ser transferidas para fitas magnticas. No caso de
Stone, parece haver espao para combinar dados de diferentes
origens dentro de bases uniformes.

Por outro lado, ele retoma o debate sobre as


classificaes, reforando aquilo que Daumard e Dupaquier j
salientavam. Stone falava dos erros frequentes nos estudos
prosopogrficos, dando nfase aos erros nas classificaes dos
contedos.

Classificaes significativas so essenciais para o sucesso


de qualquer pesquisa, mas infelizmente para o historiador
cada indivduo desempenha muitos papis, alguns dos
quais esto em conflito com outros. 37

Mas o problema no estava na natureza dos

35
Ibid.
36
Ibid.
37
Ibid.
[40]

agentes histricos, mas na mo dos historiadores:

...se uma subdiviso que depois se revela de importncia


crtica no for notada a tempo, usualmente tarde
demais para voltar e realizar todo o trabalho de novo -
uma dificuldade que particularmente aguda em
pesquisas auxiliadas por computadores, pois os cdigos
determinam as questes que podem ser depois
formuladas.38

Com isso tornamos ao problema apresentado por


Daumard, alguns anos antes. Preciso de uma boa classificao
para conhecer o passado e preciso conhecer o passado para ter
uma boa classificao. No entanto, o conhecimento prvio do
passado pode comprometer os resultados da investigao, uma
vez que aplico aos dados o pr-conceito que j tinha, sem
atentar para elementos novos surgidos no andar da pesquisa.
Para isso, h necessidade de repensar as classificaes todo o
tempo. E este problema pode ser complexo, como pensava
Daumard, ou tratar-se de uma escolha estpida, como parece
prever Stone, que j prope fazer tudo novamente. A
classificao no apenas uma pr-explicao como ela tambm
limita as perguntas possveis para os dados processados. Neste
sentido, o dano causado pelo processamento veloz dos
computadores pode alertar o historiador para a importncia de
pensar sobre suas classificaes.

Por fim, parece interessante notar como Stone, j


naquela poca identificava uma postura que parece ter sido
hegemnica entre os historiadores nos ltimos 40 anos, ao tratar
do advento do computador na pesquisa em histria:

...seria adotar a postura do avestruz fingir que isso no


est acontecendo agora e que no acontecer em uma

38
Ibid.
[41]

escala ainda maior nos anos vindouros39

E os anos vindouros prometiam muito.

O primeiro Manual de Computao para historiadores

Em 1971, o historiador Edward Shorter lanava The


historian and the Computer. A practical guide.40 Era a primeira
vez que surgia um manual voltado diretamente para o pblico da
disciplina. Seu foco principal era ensinar os historiadores
interessados em estudos quantitativos como preparar sua
pesquisa para um bom processamento com o uso de cartes
perfurados. A tarefa era fcil: aprender a usar um IBM 360 seria
to simples quanto entender o funcionamento do motor de um
automvel! Aps algumas pginas sem conseguir explicar o
funcionamento do computador, mas decifrando os assustadores
nomes das partes que o compunham, ele enfim nos fala que no
fundamental entender o funcionamento completo da mquina:
bastava o mnimo para perder o medo.

Shorter foi audaz e pioneiro, mas criou um livro


absolutamente datado. Apesar de ter servido por
aproximadamente dez anos, sua obra ficou muito presa
tecnologia disponvel nos anos 1960 e 70, como os lendrios
softwares Fortran e Cobol (que ainda so usados hoje, mas no
por historiadores). Mas no podemos compreender Shorter como
algum fora de seu tempo. Todo o contrrio. No mesmo ano em
que era lanado The historian and the computer, surgia a revista
Computers and medieval data processing uma publicao
canadense voltada para a informatizao dos estudos sobre
Idade Mdia. A publicao no trazia artigos, mas notcias sobre

39
Ibid.
40
SHORTER, Edward, The historian and the Computer. A practical guide, New
Jersey: Prentice-Hall, 1971.
[42]

publicaes, projetos e outras informaes interessantes para o


medievalista moderno.

Ao longo de sua existncia (durou entre 1971 e


1987), Computers trazia em cada edio uma lista dos projetos
sobre histria medieval que lanavam mo da informtica. Ao
todo, foram mencionados 354 projetos, a grande maioria nos
Estados Unidos, seguidos de Canad e Frana. Era um pblico
que compreendia muito bem as palavras de Shorter: os
equipamentos mais utilizados foram, de longe, os IBM 360 e
370, rodando, na maioria dos casos, o Fortran IV, alm de
outros como PL/1 e Snobol.41 O foco temtico de Shorter,
contudo, era um tanto distante daqueles projetos da Computers
and medieval data processing. A maior parte daquelas
empreitadas visava o processamento de textos e sua lematizao
automtica. Shorter estava dirigido para os estudos
quantitativos, dentro do mesmo contexto que trazia os
computadores como ferramentas incontornveis.

Por outro lado, seu objetivo central domesticar


aquilo que considerava o aparente mistrio das mquinas.
Buscando a vulgarizao e a ruptura com a postura do avestruz,
Shorter ficou mais prximo do entusiasmo indiscriminado dos
ninfomanacos, como dizia Stone.

Reconstructing historical Communities: um projeto


pioneiro

Em 1979, Alan Marcfarlane publicava, em


colaborao com Charles Jardine, um breve texto no 7

41
UNIVERSIT DE MONTRAL INSTITUT DTUDES MDIVALES, Computers
and Medieval Data Processing: Informatique Et Etudes Medievales, [s.l.]:
Universit de Montreal, Institut dtudes medievales., 1971.
[43]

Congresso Internacional de Histria Econmica. Apesar de


42

breve, o texto continha a essncia das reflexes iniciadas em


1972, quando se iniciara a aventura de Macfarlane e Sarah
Harrison na tentativa de informatizar fontes para o estudo de
histria local na Inglaterra. O resultado da pesquisa tornou-se
43

livro um pouco antes, com o nome de Reconstructing historical


Communities.44 Destaco isso tudo, pois me parece que esta
comunicao trazia elementos realmente inovadores para aquele
momento e que so questes-chave ainda hoje.

Jardine e Macfarlane pareciam extremamente


insatisfeitos com o que a tecnologia oferecia naquele momento.
Os programas no se adequavam s necessidades de pesquisa
do grupo e por vrias razes. A primeira era conceitual: os
programas de gerenciamento de bancos de dados disponveis na
poca eram problem-oriented (orientados a partir de um
problema, algo que tambm se pode chamar de method-
oriented, orientado pelo mtodo) e no pela fonte. A
programao dava conta de tarefas a cumprir e no havia
condies para, por exemplo, aplicar as proposies
metodolgicas de Louis Henry e Wrigley, no que diz respeito,
respectivamente, ao chamado mtodo de reconstituio de
famlias e aos Record-linkage methods. Isso se dava pelo fato de
que estas metodologias empregavam o uso de qualidades
diferentes de dados, a partir de fontes, de modo relacional.

Para ilustrar o tamanho do problema, ele


apresentou um exemplo usando o longevo pacote SPSS (ainda
hoje hegemnico nas Cincias Sociais). Seu argumento era de

42
MACFARLANE, Alan, Computer input of Historical Records for multi-source
record linkage, in: Proceedings of the Seventh International Economic History
Conference, Edinburgh: [s.n.], 1979.
43
MACFARLANE, Alan, The computer revolution and local history.
44
MACFARLANE, Alan, Reconstructing historical Communities, Cambridge:
Cambridge University Press, 1977.
[44]

que o programa era adequado para os surveys criados pelos


socilogos, mas identificou seu limite: se ele dispunha de uma
tabela com dados sobre a educao infantil e de outra com as
informaes sobre as famlias e quisesse cruzar os registros, no
seria possvel por conta do modelo conceitual prprio do pacote.
Alm disso, os pacotes da poca, incluindo SPSS, no dispunham
de elementos para incluir documentos inteiros, o que forava a
perda de dados involuntria, sem falar na incapacidade dos
aplicativos em processar contedos incertos, imprecisos ou
confusos, (fuzzy data).

na constatao dos limites do que era praticado


na poca por seus colegas que Macfarlane vai explorar dois
caminhos at ento desconhecidos pelos historiadores (e diria,
tambm, pelos programadores). O primeiro e mais importante
elemento a adoo de um modelo de dados sourced-oriented
(orientado pela fonte). Ao invs de extrair dos documentos os
dados necessrios para cumprir as exigncias do programa, em
campos possveis, a fonte seria colocada integralmente dentro do
programa, sem cortes. Isso seria possvel graas pr-edio
dos textos, j que no haveria utilidade em simplesmente ter os
textos integrais no computador. Seria importante cont-los,
cruz-los e aplicar outras metodologias de acordo com a
necessidade. Deste modo, se um registro de batismo dizia que
John, filho de Henry Abbott foi batizado em 5 de maio de 1607,
o documento seria assim transcrito para o entendimento da
mquina da seguinte maneira:

(P (N John) (K the son of (P (N Henry Abbott))) (E was


baptized. (D 5th May 1607)))
[45]

[explicao: P = person (pessoa); N = name (nome); K =


kinship (parentesco, indicando o tipo em linguagem natural, no
caso, o ingls); E = event (evento); D = date (data)).

Com o uso destes cdigos e parnteses, um


historiador explicaria mquina o significado de cada coisa:
datas, nomes, relacionamentos, etc. Demandava algo importante
e vlido, com debate, at os dias atuais: a normatizao de
nomes e a atualizao da lngua. No caso, inclusive textos em
latim foram traduzidos para tornar o clculo possvel. O uso do
recurso de pr-edio foi adotado, pouco tempo depois, no
desenvolvimento do kleio, por Manfred Thaller, sobre o qual
falaremos mais adiante. Recentemente esta prtica tornou-se
45

modelo nas linguagens da internet, com a chamada web


semntica, onde as palavras em um site no so mais
amontoados de letras organizados pelo formato (texto grande ou
pequeno, com negrito ou em itlico, etc). semelhante ao que
se utiliza com a linguagem XML, para dar um exemplo disponvel
na internet.

Alm da programao orientada pela fonte histrica


estruturada de modo legvel pelo computador, Macfarlane e
Jardine foram pioneiros no uso de uma tecnologia ainda muito
pouco conhecida na poca: o modelo relacional de dados, hoje
hegemnico a ponto de ser tomado quase como norma. Na
poca, utilizaram um manual sobre databases feito por C. J.
Date, famoso no apenas pela didtica na explicao dos
recursos tcnicos, mas igualmente por ter pertencido ao grupo
que criou, dentro da IBM, a linguagem SQL. O uso desta
tecnologia tornava possvel cruzar dados de diferentes tabelas,
que conteriam informaes de fontes diversas, as quais
permitiriam o emprego de anlises como as de Henry e Wrigley.

45
ROWLAND, Robert, L`informatica e il mestiere dello storico, Quaderni
Storici, v. 78, n. 03, p. 693 720, 1991.
[46]

Manfred Thaller e o kleio

No final dos anos 1970 a equipe de Manfred Thaller,


no Max Plank Institute comeou a desenvolver uma ferramenta
para o processamento de dados em histria. Chama-se kleio. Os
primeiros resultados s comearam a surgir em meados da
dcada seguinte. O kleio era um programa feito sob medida para
a pesquisa histrica e orientado pela fonte: implicava na
transcrio controlada da fonte para uma linguagem
compreensvel pelo computador, atribuindo cdigos pr-definidos
ao texto. Em boa medida, ele seguia de perto as formulaes de
Macfarlane e h quem associe as duas iniciativas.
46

O sistema de Thaller, influenciado ou no por


Macfarlane, previa a criao de um programa que poderia ser
instalado em outras mquinas, coisa que no fora considerada
em Cambridge. Com o tempo, o kleio passou de uma linguagem
que tratava dados de fontes para uma historical Workstation, na
qual qualquer historiador, sem grande conhecimento de
informtica, poderia trabalhar sem dependncia de um
programador, o que geraria uma grande economia no de tempo
na pesquisa. A ferramenta dispunha de conexes com outros
sistemas de anlise, como o SPSS. Neste sentido, kleio sempre
foi um organizador de informao, mais do que um software
completo, prximo de uma base de dados de historiador.

O trabalho de abastecimento era feito seguindo a


ordem da fonte e no segundo demandas de formulrios pr-
definidos. Neste sentido, havia igualmente uma economia de
trabalho no preenchimento das fontes. O grande mrito de kleio
era exatamente o fato de ser orientado pela fonte, a ponto de
no interferir, ou de interferir muito pouco, na estrutura original
da fonte. Segundo Thaller:

46
Ibid.
[47]

Dados so administrados na forma de colees de


pedaos de texto, sem qualquer suposio sobre seu
significado. Todas as suposies (o status social derivado
de uma dada ocupao; o significado cronolgico da data
apontada para dias diferentes no calendrio de vrias
dioceses; a taxa de cmbio de duas moedas diferentes)
so geridos em tabelas completamente independentes
47
dos dados originais.

Kleio foi um dos primeiros programas (e talvez um


dos nicos) a criar sistema de identificao de dados incertos e
imprecisos (fuzzy). Fora desenvolvida uma codificao especial
para indicar incertezas e imprecises, o que dava uma grande
vantagem comparativa entre este programa e os softwares
comerciais da poca, contra os quais Thaller se manifestava
preocupado, precisamente pela falta deste tipo de recurso.
48

Neste sentido, novamente h uma proximidade com Macfarlane.

O sistema Fichoz

Em um artigo de 2004, Jean Pierre Dedieu


apresentava um banco de dados que j tinha alguns anos de
existncia: o sistema Fichoz. Trata-se de uma base centrada no
49

mtodo, na qual h uma metodologia de trabalho prvia ao


tratamento dos dados. A ideia principal a de que possvel
decompor a vida dos agentes histricos em eventos. Neste
sentido, para cada ato seria criado um registro com informaes

47
THALLER, Methods and techniques of historical computation.
48
THOMAS, William, Computing and the Historical Imagination, in:
SCHREIBMAN, Susan; SIEMENS, Ray; UNSWORTH, John (Orgs.), A Companion
to Digital Humanities, Oxford: Blackwell, 2004.
49
DEDIEU, Jean Pierre, Les grandes bases de donnes: une nouvelle approche
de lhistoire sociale. Le systme Fichoz, Revista da Facultade de Letras-
Histria, v. 05, 2004.
[48]

como a data, o local, a interao com outro agente e um campo


de detalhamento. A interao e a anlise detalhada de cada ato
so os pontos fortes desta forma de coletar e organizar os
dados. Deste modo, seriam possveis buscas por indivduos
(biografias), por grupos de indivduos (prosopografias), por
pessoas conectadas com outras por algum motivo (anlise de
redes sociais) e por sries, de acordo com a necessidade. Isso
seria possvel, pois cada registro colocaria dois ou mais agentes
histricos em relao uns com os outros:

A nova concepo do trabalho em histria social nos d a


soluo. preciso tratar cada dado como um evento
dentro da vida de um ator. A documentao deve ser lida
como um conjunto de sequencias que descrevem as
aes efetuadas ou sofridas por um ator individual. Cada
uma destas aes deve corresponder a um registro dentro
da base de dados contendo todos os elementos
necessrios a sua interpretao: natureza e descrio da
ao, identificao do ator, data, referncia, elementos de
contexto, etc. A converso dos documentos em atos da
responsabilidade do pesquisador que o faz a partir de sua
50
margem de interpretao.

O trao marcante deste sistema sua versatilidade.


As buscas e cruzamentos de informao seriam feitas no mesmo
formulrio criado para o abastecimento, permitindo escolher
muitos campos simultaneamente, inclusive de tabelas
relacionadas. Isso era relativamente fcil graas ao software
utilizado, o Filemaker. Porm, o grande mrito da base est na
sua estrutura: ela ao mesmo tempo robusta e verstil, ao
utilizar poucos campos e tirar proveito da possibilidade, ilimitada,
em qualquer sistema, de criar registros. E como cada ato seria
um registro, bastaria gerar tantos registros quantos fossem
necessrios para desmontar um processo histrico, reagrupando

50
Ibid.(Traduo nossa. O original est em francs).
[49]

o mesmo por pessoas, datas, localidades ou metodologias. Esta


estrutura permitia receber dados de qualquer tipo de fonte:

Tal esquema se prova extraordinariamente robusto e


permite de cobrir o conjunto dos casos possveis,
qualquer que seja a fonte crnica, arquivos
administrativos ou judicirios, correspondncias, atos
notariais, registros paroquiais, literatura de segunda mo
ou outro. Isso permite claramente uma contagem
extremamente veloz dos instrumentos pblicos registros
paroquiais, estado civil, atos notariais que so em
ltima anlise instrumentos para criar relaes
interindividuais. E posiciona de maneira imediata o
assunto dentro do contexto da carreira de cada um dos
51
atores.

A base Fichoz ainda utilizada por um grupo de


pesquisadores e para diversas pesquisas.

* * *

A proposta neste captulo no foi a de esgotar as


iniciativas de uso de bancos de dados dentro da produo do
conhecimento histrico, assunto para o qual seria necessria
uma enciclopdia. Mas vimos, com a ajuda de algumas
experincias pontuais, alguns temas relevantes que sero
retomados ao longo das prximas pginas. E, mais importante,
vimos que o uso do computador em histria tem uma longa data
e que no h motivo para reinventar a roda.

51
Ibid.
[50]

Algumas questes prprias da


informtica

Quando se fala de questes tcnicas os


historiadores costumam correr para as montanhas. difcil saber
os motivos da longeva averso de nossos colegas ao universo da
informtica. Alguns apresentam justificativas epistemolgicas,
outros optam por expor seu desprezo pela tcnica (a respeito de
que j discutimos antes) e muitos se consideram incapazes de
aprender. Mas acredito que quem aprendeu a usar um aparelho
celular ou o email poder facilmente aprender alguns dos
elementos bsicos que caracterizam as bases de dados.

Veremos que no to complicado. O problema


grande devido falta de didtica ou de pacincia dos
programadores. Tentaremos ser didticos aqui. Tudo bastante
lgico. Se formos capazes de discutir sobre as representaes do
poder no Antigo Regime, seremos capazes de aprender alguns
procedimentos da informtica.

Estrutura de dados

A primeira coisa que importa saber quais so os


elementos que compem uma base de dados, sua estrutura.
bem mais simples do que Althusser! Uma base um conjunto de
TABELAS articuladas. Alguns usam a palavra entidade para
designar as tabelas, um nome um tanto sobrenatural. Essas
tabelas podem conter diferentes tipos de informao: sobre
pessoas, casas, terras, por exemplo, endereos, etc. Podemos
criar apenas uma tabela, se for o caso. Sobre essa deciso, que
[51]

envolve predominantemente problemas prprios do


conhecimento histrico, veremos adiante, quando lermos sobre a
montagem de bases. Continuemos com as nossas tabelas.

Figura 5 - Ilustra a estrutura de um banco de dados

Uma tabela formada por campos e registros


(tambm conhecidos como "colunas" e "linhas"). Nas colunas,
indicam-se os campos do banco de dados (tambm chamados
por alguns de atributos), como geralmente aparece em
formulrios, por exemplo, nome, endereo e estado civil. As
linhas correspondem aos registros. No caso de uma tabela feita
para organizar e gerenciar uma turma escolar, a tabela seria
composta por campos como nome, matrcula e idade, por
exemplo. Os registros seriam tantos quantos fossem os alunos
matriculados na turma.

Figura 6 - Modelo de tabela Figura 7 - Modelo de tabela (como em um


(conceitual) formulrio)

Como pudemos ver, algo bem mais simples mais


que Lvi-Strauss. Agora, que j dominamos essa informao,
[52]

podemos avanar um pouco mais. Cada um dos campos (ou


atributos, a mesma coisa) da nossa base deve ter sua prpria
personalidade, ou seja, devem ser qualificados. Ele pode ser um
campo de texto (curto ou longo), de nmero, de data, de
imagem, de clculo, entre outras possibilidades. Devo prever
que tipo de informao vai entrar ali. Cada software utiliza suas
tipologias, mas texto, nmero e data sempre aparecem e so os
mais importantes para nossos bancos. Alm de definir que tipo
de campo ser, podemos tambm definir o tamanho mximo
desse campo, quantas casas ele ter. Por exemplo, um campo
como nome certamente ser do tipo texto e seria
recomendvel permitir at 150 caracteres para seu
preenchimento, ainda que possamos deixar esse campo com
tamanho ilimitado. Na maior parte das vezes, essa ltima deciso
incua. Mas, para as bases de dados online, costuma fazer a
diferena ter campos enxutos para acelerar as buscas.

Nada impede que escolhamos um campo de texto


ou de nmero para colocar datas, utilizando no preenchimento
o formato AAAA-MM-DD (ano-ms-dia, 1654-02-04). No
momento de colocar os registros em ordem, tendo como critrio
a cronologia, ser absolutamente fcil de obter resultados, pois
tanto para nmero quanto para texto o retorno ser igual, na
ordem. Se usarmos o formato DD-MM-AAAA (dia-ms-ano, 04-
02-1654, ou com barras no lugar do trao) s conseguiremos
ordenar pelo dia, depois, pelo ms, e, finalmente pelo ano.
Dessa forma, no ser respeitada a cronologia, mas somente o
dia do ms que corresponde ao registro, o que no costuma ser
til na maioria das pesquisas em Histria, ainda que possa ser
objeto de anlise (para acontecimentos com regularidade
mensal, como pagamento de aluguis no Sculo XX, por
exemplo). Uma deciso dessas, mal feita, gera problemas ao
longo de todo o trabalho. Para esse ltimo estudo, bastaria criar
outro campo chamado dia do ms, do tipo clculo, que
[53]

capturasse do campo data apenas os ltimos dois dgitos, que


corresponderiam ao dia (1678-12-03 = 03), desde que o dia
fosse sempre escrito com duas casas, mesmo para os primeiros
nove dias (01, 02, 03...), caso contrrio, o campo de clculo
tomaria o trao junto (1678-12-3 = -3), e nossa pesquisa
ficaria novamente comprometida.

H uma diferena grande entre o que fazem os


programadores e o que querem os historiadores. Os
programadores so formados dentro de uma lgica de resolver
problemas. Para os historiadores, isso parece timo, pois nosso
trabalho consiste em criar problemas. Aparentemente, o
casamento seria perfeito. Contudo, no essa a rotina destas
famlias/projetos de pesquisa. As bases de dados criadas pelos
programadores so sempre method-oriented, orientadas pelo
mtodo, pelo desafio a resolver, pelo plano de negcios do
cliente. Enquanto isso, os historiadores geralmente preferem
trabalhar com bases source-oriented, ou seja, aquelas cujas
fontes, as evidncias empricas, sejam o centro das atenes, de
tal maneira que a base fique o mais prximo possvel da fonte,
mas sem perder a capacidade de ser automatizada.52 Vimos isso
quando lemos sobre os modelos de Macfarlane e Thaller.
53

Esses historiadores resolveram o problema usando


uma linguagem de pr-edio das fontes, informando que
certos nmeros no eram apenas nmeros, mas datas, um
amontoado de letras era o nome de um agente histrico e outro
conjunto era o nome de uma instituio. Esse tipo de marcao

52
H tambm ocasies em que os historiadores no sabem o que querem,
mas quanto a isso no h como ajudar.
53
THALLER, Manfred, Can we afford to use the computer; can we afford not to
use it?, in: MILLET, Hlne (Org.), Informatique et prosopographie, [s.l.]:
CNRS, 1985; MACFARLANE, Computer input of Historical Records for multi-
source record linkage; THALLER, Methods and techniques of historical
computation.
[54]

ou rotulao segue um princpio semelhante ao que foi adotado,


recentemente, com a chamada web semntica, com a atribuio
de tags, rtulos, aos textos, de modo a indicar o que cada coisa
dentro do texto.

Outro problema frequente a constante


preocupao dos programadores com o tamanho das bases e
como devem ser feitas com o mnimo de texto. Para os
historiadores isso frustrante. No h, contudo, um lado certo.
Os programadores foram ensinados a enxugar as bases para
garantir a eficincia, enquanto os historiadores so formados
com uma preocupao de guardar grandes quantidades de texto
e seus metadados. Gostamos de guardar tudo, mas no adianta
guardar tudo fora de ordem, pois o mesmo que no guardar.
Ter e no encontrar como no ter.

Bases relacionais

Alan Macfarlane destacou a insuficincia dos


modelos de bases de dados disponveis naquele momento (como
o pacote SPSS) e chamou, pela primeira vez, entre os
historiadores, a ateno para os bancos de dados relacionais.
54

Segundo ele, seria o nico modo de testar os dados com duas


das metodologias que ele pretendia usar, o mtodo de
reconstituio de famlias, criado por Louis Henry nos anos 1950,
e os mtodos de record linkage, propostos por Wrigley poucos
anos antes. Ele tinha razo. Para realizar esse tipo de estudo de
modo eficiente e tendo em conta as caractersticas das fontes,
fundamental criar diferentes tabelas e associar seus dados de
modo organizado, a partir de certos elementos em comum como,
por exemplo, o nome (ou melhor, uma matrcula que identifique

54
MACFARLANE, Computer input of Historical Records for multi-source record
linkage; MACFARLANE, Reconstructing historical Communities.
[55]

univocamente a pessoa que portava aquele nome e que talvez


tenha um homnimo).

que, na fonte, alguns dados so nicos. O normal


para um registro de casamento no ocidente que haja um noivo
e uma noiva. No esto previstos outros cenrios (e, se surgir,
ser uma descoberta extraordinria). Podemos criar o campo
"noivo" e o "noiva". Contudo, o nmero de testemunhas do
casamento imprevisvel. comum que seja composto de duas
pessoas, porm, pode ter quatro. Como lidar com esses dados
que so sabidamente, imprevisveis? A mesma coisa ocorre ao
elaborar uma tabela para biografias. Temos apenas uma data de
batismo, apenas uma me biolgica. E como lidamos com os
dados que temos sobre as diferentes ocupaes exercidas por
um sujeito ao longo da vida? Se ele teve apenas um trabalho,
fcil. E se temos casos de gente que teve oito diferentes
profisses, algumas simultneas?

Um RELACIONAMENTO (nunca confundir com as


anlises de redes sociais) uma ligao entre duas tabelas,
como o prprio nome j indica. Podemos, por exemplo, ter uma
tabela com os nomes dos alunos matriculados, e outra, com as
notas que obtiveram nas avaliaes. As notas tm um formato, e
os alunos tm outro. So objetos com caractersticas diferentes,
mas relacionados no ao, pois os alunos tm as notas. Se as
duas tabelas apresentam o nmero de matrcula dos alunos,
podemos criar o relacionamento usando a matrcula como elo.
Desse modo, teremos as informaes das notas dentro da tabela
dos alunos matriculados, inclusive, as mdias.

Outro exemplo pode ilustrar melhor a utilidade dos


relacionamentos. Se tivermos uma lista de trabalhadores de uma
fbrica (com suas carteiras de trabalho) e uma lista de todos os
setores da empresa, que podem variar entre um e n (no
sabemos quantos departamentos a empresa pode ter), podemos
[56]

criar um relacionamento utilizando o nmero da carteira de


trabalho como elo. Esse relacionamento nos dir em quais
setores cada funcionrio trabalhou e poder indicar, at, o
perodo em que isso ocorreu. Podemos saber tambm que
funcionrios trabalharam em quais setores, adotando a
perspectiva oposta. Assim, podem existir vrios tipos de
relacionamentos, a saber:

Um para um, 1:1;


Um para vrios, 1:n (primeiro exemplo, pois um aluno pode
ter muitas notas);
Vrios para vrios, n:n (segundo exemplo, porque um
operrio pode trabalhar em vrios departamentos e um
departamento pode ter vrios empregados).

Chamamos isso de cardinalidade. Vejamos, abaixo,


algumas ilustraes para explicar bem mais isso tudo. Os
relacionamentos e a cardinalidade podem ser fundamentais
numa pesquisa em Histria, porquanto possvel colocar em
dilogo tabelas com informaes de natureza diferente (tipos
diferentes de fontes, por exemplo) que tenham algo em comum
(um mesmo personagem, uma mesma data, um mesmo lugar,
etc.).

Figura 8 - Exemplo de modelo de dados com relacionamento. A cardinalidade indica


que uma biblioteca pode ter vrios livros, neste modelo.
[57]

No modelo acima, h duas tabelas relacionadas,


atravs dos campos Nome e Biblioteca. Esses dois campos
dizem respeito mesma coisa, o nome de uma instituio
especfica, que abriga e organiza livros. E como 1:n (um para
muitos), podemos atribuir tantos livros para a nossa biblioteca
quantos forem necessrios. Vejamos abaixo como isso ficaria em
um formulrio de preenchimento, em branco, na primeira
imagem e com alguns dados na segunda:

Figura 9 - Exemplo de formulrio com Figura 10 - Exemplo de formulrio com


RELACIONAMENTO (sem dados) RELACIONAMENTO (com dados)

Como definimos um para muitos, podemos incluir


vrios livros dentro da tabela Bibliotecas, atravs do
relacionamento. Com isso, as caractersticas de cada tabela,
adequadas para coisas diferentes, so respeitadas, mas sem
perder a possibilidade de cruzar os dados. Em Histria, podemos
respeitar as caractersticas de cada fonte, sem perder a
possibilidade de cruz-las. Na construo de bases de dados em
Histria, podemos usar os relacionamentos de diversas maneiras.
Eles podem ser usados para formar hierarquias entre as
informaes, como no exemplo da biblioteca; para estabelecer
ligaes equilibradas entre informaes diferentes, entre
personagens, por amizade, ou lugares, por proximidade, para
dar um exemplo, e apenas para organizar informao, como no
caso dos alunos e das notas, pelo simples fato de serem
includos em tabelas diferentes.
[58]

Modelos conceituais, lgicos e fsicos

Continuamos com o vocabulrio dos programadores.


Vale a pena, pois desdobra em etapas o planejamento das
bases. Cada minuto gasto com planejamento, nesse mundo da
computao, uma economia de horas ao longo da pesquisa (ou
a perda de horas de correes e adaptaes). Planejar uma base
de dados criar modelos. No so os mesmos modelos que
criamos em Histria, mas devem estar diretamente associados,
como j vimos. E essa modelagem dos bancos de dados feita
em trs etapas: o modelo conceitual, o modelo lgico e o modelo
fsico. Essa forma de organizao j antiga na informtica e
conta j algumas dcadas de vida.

Modelo conceitual

Tudo comea com uma folha de papel onde vamos


anotar uma lista de desejos. A base deve tratar de tal assunto,
portanto, precisa ter informaes sobre x, y e z, campos
especficos para essas informaes e, talvez, algum
relacionamento. Tudo isso deve ser listado. O passo seguinte ,
em outra folha de papel (essa uma recomendao pessoal, d
mais liberdade) desenhar um quadrado (de bom tamanho) para
cada tabela, cujo interior contenha uma lista dos campos que
vo formar essa entidade. como se fosse um croquis da futura
base, feito por um arquiteto ou estilista. Nesse caso, nosso
croquis ser feio, quadrado e cheio de riscos. Mas ser
importante.

Bom mesmo seria fazer esse planejamento


discutindo com outros colegas, mas nem sempre o caso. Com
todo o esquema diante de nossos olhos, convm pensar
possibilidades e limites. Para isso, no caso do conhecimento
histrico, fundamental conhecer as fontes e seus limites e,
[59]

como salientaram Genet e Luzzati, ter erudio histrica para


fazer isso. Convm fazer um exerccio mental para checar a
55

viabilidade da base. O desenho abaixo ilustra esse esforo, sem


querer propor um modelo para processos-crime, pois seria bem
mais complexo. apenas uma ilustrao dessa etapa do
desenvolvimento.

Figura 11 - Ilustrao da etapa conhecida como "modelo conceitual".

55
LUZZATI, Michele, La reconstruction nominative et prosopographique de la
population dune ville mdivale: projet de constituition dune banque de
donnes pour lhistoire de Pise au XVe sicle., in: MILLET, Hlne (Org.),
Informatique et prosopographie, [s.l.]: CNRS, 1985; GENET, Histoire,
informatique, mesure.
[60]

Acusados e processos so objetos diferentes, com


naturezas diferentes e, consequentemente, com dados possveis
diversos. Por isso devem estar em tabelas diferentes, mas
relacionados. Testemunhas e juzes so seres humanos iguais
aos acusados, mas com caractersticas diferentes dentro de um
processo. Por essa razo, so separados em tabelas distintas,
com campos especficos para cada um. No se espera o
testemunho de um juiz, assim como no se espera saber a qual
tribunal pertencia o acusado.

Modelo lgico

O passo seguinte o modelo lgico. Talvez no seja


lgico cham-lo assim, mas o nome. Nesse momento, vamos
apenas aperfeioar nosso esquema. Dessa vez, vamos inserir
informaes detalhadas para cada um dos campos e em cada
uma das tabelas - de que tipo ser cada campo, com que
tamanho em nmero de caracteres (e ainda no vimos nada
sobre o visual que ter o formulrio de preenchimento e a
tabela, que ser assunto mais adiante).

Nessa fase tambm vamos indicar que campos vo


ser responsveis por criar relacionamentos com outras tabelas
e qual ser a cardinalidade desses relacionamentos, se um para
um, um para muitos ou muitos para muitos. Devemos tomar o
mesmo cuidado da etapa anterior, prevendo necessidades e
testando mentalmente nosso modelo com alguns casos das
nossas fontes. Vejamos novamente o exemplo da base para
estudar processos-crime, que teria agora a seguinte
configurao:
[61]

Figura 12 - Exemplo de Modelo Lgico

Temos o mesmo modelo anterior, mas agora mais


detalhado e claro, apontando quais os relacionamentos esto
previstos com o uso de setas.

Modelo fsico

O modelo fsico representa a base de dados j


montada, com todas as tabelas, campos e relacionamentos e
funcionando dentro de um disco rgido de computador,
fisicamente. a base pronta para usar, seguindo tudo o que foi
planejado. No h muito que dizer, em termos de informtica.
Mas h muito para ser dito no que toca Histria. Parece-me
importante, tendo pronto o nosso modelo fsico, gastar mais
algumas horas em planejamento. Importa tomar um conjunto de
[62]

fontes para testar o modelo. No preciso ter muitas, eu diria


que uma amostra de 1% dos casos, se forem milhares e longos,
j ajuda. Se forem milhares e curtos, eu recomendaria testar
com 3% dos casos. Se forem centenas e longos, recomendaria
5%, se forem curtos, 10%. Mas no tome esses valores como
receitas de bolo. Esses testes devem ajudar voc a deixar sua
base de dados flexvel na medida certa e no para criar
confuso.

Qual a ideia? de que, quando confrontamos


nossa massa documental com a base criada, mesmo tendo
pensando muito no assunto e conhecendo bem a documentao,
esse encontro certamente vai apontar problemas e limites da
nossa base. certo que esses problemas podem surgir quando
estamos no final do preenchimento. Esse um problema crnico
da pesquisa e do uso de bases de dados, segundo nos ensinou
Adeline Daumard. Mas podemos evitar alguns incmodos, mais
simples, antes de comear a preencher a base de modo
sistemtico. Feito esse teste, recomendvel descartar o que foi
preenchido, salvo se nenhum erro foi detectado (o que seria
muito estranho). A tarefa seguinte criar um pequeno manual
de preenchimento e um treinamento com os abastecedores, se
forem muitos. Treinar as pessoas e s depois descobrir que a
base precisar de mudanas seria uma grande perda de tempo e
trabalho. Melhor fazer as coisas na ordem.

Dicionrios de dados

O termo dicionrio de dados um conceito da


informtica utilizado com frequncia pelos programadores. Trata-
se de um relatrio, um documento no qual a base de dados
descrita de modo claro e sinttico. Ele pode ser feito num
documento de texto, numa planilha eletrnica, em outro banco
de dados ou numa folha de papel. Mas precisa ser til para
[63]

explicar como a base funciona para que qualquer pessoa possa


entend-la e ele deve informar quais so as tabelas que
compem a base e que campos compem cada tabela,
descrevendo os seguintes itens:

Domnio: se um campo de texto, nmero, data,


boleano, etc;
Tamanho: nmero de caracteres previstos;
Descrio: nota sobre detalhes do campo, se tem
algum formato especial, variveis prvias, etc.

O dicionrio de dados deve servir como uma


descrio completa do funcionamento da base, destacando como
so inseridos os dados e como sero extrados. Tendo em vista a
produo do conhecimento histrico, seria conveniente
especificar tambm detalhes sobre a origem dos dados, como
cada informao obtida na fonte e colocada dentro dos campos
ou, pelo menos, como isso deveria ser feito. O dicionrio pode
ser o resultado formal dos modelos, mas no a mesma coisa.
uma descrio desses modelos. Uma metabase!

Aspectos visuais sobre as bases

Uma base no precisa ser bonita, mas deve ser


visualmente clara. recomendvel que ela tenha algum
equilbrio esttico, pois vamos trabalhar muitas horas e dias com
ela, e isso pode afetar nossa viso e nosso humor, o que no
pouca coisa. No simples discutir sobre os aspectos visuais de
bases de dados sem fazer referncia a um programa especfico,
j que isso varia conforme o software. Em pacotes comerciais,
como Filemaker e Microsoft Access, essas opes so bastante
[64]

acessveis e o leque de cores, de formas, de contornos e de


outros detalhes muito grande. A situao diferente para
quem usa bases SQL. Ou o utilizador usa as formas normais da
maioria dos programas, geralmente muito simples, ou precisa
criar um formulrio em linguagem de programao (PHP, CSS)
que permite praticamente tudo, mas com um custo de tempo e
esforo enorme.

Mesmo com as dificuldades apontadas acima,


atrevo-me a apresentar algumas sugestes para quem vai criar
sua base, independentemente da plataforma escolhida. Vamos
comear com as diferentes formas de ver os dados, passando
para as cores, as formas e outros elementos.

Formas diferentes de visualizar dados

Ainda que isso varie de acordo com o programa


utilizado, muito comum diferenciarmos tabelas, formulrios e
listas. Ateno, caro leitor, para no ter dvidas! Tabela aqui
diferente do que usamos at agora. No sinnimo de
entidade, como aquele lugar onde guardamos contedos de
diferentes tipos atravs de campos. a imagem comum da
tabela, uma forma de ver dados em que se usam linhas e
colunas. Eles podem ter (e geralmente tem) relao direta com
aquela outra tabela - a das entidades. Mas pode NO ter.
Podemos criar uma tabela-visual para apresentar dados de
diferentes tabelas-entidades, usando um relacionamento. Por
isso, vou usar a expresso tabela-visual, como usarei
formulrio-visual e lista-visual, para que fique claro que estou
falando das formas de exibir os contedos na tela do
computador (ou na impressora), e no, o conjunto completo de
dados.
[65]

Figura 13 Exemplo de diferenciao entre tabelas "entidade" e tabelas


"visuais"

Na imagem acima vemos que foram usadas trs


diferentes tabelas-entidade, cada uma com seus dados, para
criar uma nica tabela-visual. Porm nem todos os dados de
cada tabela-entidade foram usados, apenas alguns. Isso mostra
a diferena entre as duas.

Se estivermos consultando uma base de dados,


geralmente o que vemos so os registros dispostos na forma de
uma tabela-visual ou de uma lista-visual. Eles podem mas no
precisam exibir todos os dados da tabela-entidade. Outros
podem ficar ocultos, disponveis somente quando observarmos a
ficha de um registro. Se estivermos abastecendo uma base com
dados, temos o cenrio oposto: geralmente comeamos com o
formulrio-visual em branco, preenchemos os campos e s ento
poderemos ver esse registro em uma tabela-visual. Usamos
esses recursos para facilitar nosso uso. Se todos os dados
aparecerem em todos os registros de uma tabela-visual, a
imagem ser catica e confusa, salvo se nosso banco tiver
pouqussimos campos, entre dois e dez, por exemplo, e nenhum
deles mais longo que 50 caracteres. Se algum for maior,
ocupar muito espao e ser visualmente condenvel.
[66]

Figura 14 - Exemplo de formulrio Figura 15 - Exemplo de tabela

Assim, podemos estabelecer esta regra: na tabela-


visual, exibimos apenas os dados que permitem identificar as
coisas e separar os registros entre si. Deixamos os detalhes para
os formulrios-visuais, que tambm so usados para o
preenchimento das fichas. Isso talvez no se aplique a tabelas-
visuais com menos de oito campos curtos. Nesse caso, talvez
seja mais fcil nem usar formulrios: a tabela j exibe tudo o
que importa. Se voc gosta de imprimir, lembre-se das florestas,
do lixo e das grandes corporaes por trs das poluentes
fbricas de celulose que destroem rios para clarear o papel. Se
ainda assim quiser imprimir, talvez o mais inteligente seja criar
listas-visuais, que apresentam poucos campos, apenas os
essenciais para alguma finalidade. Vimos, pois, que convm
elaborar tantos visuais quantos forem necessrios para facilitar a
consulta dos dados. Como a tabela-visual diferente da tabela-
entidade, poderemos ver seus dados de mltiplas maneiras. Essa
uma das grandes vantagens do modelo relacional.

Em alguns programas, as tabelas-visuais tm


contedos distribudos de modo mais complexo, de tal maneira
que possamos ter campos direita e esquerda de outros,
como j espervamos, mas tambm acima e abaixo de outros,
como se tivssemos andares de campos. Esse recurso pode ser
til em alguns visuais. Podemos, por exemplo, colocar os nomes
dos pais do noivo acima do campo noivo e os nomes dos pais
[67]

da noiva acima do campo noiva, em um registro que informa


casamentos. Tambm podemos ter um registro com trs
andares, de tal modo que tenhamos de cima para baixo, em
um registro de batismo, a data do batismo, a data do
nascimento e o nmero de dias entre a primeira e a segunda,
como se fosse uma subtrao matemtica mesmo, apresentada
com clareza. Se voc achar exagerado que as linhas de sua
tabela tenham andares, pode guardar essas funcionalidades
para os formulrios. Mas pode ser vantajoso.

Figura 16 - Exemplo de tabela-visual com "andares"

Cores

Mesmo que saibamos que o vermelho sempre


mais bonito do que o azul, parece-me conveniente escolher esta
ltima cor para o pano de fundo da base. Para ser mais preciso,
eu usaria um tom claro de azul, com a medida RGB
244,244,255.56 Essa cor tem algumas qualidades: quebra o

56
O sistema RGB indica a mistura de R (red, vermelho), G (green, verde) e B
(blue, azul) numa ordem que vai de 0 a 255. No caso, um 244, 244, 255, indica
um azul, j que o B tem o maior valor. O fato de todos estarem com valores
[68]

fundo branco, que pode ofuscar quem trabalha por muitas horas,
especialmente em monitores muito iluminados, mas no escura
o suficiente para atrapalhar a leitura. uma cor associada
tranquilidade, ao mar, vastido do cu, entre outras coisas que
voc no ver durante seu trabalho na base. Testei muito com
outras cores e no tive resultados melhores.

Convm usar as cores como aliadas na criao dos


visuais, tanto formulrios quanto tabelas. Se usarmos aquele
azul clarinho, que indiquei acima para uma tabela, devemos
intercalar as linhas das tabelas usando outra cor - eu diria o
branco - para facilitar a observao. Isso melhor do que usar
contornos, que poluem tanto quanto o excesso de campos
visveis. Da mesma forma, nos formulrios, convm usar
diferentes tons de azul, como aquele, e o mesmo branco para
certos campos. Isso ajuda a disciplinar o olho na tela, de tal
maneira que possamos acelerar a identificao de dados e, at,
encontrar coisas fora do lugar com maior facilidade.

Como queremos usar as cores como aliadas nesse


processo de disciplinar o olho, podemos usar outras gamas,
preferencialmente se forem claras. No convm usar amarelo,
tem efeito pior do que o branco. Recomendo usar rosa-claro,
verde-claro (RGB 244,255,244), laranja-claro e marrom-claro.
Mas importante ter cuidado para no abusar e transformar a
base num programa infantil. Isso vai criar um efeito de confuso
e pode atrapalhar a observao dos dados. Parece mais
prudente usar as cores somente em campos muito especficos,
para destacar certas informaes. De resto, um fundo azul-claro,
com campos com a cor branca, usando um contorno cinza-
escuro parece uma pedida melhor. Quem quiser experimentar,
recomenda-se reflexo sobre as horas que ficar na frente da

bem altos indica que a cor clara, j que o branco 255, 255, 255 e o preto 0,
0, 0.
[69]

tela. Quem no quiser, j tem a uma sugesto bem clara.

Figura 17 - Exemplo do uso de cores e contrastes (o cinza-claro substitui o azul-claro


que recomendei)

Formas

H dois problemas que envolvem as formas. O


primeiro diz respeito ao tamanho da tela do computador. Poucos
softwares permitem o ajuste automtico da tela. E disso
desdobram-se dois outros problemas: a convenincia de ter uma
tela grande para poder ver mais coisas ao mesmo tempo (o que
timo) e a inconvenincia causada pelo fato de os outros
usurios terem outro tamanho de tela. difcil agradar a todos
nesse quesito. Todavia, importante pensar no universo de
monitores disponveis e nos formatos de tela utilizados (1280
X800; 800 X 600; etc). Este ltimo dado o que mais interessa,
pois o tamanho real em pixels que importa na maioria dos
programas, e no, em polegadas (como so medidos os
monitores). Convm deixar uma margem para evitar diferenas
[70]

muito grandes, tal como uma base que no pode ser vista em
alguns monitores por falta de tela.

O outro problema a organizao dos campos


dentro da tela. Aqui vale a mesma coisa dita sobre as cores:
convm usar, mas no convm abusar. importante distribuir os
campos como quem desenha a planta de uma casa. Os
moradores precisam achar as coisas e os usurios precisam
encontrar os campos que procuram. importante distribuir os
campos por critrios claros, temticos, por exemplo, ou por tipo
de dado. Se criamos uma base source-oriented, baseada na
fonte, ento o melhor, me parece, tentar reproduzir o melhor
possvel a prpria ordem da fonte. Vejamos como ficaria isso em
um formulrio-visual quase anedtico, mas igualmente vlido:

Figura 18 - Exemplo de formulrio baseado na ordem da fonte

certo que o texto varia e que no precisamos


exagerar na adequao do formulrio fonte. Mas convm
colocar os campos na ordem das informaes, pelo menos na
coleta dos dados. Para a anlise, podemos criar outros visuais,
feitos segundo outros critrios.
[71]

Entre a tcnica e a teoria: problemas cotidianos


e decises prticas

No me parece prudente discutir sobre bases de


dados em Histria pensando no uso de softwares, alis, parece
que essas duas coisas tm completa relao, o que no
verdade. Podemos fazer bases sem software algum, apenas com
fichas, inclusive bases relacionais (o trabalho ser intenso, mas
possvel). O que precisamos sempre de programao, no
sentido amplo da palavra: o de fazer um programa de tarefas,
uma ordem de aes. E na hora de planejar, convm estar
atento a certos pontos que nem sempre so objetos de reflexo.
H quem fale em boas prticas nas bases de dados. Prefiro
57

no adotar esse vocabulrio, mas vou criar uma lista de


problemas com algumas ideias de como resolv-los, justificando,
com argumentos tericos e tcnicos, meus motivos.

Homnimos

Identificar pessoas algo to complexo que j foi


tema de um livro clssico: Identifying people in the past, de E.
Wrigley. A obra foca em pesquisas voltadas para o cruzamento
de fontes e o uso sistemtico do nome como base do trabalho.
58

Ele no foi o nico. Carlo Ginzburg disse a mesma coisa em


artigo dos anos 1980, em que destacava o nome como o fio de
ariana pelo qual o historiador construiria seu caminho. H
59

outras metodologias para as quais a identificao dos nomes das

57
MANDEMAKERS, Kees; DILLON, Lisa, Best practices with large databases on
historical populations, Historical Methods, v. 37, n. 01, 2004.
58
WRIGLEY, E. A., Identifying people in the past, London: Edward Arnold,
1973.
59
GINZBURG, Carlo, O nome e o como: troca desigual e mercado
historiogrfico, in: GINZBURG, Carlo (Org.), Micro-histria e outros ensaios,
Lisboa/Rio de Janeiro: DIFEL/Bertrand Brasil, 1989.
[72]

pessoas fundamental, mesmo em estudos demogrficos.


Anlises genealgicas, estudos de onomstica, tudo depende do
bom preenchimento desse campo.

Um espectro, contudo, ronda os investigadores do


nome: o espectro da homonmia. relativamente comum que
algumas pessoas tenham o mesmo nome de outras. Eu, por
exemplo, sei de pelo menos outros quatro Tiago Gil e pelo
menos outro Tiago Lus Gil e no precisei gastar tempo para
encontr-los. Como podemos saber quem quem? Como
distinguir os atos de pessoas potencialmente diferentes que tm
o mesmo nome, vivem na mesma poca e, talvez, na mesma
regio? No tarefa simples e a soluo vai depender dos tipos
de fontes que temos e de certas caractersticas de cada
sociedade. Com isso podemos, por exemplo, verificar elementos
prprios do ciclo de vida das pessoas: h idade para casar, para
abrir negcio, para vrias coisas. Isso pode ajudar na
identificao. Afora isso, h elementos que diminuem a incerteza
como os nomes de pessoas prximas mencionadas na fonte:
pais, filhos e cnjuges; a idade; a profisso; a regio especfica.

A identificao bem feita de homnimos (ou o


contrrio, dizer que duas pessoas at ento tidas como
diferentes so, na verdade, uma nica) fruto de um artesanato
e, muitas vezes, no teremos como separar ou juntar as pessoas
por falta de informao. Para facilitar este procedimento, a
melhor coisa criar uma tabela para matricular todas as
pessoas que fazem parte do meu universo de anlise. Isso
significa atribuir um nmero para cada agente histrico que
estudamos. Esse nmero ser usado sempre junto com o nome,
em um campo separado, ao lado, preferencialmente. Com as
duas possibilidades - a de busca pelo nome e pela matrcula -
poderei checar, de tanto em tanto, as possibilidades de juntar ou
separar as pessoas, tendo em conta suas aes e referncias
cruzadas. Porm, s podemos fazer bem esse artesanato de
[73]

encontrar pessoas quando cruzamos muitas fontes diferentes.

Usar apenas as matrculas vai diminuir as chances


de juntarmos os pedaos da mesma pessoa que estavam
separados devido a algumas dvidas que tnhamos. Usar
somente o nome vai confundir, manter todas as informaes
juntas e no ser possvel realizar certas anlises automticas
que s podemos fazer quando j estamos convencidos da
integridade dos nossos agentes, como as anlises de redes
sociais. possvel automatizar isso, mas somente depois de um
longo artesanato de preparao de dados. Com uma tabela de
nomes matriculados, podemos centralizar vrias informaes
que permitem a identificao correta das pessoas: cnjuges,
pais, filhos, data e local de nascimento, apelidos, variaes
conhecidas do nome, etc.

H, ainda, um agravante: algumas pessoas tm


variaes de nome, e no estou falando de Antonio com ou sem
acento no o. Estou pensando em possibilidades como
Alencastro, AlencastrE, LencastrO e LencastrE. Todos esto
corretos e podem fazer referncia ao mesmo sujeito. certo que
podemos normatizar, como veremos adiante, mas fontes
diferentes podem trazer variaes do mesmo nome. Nesse caso,
seria importante criar, se o programa permitir, formas
automticas de tomar o primeiro nome com as ltimas letras do
ltimo (o que faria coincidir Jos Lencastre com Jos
Alencastre) ou o primeiro nome com as primeiras do ltimo (o
que faria coincidir Jos Alencastro com Jos Alencastre). Com
esse procedimento, poderamos minimizar um problema que j
sabemos crnico em nosso trabalho.

Esforos assim poderiam tambm ajudar a


encontrar um sujeito que se chama Joo Pedro da Silva, mas
que costuma aparecer na documentao apenas como Joo
Pedro. Concluso parcial: devemos ter um sistema de controle
[74]

dos nossos agentes e que deve ser feito de modo a permitir a


descoberta de homnimos.

Atualizar, normatizar ou manter o original?

O melhor normatizar os nomes e atualizar a


linguagem. Sempre. E tenho bons companheiros que comungam
dessa opinio, como o prprio Alan Macfarlane. Reconheo que
60

isso tem um custo: preciso ter pessoas capacitadas para


transcrever, que no leiam algo diverso do que est no original e
saibam desdobrar corretamente as tradicionais abreviaturas.
mais demorado e trabalhoso, mas, feitas a atualizao e
normatizao, dentro do banco de dados, o material j estar
pronto para anlise e ser possvel submeter os dados a muitas
metodologias e perguntas com resultados rpidos. Ou seja,
depois de um longo esforo, os ganhos sero imediatos e
podero ser utilizados por muito tempo. Gasta-se de um lado,
economiza-se de outro, sem perder o principal.

Manter os textos no original quase como no t-


los em uma base. quase como ter apenas a foto do
documento. No adianta ter dados assim. Entendo os
argumentos de quem prefere manter o original: o de que, com
isso, ser possvel encontrar erros de atualizao e de
desdobramento de abreviaes. Mas preciso um trabalho
duplo, para o qual, muitas vezes, no temos tempo ou recursos.
E transcrever, por si s, j demanda muito tempo. Mas tendo em
mente essa opo, a de manter no original, vou apresentar
algumas ideias que podem automatizar o artesanato da
paleografia.

A proposta comea assim: ter um campo texto

60
MACFARLANE, Computer input of Historical Records for multi-source record
linkage.
[75]

original para cada excerto informatizvel da fonte, para cada


pedao de texto do documento original que possa virar um
registro dentro de uma tabela. Por exemplo, os livros de batismo
tm pginas e pginas de descries daquele ritual, um atrs do
outro. Podemos ter um registro para cada batizado anotado pelo
padre. Esses sero nossos excertos informatizveis, so pedaos,
excertos, e so informatizveis, porquanto podem ser
desmontados em campos de um database. Este campo texto
original vai receber, durante a transcrio, o contedo tal como
est na fonte, anotado, em campos separados, de qual livro,
qual pgina e a ordem do excerto na pgina (se era o primeiro
registro de batismo, o segundo ou terceiro, etc.).

Ento, teremos uma base de batismos composta


apenas por trechos inteiros de registros. O passo seguinte, e a
entra a astcia, ser o de criar um campo texto atualizado",
que vai conter os mesmos dados do texto original, mas de
modo atualizado. A forma mais simples (e mais trabalhosa) seria
repetir o trabalho de digitao com a atualizao, mas no a
recomendo. Utilizando recursos disponveis apenas nos
modernos bancos de dados, seria possvel criar um campo de
clculo que repetisse o contedo do campo, mas substituindo
valores antigos por atuais. Um clculo que repetisse e atualizasse
ao mesmo tempo, substituindo Joseph por Jos, sem que
fosse necessria a interveno humana. Ela teria ocorrido antes,
na criao de uma tabela (longa) de substituies programadas.

Outra sada possvel, seria copiar o contedo do


original para o atualizado e mandar substituir, palavra por
palavra, as palavras velhas pelas atuais. Isso tem um grande
risco: uma vez cometido um erro, ele seria propagado por todos
os registros, demandando um novo esforo. No caso da
utilizao do cdigo, bastaria acertar o clculo, e nada se
perderia. Assim teramos duas verses, sem perder dados
originais e com contedos homogeneizados e normatizados
[76]

prontos para uso. Vejamos:

Original Viso do campo com clculo


Aos treis dias do ms de Aos trs dias do ms de
agosto do ano de mil agosto do ano de mil
setessentos e secenta e seis setecentos e sessenta e seis
annos nesta paroquial igreja de anos nesta paroquial igreja de
So Bento baptizei e pus os So Bento batizei e pus os
sanctos leos a innocente santos leos a inocente
Benedicta, filha legtima de Benedita, filha legtima de
Joseph dos Sanctos e de Jos dos Santos e de
Benedicta da Conceiam... Benedita da Conceio...

Clculo utilizado:
Substituir:
treis = trs
setessentos = setecentos
Secenta = sessenta
nn = n
pti = ti
ncto = nto
ict = it
Joseph = Jos
Conceiam = Conceio

Nesse momento, quem estava convencido pela


normatizao e atualizao j deve estar se perguntando: no
mais vantagem deixar no original e usar aqueles recursos? Minha
resposta continua sendo no. E vou apresentar uma nova
sugesto: associar cada ficha, atravs de um campo, com o
endereo (digital, url) do arquivo de imagem (png, jpg, tif, etc)
que contm o documento original fotografado. Desse modo, ser
possvel cotejar sempre os dados na base com os originais, sem
risco para o trabalho e de modo auditvel.
[77]

Formatos de data

A melhor opo, no meu ponto de vista, usar o


sistema AAAA-MM-DD, 1798-07-14. Independentemente do
software que escolhermos, esse sistema vai funcionar. Se for
preciso exportar os dados para anlise, o programa pode no
entender o formato 'data', mas entender o formato 'nmero' e
ser possvel colocar em ordem. Igualmente, ser possvel usar
campos de clculo para tomar o dia, o ms e o ano
isoladamente - se for conveniente por alguma razo. Com o
campo do tipo 'data' diferente, pois, nem sempre, d certo. E
h ainda o risco de confundirmos o sistema americano com o do
resto do mundo, que troca o ms pelo dia. H certos programas
que so capazes de calcular a diferena de tempo entre duas
datas, medida em nmero de dias. Para isso, necessrio usar o
formato de data. Assim, nossa defesa do padro AAAA-MM-DD
estaria em xeque. Convm saber se o mesmo programa no
permite tomar partes desse ltimo formato e isolar ano, ms e
dia e reuni-los no formato de data tradicional. Se permitir, timo,
caso contrrio, resta saber se essa funcionalidade necessria e
se vale a pena optar por esse ou aquele caminho. Se tudo deu
errado, no se preocupe: planilhas eletrnicas so capazes de
resolver esse problema, para qualquer das opes. Basta saber
usar bem os clculos disponveis.

Texto integral ou fragmentos?

Manter os textos na ntegra sempre a melhor


opo. Se no for possvel, bom estabelecer um critrio claro
de seleo e informar isso no Dicionrio de dados ou no dirio
da pesquisa (sobre o qual falaremos depois). A integralidade dos
textos permite a longevidade do uso da base. Se, em algum
momento, percebermos (e ser inevitvel) que deixamos de lado
trechos relevantes, por algum fator que no podamos prever (o
[78]

que igualmente crnico), teremos que refazer tudo ou


abandonar a base. Outra opo a de preparar a base para
acrscimos futuros, diante de uma realidade que impede a coleta
total das fontes. Mas, para isso, necessrio planejamento.

Reutilizao de dados

Um dos grandes desafios das bases de dados a


possibilidade de usar a base por longo tempo. Isso implica duas
questes: uma tcnica e outra terico-metodolgica. A tcnica
simples: preciso planejar contnuas mudanas de formato para
os dados, migrando de sistema conforme os antigos vo sendo
substitudos, e os padres forem sendo alterados. Isso
geralmente acontece com rapidez em informtica, mas nem
tanto. O modelo de dados SQL, relacional, atualmente o mais
utilizado, data de meados dos anos 1970 e o modelo anterior,
hierrquico, foi utilizado desde os anos de 1950 at os de 1990.
Programas mudam, mas relativamente fcil migrar entre os
sistemas, porm preciso estar atento. O sistema criado pelo
Padre Roberto Busa no incio dos anos 1950, existe at hoje e
passou de cartes perfurados para uma base SQL na internet.

O problema terico-metodolgico mais complexo.


Tem relao com o modelo conceitual que escolhemos para
nossa base. Esse modelo pode prever uma longevidade para a
proposta ou ignorar essa etapa. Isso acontece devido mudana
nos problemas de pesquisa em histria, na mudana de temas,
objetos e at de paradigmas, ainda que em outro ritmo. Um
exemplo simples pode ilustrar isso: criamos uma base de dados
para inventrios post-mortem e, por escolhas prprias da nossa
realidade de pesquisa (as hipteses apontavam outro caminho,
tnhamos pouco tempo, poucos recursos, demanda por artigos,
etc.), optamos por no incluir dados sobre os herdeiros
apontados logo no incio do documento. No meio da
[79]

investigao, percebemos que as informaes sobre os herdeiros


eram fundamentais. Essa situao, absolutamente possvel no
cotidiano da pesquisa, teria duas sadas possveis: voltar s
fontes e corrigir o banco de dados com muito trabalho (teramos
que deslocar pessoal para o arquivo duas vezes, com gastos de
transporte, de tempo e, talvez, de pagamentos) ou abdicar da
resposta que agora parecia ser a melhor, informando ao leitor
que h um elemento no considerado que poderia ter sido
importante.
61

O exemplo dado simples, mas ilustrativo. A


mesma dificuldade pode ter uma manifestao mais fina. A
opo que defendo, de atualizar a grafia e normatizar os nomes,
inviabiliza qualquer uso da base para estudos de lingustica de
grafias arcaicas. Nesse caso particular, parece-me que vale a
pena pagar o preo, quando no temos condies de criar um
campo de clculo chamado texto atualizado. Concordo com
Kevin Schrer quando argumenta que impossvel prever
62

todos os usos futuros de uma base. Mas seria conveniente, pelo


menos, pensar em certas metodologias mais prprias do tipo de
histria que cada um faz, avaliando se podemos planejar a base
tendo em conta algumas possibilidades reais. No podemos
prever o futuro, mas seria constrangedor esquecer algumas
demandas do presente por falta de planejamento.

Fuzzy information

Talvez seja a maior especificidade da relao entre


Histria e Informtica: os dados dos historiadores,

61
PRATESI, Alessandro, Limiti e difficolt delluso dellinformatica per lo studio
della forma diplomatica e giuridica dei documenti medievali, in: FOSSIER,
Lucie; VAUCHEZ, Andr; VIOLANTE, Cinzio (Orgs.), Informatique et histoire
mdivale, Roma: cole Franaise de Rome, 1977, p. 187190.
62
SCHRER, Historical demography, social structure and the computer.
[80]

diferentemente do que geralmente se demanda da informtica,


so geralmente imprecisos, incertos e escorregadios. Como
posso preencher o campo idade de uma base feita para coletar
"listas nominativas de habitantes" se a fonte me diz que Fulano
de Tal disse ter 50 anos mais ou menos? E como preencho o
campo data se o ano est borrado e s tenho dia e ms? No
primeiro caso, no basta colocar 50 no campo idade e perder
o mais ou menos no poo do esquecimento chamado de
campo Observaes. Feito isso, estaremos dando por exata
uma coisa que os coevos, os nativos do tempo, consideravam
imprecisa. E eles nem sonhavam com a preciso dos nossos dias.

A soluo desse problema pode ser fcil, para


alguns casos, e complicada, para outros. Para mencionar uma
data da qual no temos os dados completos, utilizando o sistema
AAAA-MM-DD, basta preencher usando um coringa, como o 0
no lugar da informao perdida: 1789-00-00. Assim, possvel
aproveitar os contedos disponveis, sem forar o restante.
Podemos usar sinais indicadores quando temos condies de
detalhar mais. Sabendo, por exemplo, o ano do acontecido e que
foi depois de agosto, podemos usar a seguinte norma: 1789>08-
00. O sinal de maior indica que foi depois de agosto, embora no
saibamos o dia. Se no sabemos o ano, podemos inserir o
mesmo sinal na frente do conjunto: >1789-00-00. Na hora de
processar dados em srie, basta mandar eliminar os registros
com datas imprecisas, o que no seria possvel colocando a
informao sobre preciso no famigerado campo Observaes.

O outro exemplo que dei, da idade, pode ter uma


soluo semelhante, ainda que me parea mais difcil. Um sinal
grfico pode indicar a dvida como estava na fonte (por
exemplo, um * para mais ou menos, um > para mais de
etc.). Contudo, isso seria igualmente perigoso, pois, em alguns
casos, as fontes informam as dvidas dos contemporneos com
a prpria idade, em outros no, mesmo quando tinham. Nesse
[81]

caso, no colocaramos o *, por falta da prpria fonte. Essa


uma das suas caractersticas que deve ser considerada na hora
do planejar o banco.

Outra sada seria deixar na tabela lista nominativa


um campo idade dita sobre cuja irregularidade no teramos
dvida. Se essas informaes fossem realmente relevantes para
nossa pesquisa, penso que pareceria vlido criar outra tabela
que juntasse os dados cruzados da mesma fonte na srie, alm
de outras, com os quais se poderiam comparar vrios
documentos, com o objetivo de saber as variaes disponveis
para cada sujeito. Isso nos ajudaria, inclusive, a estimar o grau
de impreciso da poca e seus desdobramentos, como um
possvel envelhecimento rpido ou a idade social das pessoas,
expressa numericamente por falta de outra medida.

Por fim, no deixa de ser interessante, se o


planejamento julgar conveniente, criar campos de avaliao da
qualidade da informao, inclusive para cada campo, se parecer
adequado. Eu no faria isso para todos os campos, mas,
dependendo da fonte e do caso, pode ser uma soluo.

Os campos Observaes, comentrios e notas

O leitor atento j percebeu a antipatia desse que


escreve pelo campo observaes. isso mesmo. Geralmente
usado como um saco de gatos, o campo observaes e seus
amigos comentrios e notas mais atrapalham do que ajudam.
Eles, comumente, so a vala comum onde todas as falhas do
projeto vo parar. E muitas dessas falhas poderiam ter rendido
grandes ideias e concluses. Nosso foco precisa estar em evitar
o campo observaes. Antes de preench-lo, seria melhor
discutir com a equipe, ou pensar sozinho, se for o caso, na
possibilidade de criar algum campo ou soluo que resolva
[82]

aquele problema e outros potenciais, vindouros, da mesma


natureza.

Esse campo, contudo, indispensvel. Ele pode ser


importante para anotaes temporrias. Nesse caso, sua
utilidade bem grande. Mas eu no o chamaria de
observaes, nome convidativo para procedimentos
preguiosos de trabalho, e criaria um campo chamado de notas
temporrias de pesquisa, mais apropriado para sua real e
valorosa funo.
[83]

Engenharia de pesquisa

O engenheiro recebe uma tarefa, avalia, projeta,


calcula, executa e entrega. Nesse meio tempo, o historiador
continua polemizando sobre a arbitrariedade da tarefa. Eu
entendo e compartilho os porns dos historiadores. Mas
tambm fato que no sabemos organizar grandes projetos ou
pesquisas que exijam mais flego. Digo isso em comparao com
o que fazem os pesquisadores das cincias duras (mas no s
eles), em que procedimentos de pesquisa e de autoria coletiva e
domnio de recursos de financiamento so, h muito tempo,
normatizados e domesticados. No pretendo seguir com a
reclamao, mas acho que o desenvolvimento de uma base de
dados bem feita envolve um grande planejamento. Por isso, vou
apresentar alguns problemas e sugestes para conduzir
trabalhos individuais e coletivos, dando nfase a estes ltimos. O
leitor saber adaptar os conceitos para os casos particulares.

Levantamento inicial

Convm sempre fazer um levantamento amplo da


documentao total que ser analisada, incluindo variveis de
resposta de campos, nomes e lugares, bem como a variao
mnima e mxima de pginas por documento. Por exemplo, se
63

pretendo trabalhar com processo-crime de uma localidade ao


longo de 20 anos, importante saber, de antemo, de quantos
processos estou falando. O conhecimento do conjunto vai ajudar
a selecionar a amostra que utilizarei ou a demanda de recursos e

63
AUTRAND, Franoise, Le personnel du parlement de Paris: traitement
automatique dune prosopographie en vue dune tude sociale, in: FOSSIER,
Lucie; VAUCHEZ, Andr; VIOLANTE, Cinzio (Orgs.), Informatique et histoire
mdivale, Roma: cole Franaise de Rome, 1977, p. 239243.
[84]

pessoal que terei para levantar todos os documentos. Por outro


lado, saber o volume estimado dos processos ajuda a decidir
sobre seu uso integral ou parcial. Para a maior parte desse
levantamento, h catlogos e ndices de arquivos, mas, nem
sempre, assim e, no raras vezes, ns mesmos precisaremos
fazer nossos instrumentos de consulta.

difcil fazer o prprio catlogo, ainda mais com as


demandas que salientei aqui, que incluem, alm da informao
sobre o nmero total de processos, dados sobre seu volume
estimado. Convm tomar amostras para facilitar. impreciso,
mas alguma informao. Aqui convm avaliar o custo e o
benefcio. Caso a documentao ultrapasse certo volume, mais
de 100, por exemplo, devem-se tomar umas vinte amostras. Se
for mais de 1000, eu tomarei 50 amostras. Menos de 50, nem
convm tomar amostras, pois melhor j levantar todas. Mesmo
que voc no utilize todos esses documentos, importante,
inclusive para sua pesquisa, saber o universo particular do qual
fazem parte. Isso nos ajuda a saber que aquilo que julgamos
incrvel era, na verdade, algo comum. Poupa-nos de dizer
besteiras. Sempre diremos, mas melhor evitar as mais
ingnuas e deixar somente s as melhores para os crticos.

Montagem de equipes

A seleo dos membros da equipe importante,


mas no vou entrar nesse mrito. Cada um saber como
selecionar seus colegas, conforme puder, pois geralmente isso
no est disponvel. Escolhendo ou no, resta organizar a equipe
de modo eficaz, a fim de que todos entendam perfeitamente os
objetivos da pesquisa e o funcionamento da base, se possvel,
participando do seu desenvolvimento. importante criar um
clima de colaborao e de debate sobre o desenvolvimento da
pesquisa. Certas incongruncias entre a documentao e a base
[85]

podem ser percebidas com perspiccia pelo mais novato dos


auxiliares. importante que ele se sinta livre para discutir com
colegas e coordenadores. Da mesma forma, podem conceber
eventuais funcionalidades que agilizem o trabalho, sem
prejudicar a qualidade do abastecimento.

Uma vez pronta, hora de testar a base, como j


vimos. Passado o perodo de treinamento, vamos comear o
abastecimento dos dados. Nesse momento, importante medir a
produtividade mdia dos abastecedores. Com essa informao,
podemos ter uma ideia mais precisa sobre como ser o futuro do
trabalho. No projeto que resultou em Reconstructing historical
Communities, Macfarlane j falava do planejamento dos
trabalhos e usava uma medida particular para avaliar a demanda
por trabalho. Segundo ele, o projeto acabou em 1983 com uma
mdia de 30 pessoas-ano. Era a produtividade estimada de um
auxiliar de pesquisa ao longo de um ano.

A montagem de uma equipe passa por esse tipo de


clculo. bem verdade que no podemos contratar as pessoas
sem dinheiro, mas importante saber a demanda real de mo
de obra cientfica qualificada para o projeto. Com isso saberemos
se o projeto durar poucos ou muitos anos, se ter reais
condies de ser finalizado ou se precisar de cortes na
proposta. Sabendo do que a equipe capaz, podemos estimar o
trmino do perodo de abastecimento, identificando, inclusive,
certos excessos, como aquele auxiliar que preenche muito
rpido, talvez com erros, e o que muito lento e que poderia
melhorar.

Acho que uma boa equipe no precisa ser


hierarquizada, salvo se houver um coordenador que distribua as
tarefas e administre a base de dados, inclusive na
implementao de melhorias. A experincia me indica que, se
criado um clima de colaborao, os membros da equipe sero
[86]

capazes de se engajar de modo pleno. Se isso vale para a


qualidade da pesquisa, j no estou certo se vale para a gesto
do tempo de trabalho e da produtividade, que no podem ser
esquecidos. Para isso, h o coordenador.
64

Treinamento

O treinamento fundamental. Sua realizao,


contudo, vai depender de cada projeto. Parece que o melhor
meio de treinar a equipe criar uma base paralela, cpia da
original, que funcionar como um simulador de voo. Os dados
inseridos sero perdidos, propositalmente, mas haver diferena
grande com a prtica, salvo o fato de no ser de verdade. H
algumas coisas que podem ajudar. Criar um manual especfico
para uma base no me parece uma boa ideia. Ele pode ser
consultado por uns, mas por outros no, que vo tocar de
ouvido no preenchimento. Ele pode ser usado algumas vezes,
mas no todas, e isso vai comprometer a qualidade do
preenchimento da base. O melhor criar bases autoexplicativas
e, se for necessrio, inserir certas regras de procedimentos ao
lado do campo especfico. Alm disso, pode ser til a criao de
vdeos demonstrativos. Eles tm grande vantagem em relao
aos manuais: mostram onde o sujeito deve clicar exatamente,
sem obrig-lo a procurar um mitolgico boto Salvar (que,
nesse momento, j poderia ter sido renomeado para Enviar,
para piorar tudo...)

64
Dupaquier j falava, em 1968, de importncia de um animateur da equipe,
que faria aquilo que apresentei como responsabilidade do coordenador. Ver:
DUPAQUIER, Jacques, Suggestions pour lorganisation du travail dquipe en
histoire sociale, in: Lhistoire sociale: sources et mthodes, Paris: Presses
Universitaires de France, 1967.
[87]

Coletando os dados e abastecendo a base

Considerando que construmos uma base tendo uma


boa noo do conjunto das fontes que vamos usar e que
previmos seu uso com variada e conhecida metodologia e j a
testamos com uma boa amostra das fontes, corrigindo suas
imperfeies, chegado o momento de iniciar o abastecimento.
Essa a fase que mais demanda engenharia. preciso decidir
qual o melhor (ou possvel) meio de coletar os dados e coloc-los
na base. uma pergunta muito antiga nesse mtier. Thaller j
apresentava essa preocupao em 1985. Geralmente, os
65

arquivos esto longe dos computadores, ainda que isso tenha


mudado muito desde a inveno e popularizao de laptops e
cmaras digitais. Mas nem todos os arquivos permitem estes
equipamentos, e h, inclusive, arquivos que no tm tomada
disponvel para pesquisadores.

Outra questo que se coloca a hospedagem do


banco de dados, sobre onde ele deve estar armazenado. Se for
uma pesquisa individual, a soluo fcil: no computador dessa
pessoa. Mas quando temos dois, a pergunta j qualificada.
Devemos criar duas cpias do arquivo e juntar tudo depois?
Devemos colocar o arquivo num servidor da internet? S um
abastece a base?, etc. Essas so questes que se complicam
quando trabalhamos com grupos maiores e se complicam ainda
mais quando dependemos de informaes adicionais para tomar
decises (identificar um sujeito, por exemplo, que pode estar
sendo identificado, ao mesmo tempo, por outro colega). Nesses
casos, importante ter sincronia no trabalho para evitar perda
de tempo e redundncia de informao.

Antes de iniciar, creio que dois pontos devem ser


ressaltados: importante ter sincronia no abastecimento, com

65
THALLER, Can we afford to use the computer; can we afford not to use it?.
[88]

uma nica base, que deve ser preenchida ao mesmo tempo, e a


coleta deve ser o mais completa possvel, de tal modo que no
haja necessidade de voltar ao arquivo. Mas como fazer isso? As
solues para esses problemas so vastas, mas devo advertir o
leitor de que minha resposta estar, inevitavelmente, datada em
poucos anos. No h questes de flego por trs nem
perspectiva terica alguma que nos ajude a dar longevidade para
essas solues. Logo surgiro solues melhores, e isso muito
bom.

Estratgias de coleta

Fotografar os originais com cmeras digitais o


melhor caminho. Boas fotos so, geralmente, para o historiador,
melhores do que o original, e por uma razo muito simples:
podemos tratar as imagens, mudar o contraste e ler melhor
aquela tinta apagada ou tentar ver algo alm do borro. Se a
tinta est esmaecida, a fotografia digital ajuda. Hoje, qualquer
pessoa tem acesso a programas gratuitos de edio de imagem,
fceis de usar. Com a fotografia digital possvel, inclusive, ver a
marca dgua do papel, se isso parecer importante e s vezes .
Vou seguir este texto com dois caminhos: o dos que podem usar
a cmera e o dos que no podem. Comecemos pelos primeiros.

Para que as fotos sejam melhores do que os


originais, tendo em conta a pesquisa em Histria, preciso
algum cuidado. No difcil. Basta lembrar que fotografia o
registro da luz. preciso luz. E os Arquivos (acervos) geralmente
no tm uma boa iluminao. Logo, ou conseguimos iluminao
por nossa conta (com autorizao do Arquivo) ou usamos uma
ligeira astcia: regular o diafragma da cmera, deixando-o mais
aberto (para a entrada de mais luz) e aumentando o tempo de
exposio da foto (para que a luz entre por mais tempo). Como
o documento fica parado, ser fcil. S nos resta uma coisa: no
[89]

tremer. Se tremermos, a imagem ficar sem foco. Ou temos


firmeza nas mos e nos braos ou usamos um trip (com
autorizao do Arquivo).

O trip garante estabilidade, mas convm us-lo


bem. No h mistrio, mas h uma dica: os trips tm ps
retrteis. Convm expandir apenas um deles, de tal maneira que
fique apoiado no cho, enquanto os outros dois ficam apoiados
na mesa de trabalho. Isso vai dar espao de trabalho e gerar um
ngulo bom para colocar o documento por baixo da cmera.
Contudo, ateno para o contrapeso! A cmera geralmente
pesada, e o uso do trip, nesse ngulo, pode fazer cair o
conjunto. Use um contrapeso. Eu gosto de usar um saco de
moedas amarrado no p expandido.

Outra dica importante sempre fotografar a


referncia, a cota do documento, antes de capturar o conjunto
para, depois, organizar as fotos em pastas corretamente
identificadas. Como a notao, comumente, pequena e usamos
programas em que podemos ver as miniaturas das fontes
(gerenciador de arquivo), convm usar um divisor adicional,
algo que indique a mudana de documento, alm da foto da
cota. Pode ser uma folha em branco ou a mesa do arquivo.
Minha dica tirar foto da mo bem aberta. Com a certeza de
que um novo documento est naquelas fotos, poderei facilmente
arrastar todos os arquivos para a pasta do computador que lhes
cabe. to prosaico quanto prtico.

Vejamos, agora, o caso de quem no pode usar


uma cmera digital no Arquivo. No h motivo para desnimo.
Se for uma pesquisa individual, o problema menor. Basta fazer
um bom planejamento da base, estimar bem o volume de
informao que ser tratado e comear o trabalho. Nesse caso,
vou comear considerando que um laptop (ou outro
equipamento porttil com teclado) est disponvel para a tarefa.
[90]

fundamental transcrever o texto todo dos documentos para


evitar a volta ao Arquivo, que sempre mais custosa. Se a base
j foi feita prevendo a transcrio de partes, tudo estar
resolvido. O importante ter o controle da informao e pensar
tudo de tal modo a evitar o retorno constante aos Arquivos.

Em se tratando de uma pesquisa coletiva, com um


banco de dados utilizado por vrias pessoas, convm pensar
melhor. muito arriscado trabalhar com vrios abastecimentos
simultneos e independentes, salvo se houver uma diviso muito
clara de trabalhos, com fontes muito diferentes ou pocas muito
claras. possvel tambm criar um sistema que importe as
diversas verses da base checando se h repetio. Isso pode
ser muito simples, se a base for orientada pela fonte, pois cada
um cuidar da sua fonte, que geralmente nica. O perigo se
apresenta quando a fonte no nica, como jornais, livros, fotos
e panfletos. Diferentes caixas do mesmo acervo podem conter
cpias que sero duplicadas na base e podem ser classificadas
de modo diferente, gerando redundncia.

H um perigo maior, quando as bases so


orientadas pelo mtodo. Para as biografias, por exemplo, o
mesmo personagem pode aparecer vrias vezes e com
informaes diferentes em cada uma. Unificar isso tudo
demandaria um trabalho manual muito grande. Um sistema de
importao poderia resolver, mas, se for feito com algum erro,
pode embaralhar tudo. A melhor soluo, no atual estado da
tecnologia, evitar bases mltiplas (divididas para vrios
pesquisadores abastecerem separadamente). Considerando a
popularizao dos aparelhos de internet mvel e dos servidor de
dados nas nuvens, parece-me mais fcil investir nisso do que
em correes e importaes sem fim. Alm disso, com uma base
nica, todos podero saber o que os outros j recolheram (ou
esto recolhendo), e essa informao pode ajudar, inclusive, no
abastecimento de novos dados. Por fim, qualquer alterao nos
[91]

campos ou na estrutura da base ser automaticamente


disponvel para todos, sem seja preciso corrigir todas as bases
paralelas.

A situao de no dispor de um equipamento


(laptop, tablet, etc) no Arquivo uma situao cada vez mais
rara, mas pode ocorrer. sempre bom ter um caderninho, mas a
melhor sada imprimir o formulrio da base numa folha A4 e
levar muitas cpias. Usar canetas de cores diferentes e
marcadores de texto, dando significado para as cores, pode ser
importante. Era assim que os historiadores que aplicavam o
mtodo Henry faziam antes da vulgarizao dos computadores
pessoais. E foi no auge do uso dessa metodologia que a
companhia francesa BIC lanou, em 1970, sua verso de quatro
cores. At onde sei, no h nenhuma relao, mas deve ter feito
a alegria dos historiadores demgrafos.

Vejamos, agora, uma soluo bem mais cmoda e


que eu sequer supus no incio do texto: as fontes disponveis na
internet. No h muito para dizer, mas no poderia esquec-las.
claro que h materiais digitalizados com qualidades muito
variadas, algumas delas duvidosas. Mas diversos acervos
digitalizam seus documentos e a maioria utiliza scanners
planetrios, o que excelente. Sobre esses ltimos, to vlido
quanto estar no arquivo e, em termos de praticidade, at
melhor. H que se ter o cuidado de no esquecer outros
documentos que estejam no mesmo arquivo e que ainda no
foram digitalizados, se forem importantes.

H documentos online de qualidade duvidosa: fotos


de baixa resoluo, textos transcritos suspeitos e rvores
genealgicas feitas por descendentes dos nossos agentes, por
fs ou curiosos. Sobre isso tudo, entendo que devemos agir com
aquilo que mais trabalhamos ao longo de um curso de Histria: a
crtica. No descarto nenhuma informao de antemo - nem as
[92]

do arquivo - nem as do pior site da internet. De algum modo,


todos esto errados, e todos so pistas que podem ou no fazer
sentido diante de um nmero muito maior de material emprico,
de uma boa metodologia e de muita reflexo terica. Resta,
contudo, tratar fontes de tipos e origens diferentes, tal como
fazemos com as fontes dos Arquivos, separando cada uma delas
e dando um tratamento adequado.

O preenchimento manual da base

O preenchimento manual, com digitao, ainda o


sistema mais comum e deve continuar sendo por muitos anos.
Sabendo disso e tendo em conta o custo elevado desse tipo de
mo de obra, convm otimizar ao mximo esse trabalho,
automatizando algumas coisas e reduzindo o tempo que poderia
ser gasto na leitura dos manuscritos e na escrita, simplesmente.
Neste sentido, bases muito complexas, difceis de preencher,
devem ser evitadas. Por exemplo, aquelas que demandam que
os nomes dos agentes histricos sejam cadastrados antes de ser
citadas na transcrio de um documento. melhor inventar um
sistema de cadastro automtico que ser checado
posteriormente, com o acumulado dos dados, e que permitir
comparaes e acertos. Mas h outras tticas, especialmente nos
programas atuais de gerenciamento de bases de dados.

Um recurso bastante prtico, que deve ser usado


com algum cuidado, o autocompletar. Muitos programas tm
isso. O lado bom que poupa tempo e ruim que podem errar a
sugesto, e o digitador no perceber, devido quantidade de
repeties que deve fazer. Melhor do que o autocompletar o
campo de opes mltiplas, do qual o digitador pode escolher
uma ou vrias. Convm no deixar nada pr-marcado e dificultar
um pouco a escolha, de tal modo que ela tenha sido fruto de
uma deciso clara, e no, de um descuido. Outra opo pode ser
[93]

a criao de avisos de alerta. Se um campo numrico


preenchido com texto, o computador avisa ao digitador e
questiona se est certo disso.

Alguns programas mais elaborados permitem


manobras mais ousadas. possvel, por exemplo, criar certas
programaes, tambm conhecidas como macros que vo
realizar tarefas repetitivas previstas pelos usurios a partir do
acionar de um boto ou de um comando de teclado (tecla F4,
por exemplo). Em uma base de batismos, implementei um
sistema assim para casos comuns com aquela documentao,
como padrinho filho do capito..., madrinha casada
com..., de tal maneira que bastava completar com a informao
faltante. Esse procedimento agilizou o trabalho sem prejudicar a
qualidade. Reforamos a ideia de que preciso automatizar o
artesanato, pois ainda realizamos todo o trabalho, mas usando
facilidades aportadas pelo computador.

Importando dados (digitais)

Muitas vezes, temos materiais que foram produzidos


para outras pesquisas ou, simplesmente, transcritos no editor de
texto e que gostaramos de importar para uma base de dados.
Nem sempre fcil, mas, quase sempre, possvel. Com um
pouco de engenhosidade, possvel fazer manobras incrveis.
Para tanto, importa conhecer algumas coisas. A primeira o
sistema de importao dos softwares de planilha eletrnica, por
meio dos quais se pode importar dados de texto para tabelas,
com cada coisa em seu lugar. Para fazer isso, devemos colocar o
texto que queremos em um arquivo com extenso ".txt".
Contudo, isso no basta. O computador faz coisas incrveis, mas
no adivinho. Ele precisa saber onde comea uma informao
e onde acaba a anterior. Para tal, necessrio colocar alguns
marcos indicadores, como a vrgula ou o ponto e vrgula.
[94]

Geralmente esta ltima melhor, pois muito comum usarmos


vrgulas em textos. Fazendo isso, basta seguir um guia do
prprio software e importar todos os dados.

Essa facilidade est disponvel em vrios programas


e pode ser incrementada com o uso de campos de clculo. Se o
texto que estamos importando j um pouco estruturado, fica
mais fcil. Temos, por exemplo, uma lista de nomes, com o
telefone e o endereo. Podemos separar esses trs tipos de
informao em campos distintos sem precisar de muito esforo.
Se os telefones estiverem com o prefixo, fica ainda mais fcil.
Isso porque vamos verificar que nosso documento tem a
seguinte estrutura: texto, nmero, texto. Vejamos um exemplo:

Joaquim Nina. (61) 3624-3452. Rua das Graas, 72


Severino. (61) 5262-2352. Rua Haddock Lobo, 23

Se usarmos um campo de clculo, podemos mandar


o campo capturar tudo o que houver entre o primeiro e o
segundo ponto (note-se que, nesse exemplo, o nmero sempre
acaba com um ponto). O que houver at o primeiro ponto
nome e o que vier depois do segundo, endereo. Nem sempre,
h tantos pontos para facilitar a vida, mas comum
encontrarmos algum elemento para estabelecer as regras para
nosso campo de clculo. Se estivermos com apenas duas linhas,
no vale a pena fazer isso, mas quando temos centenas, poupa
muitas horas de trabalho. O mesmo pode ser feito para catalogar
fotos do computador. Basta escolher a pasta onde esto as
imagens, copiar o endereo delas (o caminho que indica sua
pasta) e colar no navegador de internet, o qual vai apresentar
uma lista de todos os arquivos da pasta. Basta copiar e colar
numa planilha eletrnica. Com isso, teremos um banco de dados
de arquivos da pasta, que pode ser usado para organizar fotos
de documentos, inclusive relacionando as fotos com as
transcries, com o banco de dados, etc.
[95]

Importando dados (analgicos)

Podemos fazer algo semelhante com documentos


impressos (e sem manchas ou imperfeies grficas). Basta usar
o scanner e um programa de OCR (Optical character recognition,
ou reconhecimento ptico de caracteres). Esse programa vai
reconhecer o texto, com algumas imperfeies, mas bem no
conjunto. Se os dados estiverem estruturados no original, como
uma tabela, uma lista, ou pontuados de modo coerente, como
no exemplo que apresentamos acima, sero facilmente
importados para um banco de dados. Depois de escaneados e
reconhecidos, basta aplicar as mesmas regras que apresentei
para capturar as informaes.

Administrao da base

Uma base coletiva, em um projeto de pesquisa


maior, deve ter um sistema de administrao, tanto se for nica,
na internet, quanto se for uma base mltipla (com vrias cpias
sendo abastecidas simultaneamente). As duas demandam
ateno, mas cada uma de modo particular. Uma base mltipla
demanda grande ateno sobre a importao dos dados e a
sincronizao dessas informaes. preciso distribuir as tarefas
e coordenar quem ficou responsvel pelo que, tendo em conta o
levantamento prvio do conjunto da documentao. Por seu
turno, uma base nica, online, demanda o cadastro de usurios,
atribuio de poderes para cada participante (do que pode ou
no fazer) e a distribuio de tarefas. No caso de uma base
nica, preciso criar campos para registrar quem preencheu a
ficha e quando. Isso ajuda a identificar erros e a controlar o
trabalho.

Independentemente do tipo de base escolhida,


interessante criar um dirio de campo, um espao para que
[96]

todos os membros da equipe descrevam diariamente o trabalho.


prefervel que ele seja pblico e que todos possam ler os
dirios dos colegas, acompanhando o andamento dos trabalhos.
Isso d unidade ao grupo e unifica as decises, ressaltando, de
imediato, prticas mais individualizadas (o famoso "fiz do meu
jeito"). Alm disso, esse dirio pode servir como base para um
relatrio ou ser usado como um memorial do trabalho realizado,
permitindo uma auditagem em qualquer tempo. Se a base for
online, conveniente que o dirio tambm seja. Para isso h
diversos blogs disponveis.

Checagem de dados

Trabalhar com equipes demanda cuidado com a


qualidade dos registros, no somente por causa da falta de
cuidado potencial de algum dos colegas como tambm da
potencial falta de homogeneidade na tomada de deciso no
momento do preenchimento. Informaes inesperadas aparecem
o tempo todo, e cada um as classifica como quer. Assim,
importante criar dispositivos e protocolos de checagem de dados.
H formas tradicionais de fazer isso, como conferir uma amostra
da base com os dados originais. Mas h erros simples e
frequentes que podem ser resolvidos de modo automatizado. Um
deles consiste em exibir os registros em forma de uma tabela e
verificar, visualmente, se os informaes de cada campo so
coerentes com o esperado. Isso pode ser feito com grandes
quantidades de registro, e essa simples verificao visual j
destaca muitos problemas.

Outra sada possvel hierarquizar os registros,


campo por campo. Erros de data, por exemplo, so rapidamente
visveis com esse tipo de procedimento. Espaos antes de texto
tambm so ressaltados. Isso tudo pode ser amplificado
exportando-se os dados para uma planilha eletrnica.
[97]

Informaes fora do lugar ou muito discrepantes podem ser


identificadas com facilidade. claro que algumas podem virar
grandes descobertas, digamos assim, mas pode ser um simples
erro de digitao. Com os dados exportados para uma planilha
eletrnica, podemos mandar eliminar (apenas na planilha) os
elementos repetidos e obter apenas as variaes disponveis.
Isso permite verificar pequenos erros, como Tera-feira e
Terca_feira. Esse pequeno detalhe geraria duas informaes
diferentes. Os campos de clculo podem ser igualmente teis
para essa tarefa, assim como o uso das tabelas dinmicas. Tudo
isso sem perder o nosso artesanato.
[98]

Montando bases: alguns exemplos


concretos

Muitos historiadores que vimos defendem que as


bases, em Histria, deveriam ser source-oriented, ou seja, feitas
a partir da estrutura das fontes. Essa afirmao - que defendo -
pode ser polmica por dois motivos. O primeiro que ela tem
cheiro de positivismo. Aprendemos na universidade a no nos
deixarmos levar pelas fontes, ou que toda a fonte
enganadora ou que a teoria que abre a caixa-preta das
fontes. Tudo isso me parece correto e no vou divergir. O
problema que, para fazer a nossa virada epistemolgica e ver
alm do que diz a nossa empiria, preciso conhec-la. preciso,
ainda, conhecer os informantes: saber como as fontes foram
construdas, por quem, com que propsito, que interesses
estavam em jogo. Enfim, preciso saber como arrancar a
informao de quem pretendia falar de outra coisa ou, como
dizia Certeau, "transformar em 'documentos' determinados
objetos distribudos de outra forma." certo que partimos de
66

um problema de pesquisa, mas o caminho inclui uma parada


para um longo contato com a empiria.

O segundo motivo para a polmica que muitas


pessoas j usam ou pretendem construir bases direcionadas para
certos objetivos, sem um grande desmonte da empiria ou sem
um foco maior nesse esforo. Para ajudar o argumento dessas
pessoas, vou at citar um bom exemplo de base de dados desse
tipo: o projeto The Trans-Atlantic Slave Trade Database. Trata-
67

se de um banco de dados com mais de 35.000 viagens de navios


66
DE CERTEAU, A operao histrica, p. 30.
67
Voyages Database. 2009., Voyages: The Trans-Atlantic Slave Trade
Database., disponvel em: <http://www.slavevoyages.org>, acesso em:
4 jan. 2014.
[99]

negreiros na poca moderna. Um projeto que no pretende a


preciso exata do nmero de viagens e de seres humanos
transportados. Ele pretende estimar o volume total ou, para
empregar o conceito correto, a grandeza daquela prtica, que
no tinha nenhuma grandeza, mas contava com dezenas de
milhares de viagens com mais de uma dezena de milho de
almas conduzidas para o trabalho escravo. A exatido aqui no
o objetivo nem poderia ser. A crtica documental foi pouco
considerada e h motivos para isso. Se fosse bem feita, como
quem faz uma tese usando uma nica fonte, o projeto jamais
seria concludo. E uma crtica bem feita pode mudar o nmero
exato de navios e escravos que cruzaram o Oceano Atlntico,
mas no a grandeza. Por outro lado, o nmero exato seria uma
esperana assaz ingnua.

A pouca preocupao relativa com a crtica da fonte


no The Trans-Atlantic Slave Trade Database se justifica pela
dimenso do projeto. Poucas vezes ela est to bem amparada.
No vou criar aqui uma regra ou mesmo dar uma sugesto que
proponha os limites desse expediente. Isso depende das
caractersticas de cada pesquisa, mas deve ser levado em conta.
Em geral, eu recomendaria sempre conhecer bem as fontes,
especialmente as que so centrais para nossa pesquisa.

Convm enfatizar que no apenas com uma


pergunta ou problema que conduzimos uma pesquisa sem ter a
fonte como eixo central. H certas metodologias que podem se
valer de um leque muito amplo de fontes, como os estudos
prosopogrficos e de anlise de redes sociais. Em ambos os
casos, podemos compor um mosaico de informaes sobre cada
um dos personagens que fazem parte do nosso estudo, tendo
como fonte dezenas ou centenas de fragmentos com as mais
diversas origens. E seria quase impossvel fazer a crtica
completa de todas. Veremos, agora, algumas aplicaes
possveis de bases de dados tomando exemplos elaborados a
[100]

partir de fontes diversas, metodologias e temticas.

Antes de continuar, gostaria de insistir em algo que


me parece fundamental: as bases de dados podem ser usadas
em qualquer pesquisa, e no, apenas, em estudos quantitativos
ou seriais. certo que estes ltimos dependem de bases para
ser realizados, mas a recproca no verdadeira. Podemos usar
bases para qualquer tipo de estudo. claro que nem todos os
estudos ou abordagens precisam desse tipo de ferramenta, mas
o simples fato de organizar as informaes, mesmo notas de
pesquisa, torna as bases de dados teis para qualquer situao.

Bases centradas na fonte

Esse o tipo preferido de grandes nomes, como


Manfred Thaller e Alan Macfarlane. Ambos adotaram como
padro de trabalho uma espcie de transcrio estruturada,
atravs da qual o documento era transcrito normalmente, mas
certos fragmentos, palavras, nmeros e datas, eram rotulados
para que o computador pudesse process-los. O mesmo tambm
defendido por Carvalho, que disse que "os melhores mtodos
de entrada de dados oriundos de fontes histricas so aqueles
que preservam a estrutura original da informao". Usando
68

desse recurso ou no, precisamos criar tabelas e campos para


transformar nossos papis velhos em bytes. Vejamos alguns
exemplos.

Registros de batismo

Comecemos com uma fonte bastante tradicional nas


aplicaes informatizadas: os registros de batismo. Sei que os

68
CARVALHO, Joaquim, Soluzioni informatiche per microstorici, Quaderni
Storici, v. XXVI, n. 03, 1991(Traduo nossa. O original est em italiano).
[101]

mais antigos conservados so de algumas cidades italianas e que


podemos encontr-los em toda a Europa, na frica e na Amrica.
Como vou trabalhar com essa fonte, li vrios artigos e livros
sobre o uso que fizeram dela e das variaes possveis (ou, pelo,
menos as mais comuns) em seu formato. Sei que h vasta
metodologia desenvolvida para sua anlise e que elas podem se
revelar teis em algum momento da pesquisa, pois minha
pergunta inicial pode se revelar insuficiente e demandar outras
abordagens no previstas inicialmente. Para tanto, precisarei
adequar a pesquisa. Quando isso acontecer, ser bom ter
preparado a base de maneira a prever algumas possibilidades.
Isso no significa criar uma base para tudo, mas desmontar de
tal modo que os dados dos batismos possam ser remontados de
diversos modos e no apenas da forma originalmente pensada.

Vamos pensar na forma como os registros esto


dispostos. Sempre sero na forma de livros, no apenas pelo
fato de isso ser comum, mas porque h uma demanda oficial
atravs de normativas internas da Igreja, que no vou explorar
aqui. Todos os arquivos tm volumes onde ficam registrados os
batismos que couberam ali. O nmero de registros de batismo
possvel em cada tomo n. No h mnimo ou mximo. Eles no
tm diviso interna estabelecida. Os batismos geralmente so
listados na ordem cronolgica, um aps o outro. possvel
encontrar divises em alguns casos, como metade do livro para
pessoas livres e a outra metade para escravos, em sociedades
escravistas. H, igualmente, separao para indgenas. Mas so
especificidades de alguns exemplares e no regras da fonte.
Precisamos, contudo, considerar esta possibilidade e saber incluir
isso no nosso modelo conceitual.

Mesmo que os registros estejam dentro de livros,


eles se constituem em uma srie. Os livros so o suporte para
que a srie exista e fique organizada, mas se fosse possvel ter
um livro infinito, ele teria todos os registros. Assim, o livro
[102]

importante, mas no central. O centro das atenes est no


registro propriamente dito que tem uma estrutura interna
relativamente regular. comum que comece com a data, que
fale imediatamente o nome do batizando com sua legitimidade, e
os responsveis por ela, seus pais. Pode mencionar os avs,
mas, nem sempre, isso ocorre. Ele informa os padrinhos e acaba
com a assinatura do padre. comum que sejam acrescidas
observaes sobre cada um dos participantes, especialmente
sobre o estatuto das pessoas, a residncia, a naturalidade e o
local do batizado.

Observando a descrio acima, sabemos que h


elementos constantes e esperados, como o nome do batizando,
dos pais e dos padrinhos. Seria igualmente esperada a
informao sobre os avs, mas ela no to regular. H ainda
contedos completamente irregulares, que podem ou no ser
mencionados para alguns (e no, para todos) dentro de um
mesmo registro. Pode haver duas informaes de qualidade
diferente ("filho do capito" nos diz de quem filho e que o pai
capito) para um nico participante e nenhuma para os demais.
Por ter visto muitos registros, sei que possvel que os batizados
aconteam em um lugar diferente da Igreja Matriz, como em
uma propriedade agrria ou na casa de algum. Da mesma
maneira, a criana pode ter sido batizada in extremis, por temor
de sua morte, mas sobrevivido para ter com o padre e receber
os santos leos posteriormente. O padre pode ser um e a pessoa
que batiza, outra, assim como o batismo pode ser dado por um
padre e o registro ser feito por outro.

Podemos comear nosso trabalho. Tomamos o


papel e anotamos todas essas observaes. Sabemos tambm o
volume que vamos abordar - se um, dois ou trs livros, por
exemplo. Contamos que cada pgina tem, em mdia, quatro
registros e que os trs volumes que vamos usar tem, somados,
650 pginas. Isso nos permite estimar a grandeza do nmero de
[103]

registros: uns 2600. Tendo isso apontado, podemos seguir em


frente. O passo seguinte pensar sobre quantas tabelas sero
necessrias. Pelo que foi dito at aqui, quantas voc, leitor,
pensaria? Eu diria que, pelos menos, trs: uma para registrar os
livros, outra, a mais importante, para registrar os batismos, e
uma terceira para registrar as informaes irregulares sobre os
participantes do batismo, sua condio social, seu estatuto, sua
residncia, etc. Elas merecem, em minha opinio, uma tabela
separada e relacionada com a dos batismos. Vejamos:

Figura 19 - Modelo Conceitual de uma base para registros de batismos

Criamos tabelas quando os fragmentos que


identificamos em nossos materiais tm relevncia e
especificidades suficientes para ganhar um espao exclusivo feito
sob medida. Vamos pensar, agora, nos campos de cada uma das
tabelas, comeando pela de livros. O primeiro campo que
sempre devemos criar o cdigo, um campo que vai identificar
inequivocamente cada registro, nesse caso, cada livro. Alguns
usam a expresso Identificador ou ID. H quem use
Matrcula. Eu prefiro chamar de cdigo, especialmente pelo
fato de que ali ser inserido um cdigo alfanumrico que ser
facilmente identificado como uma fonte. No caso dos batismos,
eu faria algo como SAnt_bat_001 para identificar o livro de
batismos nmero 1 da Parquia de Santo Antnio. Os
programadores chamam esse tipo de campo de chave primria.
Depois, veremos que os registros de batismos desse mesmo livro
tero tambm esse rtulo, acrescido da pgina e da ordem do
[104]

registro dentro dela. O campo seguinte o nome da parquia,


um campo de texto; o prximo o nmero do volume, e o
seguinte, um campo de texto para informar o ano inicial e o final
do tomo. tambm importante fazer um campo para informar o
nmero de registros total desse livro, assim como o de pginas.
Eu ainda faria um campo para a abertura do livro (isso feito,
quase sempre, na primeira folha) e outro para seu fechamento
(fica na ltima). Acabaria com um campo de observaes. Talvez
seja o caso de criar um campo para o nome do volume, pois, em
algumas vezes so identificados com um ttulo como Livros dos
Pretos da Candelria. Assim, temos:

TABELA LIVROS

CAMPO TIPO OBS


Cdigo_livro* Texto (chave Mximo de 12 caracteres
primria)
Parquia Texto Livre
Nmero do livro Nmero Mximo de 3 caracteres
Data inicial Data (ou AAAA
texto)
Data final Data (ou AAAA
texto)
Total de registros Nmero Mximo de 5 caracteres
Total de pginas Nmero Mximo de 4 caracteres
Abertura Texto Livre
Fechamento Texto Livre
Observaes Texto Livre
* Indica que o campo ter um relacionamento com outra tabela.

Agora precisamos dar conta da tabela Batismos


propriamente dita, que requer mais trabalho. Comeamos
novamente com o campo cdigo_livro, que vai receber o
cdigo do livro em todos os registros, de modo a permitir seu
relacionamento. como se carimbssemos o cdigo do livro em
cada registro para associ-los. Com isso, no precisamos digitar
[105]

nenhum dado do livro no registro, que j herdar todos do seu


pai. Essa filiao to marcante que muitos programadores
costumam chamar os campos de ID (identificador) e
ID_parent (identificado do pai) para enfatizar isso. Pode ser
uma opo. Eu prefiro utilizar a palavra cdigo, seguida de
outra que indica o que est sendo codificado. E nesse caso
particular, importante usar o mesmo nome, pois logo criaremos
outro campo cdigo para outro relacionamento que a base
ter, agora, com os detalhes relativos aos participantes do
batismo. Esse campo ser chamado de cdigo_registro. O
prximo campo pode ser o de transcrio, que receber o texto
do batismo na ntegra. uma alternativa, no necessrio, mas
pode ser til para evitar novas viagens ao arquivo. Eu o usaria
pensando no problema apresentado na pgina 27, quando falei
que Martha Hameister encontrou um registro de batismo
excepcional. No preciso criar um campo para o texto
inesperado, mas no vamos perder essa preciosidade. Ele ficar
junto com as outras informaes seriveis, mas integralmente
transcrito. Vejamos que outros campos seriam necessrios:

TABELA BATISMOS

CAMPO TIPO OBS


Cdigo_livro* Texto Mximo 12 carac.
Cdigo_registro* Texto Mximo 19 carac.
Transcrio Texto Livre
Local de nascimento Texto Livre
Local do batizado Texto Livre
Padre celebrante Texto Caixa de escolha
Quem redigiu Texto Caixa de escolha
Data do batismo Data ou Livre
Texto
Data do nascimento Data ou Livre
Texto
Nome do batizando Texto Livre
[106]

Sexo Texto Caixa de escolha (M, F)


Legitimidade Texto Caixa de escolha (L, N)
Pai Texto Livre
Me Texto Livre
Padrinho Texto Livre
Madrinha Texto Livre
Av paterno Texto Livre
Av paterna Texto Livre
Av materno Texto Livre
Av materna Texto Livre
Observaes Texto Livre
* Indica que o campo ter um relacionamento com outra tabela.

Comecemos observando o campo Cdigo_registro


que deve ter at 19 caracteres para que possa receber o
cdigo_livro integralmente e ser acrescido de nmeros que
indiquem a pgina e a ordem do batismo na dita mesma. Ficar
algo como SAnt_bat_001_023v_3. Nesse caso, vai significar:
Parquia de Santo Antnio, 1 livro de Batismos na pgina 23
verso, 3o registro na ordem da folha, de cima para baixo. Com
isso, cada registro ter seu endereo completo no Arquivo da
Igreja, de uma forma compacta e fcil de entender (e de citar,
pois pode ser usada como referncia nos textos que forem feitos
com o registro. Basta copiar e colar).

O sexo no dito, mas pode ser uma informao


fcil de se obter, tendo em conta apenas o nome. Uma opo, j
usada e aprovada pelo autor, criar um pequeno aplicativo que
faa uma varredura pelos registros para procurar nomes
masculinos e femininos e preencher automaticamente o sexo.
Para isso, preciso ter uma lista prvia dos nomes para cada
sexo. D trabalho e deve ser feita para cada contexto, regio e
poca, pois muda bastante, mas, depois, basta aplicar para
qualquer outra fonte ou registro novo. Essa aplicao depende
do programa e da habilidade do usurio em cri-la. No vamos
ensinar aqui, pois depende de cada software.
[107]

Por fim, temos a terceira tabela, Detalhes que


ser muito enxuta para permitir alguma maleabilidade, para que
possamos receber qualquer tipo de dado adicional. Comeamos
com nosso velho amigo cdigo, nesse caso, cdigo_registro,
que associar todos os detalhes com os batismos respectivos. O
seguinte um campo que classifica o tipo de informao que
ser includa e que vai depender dos critrios que cada equipe
ou pesquisador adotar. Eu criaria opes como Batizado em,
Casado com, Filho de, Qualificativo, etc, tendo em conta o
que aparece na fonte, mas de modo minimamente estruturado.
Depois poderemos reagrupar esses rtulos em outras categorias
e analisar como quisermos. Uma postura mais indutiva permite
isso. O campo seguinte nos diz sobre de qual dos participantes
ser a informao, se do pai, da me, dos padrinhos ou dos
avs. O quarto campo ser para indicar o nome do referido, para
associar o detalhe com a pessoa. O quinto, que chamarei de
informao, permitir detalhar de modo descritivo o que est
sendo registrado. Vejamos:

TABELA DETALHES

CAMPO TIPO OBS


Cdigo_registro* Texto Mximo 12 carac.
Tipo de informao Texto Caixa de opes
Qual posio Texto Caixa de opes
Quem Texto Livre
Informao Texto Livre
Observaes Texto Livre
* Indica que o campo ter um relacionamento com outra tabela.

Com isso, j temos o modelo conceitual de nossa


base e elementos para construir os modelos lgico e fsico. A
construo desses dois vai depender do software escolhido, mas
ser apenas uma tarefa mecnica depois de todas estas
decises. Mas, com isso, temos apenas uma base individual,
[108]

para um nico usurio. Se quisssemos gerar um sistema com


controle de usurios, distribuio de tarefas e auditoria,
precisaramos fazer outra tabela, para cadastrar os usurios, e
criar os campos usurio e data de criao em cada uma das
outras tabelas, para que registrasse quem fez o que e quando.
Vale a mesma lgica apresentada at aqui.

Com essa estrutura, podemos fazer coisas muito


complexas com essa fonte. Podemos, por exemplo, selecionar
apenas os livros que contenham registros nos quais o padrinho
era filho de capito. Com isso quero dizer que resguardando as
especificidades de cada tipo de informao ao criar trs tabelas,
podemos ainda fazer buscas cruzadas considerando que as trs
tabelas esto relacionadas. Respeitamos a estrutura da fonte e
ainda temos como recuperar dados com rapidez e complexidade.
Se fizssemos apenas uma tabela, teramos muita dificuldade de
guardar esses dados como padrinho era filho de capito e
tenderamos a perder a informao, colocando-a em um campo
muito especfico ou, simplesmente, ignorando-a. O planejamento
permitiu, como vimos, um uso amplo dos dados . Mais adiante,
veremos como essa base poderia se integrar com outras, de
batismo e de bitos, para a aplicao do mtodo Henry.

Correspondncias

Vimos (na pgina 24) que as correspondncias


podem ser vistas como um tipo de fonte sem estrutura, diferente
dos batismos. Isso no quer dizer que no possamos fazer bases
delas. O que no podemos forar uma estruturao onde no
h. As correspondncias sequer tm uma forma padronizada de
preservao, como os livros, no caso dos batismos. A nica coisa
que garante a especificidade do gnero sua ampla utilizao
nos ltimos sculos, ainda que seja imemorial. H alguma
bibliografia sobre esse tipo de fonte, ainda que no seja to
[109]

vasta quanto aquela dedicada aos registros paroquiais e h


inmeros estudos que usam este tipo de fonte, mas sempre
dando um tratamento semelhante a livros, inclusive com a
publicao de sries de correspondncias.

O que realmente regular ou esperado, previsto


so informaes como remetente, destinatrio, data, local
do remetente, local do destinatrio e o texto da carta. Com
isso faremos nossa base. Poderamos acrescentar outros campos
por capricho, para aproveitar bem mais a fonte: pessoas
citadas, locais citados e temas. So trs campos que
evidenciam a interveno direta do historiador, mas sem
perturbar a fonte. Poderamos tambm acrescentar um campo
para incluir o perodo que a carta cobre, se faz referncia a
coisas passadas ou expectativas futuras, campos para resumo,
recortes e outro para identificar recursos discursivos utilizados.
Assim, estaramos desmontando de forma mais adequada a
fonte, como devemos fazer. Vejamos:

TABELA CORRESPONDNCIAS

CAMPO TIPO OBS


Remetente Texto Livre
Local do remetente Texto Livre
Destinatrio Texto Livre
Local do destinatrio Texto Livre
Data Data ou texto AAAA-MM-DD
Texto da carta Texto Livre
Cdigo_carta Texto Livre

Campos opcionais que podem ser teis:

CAMPO TIPO OBS


Pessoas citadas Texto Livre
Locais citados Texto Livre
[110]

Temas Texto Livre ou caixa de


opes
Perodo abarcado Texto Livre
Resumo Texto Livre
Recortes Texto Livre
Recursos discursivos Texto Livre

Haveria, ainda, outra possibilidade, a de criar um


campo adicional para recolher dados sobre outras cartas
mencionadas na prpria carta. Isso seria interessante, porque,
muitas vezes, as cartas so respostas a outras anteriores, que
por sua vez foram respostas de outras mais e isso
freqentemente mencionado (Respondo por esta a sua do
dia... ou frmulas semelhantes). Com esse controle, podemos
ver o tempo de resposta entre uma carta e outra e observar uma
srie delas, quase uma conversa, entre duas pessoas. Para isso,
bastaria o campo em resposta carta de e, talvez, um campo
de clculo que medisse a diferena entre as duas datas, ainda
que possa ser feito em uma planilha, uma vez exportados esses
dados, o que j facilitaria a preparao de um grfico. Contudo,
nem sempre, a carta responde a apenas uma original. Pode ser o
caso de, analisando a documentao, percebermos que h
missivas que respondem a duas ou trs anteriores, que so
claramente mencionadas. Nesse caso, no basta um campo de
"em resposta carta de...". preciso criar outra tabela que
contenha aquele campo e as datas das originais e da atual.

Fontes dialgicas

Tomei a expresso "dialgicas" do texto O


inquisidor como antroplogo, de Carlo Ginzburg. Serve para
69

69
GINZBURG, Carlo, O inquisidor como antroplogo: uma analogia e as suas
implicaes, in: Micro-histria e outros ensaios, [s.l.: s.n.], 1989.
[111]

designar as fontes que foram produzidas a partir de um dilogo,


como interrogatrios da igreja ou da polcia. claro que so
frutos de pocas muito diferentes, mas o que faz Ginzburg
aproxim-las que elas tm uma estrutura semelhante e tendem
a formar corpi documentais mais organizados do que as
correspondncias e formar sries completas, tanto nos locais
onde so produzidas quanto nos Arquivos. H muitos estudos
sobre esse tipo de fonte, ainda que a maioria dos trabalhos que
as utilizem no faa nenhuma reflexo sobre sua produo. A
produo dessas fontes segue um ritual semelhante, com a
instaurao do processo, que transcrito do incio ao fim (com
ausncias, talvez, mas com um incio e um final). regular
tambm o fato de haver depoimentos em srie e, para cada caso
particular, uma lista de perguntas que foram feitas aos
interrogados. Ou seja, temos duas camadas de regularidades:
uma prpria da fonte, com o processo, os depoimentos e as
listas de perguntas; outra, prpria de cada conjunto, com a
lgica prpria das perguntas, de acordo com a dinmica do
processo, com o momento de sua produo e com o caso em
questo.

Precisamos, ento, de uma tabela para o processo


na qual haver campos como data inicial e data final, alm
de uma smula do caso, de uma lista de acusados e de
testemunhas. certo que dados mais bsicos sero necessrios,
como o local do inqurito e os nomes dos investigadores e dos
juzes. Nesse caso, seria importante ter informaes sobre cada
uma das instncias pelas quais passou, sabendo que
recorrente que haja hierarquias na Justia desde longo tempo.
bem verdade que nosso processo pode ter sido arquivado na
origem, numa delegacia de interior, mas o simples fato de
pensarmos que poderia ter tido uma longa trajetria, mas que
no teve j nos faz aprimorar nossa reflexo sobre a fonte e o
problema histrico em si. Era normal ser arquivado ou foi uma
[112]

deciso arbitrria? Quais os trmites mais recorrentes? So


questes que colocamos diante da demanda por organizar nosso
material em caixinhas (campos) de uma tabela.

A primeira coisa a descobrir o fluxograma possvel


do processo, o caminho do inqurito do incio ao final. Isso varia
de acordo com o contexto. preciso tambm saber se h
diferenas entre essas instncias, no que toca ao processamento
dos casos. Se no houver, basta uma tabela Processos na qual
podemos marcar com um campo sim ou no todo o caminho
possvel de um caso. Isso resolveria. Deste modo, cada
interrogatrio seria colocado em uma tabela relacionada
chamada interrogatrios, uma vez que cada processo pode ter
n sesses de perguntas, ou dilogos, para manter o vocabulrio.
E como o nmero de perguntas tambm sempre n, seria
importante criar uma tabela Perguntas, que teria, alm do
campo cdigo, os campos pergunta e resposta.

Parece-me no ser preciso repetir as tabelas com os


dados organizados, como fiz com o exemplo dos batismos e das
cartas. Nesse momento, o leitor j pode bolar o prprio esquema
a partir das reflexes iniciais aqui apontadas. O importante no
simplificar aquilo que merece desdobramentos. Nosso trabalho
de historiador j uma simplificao. Colocar em bases de
dados, tambm, mas uma simplificao que organiza. No
precisamos simplificar mais nem temos motivo para isso,
porquanto temos ferramentas que nos permitem tratar as fontes
com cuidado.

Bases centradas no mtodo

Na pgina 47 vimos algo sobre o sistema "Fichoz".


Trata-se de um bom exemplo de base de dados method-centred,
que, apesar de no permitir a incorporao integral de fontes,
[113]

permitia o desdobramento de interaes sociais (descritas nas


fontes) em uma grande variedade de pedaos reagrupveis
conforme a necessidade. No caso da base "Fichoz", a
possibilidade de desmontar as fontes to grande que,
dependendo da obstinao do pesquisador, nem seria to
perigoso ficar sem elas. E seria relativamente fcil reutilizar a
base, tendo em vista sua plasticidade diante de inmeras
metodologias conhecidas na atualidade. Como sou um defensor
das bases source-centred, tenho receio de recomendar bases
centradas no mtodo, mas entendo que, quando bem feitos,
esses bancos de dados so preciosos. Vejamos alguns exemplos
de metodologias e como seria a criao de bases com essa
perspectiva.

Prosopografia

Assim como preciso conhecer a fonte para fazer


uma base centrada nelas, preciso conhecer bem a
metodologia. Para a prosopografia, por exemplo, fundamental
conhecer o clssico de Lawrence Stone sobre a aristocracia
inglesa , assim como seu artigo de 1971, que j apresentamos
70

no incio desta obra. H outros livros importantes, inclusive


muitas coletneas nacionais, mas seria muito longo apresentar
todas aqui. Isso uma tarefa do desenvolvedor da base, que
dever tomar essas referncias em conta.

Sabemos que prosopografia a biografia de um


grupo, que pode ou no ser homogneo, e que preciso ter
uma ferramenta com a qual possamos armazenar os dados de tal
maneira que possamos utilizar a base circulando entre os
indivduos e o grupo. A prosopografia j previa uma variao de
escala (pelo menos duas), muito antes de esse assunto entrar

70
STONE, The Crisis of the Aristocracy, 1558-1641.
[114]

com fora no debate historiogrfico a partir da micro-histria.


Ser o caso de termos duas bases, uma para o grupo e outra
para os agentes? Devemos ter uma ficha para cada
personagem, com sua data de nascimento, de casamento, de
morte, etc.?

J vimos um modelo interessante para a


prosopografia, a mesma base Fichoz, de Jean-Pierre Dedieu.
Ela no tinha fichas individuais e sua concepo era totalmente
oposta a esse sistema. A ideia, como j vimos, era de
desmembrar a vida das pessoas em eventos, para que pudessem
ser reagrupados depois em forma de uma biografia (numa busca
pelo sujeito) ou por meio de algum outro critrio. Com a mesma
base, seria possvel relacionar o acontecimento com outras
pessoas, permitindo anlises de redes. Isso foi possvel porque,
mesmo sem demandar inicialmente este tipo de anlise, tal
possibilidade foi pensada no incio da construo da base. O
modelo conceitual da base Fichoz me parece muito adequado
aos estudos prosopogrficos e seria difcil criar um sistema mais
eficiente e flexvel. No preciso ter uma cpia desse sistema
para reproduzir seu conceito, basta conhecer sua descrio e
aplic-la com os devidos crditos.
71

Um sistema de fichas individuais poderia ser uma


boa sada, mas tem alguns limites difceis de contornar. O
primeiro a montagem da histria de vida da pessoa. Como
desdobr-la de modo cronolgico? Mesmo que no nos agrade a
cronologia, ser que nunca precisaremos dela? Nunca teremos
algum comportamento humano marcado pelo ciclo de vida, como
idade para casar, idade para entrar no mundo do trabalho, idade
para ser deputado etc.? Outro limite que, para cada campo,
precisaramos de outro correlato para a fonte que usamos para

71
DEDIEU, Les grandes bases de donnes: une nouvelle approche de lhistoire
sociale. Le systme Fichoz.
[115]

preencher aquele campo. Por fim, deveramos ter um campo


profisso at para aqueles que nunca tiveram uma? Um campo
de matrimnio mesmo para quem nunca se casou? verdade
que importa perceber as ausncias, o que s seria possvel sem
um campo que exigisse isso de todos.

Anlise demogrfica (Mtodo Henry)

Criado ao longo dos anos 1950 como um caminho


para os estudos demogrficos de pocas conhecidas como pr-
estatsticas, quando no havia o registro sistemtico de dados
sobre as populaes, o Mtodo Henry formou geraes de
pesquisadores e outras tantas escolas de estudos demogrficos,
de Cambridge ao Minho. A proposta era relativamente simples:
se no dispomos de estatsticas oficiais para os sculos
passados, juntemos todos os registros de batismo, casamento e
bito e tentemos reconstituir as famlias dessas pocas, atravs
do cruzamento dos dados. Trabalho sem fim! E tudo isso usando
fichas de papel. O tempo passou e somente em 1968 foi
apresentado ao mundo o primeiro grande resultado da proposta,
a tese de Pierre Goubert sobre Beauvais. Desde ento, foram
72

feitos muitssimos acrscimos concepo original, variaes,


inclusive, softwares variados para aplicar o famoso mtodo. 73

Para criar uma base de dados em que se utilize o


Mtodo Henry, o ideal seria comear com trs bases de fontes:
uma para os batismos, uma para os casamentos e outra para os
bitos. Adaptaes posteriores do mtodo, feito pelo prprio

72
GOUBERT, Pierre, Cent Mille Provinciaux au XVIIe Sicle. Beauvais et le
Beauvaisis de 1600 1730, Paris: Flammarion, 1968.
73
Na Universidade do Minho (NEPS), por exemplo, foi criado o MRP, baseado
nas variaes desenvolvidas por Maria Norberta Amorim. AMORIM, Maria
Norberta et al, Reconstituio de parquias e formao de uma base de dados
central, in: , Castelo Branco: [s.n.], 2001.
[116]

Henry para o caso do Brasil, permitiriam uma quarta base, para


as listas nominativas. E isso no significa ignorar a opo de
74

quem prefere trabalhar sem bases source-centred. A questo


que o prprio mtodo prev o tratamento diferenciado para cada
fonte. O passo seguinte envolve unicamente abordagens
method-centred.

preciso criar algumas tabelas e muitos campos


para dar conta dessa metodologia. Parece-me adequado pensar
em pelo menos trs tabelas: localidade, famlia e indivduo.
Localidade, porque convm pensar que a base poder ser
utilizada para diferentes localidades, vizinhas, talvez, ou mesmo
muito distantes (para estudar migrao, por exemplo); famlia,
por ser a unidade domstica o centro do mtodo. Indivduo
permitir isolar os casos e informar suas datas de nascimento,
casamento e morte. Da mesma forma, no podemos prever
quantas pessoas formaro a famlia, o nmero de membros ,
logo, sempre n.

Se temos todos os dados organizados


adequadamente nas bases de casamento, bito e batismo, basta
exportar todos os pares de pai e me, no caso dos batismos, e
de noivos, nos casamentos. Feito isso, basta eliminar os
duplicados e teremos todos os casais disponveis naquela
amostra. Convm fazer uma varreadura para encontrar
problemas com nomes. Por exemplo, a Rita Maria de Oliveira,
casada com Raimundo da Silva, pode ter sido incorretamente
transcrita como Rosa Maria de Oliveira, por conta de um nome
borrado. Um bom estudo da nossa lista resultante da exportao
pode resultar em muitas correes necessrias.

Como nossos dados estavam organizados e j foram

74
HENRY, Louis, Tcnicas de anlise em demografia histrica, Curitiba: UFPR,
1977.
[117]

corrigidos, basta relacionar nossa nova tabela com as bases de


casamento e de batismo para que tragam informaes
complementares que formaro a ficha de cada uma das famlias.
Esse um procedimento bem menos trabalhoso do que digitar
novamente todos os casos. melhor gastar esse tempo
revisando, o que deveria ser feito de qualquer jeito. Assim, j
temos a tabela das famlias, formada por campos como pai e
me, basicamente, alm de campos que criem relacionamento
com as localidades, com as famlias e com as fichas individuais. A
tabela localidades ter os dados do conjunto que sero
herdados por todas as famlias e todos os indivduos.

Assim, resta criar a tabela indivduos, o que


poder ser feito a partir dos batismos, exportando
separadamente todos os pais, mes, padrinhos e madrinhas,
alm da criana, claro. A exportao dos dados dos avs ponto
de reflexo, pois em comunidades jovens, recm-criadas, por
exemplo, eles no costumam estar presentes. Mas pode ser
relevante se assim for considerado pela equipe. Convm exportar
esses dados junto com outros estruturantes da informao,
como o nome do casal, a data, localidade e o cdigo-fonte. No
caso dos batizandos, convm exportar tambm a data de
nascimento, se disponvel, alm da do batismo. Deste modo,
cada indivduo ser associado a um casal, mas tambm a uma
localidade, dadas as outras relaes, como o compadrio. Para
relacionar os bitos, ser preciso criar o relacionamento a partir
do nome.

Com esses procedimentos, teremos um sistema


complexo de anlise de famlias que permitir vrios outros
cruzamentos, de tal maneira que possamos saber o intervalo
intergensico e, os compadrios, as famlias sem pai, entre uma
multiplicidade de outros fenmenos sociais. Mas preciso que
fique claro que isso s ser possvel com boas bases de fontes
que daro algum trabalho, mas valero a pena. Feito isso,
[118]

teremos condies de automatizar um bocado nosso esforo, de


tal maneira que muito do que ser necessrio j estar feito. A
automao e a criao de tabelas de famlia ajudaro a revisar o
material previamente abastecido. Gasta-se tempo na preparao,
mas, no momento da anlise, os dados estaro disponveis em
poucos cliques.

Anlise de redes sociais

Os estudos de anlise de redes sociais surgiram


entre os anos de 1950 e 1960, com o trabalho pioneiro de
Elizabeth Bott, e as pesquisas de Mitchell, Boissevain e Barnes.
uma metodologia que enfatiza as interaes humanas como
objeto primordial de anlise e destaca os tipos e as formas dos
laos criados e mantidos por determinadas unidades de anlise
(que podem ser pessoas, empresas, cidades ou palavras) e como
estas relaes podem interferir no comportamento e nas
escolhas dessas unidades.75
Talvez a maior justificativa para o uso dessa
metodologia, alm das questes epistemolgicas atinentes, seja
a possibilidade de visualizar matrizes e grficos que destacam
com clareza os vnculos entre as partes e observar aspectos no
perceptveis por outros caminhos. Cada matriz e seu grfico
correspondente apresentam um instantneo dos vnculos de um
grupo. O grfico formado por ns (que representam as

75
MITCHELL, J. Clyde; BOISSEVAIN, Jeremy, Network analisys. Studies in
Human Interaction, The Hague/Paris: Mouton, 1973; MITCHELL, J. Clyde,
Social Networks, Annual Review of Anthropology, v. 03, p. 279299, 1974;
BARNES, J. A., Networks and political process, in: MITCHELL, J. Clyde (Org.),
Social Networks in urban situations: Analysis of personel relationships in
Central Africa Towns, Manchester: The University Press, 1969; BOTT,
Elizabeth, Famlia e rede social. Papis, normas e relacionamentos externos
em famlias urbanas comuns, Rio de Janeiro: Francisco Alves, 1976.
[119]

unidades), linhas (que simbolizam as relaes) e setas (que


indicam os sentidos das ligaes). De acordo com as informaes
sobre esses elementos, os desenhos e as cores do conjunto
podem variar, indicando agrupaes ou especificidades de certas
unidades ou laos. Para a criao desses grficos, existem
softwares interessantes e prticos como o Gephi e o Ucinet.
Preparar bases de dados para esse tipo de estudo
demanda tabelas com as quais se possam destacar as relaes
entre as partes, ou seja, coletar dados sobre os personagens
associados "em duplas" por tipo de relao. certo que, muitas
vezes, temos grupos que ultrapassam as duplas, mas eles devem
ser desmontados aos pares, at que todos tenha relao com
todos, pois, somente assim, ser possvel destacar esses vnculos
dentro de uma matriz. No caso hipottico de um grupo de
pessoas, temos um cenrio onde quase todos se conhecem.
Paulinho, por exemplo, conhece todos, mas a forma de
representar isso nas anlises de redes sociais requer que eu
apresente os dados destacando com 1 ou 0 (1 = conhece; 0 =
no conhece), quem amigo de quem, ou seja, dupla por dupla.

Figura 20 - Matriz matemtica das relaes de um grupo


[120]

Figura 21 - Grfico de rede criado com a matriz acima indicada

Assim, basta criar uma tabela em que se organizem


os dados com essa estrutura e tudo ficar resolvido. No caso de
registros de batismos, por exemplo, seria preciso decompor as
relaes de compadrio aos pares: pai com padrinho, pai com
madrinha, me com padrinho, me com madrinha. Mas no
basta s exportar os dados de uma base paroquial para um
programa de anlise de redes, porquanto as interaes se
repetem (um mesmo sujeito pode ser compadre de outro por
vrias vezes, por exemplo) e preciso ter esse controle e
certificar a qualidade dessas relaes. Com isso, podemos
colocar, ao invs de 1 ou 0, vrios nmeros, para indicar a
repetio dos laos ou a qualidade deles - se de compadrio, de
amizade, de vizinhana - etc. Quase todos os programas
permitem apresentar isso visualmente.

Seriais

Um sistema para fontes seriais ou seriveis j seria,


por si s, source-centred, pois, na maioria das vezes
quantificamos uma fonte nica, s bens de inventrios, por
exemplo, ou apenas os registros de compra e venda de alguma
[121]

localidade. Contudo, algumas bases no so feitas com uma


fonte nica. No significa que sejam ruins. A base Slave
Voyages, da Emory University um bom exemplo. Ela foi feita
com fontes muito variadas que mereceriam crticas muito
diversas. Mas, fazendo isso, a base no ficaria pronta nunca e
jamais teramos ideia do volume de pessoas foradas a cruzar o
Atlntico.

Em alguns casos - e isso vai depender do


planejamento da equipe - pode ser preciso criar uma base serial
que no esteja vinculada a uma nica fonte primria, que seja
um mosaico deformado, mas que nos apresente uma imagem,
ao menos borrada do que queremos saber. Para esse tipo de
abordagem, valem alguns aspectos que j pontuamos:
planejamento, discusso, experincia com a base e testes. Isso
pode garantir um bom desenvolvimento. Contudo, preciso
fazer como os coordenadores do Slave Voyages e como nos diria
Marc Bloch: preciso ter critrio. No h bom senso em Histria.
Se definirmos bons critrios, nossa base ter coerncia e ser
til. Mas o problema no se resolve a. Lembremos-nos do
debate iniciado em 1965 com Adeline Daumart: nossas hipteses
mudam ao longo da pesquisa (e, muitas vezes, elas devem
mudar), devido s prprias descobertas feitas ao longo dela.
Essas so questes sobre as quais a equipe dever refletir.
[122]

Concluso

Uma obra como esta no precisaria de concluso,


porquanto entendo que ela fica por conta do leitor, que far sua
base, talvez com a nossa ajuda. Acredito, contudo, que muito
mais do que foi dito aqui poder ser feito e pensado sobre o
assunto, com o foco especificamente direcionado para as
pesquisas na rea de Histria.

Apresentei algumas bases de dados voltadas para


fontes, e outras, para a metodologia, depois de uma breve
reflexo sobre alguns dos problemas prprios da informatizao
do conhecimento histrico, mas no falei que seria possvel criar
um grande sistema que auxilie todas as etapas do trabalho. J
h algumas iniciativas em curso, paralelas, em vrios pases, mas
todas ainda esto em fase de testes. Certamente, em alguns
meses ou anos, este texto ser acrescido de algumas novas
experincias e uma nova concluso. Espero que sim.
[123]

Bibliografia

ADELINE DAUMARD. Structures sociales et classement socio-


professionnel. Lapport des archives notariales au XVIIIe et
au XIXe sicle. Revue Historique, v. 86, n. CCXXVII, 1962.
ADELINE DAUMARD. Une rfrence pour ltude des socites
urbaines en France aux XVIIIe et XIXe sicles projet de code
socio-professionnel. Revue dHistoire Moderne et
contemporaine, v. X, p. 185210, 1963.
AMORIM, Maria Norberta; FERREIRA, Antero; RODRIGUES,
Ftima; et al. Reconstituio de parquias e formao de
uma base de dados central. In: Castelo Branco: [s.n.], 2001.
AUTRAND, Franoise. Le personnel du parlement de Paris:
traitement automatique dune prosopographie en vue
dune tude sociale. In: FOSSIER, Lucie; VAUCHEZ, Andr;
VIOLANTE, Cinzio (Orgs.). Informatique et histoire
mdivale. Roma: cole Franaise de Rome, 1977, p. 239
243.
BARNES, J. A. Networks and political process. In: MITCHELL, J.
Clyde (Org.). Social Networks in urban situations: Analysis
of personel relationships in Central Africa Towns.
Manchester: The University Press, 1969.
BOTT, Elizabeth. Famlia e rede social. Papis, normas e
relacionamentos externos em famlias urbanas comuns.
Rio de Janeiro: Francisco Alves, 1976.
BUSA, Roberto. The Annals of Humanities Computing: The Index
Thomisticus. Computers and the Humanities, v. 14, p. 83
90, 1980.
CARVALHO, Joaquim. Soluzioni informatiche per microstorici.
Quaderni Storici, v. XXVI, n. 03, 1991.
CHARLE, Christophe. Problemes de traitement informatique
dune enquete sur trois lites en 1901. In: MILLET, Hlne
(Org.). Informatique et prosopographie. [s.l.]: CNRS, 1985.
DE CERTEAU, Michel. A operao histrica. In: LE GOFF, Jacques;
[124]

NORA, Pierre (Orgs.). Histria: novos problemas. So


Paulo: Livraria Francisco Alves Editora, 1978.
DE VRIES, Jan. Population. In: BRADY JR., Thomas; OBERMAN,
Heiko; TRACY, James (Orgs.). Handbook of European
History 1400-1600. Late Middle Ages, Renaissance and
Reformation. Leiden / New York / Koln: E. J. Brill, 1994.
DEDIEU, Jean Pierre. Les grandes bases de donnes: une
nouvelle approche de lhistoire sociale. Le systme Fichoz.
Revista da Facultade de Letras- Histria, v. 05, 2004.
DUPAQUIER, Jacques. Suggestions pour lorganisation du travail
dquipe en histoire sociale. In: Lhistoire sociale: sources
et mthodes. Paris: Presses Universitaires de France, 1967.
FAURE, Robert. Machines et programmes. Quelques vues sur
lutilisation des machines traiter linformation en histoire
sociale. In: Lhistoire sociale: sources et mthodes. Paris:
Presses Universitaires de France, 1967.
FAURE, Robert. Mquinas e programas. Pontos de vista sobre a
utilizao das mquinas destinadas a elaborar a informao
em histria social. In: A Histria Social: problemas, fontes e
mtodos. Lisboa: Edies Cosmos, 1973.
FRAGOSO, Joo; PITZER, Renato Rocha. Bares, homens livres
pobres e escravos - notas sobre uma fonte mltipla. Os
Inventrios Post-mortem. Revista Arrabaldes, v. 1, n. 2,
p. 2952, 1988.
GENET, Jean-Philippe. Histoire, informatique, mesure. Histoire
& Mesure, v. 01, n. 01, p. 0718, 1986.
GINZBURG, Carlo. O inquisidor como antroplogo: uma analogia
e as suas implicaes. In: Micro-histria e outros ensaios.
[s.l.: s.n.], 1989.
GINZBURG, Carlo. O nome e o como: troca desigual e mercado
historiogrfico. In: GINZBURG, Carlo (Org.). Micro-histria e
outros ensaios. Lisboa/Rio de Janeiro: DIFEL/Bertrand
Brasil, 1989.
GOUBERT, Pierre. Cent Mille Provinciaux au XVIIe Sicle.
Beauvais et le Beauvaisis de 1600 1730. Paris:
[125]

Flammarion, 1968.
HAMEISTER, Martha Daisson. Para dar calor nova povoao:
Estudo sobre estratgias sociais e familiares a partir dos
registros batismais da Vila do Rio Grande (1738-1763).
UFRJ, Rio de Janeiro, 2006.
HARVEY, Charles; PRESS, Jon. Databases in Historical Research.
Theory, Methods and Applications. London: Macmillan
Press, 1996.
HENRY, Louis. Tcnicas de anlise em demografia histrica.
Curitiba: UFPR, 1977.
JACQUES DUPAQUIER. Problmes de la codification socio-
professionelle. In: Lhistoire sociale: sources et mthodes.
Paris: Presses Universitaires de France, 1967.
JEAN-PIERRE DEDIEU. Entrevista, realizada em outubro de 2013.
ENS, Lyon.
LUZZATI, Michele. La reconstruction nominative et
prosopographique de la population dune ville mdivale:
projet de constituition dune banque de donnes pour
lhistoire de Pise au XVe sicle. In: MILLET, Hlne (Org.).
Informatique et prosopographie. [s.l.]: CNRS, 1985.
MACFARLANE, Alan. Computer input of Historical Records for
multi-source record linkage. In: Proceedings of the Seventh
International Economic History Conference. Edinburgh:
[s.n.], 1979.
MACFARLANE, Alan. Reconstructing historical Communities.
Cambridge: Cambridge University Press, 1977.
MACFARLANE, Alan. The computer revolution and local history.
Disponvel em:
<http://www.alanmacfarlane.com/FILES/local.htm>.
MANDEMAKERS, Kees; DILLON, Lisa. Best practices with large
databases on historical populations. Historical Methods,
v. 37, n. 01, 2004.
MITCHELL, J. Clyde. Social Networks. Annual Review of
Anthropology, v. 03, p. 279299, 1974.
MITCHELL, J. Clyde; BOISSEVAIN, Jeremy. Network analisys.
[126]

Studies in Human Interaction. The Hague/Paris: Mouton,


1973.
PRATESI, Alessandro. Limiti e difficolt delluso dellinformatica
per lo studio della forma diplomatica e giuridica dei
documenti medievali. In: FOSSIER, Lucie; VAUCHEZ, Andr;
VIOLANTE, Cinzio (Orgs.). Informatique et histoire
mdivale. Roma: cole Franaise de Rome, 1977, p. 187
190.
ROWLAND, Robert. L`informatica e il mestiere dello storico.
Quaderni Storici, v. 78, n. 03, p. 693 720, 1991.
SCHRER, Kevin. Historical demography, social structure and the
computer. In: DENLEY, Peter; HOPKIN, Deian (Orgs.).
History and Computing. Manchester: Manchester
University Press, 1987.
SHORTER, Edward. The historian and the Computer. A practical
guide. New Jersey: Prentice-Hall, 1971.
STONE, Lawrence. Prosopografia. Revista de Sociologia e
Poltica, v. 19, n. 39, p. 115137, 2011.
STONE, Lawrence. The Crisis of the Aristocracy, 1558-1641.
Oxford: Oxford University Press, 1965.
STONE, Lawrence. The revival of narrative: reflections on a new
old history. Past and Present, n. 85, p. 324, 1979.
THALLER, Manfred. Can we afford to use the computer; can we
afford not to use it? In: MILLET, Hlne (Org.).
Informatique et prosopographie. [s.l.]: CNRS, 1985.
THALLER, Manfred. Methods and techniques of historical
computation. In: DENLEY, Peter; HOPKIN, Deian (Orgs.).
History and Computing. Manchester: Manchester
University Press, 1987.
THOMAS, William. Computing and the Historical Imagination. In:
SCHREIBMAN, Susan; SIEMENS, Ray; UNSWORTH, John
(Orgs.). A Companion to Digital Humanities. Oxford:
Blackwell, 2004.
UNIVERSIT DE MONTRAL INSTITUT DTUDES MDIVALES.
Computers and Medieval Data Processing: Informatique Et
[127]

Etudes Medievales. [s.l.]: Universit de Montreal, Institut


dtudes medievales., 1971.
VAN DER WOUDE, A.M.; SCHUURMAN, A. Probate inventories:
a new source for the historical study of wealth, material
culture, and agricultural development: papers presented
at the Leeuwenborch conference (Wageningen, 5-7 May
1980). [s.l.]: Hes, 1980. (A.A.G. bijdragen).
VOVELLE, Michel. Ideologias e mentalidades. So Paulo:
Brasiliense, 1987.
WRIGLEY, E. A. Identifying people in the past. London: Edward
Arnold, 1973.
Base de donnes - Wikipdia. Disponvel em:
<http://fr.wikipedia.org/wiki/Base_de_donn%C3%A9es>.
Acesso em: 27 set. 2013.
Database - Wikipedia. Disponvel em:
<http://it.wikipedia.org/wiki/Database>. Acesso em:
27 set. 2013.
Database - Wikipedia, the free encyclopedia. Disponvel em:
<http://en.wikipedia.org/wiki/Database>. Acesso em:
27 set. 2013.
Index Thomisticus. Disponvel em:
<http://www.corpusthomisticum.org/it/index.age>. Acesso
em: 27 set. 2013.
Voyages Database. 2009. Voyages: The Trans-Atlantic Slave
Trade Database. Disponvel em:
<http://www.slavevoyages.org>. Acesso em: 4 jan. 2014.