Você está na página 1de 128

Ladeira Livros

Como se faz um
banco de dados
(em Histria)

Tiago Gil
Laboratrio de Histria Social
Universidade de Braslia

2015

Copyright Tiago Lus Gil


Capa: Durval de Souza Filho
Preparao dos originais: Manoel Rendeiro Neto
Editorao Eletrnica: David da Silva Carvalho
Ladeira Livros
Rua General Cmara, 385
Centro
Porto Alegre
ISBN: 978-85-69621-00-3

Conselho Editorial
Joo Luis Ribeiro Fragoso (UFRJ)
Martha Hameister (UFPR)
Tiago Bernardon de Oliveira (UFPB)
Luis Augusto E. Farinatti (UFSM)
Helen Osrio (UFRGS)

Dados Internacionais de Catalogao na Publicao (CIP)


Ficha catalogrfica elaborada pelo bibliotecrio Miguel ngelo Bueno Portela, CRB1
2756

G463c

Gil, Tiago.
Como se faz um banco de dados (em histria) [recurso
eletrnico] / Tiago Gil. Porto Alegre : Ladeira Livros, 2015.
127 p. : il.
Documento em PDF.
Inclui bibliografia.
ISBN 978-85-69621-00-3.
1. Histria - Metodologia. 2. Banco de dados.
3. Informtica. I. Ttulo.
CDU 930:004.652

Contedo
PREFCIO ............................................................................................................... 5
INTRODUO ........................................................................................................ 7
ALGUMAS QUESTES TERICAS E METODOLGICAS .......................................... 11
UM ARTESANATO, UMA OPERAO ..................................................................................14
DESMONTANDO AS COISAS EM ORDEM ..........................................................................21
EM OMBROS DE GIGANTES .............................................................................................31
ALGUMAS QUESTES PRPRIAS DA INFORMTICA ............................................ 50
ESTRUTURA DE DADOS ...................................................................................................50
MODELOS CONCEITUAIS, LGICOS E FSICOS .......................................................................58
ASPECTOS VISUAIS SOBRE AS BASES ..................................................................................63
ENTRE A TCNICA E A TEORIA: PROBLEMAS COTIDIANOS E DECISES PRTICAS ...........................71
ENGENHARIA DE PESQUISA ................................................................................. 83
LEVANTAMENTO INICIAL.................................................................................................83
COLETANDO OS DADOS E ABASTECENDO A BASE ..................................................................87
ADMINISTRAO DA BASE ..............................................................................................95
MONTANDO BASES: ALGUNS EXEMPLOS CONCRETOS......................................... 98
BASES CENTRADAS NA FONTE ....................................................................................... 100
BASES CENTRADAS NO MTODO ................................................................................... 112
CONCLUSO ...................................................................................................... 122
BIBLIOGRAFIA .................................................................................................... 123

Prefcio
Este livro foi fruto de um ps-doutorado realizado na
cole des Hautes tudes en Sciences Sociales (EHESS) entre
agosto de 2013 e janeiro de 2014, dentro do projeto "O Bom
Governo das Gentes: hierarquias sociais e representao
segundo a poltica catlica do sculo XVI ao XVIII". Para tanto, li
centenas de artigos, livros e captulos sobre o tema, alm de
dezenas de manuais de informtica. Os resultados dessa
pesquisa tambm foram aproveitados em cursos presenciais
sobre bancos de dados, realizados na UFRJ em outubro de 2014
e na UFRGS em dezembro do mesmo ano, quando as ideias aqui
apresentadas foram alvo de debates. Os dados obtidos foram
utilizados em outras publicaes, a saber: Storici e informatica:
luso dei database (1968-2013), publicado na revista Memoria e
ricerca (Itlia, 2015) e "Our own in-house software: una

historia de historiadores programadores na obra Historiografa,


giro digital y globalizacin. Reflexiones tericas y prcticas
investigativas de Juan Andrs Bresciano (Uruguay, 2015).
Agradeo aos colegas do Departamento de Histria da UnB,
Marcelo Balaban, Neuma Brilhante, Teresa Marques, Luiz
Noguerl e Marcos Pereira pela leitura atenta, assim como aos
estudantes do Laboratrio de Histria Social da UnB, que
discutiram animadamente seu contedo. No poderia deixar de
agradecer aos professores Joo Fragoso, Jonas Moreira Vargas,
Roberto Guedes Ferreira, Antonio Carlos Juc de Sampaio,
Thiago Krause, Hlida Conceio, Helen Osrio e Lus Augusto
Farinatti, que igualmente leram e comentaram o original. O
material tambm foi avaliado pelo mestre em computao Cssio
Couto, que fez diversas sugestes.
A pesquisa contou com financiamento
(Programa Capes/Cofecub) e do CNPq.

da

CAPES

CLIQUE AQUI
PARA ADQUIRIR
A VERSO
IMPRESSA DESSE
LIVRO

[7]

Introduo
Este um livro voltado para estudantes de Histria
e para quem quer informatizar sua pesquisa desde o comeo.
Por informatizar quero dizer criar uma base de dados, ou, como
se diria em ingls to database something. Seu objetivo de
ajudar o leitor a incrementar sua pesquisa em Histria, com
algumas aplicaes possveis para as cincias sociais em geral.
No se trata de um manual tcnico. A proposta aqui contribuir
para o leitor pensar como alguns recursos prprios do universo
das bases de dados e da informtica podem melhorar a
investigao, desde a proposio do problema at a escrita do
trabalho, passando pela coleta e anlise das informaes que
daro suporte s concluses. A ateno, contudo, ficar nas
formas de organizar os materiais.
temerrio escrever um livro como este. Tratandose de informtica, ele estar datado em poucos anos. Todavia,
tentei escrev-lo pensando em questes clssicas, de longo
prazo, inclusive tomando auxlio de debates entre Histria e
Informtica que existem desde os anos 1960. Estes debates
apresentam alguns problemas estruturais na organizao das
informaes que prpria do trabalho do historiador, com a
chegada cada vez mais avassaladora das mquinas. E como
defensor do planejamento, tentei pensar o texto para alm do
seu consumo imediato, de modo a prolongar seu uso no tempo,
no tema e no espao. Veremos que conveniente fazer a
mesma coisa com as bases de dados.
O perigo da rpida obsolescncia desse tipo de
publicao se agrava devido necessidade quase direta de
referncia ao uso de certos programas. Amanh os programas
deixaro de existir e outros (melhores ou no) sero lanados.
Para tentar amenizar isso, o texto todo foi escrito levando em

[8]
conta aspectos mais gerais dos programas, sem referncia a um
pacote especfico. Fiz isso no apenas pelo problema da
obsolescncia: geralmente as pessoas acham que construir
bancos de dados ou fazer anlise de redes sociais, para dar um
exemplo, resume-se a usar um programa, minimizando a mo do
historiador em seu trabalho. Aqui quero o trabalho humano, para
o bem e para o mal, mostrando as opes por trs desse
personagem que faz pesquisa usando (ou no) bases de dados.
Muitas vezes, utilizarei metforas relacionadas ao
universo da cozinha, no apenas por uma questo didtica, mas
tambm por acreditar que de fato so campos que tm alguma
semelhana. E vou comear com um exemplo claro. A proposta
aqui no de criar sistemas que faam todo o trabalho, com
uma completa mecanizao. No quero propor uma mquina
onde voc coloca todos os produtos, como leite, batatas,
manteiga, alho e sal, para na ponta dela sair um belo pur.
preciso conhecer as engrenagens da base de dados. Nesse
caso, a ideia de um meio termo entre o artesanato simples,
amassando as batatas com a mo, e aquela nefasta mquina
que faz tudo sozinha. Garfos, facas, descascadores e
multiprocessadores podem ser teis. Proponho, assim, um
artesanato automatizado, com o uso pontual e deliberado de
recursos informticos. E como artesanato que , convm ao
historiador saber construir suas prprias ferramentas ou saber
adapt-las para usos inusitados, como quase tudo em Histria.
Ao leitor ctico ou desconfiado das bases de dados
ou das possibilidades que a informtica oferece na produo do
conhecimento histrico, j aviso que este ser um livro de
Histria. Vamos falar de alguns problemas prprios do universo
da pesquisa, desde a proposio do problema at a redao
final. Ao leitor que acredita que as bases de dados so um
problema exclusivamente tcnico, lembro que existem milhares
de bases de dados tecnicamente perfeitas, mas que se tornaram

[9]
obsoletas e inutilizveis diante de problema prprios do universo
do historiador. H bases que foram feitas para um tipo de uso e,
por opes mal feitas na sua origem, no permitem nada alm. E
h aquelas que sequer conseguiram responder pergunta
original. Sim, porque as bases tm relao direta com nossas
perguntas, ou deveriam ter. E preciso planejar para tirar
proveito delas. Quanto mais planejadas, por mais tempo sero
teis.
Um banco de dados pode servir para escancarar
nossas posies tericas mais ocultas e at algumas indesejadas.
Quando somos obrigados a racionalizar nosso objeto a ponto de
faz-lo caber em registros de uma tabela, precisamos expor mais
as nossas posies. No h espao para um pensamento como
nosso tema muito complexo (como se alguns temas fossem
simples). preciso saber como dar vazo a essa complexidade e
precisamos fazer isso de modo claro, de tal maneira que at um
computador entenda. S tiramos da mquina aquilo que
1
colocamos l dentro.
Em 1996, um livro interessante, do qual pretendi
tirar bastante proveito, foi lanado na Inglaterra. Databases in
historical research, de Harvey e Press, tinha tudo para ser uma
obra de referncia entre os historiadores. Pensava a histria no
meio da evidente encruzilhada a que a humanidade estava
chegando, representada pela informtica. O livro parece antever
que, no futuro prximo, cada vez mais os historiadores
utilizariam as bases de dados para incrementar suas pesquisas.
Mas no foi assim e nem Harvey e Press foram os primeiros a
errar com essa mesma previso. Contudo, o caso deles
especial. Quando escreveram sua obra, as databases estavam se
1

CHARLE, Christophe, Problemes de traitement informatique dune enquete


sur trois lites en 1901, in: MILLET, Hlne (Org.), Informatique et
prosopographie, [s.l.]: CNRS, 1985.

[10]
consolidando na informtica, em todos os campos do
conhecimento e pareciam mesmo estar se tornando um tema
2
hegemnico na relao entre histria e informtica.
Este livro no pretende rememorar os velhos
tempos em que as bases de dados podiam ser vistas como o
futuro da histria. Entendo que desde meados dos anos 1990 os
historiadores que dialogavam com a tecnologia da informao j
no so os mesmos que constroem bancos de dados para suas
pesquisas. Esses ltimos me parecem o pblico mais direto
dessas linhas. Se no a maioria dos historiadores, este l
outro problema. O nosso, aqui, consiste em discutir sobre boas
formas de fazer pesquisa histrica centrada em bancos de dados,
como diziam Harvey e Press em meados dos 1990. Ento,
convido o leitor a uma breve aventura pela tecnologia, mas sem
sair do nosso cho de historiador.

HARVEY, Charles; PRESS, Jon, Databases in Historical Research. Theory,


Methods and Applications, London: Macmillan Press, 1996.

[11]

Algumas questes tericas e


metodolgicas
Um banco de dados quase uma forma de narrativa
histrica. Ele obedece, perfeita ou imperfeitamente, aos
preceitos e s concepes de mundo (e, dentro desses, das
opinies sobre o problema de pesquisa) do pesquisador. A
primeira posio terica acreditar que seja possvel reduzir a
complexidade do social a ponto de faz-la caber na forma de
registros de uma tabela, tal como os historiadores acreditam ser
possvel fazer nas linhas de um texto. Mas essa no a nica
posio terica possvel no trabalho com bases de dados. No
quero dizer que marxistas vo produzir bases de um tipo e que
os liberais produziro, necessariamente, de outro, ainda que isso
seja perceptvel e bastante provvel. Nossas posies tericas
podem ser variadas, heterogneas, eclticas, mas esto l, no
cantinho delas, esperando a hora de aparecer para organizar o
mundo dentro dos nossos produtos. No caso da pesquisa em
Histria, isso inclui a escolha de objetos, de conjuntos de fontes,
de metodologias e de interlocutores. E na montagem da base de
dados no diferente.
3

Para ser mais claro, apresentarei aqui diversas


formas de abordar o problema. Posso dizer que existem dois
tipos de bases, as analticas (orientadas pelo mtodo, como
3

No vou discutir o significado terico de narrativa histrica, j


exaustivamente abordado por centenas de historiadores ao longo dos ltimos
40 anos. Apenas para tomar um referencial, apresentarei aqui uma definio
retirada de Lawrence Stone, que ao apontar a volta narrativa, destaca
algumas de suas caractersticas no discurso histrico: ser descritiva, focada
mais ao homem do que s circunstncias, atenta mais ao particular e ao
especfico que aos conjuntos e marcada pela retrica. STONE, Lawrence, The
revival of narrative: reflections on a new old history, Past and Present, n. 85,
p. 324, 1979.

[12]
preferem alguns autores), voltadas para um problema de
pesquisa, e as empricas (orientadas pela fonte) que procuram
dar conta de um corpus documental, como uma base de
registros paroquiais, de batismos, por exemplo. Isso tem relao
com uma concepo de histria que prev o trabalho do
historiador como um passo importante para o acesso ao
conhecimento do passado, uma vez que as bases analticas
estariam orientadas por um problema de pesquisa. As bases
empricas, por seu turno, organizariam o material de trabalho,
sem um acesso direto ao passado, porquanto foram organizadas
por um historiador de modo diverso ao estado original da fonte.
Tambm poderia dizer que h dois tipos de bases
de dados: as annimas e as com referncia nominal. Existem as
pesquisa que demandam ateno s histrias pessoais e aquelas
para as quais isso no afeta o resultado. Poderia colocar, de um
lado, as bases de dados dos micro-historiadores, dos demgrafos
historiadores de Cambridge e de algumas cepas de demgrafos
franceses. No outro extremo, colocaramos os cliometristas e
dezenas de demgrafos franceses to tributrios de Louis Henry
como os primeiros, mais interessados, contudo, em calcular o
intervalo intergensico dos camponeses do Sculo XVII do que
mapear as opes de casamento de um ncleo familiar
especfico ao longo do mesmo sculo.
Entre aqueles que fazem bases no annimas,
dando nfase aos agentes histricos e aos seus nomes, podemos
apontar outra diviso: os que fazem bases individuais
(biogrficas), os que fazem bases ao-por-ao e aqueles que
criam sistemas para recolher, em outras bases, informaes
sobre os agentes. No h aqui uma hierarquia de qualidade de
base nem o melhor jeito de fazer o trabalho. H trs ideias de
como deve ser feito o trabalho do historiador.
A

primeira

enfatiza

as

trajetrias

individuais,

[13]
atomizando os personagens e dando pouco espao para
dinmicas sociais e situaes inusitadas. Por exemplo, se criamos
um campo para profisso, teremos que colocar ali toda a
informao de uma vida de atividades ou escolher uma mais
importante, varrendo debaixo do tapete outras informaes que
poderiam se revelar fundamentais no andamento da pesquisa.
Mas podemos inserir vrios campos de profisso: profisso1,
profisso2, etc. Quantos seriam necessrios? Depende do
personagem. E qual seria a profisso1 quando nosso heri
mantm duas paralelas? Estamos sempre fazendo opes,
orientados por nossos problemas de pesquisa. At a, tudo
epistemologicamente
timo,
ajuda
em
um
estudo
prosopogrfico. A questo que nossas perguntas mudam ao
longo da pesquisa.
A segunda opo, registrar em tabelas ao-porao parece muito melhor nesse sentido. Ao invs de
registrarmos "pessoas", registraramos "atos". Ela elimina os
problemas apresentados acima, mas no nada neutra. Faz
parte de uma concepo de histria muito em voga no atual
estgio dos estudos, que enfatiza a interao social e as redes
de relacionamento. Talvez no seja indicada para outros temas
de pesquisa. Por outro lado, o que so aes ou atos? Um
espirro e um homicdio tm o mesmo significado? Uma conversa
tem semelhante estatuto e deve ser desmembrada no mesmo
formulrio de um arranjo matrimonial? Esse arranjo matrimonial
significaria apenas um registro na tabela ou dezenas deles
(considerando a cerimnia oficial, as testemunhas, a festa)?
A terceira alternativa pode ser tomada em
diferentes contextos. Pode ter sido uma opo segura, devido
incerteza sobre qual procedimento metodolgico seria mais
adequado para o problema de pesquisa adotado. Mas pode ser
igualmente uma soluo de convenincia, diante de informaes
de fontes diversas e desorganizadas. De modo geral, todas

[14]
envolvem aspectos tericos, metodolgicos e tcnicos e fazem
isso ao mesmo tempo, de tal maneira que no podemos dissociar
estes trs elementos durante o trabalho.

Um artesanato, uma operao


J vimos que h muito do historiador por trs dessa
aparente deciso tcnica de construir um banco de dados . Mas
isso no ocorre por causa dos bancos. O mesmo poderia ser dito
do trabalho do historiador com seus recortes, suas notas, seus
instrumentos de organizao dos materiais dirios de trabalho,
fichas, cadernos, canetas ou laptops. Em texto clssico de 1974,
Michel de Certeau dizia:
Em histria, tudo comea com o gesto de selecionar, de
reunir, de, dessa forma, transformar em "documentos"
determinados objetos distribudos de outra forma. Essa
nova repartio cultural o primeiro trabalho. Na
realidade ela consiste em produzir tais documentos, pelo
fato de recopiar, transcrever ou fotografar esses objetos,
mudando, ao mesmo tempo, seu lugar e seu estatuto.
Esse gesto consiste em "isolar" um corpo, como se faz em
fsica. Forma a "coleo". [...] O material criado por
aes combinadas que o repartem no universo do uso,
que tambm vo procur-lo fora das fronteiras do uso e
que fazem com que seja destinado a um reemprego
coerente. a marca dos atos que modificam uma ordem
recebida e uma viso social. Instauradora de signos
oferecidos a tratamentos especficos, essa ruptura no ,
portanto, nem apenas, nem primeira vista, o efeito de
4
um "olhar". necessria uma operao tcnica.

tcnica,

geralmente

desprezada

pelos

DE CERTEAU, Michel, A operao histrica, in: LE GOFF, Jacques; NORA,


Pierre (Orgs.), Histria: novos problemas, So Paulo: Livraria Francisco Alves
Editora, 1978, p. 30.

[15]
historiadores, assume no texto de Certeau, um lugar
fundamental: Se verdade que a organizao da histria
relativa a um lugar e a um tempo, inicialmente o por suas
5
tcnicas de produo [...] a histria mediada pela tcnica.
Isso significa exatamente aquele conjunto de operaes que
comea com o gesto de selecionar e de reunir, para em seguida
criar o material por aes combinadas que vo reparti-lo no
universo do uso para um reemprego coerente. Graficamente,
poderamos apresentar o raciocnio da seguinte forma:

Figura 1 - Esquema ilustrativo de uma afirmao de Michel de Certeau

Em um texto de 1986, Jean-Phillipe Genet apresenta


um modelo aproximado do de Certeau, numa tentativa mais
clara de produzir conhecimento histrico com o uso de bancos
de dados. Para ele, tudo comea com o Real Passado, um
abstrato mundo real do qual no temos todos os indcios,
devido perda ou ao desconhecimento desses traos, ou seja,
por um dficit positivo. Com um processo de seleo e busca,
montamos um Real Histrico, composto pelas fontes conhecidas.
Uma vez coletadas e interpretadas, elas se transformam em uma
coleo (palavra que tambm utilizada e reforada por
Certeau) de dados, que Genet denominou de metasoures
(metafontes). Graficamente, o argumento do autor poderia ser
expresso da seguinte maneira.

Ibid., p. 28.

[16]

Figura 2 - Esquema ilustrativo de uma afirmao de Jean-Phillipe Genet

Poderamos antepor um elemento diante desses


dois modelos: um problema de pesquisa. A seleo das fontes,
mencionada por Certeau, s faz sentido diante de um
problema/questo que oriente essa seleo. bem verdade que
o problema pode se apresentar no contato com alguma
documentao, e no, apenas, com a leitura de outros estudos
(muito menos por um crebro genial ou pela intercesso divina).
No importa de onde surgiu a ideia. Importa que colocado um
problema, mesmo que frgil, ele demanda o passo seguinte - a
seleo das fontes. O esquema ficaria um pouco alterado, mas
coerente com as posies acima apresentadas, comeando com
um problema, que tem origem na experincia do historiador,
seja com fontes, com sua vida pessoal, com suas leituras, ele
seleciona e rene suas fontes para desmont-las com aes
combinadas, criando um material ou "metafontes" que sero
reordenadas na anlise e descritas em um texto, mediado pelas
opes tericas e metodolgicas do autor e pelo problema de
pesquisa original.

Figura 3 - Esquema das etapas da produo do conhecimento histrico

[17]
Essa descrio de procedimentos, que enfatiza as
tcnicas prprias do historiador, , agora, nosso foco no debate
sobre a informatizao. H dcadas os historiadores buscam
automatizar seus procedimentos. E como foi dito antes, no h
como criar um software em que, utilizando as tcnicas do
conhecimento histrico, coloquemos o problema e obtenhamos a
resposta. O que possvel (e bastante vivel) automatizar
alguns procedimentos do historiador em cada uma dessas
etapas, para que o pesquisador possa fazer tantas aes
combinadas quanto pretenda de modo eficiente e criar uma
ferramenta com a qual ele possa reunir os materiais, os dados,
ou as "metafontes", em um ambiente que permita selees,
buscas e ordenamentos variados sem a perda da informao
original. Em suma, trata-se de organizar o trabalho de modo a
permitir experincias. Como disse o mesmo Certeau:
A utilizao de tcnicas atuais de informao conduz o
historiador a separar o que at agora se encontrava em
seu trabalho: a construo dos objetos de pesquisa e,
portanto, tambm as unidades de compreenso; a
acumulao de "dados" (informao secundria, ou
material refinado) e seu arranjo em lugares onde possam
ser classificados e deslocados; a explorao tornada
possvel pelas diversas operaes a que esse material
6
suscetvel.

Ressalte-se, contudo que esta tarefa tem suas


dificuldades. Se for correto que podemos administrar muito
melhor nossos dados com o uso de uma boa base, igualmente
certo que uma base mal feita v gerar problemas de toda ordem.
Criar uma tabela para coletar os dados de uma fonte pode
parecer muito simples, em alguns casos, mas no . Novamente
Genet nos apresenta um problema crucial: a necessidade de
conhecer profundamente as fontes que utilizamos, antes de
montar um banco de dados com elas. Conforme o autor:
6

Ibid., p. 34.

[18]
O dado [...] um artefato, no sentido que os arquelogos
empregam este termo, um objeto construdo em funo
de alguns objetivos bem precisos. De uma mesma fonte
dois historiadores extraem dados completamente
diferentes. A operao de constituio e de
estabelecimento do dado depende, assim, de trs
parmetros complementares. O primeiro, que preciso
manter no seu devido lugar a crtica das fontes [...]
justamente por causa das imensas possibilidades
oferecidas pelo computador, me parece que a crtica das
fontes sobre todas as suas formas se impe com um rigor
7
maior...

preciso saber o modo como a fonte foi construda,


seu pblico, seus autores, seus limites, seus objetivos e que
interesses agiram para que aquele documento chegasse quela
forma (que finalmente teve mas que diferentes projetos
desejavam alterar). Alm dessa erudio documental, Genet
destaca a importncia do conhecimento tcnico sobre as bases e
seu dilogo com o fazer histrico e com a erudio das fontes.
Ao escolher campos que acolhero nossos dados , estaremos
escolhendo que informaes vamos privilegiar e quais as que
sero consideradas menos importantes ou que sero menos
desdobradas.
Podemos criar um campo data, mas tambm
preparar um para dia, outro para ms e finalmente um para o
ano. Se a opo for pelo primeiro, importa elaborar um campo
do tipo data (como veremos adiante). Caso contrrio, podemos
estabelecer campos numricos para dias, meses e anos. Mas
interessa fazer esse desdobramento? Nossa pergunta demanda
padres que envolvam atividades regulares dentro de um ms
(como o pagamento de aluguis)? Ou dentro de um ano

GENET, Jean-Philippe, Histoire, informatique, mesure, Histoire & Mesure,


v. 01, n. 01, p. 0718, 1986, p. 10 e 11(Traduo nossa. O original est em
francs).

[19]
(aniversrios ou safras)? E se nossas atividades tiverem uma
regularidade semestral ou quinquenal? Saber escolher os campos
certos tecnicamente importante, no somente pela tcnica da
informtica, mas tambm por nossas tcnicas de historiador.
O mesmo Certeau que discutia sobre o que faz o
historiador quando faz Histria falava, naquele ano de 1974, do
uso do computador em nossa disciplina. No o fazia com a
maestria do programador, mas com a do estudioso do tempo. E
ao fazer isso, ressaltava exatamente a mo do pesquisador nesta
empreitada e seu lugar no tempo. Na pgina 33, ele afirma:

A especificao de seu papel [da histria] no


determinada pelo prprio aparelho (o computador, por
exemplo) que coloca a histria no conjunto de opresses
e possibilidades nascidas da instituio cientfica presente.
A elucidao do prprio da histria descentrada em
relao a esse aparelho: reflui no tempo preparatrio de
programao que a passagem pelo aparelho torna
necessria, e rejeitada [no sentido de um resultado,
expelida] no outro extremo, no tempo de explorao
aberto pelos resultados obtidos. Elabora-se, em funo
dos interditos fixados pela mquina, por objetos de
pesquisa a serem construdos, e, em funo do que
permite essa mquina, por uma maneira de tratar os
8
produtos standart da informtica.

Novamente aqui o foco est nas decises do


historiador, ao planejar a programao sobre os materiais que
utiliza. Ele tambm enfoca os limites da mquina, que acabam
entrando no que possvel obter de resposta. Como j dissemos,
isso pode ser matizado atravs do conhecimento tcnico de
informtica. Veremos isso mais adiante.

DE CERTEAU, A operao histrica, p. 33. Grifo nosso.

[20]
Nos anos de 1960 e 1970, o desejo pela
informatizao era justificado pela dificuldade de contar grandes
sries e de analisar regularidades de longos textos. Na Frana,
na Inglaterra, na Alemanha e nos Estados Unidos, o foco do uso
destas mquinas se justificava na contagem de grandes massas
documentais de fontes homogneas. Era o momento de
concepo de muitos trabalhos que ficariam prontos nos anos de
1970 e 1980. Esse interesse profundo pelas sries no foi apenas
um modismo ou febre, mas fruto de uma mudana de
concepes que teve consequncias profundas na forma de fazer
histria. As sries se tornaram importantes diante da crescente
preocupao com a definio de modelos.
As sries agora abriam o flanco de um debate at
ento interdito, devido impossibilidade fsica de observar
grandes regularidades sociais e, consequentemente, seus limites,
suas rupturas e seus casos excepcionais. Foi nesse contexto em
que certos objetos se tornaram possveis, encontrados nas
margens daquilo que se encaixava nos modelos de muitos
historiadores. Foi nesse contexto que a incluso do computador
como uma ferramenta do historiador se tornou relevante. E isso,
especialmente para a constituio de grandes bancos de dados
de sries manejveis e no apenas para flutuaes demogrficas
e econmicas, mas igualmente para o estudo de regularidades
nos textos, alm das hierarquias sociais, o que visvel na
preocupao com os estudos das categorias scio-profissionais.
Se for correto que ns historiadores temos nossa
forma e nossas tcnicas de organizar a informao, que nos so
to caras devido s especificidades do conhecimento histrico,
nada nos impede de dialogar com nossos vizinhos da
informtica, para observar como organizam as informaes,
como dispem de meios eficazes e criativos de organizar o
mundo entre tabelas e registros. Uma das demandas
fundamentais desse esforo passa pelo desafio de classificar as

[21]
coisas, no caso da informtica, atribuindo-lhe uma codificao.
Classificar parte do trabalho do historiador. Pode-se perguntar
se possvel fazer histria sem classificar. Chamar um ser
humano de agente histrico j uma classificao, assim como
cham-lo de ser humano. Do ponto de vista da Qumica, um
amontoado de tomos, maiormente de carbono. E posso dividir
esses amontoados de carbono entre os que detm os meios de
produo e os que vendem sua fora de trabalho; ou entre o
prncipe e o povo.
E no se trata apenas de usar de instrumentos de
comparao, mas de formalizar com a clareza necessria para o
processamento com os nossos critrios de anlise manifestos na
escolha dos campos, por exemplo. Se estudo uma obra literria,
como sei se o gnero que tenho em mos (romance, poesia, etc)
era comum na poca ou um formato marginal? As coisas s so
o que so em sua relao com as outras. Digo que uma obra
de fico pois sei que existem outras disponveis que no o so.
9
certo que posso definir o contexto a partir do texto e que isso
me ajuda a compreender diversos aspectos daquela sociedade
que gerou o texto. Mas sem comparar, classificar ou contar,
ficarei privado de qualquer afirmao que inclua expresses
como a maioria, a menor parte, um bom nmero, poucos,
melhores e piores. Nesse sentido, formalizar nossos critrios
em um banco de dados facilita a comparao e permite uma
clareza maior do universo que estamos estudando.

Desmontando as coisas em ordem


Colocar a histria dentro de um banco de dados
uma simplificao, mas nosso trabalho sempre uma
simplificao. A complexidade da vida social no cabe no texto,
9

Como querem os contextualistas ingleses.

[22]
tanto que precisamos de conceitos para nos aproximar dela,
como tampouco cabe nos campos de uma base. Resta simplificar
menos, ou, como disse Jean-Philippe Genet, admitir a obrigao

de consentir um empobrecimento fundamentado que estabelece


o trabalho cientfico.10
A criao de base de dados tem como pressuposto a
11
possibilidade de tomar um papel velho , que a pesquisa
transformar em fonte, de modo a produzir um desmonte. Em
outras palavras, vamos tomar um documento e desfaz-lo em
pedacinhos. Mas esse procedimento s ter sentido se os
pedacinhos forem reorganizveis depois, se pudermos
apresentar diferentes problemas para transformar aquele
conjunto de pedacinhos em uma narrativa clara. E o mais
importante: nesse processo todo de desmonte, o historiador
que deve estar coordenando tudo, decidindo, optando e
remontando as coisas segundo critrios do nosso mtier. E
preciso muito planejamento para que as bases sejam teis nesse
processo.
H diferentes formas de construir bases de dados,
como j argumentei, e cada uma delas fruto de uma forma de
pensar a histria. Da mesma maneira, cada uma dessas opes
vai envolver formas diferentes de desmontar os materiais,
tanto os empricos como com os interlocutores (bibliografia).
Contudo, a construo de bancos de dados no to subjetiva
como pode parecer. H certos procedimentos que so
importantes e regulares em qualquer pesquisa. Adiante, veremos
que as partes integrantes de uma base so as tabelas,
compostas por campos e registros. Criamos campos como
10

GENET, Histoire, informatique, mesure(Grifo nosso. O original est em


francs).
11
Faz referncia aos documentos, que podem ser orais, imagticos ou de
qualquer outra natureza.

[23]
caixinhas onde colocamos certas informaes que nos parecem
iguais. Essa simplificao, importante dizer, no privilgio de
quem usa bases de dados. Dizemos que todas as datas so
datas, tanto o dia de hoje quanto o 14/07/1789, mesmo que
tenham significados simblicos muito diferentes. Dizemos que
Joo e Pedro so nomes de pessoas, e no, simples conjuntos de
letras.
Faz-se o mesmo em bases de dados. Contudo,
dependendo do problema de pesquisa e das caractersticas de
cada fonte, podemos dizer que para fins de criao de bancos de
dados, h dois tipos de fontes: aquelas para as quais a forma
muito importante e aquelas em que a forma no to
importante.12 Por forma, estou entendendo aqui a regularidade
linear de certos fragmentos dentro de um documento. Na frase
Eu sou professor de Histria, h uma ordem linear importante,
sujeito, verbo e complemento. Se eu alterar os fragmentos, o
sentido ser igualmente alterado. Algo semelhante acontece, por
exemplo, com registros de batismo. Desde que comearam a ser
feitos de modo sistemtico (e preservados), na Itlia do Sculo
13
XIV, eles seguem um modelo muito particular, como no
exemplo abaixo:
Aos quatro do ms de novembro de mil oitocentos e
dezoito anos, nessa Igreja Matriz do Patrocnio de So
Jos, batizei e pus os santos leos ao inocente Francisco
filho de Manoel Roberto, e Maria Izabel, naturais dessa
freguesia. Padrinhos o Capito Francisco da Silva, e
Leucadia Maria, sua mulher, todos fregueses dessa
freguesia. Fiz e assinei. O Vigrio Colado, Theodoro Jos

12

Agradeo ao Professor Jean-Pierre Dedieu por chamar a ateno para este


ponto.
13
DE VRIES, Jan, Population, in: BRADY JR., Thomas; OBERMAN, Heiko; TRACY,
James (Orgs.), Handbook of European History 1400-1600. Late Middle Ages,
Renaissance and Reformation., Leiden / New York / Koln: E. J. Brill, 1994.

[24]
de Freitas Costa

14

A forma importantssima em um registro de


batismo que, dificilmente, comear com o nome dos padrinhos.
Esse modelo ser igual, na ordem dos fatores, em milhes de
registros no mundo todo: data; local; ato (batismo e leos);
nome do batizando; pais e padrinhos (com as respectivas
informaes pessoais); assinatura. claro que h muitssimas
nuances e variaes e j falaremos delas, mas h uma longa e
constante regularidade para a maior parte dos casos, ou melhor,
h uma expectativa, da poca e nossa, de que essas
informaes apaream. Deveriam aparecer.
O outro tipo de fonte aquela em que a forma, no
sentido j expresso, de sequncia linear de informaes, no
importante e nem esperada. Para um texto ficcional, por
exemplo, no h expectativa de formato, salvo uma ligeira ideia
de que eles so, geralmente, divididos em captulos, mas nem
isso to srio. O mesmo ocorre com as correspondncias. Elas
tm algumas regularidades, como os livros tm suas editoras e
autores: remetente, destinatrio, data e local. Mas seu contedo
interno, a carta propriamente dita, no formalizvel. Podemos
criar campos para destacar as pessoas e os locais mencionados,
mas essas informaes no so partes necessrias de uma carta
nem so esperadas pelo leitor ou pelo pesquisador.
Se for correto que preciso planejar para criar uma
boa base de dados, igualmente importante ter uma boa
quantidade de informaes prvias para iniciar o planejamento.
Saber diferenciar as potencialidades diversas de cada conjunto
documental fundamental para iniciar os trabalhos. E o carter
mais ou menos formal dos documentos um bom critrio de
14

Livro de Batismos 02, So Jos. 1818. Arquivo da Cria de So Jos dos


Pinhais.

[25]
avaliao. preciso conhecer a fonte para prever problemas.
Eles sempre estaro presentes, os problemas, mas o
planejamento nos livrar daqueles mais estpidos, dos quais
crtico nenhum nos poupar.
Saber identificar a forma em um documento no
algo simples. Continuemos planejando a informatizao dos
nossos registros de batismo. Para eles basta uma tabela que
tenha poucos campos:

Figura 4 - Modelo de tabela para batismos

J temos pronto nosso banco de dados. Vamos


comear a preench-lo. O prximo registro que vamos incluir
ser este:
Aos vinte de maro de mil oitocentos e dezoito anos nesta
Igreja Matriz do Patrocnio de So Jos, batizei e pus os
santos leos ao inocente Joo, filho legitimo de Joaquim
lvares e Maria dos Anjos, naturais dessa freguesia.
Padrinhos, Joo de Bastos e Ana lvares, sua mulher,
todos fregueses dessa freguesia. Fiz e assinei O Vigrio
Colado Theodoro Jos de Freitas Costa

Vamos preenchendo tudo: data, local, nome do


batizando, e... filho legtimo? Essa informao no estava no
registro anterior, que orientou meu modelo, por essa razo a

[26]
"legitimidade" no foi includa na minha base. Que tipo de campo
devo criar para dar conta disso? Que variveis posso encontrar
nesta observao antes do nome dos pais que trata da
legitimidade da criana? E por que alguns registros simplesmente
omitem esse dado? Como dizia Certeau, a formalizao da
pesquisa tem precisamente por objetivo a produo de "erros" insuficincias, faltas - cientificamente utilizveis. No nosso caso,
a simples tentativa de organizar a informao j nos trouxe
questes fundamentais para compreender a fonte e o universo
cultural que estamos observando. Criar um campo pode parecer
absolutamente tcnico, e , mas muito mais do que isso.
15
Segundo Dedieu, ao encontrar o inesperado que produzimos
conhecimento, e formalizar dados em uma base pode ser um
meio para isso.
Poderamos encontrar outros tantos exemplos que
nos mostrariam que criar uma base de dados para registros de
batismo no tarefa fcil. E a afirmao inicial de que bastaria
uma nica tabela tampouco correta ( possvel, mas seria
melhor desdobrar em vrias). Podemos falar, apenas para dar
algum exemplo, dos avs sobre os quais frequentemente h
informao. Tambm podemos lembrar o que normalmente
aparece sobre cada um dos participantes, dos pais e padrinhos:
sua origem, residncia, condio social, posio poltica e suas
relaes sociais. No mesmo livro de onde retirei aqueles
registros, comum, por exemplo, encontrar que o padrinho
filho de um capito. Ento devemos inserir um campo posio
militar do pai do padrinho?
Em sua tese de doutorado, Martha Hameister
15

16

nos

JEAN-PIERRE DEDIEU, Entrevista.


HAMEISTER, Martha Daisson, Para dar calor nova povoao: Estudo sobre
estratgias sociais e familiares a partir dos registros batismais da Vila do Rio
Grande (1738-1763), UFRJ, Rio de Janeiro, 2006.
16

[27]
conta de um registro de batismo singular. No batizado de Felcia,
filha de escravos alforriada na pia batismal (do que se esperava
a liberdade sem interferncia do senhor, j que o valor dela fora
entregue no ato do batismo, segundo o costume da poca),
havia, alm dos dados do batismo, um longo texto explicativo
que narrava uma tentativa de interferncia do senhor da me
sobre a liberdade da menina, que fora inibida pelo proco, que
justificava, detalhadamente, as motivaes que orientaram sua
ao. certo que tal documento nico. Mas qual deveria ser o
tratamento dado para ele? Ignoraramos tal maravilha por falta
de um campo justificativa da insistncia do padre em alforriar o
batizando? Certamente no. Tampouco me parece boa a ideia
de apenas mencion-lo no famoso campo Observaes, onde
costuma cair tudo aquilo que no fomos capazes de planejar. H
muitas formas de contar uma histria, assim como h muitas
formas de montar uma base de dados . Mas a proposta aqui no
de apresentar uma base voltada para batismos. No nesse
momento.
Se bem que os registros de batismo parecem muito
mais complexos do que o primeiro olhar nos permite supor,
ainda assim, h uma regularidade em sua produo. No Sculo
XX, encontraremos at mesmo formulrios previamente prontos,
feitos em grfica para o registro de batizados pelos padres.
Outro tipo de fonte bastante regular so os inventrios postmortem, feitos para identificar os bens dos falecidos para
promover a partilha entre os herdeiros. Difusos por boa parte do
17
Ocidente, eles tm uma estrutura bastante semelhante.
Embora muitos dos disponveis pelo mundo no correspondam
ao esperado, h certa lgica da fonte que permite, entre outras
17

VAN DER WOUDE, A.M.; SCHUURMAN, A., Probate inventories: a new


source for the historical study of wealth, material culture, and agricultural
development: papers presented at the Leeuwenborch conference
(Wageningen, 5-7 May 1980), [s.l.]: Hes, 1980.

[28]
coisas, a comparao. E se, algumas vezes, encontraremos
inventrios completamente fora da curva, que nos traro
muitas dvidas sobre como devem ser inseridos na base de
dados, o simples questionamento de suas diferenas em relao
ao padro de sua feitura (que inclusive regulado por Lei) j nos
d muitas ideias sobre a sociedade que o criou. A simples
constatao da diferena j nos ajuda a fazer boa Histria.
Talvez o mais interessante de trabalhar com
inventrios seja perceber seu carter plural, digamos assim.
Eles tm uma sequncia linear para a sua produo: abertura,
avaliao
dos
bens,
apresentao
dos
documentos
18
comprobatrios e partilha. comum encontrar dados da famlia
do falecido, assim como informaes sobre o parentesco dos
escravos que eram propriedade do falecido, quando em
sociedades escravistas. Contudo, possvel encontrar uma
diversidade de fontes no previstas, como recibos de compra de
medicamentos e atendimento mdico (geralmente devido a
alguma doena que levou morte o inventariado), assim como
testamentos e comprovantes de pagamento de servios
fnebres. Esses papis eram includos, pois tudo deveria ser
pago antes da partilha.
Eis a sua pluralidade, que se agua quando
pensamos que a abertura, a avaliao, os documentos e a
partilha so, igualmente, quatro fontes com estruturas muito
diversas. Se pensarmos em incluir os testamentos, teremos mais
elementos para estruturar dentro de uma base de inventrios.
Isso porque os testamentos, apesar de lembrarem as cartas por
sua aparncia (narrativa linear e o tamanho), so documentos
absolutamente estruturados, seguindo um cnone que pouco se
18

FRAGOSO, Joo; PITZER, Renato Rocha, Bares, homens livres pobres e


escravos - notas sobre uma fonte mltipla. Os Inventrios Post-mortem,
Revista Arrabaldes, v. 1, n. 2, p. 2952, 1988.

[29]
alterou em sculos. Havia uma frmula, que informava sobre o
contexto da redao do documento, geralmente uma
enfermidade aliada a dvidas sobre o que deus guardava para o
testador. Pedia-se clemncia Santssima Trindade, aos santos e
s santas da corte dos cus, ao santo do nome da pessoa e
ao(s) santo(s) de devoo, em especial, e ao seu anjo da
guarda. Na sequncia, uma lista dos ltimos desejos.
19

Todas essas fontes tm uma forma importante, uma


sequncia de fragmentos esperada tanto por ns quanto por
seus criadores. Isso no faz delas objetos fceis de informatizar.
Como vimos, h sempre espao para surpresas e isso muito
positivo para a produo do conhecimento histrico. Contudo,
grande parte dessas surpresas no exatamente
surpreendente. muito normal, nas fontes que tenho, encontrar
descries sobre a naturalidade dos avs do batizando, mas no
surpreendente que sejam omitidas em muitos casos. Da
mesma forma ser comum encontrar informaes as mais
diversas sobre os padrinhos. O padre no tinha em mente
apontar a patente militar de todos os padrinhos, mas
mencionava a de alguns. Ser melhor colocar um campo
patente militar para os padrinhos ou criar uma tabela associada
em que colocaremos todas as informaes que surgirem, as mais
diversas e imprevisveis, sobre os participantes do
acontecimento?
A soluo no simples e devemos pensar ainda
mais longe. Uma vez abastecida a base, devemos ter acesso fcil
e possibilidade de fazer buscas complexas nos nossos dados.
Isso ser mais ou menos possvel de acordo com a base que
montamos, da forma como dispomos os dados uns em relao
aos outros. O sistema de busca varia de software para software,
mas ele ser mais ou menos eficaz de acordo com a estrutura de
19

VOVELLE, Michel, Ideologias e mentalidades, So Paulo: Brasiliense, 1987.

[30]
campos que criamos para acolher os dados. Da mesma forma,
conveniente pensar na longevidade da nossa base. Para alm de
usar sistemas que sejam fceis de converter para formatos
futuros, fazendo essa migrao de tempos em tempos, j que a
rpida obsolescncia algo comum no universo digital,
precisamos pensar em bases que atendam a mais de uma
pesquisa ou que estejam preparadas para pesquisas futuras. Os
debates sobre a reusability, ou reusabilidade, numa
desaconselhada traduo para o portugus, so bastante
20
comuns e ainda no bem resolvidos. Contudo, manter o foco
na estrutura da fonte ainda a sada mais conveniente. E isso
requer alguma erudio, tcnica famosa no Sculo XIX e que
ainda tem sua importncia na programao do Sculo XXI.

20

SCHRER, Kevin, Historical demography, social structure and the computer,


in: DENLEY, Peter; HOPKIN, Deian (Orgs.), History and Computing,
Manchester: Manchester University Press, 1987; THALLER, Manfred, Methods
and techniques of historical computation, in: DENLEY, Peter; HOPKIN, Deian
(Orgs.), History and Computing, Manchester: Manchester University Press,
1987.

[31]

Em ombros de gigantes
Fazer bases de dados em histria tem sua prpria
histria. E ela no pequena. Vamos apresentar um
levantamento seletivo de experincias com esta perspectiva. Ele
no apresenta todas as experincias com bases, que foram
centenas no campo da histria, mas traz algumas que podem
ajudar a pensar problemas crnicos deste tipo de abordagem.
Muitas das questes que nos colocamos hoje j foram muito
discutidas antes, por grandes nomes da historiografia. Vamos
conhecer suas experincias e aproveitar a viagem para
apresentar alguns problemas importantes no desenvolvimento
das bases de dados.
A experincia do Padre Busa, em 1949
Quando em 1946 o padre jesuta italiano Roberto
Busa acabou sua tese sobre o conceito de presena em S.
Toms de Aquino, ele se deu conta que as expresses
geralmente tomadas na obra do santo, praesens e
praesentia, no eram as melhores para o seu estudo. Aquele
conceito se manifestava melhor na forma da partcula in, que
nunca fora organizada nos ndices de que dispunha para o
estudo. Busa no se acovardou e comeou um lento trabalho de
organizao dos textos tomsticos em fichas de frases e de
palavras. Neste momento surgiu a ideia de mecanizar o
trabalho. Anos depois, em 1949, em uma viagem aos Estados
Unidos, ele investigou as possibilidades existentes em dezenas
de universidades, encontrando dilogo junto IBM. Como ele
mesmo conta, a primeira resposta foi negativa: no seria
possvel fazer um ndice daquele porte com os equipamentos da
IBM. Diante da negativa, Busa teria invocado o prprio slogan da
companhia na poca: The difficult we do right away; the
impossible takes a little longer (O difcil ns fazemos agora; o

[32]
impossvel demora um pouco mais). Ganhou o apoio da IBM,
21
mesmo sem ter dinheiro.
Toda a preocupao de Busa, naquele momento,
estava no processamento da informao e no nas formas de
estocagem dos dados. A forma de fazer isso j estava definida
de antemo e seguia os mesmos pressupostos usados por ele na
confeco de fichas manuais, que continham palavras, frases e
suas localizaes nos textos tomistas. A palavra database (base
de dados) no aparece no seu texto, ainda que a expresso data
bank (banco de dados) seja utilizada uma nica vez, justamente
quando ele narra as dvidas que surgiram no momento de
publicar os resultados, se seriam publicados em um livro, na
forma de um enorme catlogo, ou se somente seria oferecido o
banco gerado no processo. A opo final foi pela publicao de
quinhentos exemplares de um grande catlogo.
A primeira questo que me parece pertinente com
este caso a forma com Busa criou uma demanda de pesquisa e
foi em busca da tcnica para solucion-la. E mesmo uma sada
cara e que levaria anos (neste caso, 30 anos), envolvendo o
treinamento de dezenas de ajudantes no processamento dos
cartes perfurados e fitas, foi pacientemente aceita tendo em
vista o ganho maior ao longo prazo. Esta a segunda concluso
que podemos tirar desta empreitada: o custo de
desenvolvimento e abastecimento de bancos de dados parece
alto, e certamente . Contudo, a capacidade de recuperar os
registros de forma automtica, rpida e fcil aps a concluso do
trabalho bastante compensadora. Os materiais organizados por
Busa ficaram disponveis para os pesquisadores da obra de Santo
Toms, que poderiam agora, com qualquer problema de
22
pesquisa, atingir seus objetivos com grande velocidade.
21

BUSA, Roberto, The Annals of Humanities Computing: The Index


Thomisticus, Computers and the Humanities, v. 14, p. 8390, 1980.
22
Disponvel na web no endereo: Index Thomisticus, disponvel em:
<http://www.corpusthomisticum.org/it/index.age>, acesso em: 27 set. 2013.

[33]
Por fim, temos o ausente presente, o conceito de
banco de dados, no apresentado por Busa em seu texto por ser
demasiado evidente para quem passou dcadas criando um.
Justamente naquilo que o projeto de Busa tinha de melhor:
armazenar conhecimento de modo organizado, de modo a
permitir rpida consulta posterior. Sendo assim, podemos definir
um banco de dados como um lugar onde podemos estocar a
23
integralidade das informaes relativas a um assunto ,
entendendo que este ltimo pode ser um tema ou um problema
de pesquisa. Outros acrescentariam que as informaes de um
database deveriam estar estruturadas e interligadas entre si a
partir de um modelo lgico especfico. Enfim, podemos resumir
24
dizendo tratar-se de uma coleo organizada de dados. Toda
esta discusso, contudo, passava longe da cabea de Busa e s
se tornou central a partir dos anos 1970. At ento, a grande
promessa da informtica no estava no armazenamento, mas no
seu grande potencial de processamento das informaes. Por
outro lado, um data bank seria o conjunto dos cartes,
simplesmente.
O Colquio da cole Normale Suprieure de Saint-Cloud,
de 1965
Em 1965 um grupo de historiadores tambm
deixava registrado seu debate sobre o uso de mquinas IBM e
Bull. No se tratava de um debate tcnico, ainda que estas
questes estivessem sendo discutidas. Foi durante um colquio
23

Base
de
donnes
Wikipdia,
disponvel
em:
<http://fr.wikipedia.org/wiki/Base_de_donn%C3%A9es>,
acesso
em:
27 set. 2013.
24
Database
Wikipedia,
disponvel
em:
<http://it.wikipedia.org/wiki/Database>, acesso em: 27 set. 2013; Database Wikipedia,
the
free
encyclopedia,
disponvel
em:
<http://en.wikipedia.org/wiki/Database>, acesso em: 27 set. 2013.

[34]
realizado na cole Normale Suprieure de Saint-Cloud, em maio
de 1965. O evento reunia alguns dos nomes mais expressivos da
historiografia francesa de ento, como Ernest Labrousse e
Adeline Daumard. Ainda estvamos no tempo do carto
perfurado e das fitas magnticas, e estes foram alguns dos
pontos tratados na apresentao de Robert Faure, Machines et

programmes. Quelques vues sur l'utilisation des machines


traiter l'information en histoire sociale.25 A interveno de Faure
indica qual era o pensamento da poca: a automatizao das
fontes, ou seja, a passagens dos dados dos documentos
histricos para cartes ou fitas magnticas, que seria possvel
atravs do uso de codificaes bem feitas, a partir de um
vocabulrio ou thesaurus.
Apesar do tom predominantemente tcnico da
26
apresentao de Faure, bem como do debate subsequente ,
entre cartes perfurados e fitas magnticas, ali j estavam
colocadas algumas questes importantes do ponto de vista do
historiador e que tem relao direta com a mesma questo
tcnica. Em primeiro lugar, o uso de um vocabulrio um
elemento que vai seguir atual para a construo de bancos de
dados. Hoje os programadores chamam isso de Dicionrio de
dados. Veremos sobre isso mais adiante, no h pressa.
Outro ponto, este ainda mais fundamental,
introduzido na apresentao de Faure e discutido com maior
profundidade em outra comunicao, de Jacques Dupaquier: o
problema da classificao e consequente uso de codificaes.
Faure ingenuamente acreditava na possibilidade de uma
25

FAURE, Robert, Machines et programmes. Quelques vues sur lutilisation des


machines traiter linformation en histoire sociale, in: Lhistoire sociale:
sources et mthodes, Paris: Presses Universitaires de France, 1967; FAURE,
Robert, Mquinas e programas. Pontos de vista sobre a utilizao das
mquinas destinadas a elaborar a informao em histria social, in: A Histria
Social: problemas, fontes e mtodos, Lisboa: Edies Cosmos, 1973.
26
Os debates e comentrios posteriores s apresentaes foram todos
publicados na verso original francesa, bem como na edio lusa de 1973.

[35]
codificao perfeita, que mantivesse as caractersticas da fonte.
Contudo, um dos comentaristas, Claude Mazauric, destacava
que:
...a determinao do cdigo a questo mais delicada
para o historiador [...] pois de acordo com as datas, de
acordo com as pocas, com os tipos de documentos, as
27
informaes no so equivalentes.

Dupaquier, neste mesmo evento, apresenta o texto


Problmes de la codification socio-professionelle.28 Sua
apresentao volta ao tema das classificaes, mas de modo
sutil. no comentrio de Adeline Daumard que o tema ressurge
de modo expressivo. Daumard respondia aos crticos de seu
trabalho sobre as classificaes scio-profissionais, que era
acusado de estabelecer uma grade a priori . Concordando com
seus crticos, ela dizia que
...estabelecer esta classificao, estabelecer claramente
uma hierarquia, quase, no fundo, resolver o problema.

Tratava-se de um problema clssico em histria. Ao


propor uma pergunta, estamos enquadrando agentes e
processos dentro de certos parmetros que nos parecem certos,
mas ao chegar ao final da pesquisa, descobrimos os limites de
nossos conceitos:
Se tivssemos um cdigo perfeito seria quase intil de
estudar o que quero, a burguesia, pois saberamos de
imediato o que ela . Diante deste paradoxo que est o
paradoxo da histria: precisamos de uma classificao
27

Mazauric, em comentrio ao texto de FAURE, Machines et programmes.


Quelques vues sur lutilisation des machines traiter linformation en histoire
sociale(Traduo nossa. O original est em francs).
28
JACQUES DUPAQUIER, Problmes de la codification socio-professionelle, in:
Lhistoire sociale: sources et mthodes, Paris: Presses Universitaires de
France, 1967.

[36]
para poder trabalhar; mas ao mesmo tempo, precisamos
nos resguardar de prejulgar o resultado. Esta a razo
pela qual, na minha opinio, a soluo deve ser a busca
de modo emprico, a fim de traduzir a realidade.29

Neste debate, classificao e codificao eram


sinnimos. E codificar significava transferir as classificaes para
dentro da lgica da computao da poca. Codificar era a forma
disponvel de manifestar formalmente as concepes tericometodolgicas do pesquisador, atravs de procedimentos claros
e transparentes. A partir de um estudo preliminar, foi elaborada
uma lista de classificaes prprias para as sociedades francesas
do sculo XVIII, XIX e XX, dividindo as pessoas entre agrupaes
profissionais, de renda e de hierarquia social.
Em 1962, Daumard publicou um artigo com seu
30
projeto de classificao scio-profissional. Era uma proposta
de concepo, uma forma de entender a hierarquia social
naquela sociedade. Podemos dizer que tal texto correspondia ao
que os programadores chamam hoje de Modelo conceitual.
Era isso que fazia Daumard ao criar uma lista de
identificadores possveis para o universo que estudava. E isso
no era um privilgio do tipo de histria que ela fazia, prprio
do trabalho do historiador. Estamos sempre escolhendo palavras
que identificam e caracterizam nossos objetos. Um banco de
dados exige isso na hora de seu desenvolvimento. A
complexidade do mundo social ser sempre maior que nossa
capacidade de compreend-la. Ou melhor, compreender
demanda simplificao. Resta-nos simplificar com a maior
29

Ibid.
ADELINE DAUMARD, Une rfrence pour ltude des socites urbaines en
France aux XVIIIe et XIXe sicles projet de code socio-professionnel, Revue
dHistoire Moderne et contemporaine, v. X, p. 185210, 1963; ADELINE
DAUMARD, Structures sociales et classement socio-professionnel. Lapport des
archives notariales au XVIIIe et au XIXe sicle., Revue Historique, v. 86,
n. CCXXVII, 1962.
30

[37]
complexidade possvel. E, para isso, devemos estar atentos no
desenvolvimento destes modelos conceituais. A mquina no vai
entender coisas como meu agentes se comportam de um modo
difcil de entender. preciso incluir esta complexidade no
modelo, de modo claro.
Lawrence Stone, no incio dos anos 1970
Vejamos agora um diagnstico, feito em 1971, por
Lawrence Stone, em seu clebre Prosopography, publicado
naquele inverno na revista Daedalus. Em um texto direto, ele
apresentava a metodologia que havia consagrado seu clssico
31
livro The Crisis of the Aristocracy. O uso do computador era
ainda considerado uma novidade, uma vez que os
historiadores...
lenta e timidamente
potencialidades da nova
comeam a perceber sua
lidar precisamente com
prosopografia apura.32

comeam a explorar as
ferramenta tecnolgica, eles
quase ilimitada capacidade de
o tipo de material que a

Stone nos apresenta o cenrio do uso destes


equipamentos no meio acadmico anglo-saxo da poca. Apesar
de considerar a Inglaterra e os Estados Unidos como o primeiro
e o segundo centros de pesquisa em histria do mundo, ele
admite que seus colegas americanos e franceses estavam na
frente no mundo da informtica:
...h fortes traos nacionais para essa diviso de
perspectivas - pois os estadunidenses e os franceses tm
muito mais acesso a e confiana nos computadores que
31

STONE, Lawrence, The Crisis of the Aristocracy, 1558-1641, Oxford: Oxford


University Press, 1965.
32

STONE, Lawrence, Prosopografia, Revista de Sociologia e Poltica,


v. 19, n. 39, p. 115137, 2011.

[38]
seus colegas ingleses -, fortes traos culturais - com
ameaas de uma nova guerra entre os antigos e os
modernos, entre as humanidades e as cincias...33

Havia motivos para tanto receio. O prprio Stone


apontava alguns dos problemas advindos com o uso do
computador. Ao comentar uma possvel tendncia de separao
entre a prosopografia das massas (foco nos grupos) com a das
elites (foco nos grandes homens), ele destacava o papel do
computador neste perigo:
O perigo foi bastante aumentado pelo advento do
computador, que foi adotado pelos pesquisadores mais
estatisticamente orientados com todo o entusiasmo
indiscriminado dos ninfomanacos e rejeitado pelos menos
cientficos, em parte devido a melindres intelectuais, em
parte devido a uma complacncia ignorante dos prazeres
que esto perdendo. 34

O uso de grandes computadores ainda era privilgio


dos cientistas polticos, dentro das humanidades. Naquele
contexto, eram os estudos de eleies uma das principais
aplicaes das novas tecnologias. Para Stone, o maior trunfo do
computador era...
A correlao de numerosas variveis afetando grandes
massas de dados , reunidas em uma base uniforme,
precisamente o que o computador pode fazer melhor;
tambm o que h de mais laborioso e, em vrios casos,
virtualmente impossvel de trabalhar sem auxlios
eletrnicos, mesmo para os historiadores com orientao
mais matemtica. doloroso admitir que o advento de
um aparato tcnico poderia ditar o tipo de questes
histricas formuladas e os mtodos utilizados para
35
solucion-los

33

Ibid.
Ibid.
35
Ibid.
34

[39]
Mas Stone era otimista ao considerar que:
A disponibilidade do computador crescentemente seduzir
os historiadores a concentrar suas energias nos
problemas
que
podem
ser
solucionados
pela
quantificao, problemas que s vezes - mas de maneira
nenhuma sempre - so os mais importantes ou
interessantes.36

Tal como para Busa e Faure, era o processamento


de grandes quantidades de registros que importava. Ainda no
estava claro o uso de bancos de dados que permitissem
consultas sistemticas. Mas algo mais fica sugerido no texto de
Stone. a demanda por materiais uniformes. Tanto Faure
como Busa esto, o tempo todo, pensando em processar uma
nica fonte. Para Busa, o texto de Santo Toms, para Faure, as
fontes devem ser transferidas para fitas magnticas. No caso de
Stone, parece haver espao para combinar dados de diferentes
origens dentro de bases uniformes.
Por outro lado, ele retoma o debate sobre as
classificaes, reforando aquilo que Daumard e Dupaquier j
salientavam. Stone falava dos erros frequentes nos estudos
prosopogrficos, dando nfase aos erros nas classificaes dos
contedos.
Classificaes significativas so essenciais para o sucesso
de qualquer pesquisa, mas infelizmente para o historiador
cada indivduo desempenha muitos papis, alguns dos
quais esto em conflito com outros. 37

Mas o problema no estava na natureza dos


agentes histricos, mas na mo dos historiadores:
...se uma subdiviso que depois se revela de importncia
36
37

Ibid.
Ibid.

[40]
crtica no for notada a tempo, usualmente tarde
demais para voltar e realizar todo o trabalho de novo uma dificuldade que particularmente aguda em
pesquisas auxiliadas por computadores, pois os cdigos
determinam as questes que podem ser depois
formuladas.38

Com isso tornamos ao problema apresentado por


Daumard, alguns anos antes. Preciso de uma boa classificao
para conhecer o passado e preciso conhecer o passado para ter
uma boa classificao. No entanto, o conhecimento prvio do
passado pode comprometer os resultados da investigao, uma
vez que aplico aos dados o pr-conceito que j tinha, sem
atentar para elementos novos surgidos no andar da pesquisa.
Para isso, h necessidade de repensar as classificaes todo o
tempo. E este problema pode ser complexo, como pensava
Daumard, ou tratar-se de uma escolha estpida, como parece
prever Stone, que j prope fazer tudo novamente. A
classificao no apenas uma pr-explicao como ela tambm
limita as perguntas possveis para os dados processados. Neste
sentido, o dano causado pelo processamento veloz dos
computadores pode alertar o historiador para a importncia de
pensar sobre suas classificaes.
Por fim, parece interessante notar como Stone, j
naquela poca identificava uma postura que parece ter sido
hegemnica entre os historiadores nos ltimos 40 anos, ao tratar
do advento do computador na pesquisa em histria:
...seria adotar a postura do avestruz fingir que isso no
est acontecendo agora e que no acontecer em uma
escala ainda maior nos anos vindouros39

E os anos vindouros prometiam muito.


38
39

Ibid.
Ibid.

[41]
O primeiro Manual de Computao para historiadores
Em 1971, o historiador Edward Shorter lanava The
historian and the Computer. A practical guide.40 Era a primeira
vez que surgia um manual voltado diretamente para o pblico da
disciplina. Seu foco principal era ensinar os historiadores
interessados em estudos quantitativos como preparar sua
pesquisa para um bom processamento com o uso de cartes
perfurados. A tarefa era fcil: aprender a usar um IBM 360 seria
to simples quanto entender o funcionamento do motor de um
automvel! Aps algumas pginas sem conseguir explicar o
funcionamento do computador, mas decifrando os assustadores
nomes das partes que o compunham, ele enfim nos fala que no
fundamental entender o funcionamento completo da mquina:
bastava o mnimo para perder o medo.
Shorter foi audaz e pioneiro, mas criou um livro
absolutamente
datado.
Apesar
de
ter
servido
por
aproximadamente dez anos, sua obra ficou muito presa
tecnologia disponvel nos anos 1960 e 70, como os lendrios
softwares Fortran e Cobol (que ainda so usados hoje, mas no
por historiadores). Mas no podemos compreender Shorter como
algum fora de seu tempo. Todo o contrrio. No mesmo ano em
que era lanado The historian and the computer, surgia a revista
Computers and medieval data processing uma publicao
canadense voltada para a informatizao dos estudos sobre
Idade Mdia. A publicao no trazia artigos, mas notcias sobre
publicaes, projetos e outras informaes interessantes para o
medievalista moderno.
Ao longo de sua existncia (durou entre 1971 e
1987), Computers trazia em cada edio uma lista dos projetos
40

SHORTER, Edward, The historian and the Computer. A practical guide, New
Jersey: Prentice-Hall, 1971.

[42]
sobre histria medieval que lanavam mo da informtica. Ao
todo, foram mencionados 354 projetos, a grande maioria nos
Estados Unidos, seguidos de Canad e Frana. Era um pblico
que compreendia muito bem as palavras de Shorter: os
equipamentos mais utilizados foram, de longe, os IBM 360 e
370, rodando, na maioria dos casos, o Fortran IV, alm de
outros como PL/1 e Snobol.41 O foco temtico de Shorter,
contudo, era um tanto distante daqueles projetos da Computers
and medieval data processing. A maior parte daquelas
empreitadas visava o processamento de textos e sua lematizao
automtica. Shorter estava dirigido para os estudos
quantitativos, dentro do mesmo contexto que trazia os
computadores como ferramentas incontornveis.
Por outro lado, seu objetivo central domesticar
aquilo que considerava o aparente mistrio das mquinas.
Buscando a vulgarizao e a ruptura com a postura do avestruz,
Shorter ficou mais prximo do entusiasmo indiscriminado dos
ninfomanacos, como dizia Stone.
Reconstructing historical Communities: um projeto
pioneiro
Em 1979, Alan Marcfarlane publicava, em
colaborao com Charles Jardine, um breve texto no 7
42
Congresso Internacional de Histria Econmica. Apesar de
breve, o texto continha a essncia das reflexes iniciadas em
1972, quando se iniciara a aventura de Macfarlane e Sarah
41

UNIVERSIT DE MONTRAL INSTITUT DTUDES MDIVALES, Computers


and Medieval Data Processing: Informatique Et Etudes Medievales, [s.l.]:
Universit de Montreal, Institut dtudes medievales., 1971.
42
MACFARLANE, Alan, Computer input of Historical Records for multi-source
record linkage, in: Proceedings of the Seventh International Economic History
Conference, Edinburgh: [s.n.], 1979.

[43]
Harrison na tentativa de informatizar fontes para o estudo de
43
histria local na Inglaterra. O resultado da pesquisa tornou-se
livro um pouco antes, com o nome de Reconstructing historical
Communities.44 Destaco isso tudo, pois me parece que esta
comunicao trazia elementos realmente inovadores para aquele
momento e que so questes-chave ainda hoje.
Jardine e Macfarlane pareciam extremamente
insatisfeitos com o que a tecnologia oferecia naquele momento.
Os programas no se adequavam s necessidades de pesquisa
do grupo e por vrias razes. A primeira era conceitual: os
programas de gerenciamento de bancos de dados disponveis na
poca eram problem-oriented (orientados a partir de um
problema, algo que tambm se pode chamar de methodoriented, orientado pelo mtodo) e no pela fonte. A
programao dava conta de tarefas a cumprir e no havia
condies para, por exemplo, aplicar as proposies
metodolgicas de Louis Henry e Wrigley, no que diz respeito,
respectivamente, ao chamado mtodo de reconstituio de
famlias e aos Record-linkage methods. Isso se dava pelo fato de
que estas metodologias empregavam o uso de qualidades
diferentes de dados, a partir de fontes, de modo relacional.
Para ilustrar o tamanho do problema, ele
apresentou um exemplo usando o longevo pacote SPSS (ainda
hoje hegemnico nas Cincias Sociais). Seu argumento era de
que o programa era adequado para os surveys criados pelos
socilogos, mas identificou seu limite: se ele dispunha de uma
tabela com dados sobre a educao infantil e de outra com as
informaes sobre as famlias e quisesse cruzar os registros, no
seria possvel por conta do modelo conceitual prprio do pacote.
43

MACFARLANE, Alan, The computer revolution and local history.


MACFARLANE, Alan, Reconstructing historical Communities, Cambridge:
Cambridge University Press, 1977.
44

[44]
Alm disso, os pacotes da poca, incluindo SPSS, no dispunham
de elementos para incluir documentos inteiros, o que forava a
perda de dados involuntria, sem falar na incapacidade dos
aplicativos em processar contedos incertos, imprecisos ou
confusos, (fuzzy data).
na constatao dos limites do que era praticado
na poca por seus colegas que Macfarlane vai explorar dois
caminhos at ento desconhecidos pelos historiadores (e diria,
tambm, pelos programadores). O primeiro e mais importante
elemento a adoo de um modelo de dados sourced-oriented
(orientado pela fonte). Ao invs de extrair dos documentos os
dados necessrios para cumprir as exigncias do programa, em
campos possveis, a fonte seria colocada integralmente dentro do
programa, sem cortes. Isso seria possvel graas pr-edio
dos textos, j que no haveria utilidade em simplesmente ter os
textos integrais no computador. Seria importante cont-los,
cruz-los e aplicar outras metodologias de acordo com a
necessidade. Deste modo, se um registro de batismo dizia que
John, filho de Henry Abbott foi batizado em 5 de maio de 1607,
o documento seria assim transcrito para o entendimento da
mquina da seguinte maneira:
(P (N John) (K the son of (P (N Henry Abbott))) (E was
baptized. (D 5th May 1607)))
[explicao: P = person (pessoa); N = name (nome); K = kinship
(parentesco, indicando o tipo em linguagem natural, no caso, o
ingls); E = event (evento); D = date (data))]

Ou seja, uma pessoa chamada John tinha


parentesco (k), no caso, era filho de outra pessoa chamada
Henry Abbott e participou de um evento, um batizado, em uma
data, no caso, no dia 5 de maio de 1607. Com o uso destes
cdigos e parnteses, um historiador explicaria mquina o

[45]
significado de cada coisa: datas, nomes, relacionamentos, etc.
Demandava algo importante e vlido, com debate, at os dias
atuais: a normatizao de nomes e a atualizao da lngua. No
caso, inclusive textos em latim foram traduzidos para tornar o
clculo possvel. O uso do recurso de pr-edio foi adotado,
pouco tempo depois, no desenvolvimento do kleio, por Manfred
45
Thaller, sobre o qual falaremos mais adiante. Recentemente
esta prtica tornou-se modelo nas linguagens da internet, com a
chamada web semntica, onde as palavras em um site no so
mais amontoados de letras organizados pelo formato (texto
grande ou pequeno, com negrito ou em itlico, etc).
semelhante ao que se utiliza com a linguagem XML, para dar um
exemplo disponvel na internet.
Alm da programao orientada pela fonte histrica
estruturada de modo legvel pelo computador, Macfarlane e
Jardine foram pioneiros no uso de uma tecnologia ainda muito
pouco conhecida na poca: o modelo relacional de dados, hoje
hegemnico a ponto de ser tomado quase como norma. Na
poca, utilizaram um manual sobre databases feito por C. J.
Date, famoso no apenas pela didtica na explicao dos
recursos tcnicos, mas igualmente por ter pertencido ao grupo
que criou, dentro da IBM, a linguagem SQL. O uso dessa
tecnologia tornava possvel cruzar dados de diferentes tabelas,
que conteriam informaes de fontes diversas, as quais
permitiriam o emprego de anlises como as de Henry e Wrigley.
Manfred Thaller e o kleio
No final dos anos 1970 a equipe de Manfred Thaller,
no Max Plank Institute ,comeou a desenvolver uma ferramenta
45

ROWLAND, Robert, L`informatica e il mestiere dello storico, Quaderni


Storici, v. 78, n. 03, p. 693 720, 1991.

[46]
para o processamento de dados em histria. Chamava-se kleio.
Os primeiros resultados s comearam a surgir em meados da
dcada seguinte. O kleio era um programa feito sob medida para
a pesquisa histrica e orientado pela fonte: implicava na
transcrio controlada dos documentos para uma linguagem
compreensvel pelo computador, atribuindo cdigos pr-definidos
ao texto. Em boa medida, ele seguia de perto as formulaes de
46
Macfarlane e h quem associe as duas iniciativas.
O sistema de Thaller, influenciado ou no por
Macfarlane, previa a criao de um programa que poderia ser
instalado em outras mquinas, coisa que no fora considerada
em Cambridge. Com o tempo, o kleio passou de uma linguagem
que tratava dados de fontes para uma historical Workstation, na
qual qualquer historiador, sem grande conhecimento de
informtica, poderia trabalhar sem dependncia de um
programador, o que geraria uma grande economia no de tempo
na pesquisa. A ferramenta dispunha de conexes com outros
sistemas de anlise, como o SPSS. Neste sentido, kleio sempre
foi um organizador de informao, mais do que um software
completo, prximo de uma base de dados de historiador.
O trabalho de abastecimento era feito seguindo a
ordem da documentao e no segundo demandas de
formulrios pr-definidos. Neste sentido, havia igualmente uma
economia de trabalho no preenchimento das fontes. O grande
mrito de kleio era exatamente o fato de ser orientado pela
fonte, a ponto de no interferir, ou de interferir muito pouco, na
estrutura original dos documentos. Segundo Thaller:
Dados so administrados na forma de colees de
pedaos de texto, sem qualquer suposio sobre seu
significado. Todas as suposies (o status social derivado
de uma dada ocupao; o significado cronolgico da data
46

Ibid.

[47]
apontada para dias diferentes no calendrio de vrias
dioceses; a taxa de cmbio de duas moedas diferentes)
so geridos em tabelas completamente independentes
47
dos dados originais.

Kleio foi um dos primeiros programas (e talvez um


dos nicos) a criar sistema de identificao de dados incertos e
imprecisos (fuzzy). Fora desenvolvida uma codificao especial
para indicar incertezas e imprecises, o que dava uma grande
vantagem comparativa entre este programa e os softwares
comerciais da poca, contra os quais Thaller se manifestava
48
preocupado, precisamente pela falta deste tipo de recurso.
Neste sentido, novamente h uma proximidade com Macfarlane.
O sistema Fichoz
Em um artigo de 2004, Jean Pierre Dedieu
apresentava um banco de dados que j tinha alguns anos de
49
existncia: o sistema Fichoz. Trata-se de uma base centrada no
mtodo, na qual h uma metodologia de trabalho prvia ao
tratamento dos dados. A ideia principal a de que possvel
decompor a vida dos agentes histricos em eventos. Neste
sentido, para cada ato seria criado um registro com informaes
como a data, o local, a interao com outro agente e um campo
de detalhamento. A interao e a anlise detalhada de cada ato
so os pontos fortes desta forma de coletar e organizar os
dados. Deste modo, seriam possveis buscas por indivduos
(biografias), por grupos de indivduos (prosopografias), por
47

THALLER, Methods and techniques of historical computation.


THOMAS, William, Computing and the Historical Imagination, in:
SCHREIBMAN, Susan; SIEMENS, Ray; UNSWORTH, John (Orgs.), A Companion
to Digital Humanities, Oxford: Blackwell, 2004.
49
DEDIEU, Jean Pierre, Les grandes bases de donnes: une nouvelle approche
de lhistoire sociale. Le systme Fichoz, Revista da Facultade de LetrasHistria, v. 05, 2004.
48

[48]
pessoas conectadas com outras por algum motivo (anlise de
redes sociais) e por sries, de acordo com a necessidade. Isso
seria possvel, pois cada registro colocaria dois ou mais agentes
histricos em relao uns com os outros:
A nova concepo do trabalho em histria social nos d a
soluo. preciso tratar cada dado como um evento
dentro da vida de um ator. A documentao deve ser lida
como um conjunto de sequencias que descrevem as
aes efetuadas ou sofridas por um ator individual. Cada
uma destas aes deve corresponder a um registro dentro
da base de dados contendo todos os elementos
necessrios a sua interpretao: natureza e descrio da
ao, identificao do ator, data, referncia, elementos de
contexto, etc. A converso dos documentos em atos da
responsabilidade do pesquisador que o faz a partir de sua
50
margem de interpretao.

O trao marcante deste sistema sua versatilidade.


As buscas e cruzamentos de informao seriam feitas no mesmo
formulrio criado para o abastecimento, permitindo escolher
muitos campos simultaneamente, inclusive de tabelas
relacionadas. Isso era relativamente fcil graas ao software
utilizado, o Filemaker. Porm, o grande mrito da base est na
sua estrutura: ela ao mesmo tempo robusta e verstil, ao
utilizar poucos campos e tirar proveito da possibilidade, ilimitada,
em qualquer sistema, de criar registros. E como cada ato seria
um registro, bastaria gerar tantos registros quantos fossem
necessrios para desmontar um processo histrico, reagrupando
o mesmo por pessoas, datas, localidades ou metodologias. Esta
estrutura permitia receber dados de qualquer tipo de fonte:
Tal esquema se prova extraordinariamente robusto e
permite de cobrir o conjunto dos casos possveis,
qualquer que seja a fonte crnica, arquivos
50

Ibid.(Traduo nossa. O original est em francs).

[49]
administrativos ou judicirios, correspondncias, atos
notariais, registros paroquiais, literatura de segunda mo
ou outro. Isso permite claramente uma contagem
extremamente veloz dos instrumentos pblicos registros
paroquiais, estado civil, atos notariais que so em
ltima anlise instrumentos para criar relaes
interindividuais. E posiciona de maneira imediata o
assunto dentro do contexto da carreira de cada um dos
51
atores.

A base Fichoz ainda utilizada por um grupo de


pesquisadores e para diversas pesquisas.
*

A proposta neste captulo no foi a de esgotar as


iniciativas de uso de bancos de dados dentro da produo do
conhecimento histrico, assunto para o qual seria necessria
uma enciclopdia. Mas vimos, com a ajuda de algumas
experincias pontuais, alguns temas relevantes que sero
retomados ao longo das prximas pginas. E, mais importante,
vimos que o uso do computador em histria tem uma longa data
e que no h motivo para reinventar a roda.

51

Ibid.

[50]

Algumas questes prprias da


informtica

Quando se fala de questes tcnicas os


historiadores costumam correr para as montanhas. difcil saber
os motivos da longeva averso de nossos colegas ao universo da
informtica. Alguns apresentam justificativas epistemolgicas,
outros optam por expor seu desprezo pela tcnica (a respeito de
que j discutimos antes) e muitos se consideram incapazes de
aprender. Mas acredito que quem aprendeu a usar um aparelho
celular ou o email poder facilmente aprender alguns dos
elementos bsicos que caracterizam as bases de dados.
Veremos que no to complicado. O problema
grande devido falta de didtica ou de pacincia dos
programadores. Tentaremos ser didticos aqui. Tudo bastante
lgico. Se formos capazes de discutir sobre as representaes do
poder no Antigo Regime, seremos capazes de aprender alguns
procedimentos da informtica.

Estrutura de dados
A primeira coisa que importa saber quais so os
elementos que compem uma base de dados, sua estrutura.
bem mais simples do que Althusser! Uma base um conjunto de
TABELAS articuladas. Alguns usam a palavra entidade para
designar as tabelas, um nome um tanto sobrenatural. Essas
tabelas podem conter diferentes tipos de informao: sobre
pessoas, casas, terras, por exemplo, endereos, etc. Podemos
criar apenas uma tabela, se for o caso. Sobre essa deciso, que

[51]
envolve
predominantemente
problemas
prprios
do
conhecimento histrico, veremos adiante, quando lermos sobre a
montagem de bases. Continuemos com as nossas tabelas.

Figura 5 - Ilustra a estrutura de um banco de dados

Uma tabela formada por campos e registros


(tambm conhecidos como "colunas" e "linhas"). Nas colunas,
indicam-se os campos do banco de dados (tambm chamados
por alguns de atributos), como geralmente aparece em
formulrios, por exemplo, nome, endereo e estado civil. As
linhas correspondem aos registros. No caso de uma tabela feita
para organizar e gerenciar uma turma escolar, a tabela seria
composta por campos como nome, matrcula e idade, por
exemplo. Os registros seriam tantos quantos fossem os alunos
matriculados na turma.

Figura 6 - Modelo de tabela


(conceitual)

Figura 7 - Modelo de tabela (como em um


formulrio)

Como pudemos ver, algo bem mais simples que


Lvi-Strauss. Agora, que j dominamos essa informao,

[52]
podemos avanar um pouco mais. Cada um dos campos (ou
atributos, a mesma coisa) da nossa base deve ter sua prpria
personalidade, ou seja, devem ser qualificados. Ele pode ser um
campo de texto (curto ou longo), de nmero, de data, de
imagem, de clculo, entre outras possibilidades. Devo prever
que tipo de informao vai entrar ali. Cada software utiliza suas
tipologias, mas texto, nmero e data sempre aparecem e so os
mais importantes para nossos bancos. Alm de definir que tipo
de campo ser, podemos tambm definir o tamanho mximo
desse campo, quantas casas ele ter. Por exemplo, um campo
como nome certamente ser do tipo texto e seria
recomendvel permitir at 150 caracteres para seu
preenchimento, ainda que possamos deixar esse campo com
tamanho ilimitado. Na maior parte das vezes, essa ltima deciso
incua. Mas, para as bases de dados online, costuma fazer a
diferena ter campos enxutos para acelerar as buscas.
Nada impede que escolhamos um campo de texto
ou de nmero para colocar datas, utilizando no preenchimento
o formato AAAA-MM-DD (ano-ms-dia, 1654-02-04). No
momento de colocar os registros em ordem, tendo como critrio
a cronologia, ser absolutamente fcil de obter resultados, pois
tanto para nmero quanto para texto o retorno ser igual, na
ordem. Se usarmos o formato DD-MM-AAAA (dia-ms-ano, 0402-1654, ou com barras no lugar do trao) s conseguiremos
ordenar pelo dia, depois, pelo ms, e, finalmente pelo ano.
Dessa forma, no ser respeitada a cronologia, mas somente o
dia do ms que corresponde ao registro, o que no costuma ser
til na maioria das pesquisas em Histria, ainda que possa ser
objeto de anlise (para acontecimentos com regularidade
mensal, como pagamento de aluguis no Sculo XX, por
exemplo). Uma deciso dessas, mal feita, gera problemas ao
longo de todo o trabalho. Para esse ltimo estudo, bastaria criar
outro campo chamado dia do ms, do tipo clculo, que

[53]
capturasse do campo data apenas os ltimos dois dgitos, que
corresponderiam ao dia (1678-12-03 = 03), desde que o dia
fosse sempre escrito com duas casas, mesmo para os primeiros
nove dias (01, 02, 03...), caso contrrio, o campo de clculo
tomaria o trao junto (1678-12-3 = -3), e nossa pesquisa
ficaria novamente comprometida.
H uma diferena grande entre o que fazem os
programadores e o que querem os historiadores. Os
programadores so formados dentro de uma lgica de resolver
problemas. Para os historiadores, isso parece timo, pois nosso
trabalho consiste em criar problemas. Aparentemente, o
casamento seria perfeito. Contudo, no essa a rotina destas
famlias/projetos de pesquisa. As bases de dados criadas pelos
programadores so sempre method-oriented, orientadas pelo
mtodo, pelo desafio a resolver, pelo plano de negcios do
cliente. Enquanto isso, os historiadores geralmente preferem
trabalhar com bases source-oriented, ou seja, aquelas cujas
fontes, as evidncias empricas, sejam o centro das atenes, de
tal maneira que a base fique o mais prximo possvel da fonte,
mas sem perder a capacidade de ser automatizada.52 Vimos isso
53
quando lemos sobre os modelos de Macfarlane e Thaller.
Esses historiadores resolveram o problema usando
uma linguagem de pr-edio das fontes, informando que
certos nmeros no eram apenas nmeros, mas datas, um
amontoado de letras era o nome de um agente histrico e outro
conjunto era o nome de uma instituio. Esse tipo de marcao
52

H tambm ocasies em que os historiadores no sabem o que querem,


mas quanto a isso no h como ajudar.
53
THALLER, Manfred, Can we afford to use the computer; can we afford not to
use it?, in: MILLET, Hlne (Org.), Informatique et prosopographie, [s.l.]:
CNRS, 1985; MACFARLANE, Computer input of Historical Records for multisource record linkage; THALLER, Methods and techniques of historical
computation.

[54]
ou rotulao segue um princpio semelhante ao que foi adotado,
recentemente, com a chamada web semntica, com a atribuio
de tags, rtulos, aos textos, de modo a indicar o que cada coisa
dentro do texto.
Outro problema frequente a constante
preocupao dos programadores com o tamanho das bases e
como devem ser feitas com o mnimo de texto. Para os
historiadores isso frustrante. No h, contudo, um lado certo.
Os programadores foram ensinados a enxugar as bases para
garantir a eficincia, enquanto os historiadores so formados
com uma preocupao de guardar grandes quantidades de texto
e seus metadados. Gostamos de guardar tudo, mas no adianta
guardar tudo fora de ordem, pois o mesmo que no guardar.
Ter e no encontrar como no ter.
Bases relacionais
Alan Macfarlane destacou a insuficincia dos
modelos de bases de dados disponveis naquele momento (como
o pacote SPSS) e chamou, pela primeira vez, entre os
54
historiadores, a ateno para os bancos de dados relacionais.
Segundo ele, seria o nico modo de testar os dados com duas
das metodologias que ele pretendia usar, o mtodo de
reconstituio de famlias, criado por Louis Henry nos anos 1950,
e os mtodos de record linkage, propostos por Wrigley poucos
anos antes. Ele tinha razo. Para realizar esse tipo de estudo de
modo eficiente e tendo em conta as caractersticas das fontes,
fundamental criar diferentes tabelas e associar seus dados de
modo organizado, a partir de certos elementos em comum como,
por exemplo, o nome (ou melhor, uma matrcula que identifique
54

MACFARLANE, Computer input of Historical Records for multi-source record


linkage; MACFARLANE, Reconstructing historical Communities.

[55]
univocamente a pessoa que portava aquele nome e que talvez
tenha um homnimo).
que, na fonte, alguns dados so nicos. O normal
para um registro de casamento no ocidente que haja um noivo
e uma noiva. No esto previstos outros cenrios (e, se surgir,
ser uma descoberta extraordinria). Podemos criar o campo
"noivo" e o "noiva". Contudo, o nmero de testemunhas do
casamento imprevisvel. comum que seja composto de duas
pessoas, porm, pode ter quatro. Como lidar com esses dados
que so sabidamente, imprevisveis? A mesma coisa ocorre ao
elaborar uma tabela para biografias. Temos apenas uma data de
batismo, apenas uma me biolgica. E como lidamos com os
dados que temos sobre as diferentes ocupaes exercidas por
um sujeito ao longo da vida? Se ele teve apenas um trabalho,
fcil. E se temos casos de gente que teve oito diferentes
profisses, algumas simultneas?
Um RELACIONAMENTO (nunca confundir com as
anlises de redes sociais) uma ligao entre duas tabelas,
como o prprio nome j indica. Podemos, por exemplo, ter uma
tabela com os nomes dos alunos matriculados, e outra, com as
notas que obtiveram nas avaliaes. As notas tm um formato, e
os alunos tm outro. So objetos com caractersticas diferentes,
mas relacionados na ao, pois os alunos tm as notas. Se as
duas tabelas apresentam o nmero de matrcula dos alunos,
podemos criar o relacionamento usando a matrcula como elo.
Desse modo, teremos as informaes das notas dentro da tabela
dos alunos matriculados, inclusive, as mdias.
Outro exemplo pode ilustrar melhor a utilidade dos
relacionamentos. Se tivermos uma lista de trabalhadores de uma
fbrica (com suas carteiras de trabalho) e uma lista de todos os
setores da empresa, que podem variar entre um e n (no
sabemos quantos departamentos a empresa pode ter), podemos

[56]
criar um relacionamento utilizando o nmero da carteira de
trabalho como elo. Esse relacionamento nos dir em quais
setores cada funcionrio trabalhou e poder indicar, at, o
perodo em que isso ocorreu. Podemos saber tambm que
funcionrios trabalharam em quais setores, adotando a
perspectiva oposta. Assim, podem existir vrios tipos de
relacionamentos, a saber:

Um para um, 1:1;


Um para vrios, 1:n (primeiro exemplo, pois um aluno pode
ter muitas notas);
Vrios para vrios, n:n (segundo exemplo, porque um
operrio pode trabalhar em vrios departamentos e um
departamento pode ter vrios empregados).

Chamamos isso de cardinalidade. Vejamos, abaixo,


algumas ilustraes para explicar bem mais isso tudo. Os
relacionamentos e a cardinalidade podem ser fundamentais
numa pesquisa em Histria, porquanto possvel colocar em
dilogo tabelas com informaes de natureza diferente (tipos
diferentes de fontes, por exemplo) que tenham algo em comum
(um mesmo personagem, uma mesma data, um mesmo lugar,
etc.).

Figura 8 - Exemplo de modelo de dados com relacionamento. A cardinalidade indica


que uma biblioteca pode ter vrios livros, neste modelo.

[57]
No modelo acima, h duas tabelas relacionadas,
atravs dos campos Nome e Biblioteca. Esses dois campos
dizem respeito mesma coisa, o nome de uma instituio
especfica, que abriga e organiza livros. E como 1:n (um para
muitos), podemos atribuir tantos livros para a nossa biblioteca
quantos forem necessrios. Vejamos abaixo como isso ficaria em
um formulrio de preenchimento, em branco, na primeira
imagem e com alguns dados na segunda:

Figura 9 - Exemplo de formulrio com


RELACIONAMENTO (sem dados)

Figura 10 - Exemplo de formulrio com


RELACIONAMENTO (com dados)

Como definimos um para muitos, podemos incluir


vrios livros dentro da tabela Bibliotecas, atravs do
relacionamento. Com isso, as caractersticas de cada tabela,
adequadas para coisas diferentes, so respeitadas, mas sem
perder a possibilidade de cruzar os dados. Em Histria, podemos
respeitar as caractersticas de cada fonte, sem perder a
possibilidade de cruz-las. Na construo de bases de dados em
Histria, podemos usar os relacionamentos de diversas maneiras.
Eles podem ser usados para formar hierarquias entre as
informaes, como no exemplo da biblioteca; para estabelecer
ligaes equilibradas entre informaes diferentes, entre
personagens, por amizade, ou lugares, por proximidade, para
dar um exemplo, e apenas para organizar informao, como no
caso dos alunos e das notas, pelo simples fato de serem
includos em tabelas diferentes.

[58]

Modelos conceituais, lgicos e fsicos


Continuamos com o vocabulrio dos programadores.
Vale a pena, pois desdobra em etapas o planejamento das
bases. Cada minuto gasto com planejamento, nesse mundo da
computao, uma economia de horas ao longo da pesquisa (ou
a perda de horas de correes e adaptaes). Planejar uma base
de dados criar modelos. No so os mesmos modelos que
criamos em Histria, mas devem estar diretamente associados,
como j vimos. E essa modelagem dos bancos de dados feita
em trs etapas: o modelo conceitual, o modelo lgico e o modelo
fsico. Essa forma de organizao j antiga na informtica e
conta j algumas dcadas de vida.
Modelo conceitual
Tudo comea com uma folha de papel onde vamos
anotar uma lista de desejos. A base deve tratar de tal assunto,
portanto, precisa ter informaes sobre x, y e z, campos
especficos para essas informaes e, talvez, algum
relacionamento. Tudo isso deve ser listado. O passo seguinte ,
em outra folha de papel (essa uma recomendao pessoal, d
mais liberdade) desenhar um quadrado (de bom tamanho) para
cada tabela, cujo interior contenha uma lista dos campos que
vo formar essa entidade. como se fosse um croquis da futura
base, feito por um arquiteto ou estilista. Nesse caso, nosso
croquis ser feio, quadrado e cheio de riscos. Mas ser
importante.
Bom mesmo seria fazer esse planejamento
discutindo com outros colegas, mas nem sempre o caso. Com
todo o esquema diante de nossos olhos, convm pensar
possibilidades e limites. Para isso, no caso do conhecimento
histrico, fundamental conhecer as fontes e seus limites e,

[59]
como salientaram Genet e Luzzati, ter erudio histrica para
55
fazer isso. Convm fazer um exerccio mental para checar a
viabilidade da base. O desenho abaixo ilustra esse esforo, sem
querer propor um modelo para processos-crime, pois seria bem
mais complexo. apenas uma ilustrao dessa etapa do
desenvolvimento.

Figura 11 - Ilustrao da etapa conhecida como "modelo conceitual".


55

LUZZATI, Michele, La reconstruction nominative et prosopographique de la


population dune ville mdivale: projet de constituition dune banque de
donnes pour lhistoire de Pise au XVe sicle., in: MILLET, Hlne (Org.),
Informatique et prosopographie, [s.l.]: CNRS, 1985; GENET, Histoire,
informatique, mesure.

[60]
Acusados e processos so objetos diferentes, com
naturezas diferentes e, consequentemente, com dados possveis
diversos. Por isso devem estar em tabelas diferentes, mas
relacionados. Testemunhas e juzes so seres humanos iguais
aos acusados, mas com caractersticas diferentes dentro de um
processo. Por essa razo, so separados em tabelas distintas,
com campos especficos para cada um. No se espera o
testemunho de um juiz, assim como no se espera saber a qual
tribunal pertencia o acusado.

Modelo lgico
O passo seguinte o modelo lgico. Talvez no seja
lgico cham-lo assim, mas o nome. Nesse momento, vamos
apenas aperfeioar nosso esquema. Dessa vez, vamos inserir
informaes detalhadas para cada um dos campos e em cada
uma das tabelas - de que tipo ser cada campo, com que
tamanho em nmero de caracteres (e ainda no vimos nada
sobre o visual que ter o formulrio de preenchimento e a
tabela, que ser assunto mais adiante).
Nessa fase tambm vamos indicar que campos vo
ser responsveis por criar relacionamentos com outras tabelas
e qual ser a cardinalidade desses relacionamentos, se um para
um, um para muitos ou muitos para muitos. Devemos tomar o
mesmo cuidado da etapa anterior, prevendo necessidades e
testando mentalmente nosso modelo com alguns casos das
nossas fontes. Vejamos novamente o exemplo da base para
estudar processos-crime, que teria agora a seguinte
configurao:

[61]

Figura 12 - Exemplo de Modelo Lgico

Temos o mesmo modelo anterior, mas agora mais


detalhado e claro, apontando quais os relacionamentos esto
previstos com o uso de setas.
Modelo fsico
O modelo fsico representa a base de dados j
montada, com todas as tabelas, campos e relacionamentos e
funcionando dentro de um disco rgido de computador,
fisicamente. a base pronta para usar, seguindo tudo o que foi
planejado. No h muito que dizer, em termos de informtica.
Mas h muito para ser dito no que toca Histria. Parece-me
importante, tendo pronto o nosso modelo fsico, gastar mais
algumas horas em planejamento. Importa tomar um conjunto de
fontes para testar o modelo. No preciso ter muitas, eu diria
que uma amostra de 1% dos casos, se forem milhares e longos,

[62]
j ajuda. Se forem milhares e curtos, eu recomendaria testar
com 3% dos casos. Se forem centenas e longos, recomendaria
5%, se forem curtos, 10%. Mas no tome esses valores como
receitas de bolo. Esses testes devem ajudar voc a deixar sua
base de dados flexvel na medida certa e no para criar
confuso.
Qual a ideia? de que, quando confrontamos
nossa massa documental com a base criada, mesmo tendo
pensando muito no assunto e conhecendo bem a documentao,
esse encontro certamente vai apontar problemas e limites da
nossa base. certo que esses problemas podem surgir quando
estamos no final do preenchimento. Esse um problema crnico
da pesquisa e do uso de bases de dados, segundo nos ensinou
Adeline Daumard. Mas podemos evitar alguns incmodos, mais
simples, antes de comear a preencher a base de modo
sistemtico. Feito esse teste, recomendvel descartar o que foi
preenchido, salvo se nenhum erro foi detectado (o que seria
muito estranho). A tarefa seguinte criar um pequeno manual
de preenchimento e um treinamento com os abastecedores, se
forem muitos. Treinar as pessoas e s depois descobrir que a
base precisar de mudanas seria uma grande perda de tempo e
trabalho. Melhor fazer as coisas na ordem.
Dicionrios de dados
O termo dicionrio de dados um conceito da
informtica utilizado com frequncia pelos programadores. Tratase de um relatrio, um documento no qual a base de dados
descrita de modo claro e sinttico. Ele pode ser feito num
documento de texto, numa planilha eletrnica, em outro banco
de dados ou numa folha de papel. Mas precisa ser til para
explicar como a base funciona para que qualquer pessoa possa
entend-la e ele deve informar quais so as tabelas que

[63]
compem a base e que campos compem cada tabela,
descrevendo os seguintes itens:

Domnio: se um campo de texto, nmero, data,


boleano, etc;
Tamanho: nmero de caracteres previstos;
Descrio: nota sobre detalhes do campo, se tem
algum formato especial, variveis prvias, etc.

O dicionrio de dados deve servir como uma


descrio completa do funcionamento da base, destacando como
so inseridos os dados e como sero extrados. Tendo em vista a
produo do conhecimento histrico, seria conveniente
especificar tambm detalhes sobre a origem dos dados, como
cada informao obtida na fonte e colocada dentro dos campos
ou, pelo menos, como isso deveria ser feito. O dicionrio pode
ser o resultado formal dos modelos, mas no a mesma coisa.
uma descrio desses modelos. Uma metabase!

Aspectos visuais sobre as bases


Uma base no precisa ser bonita, mas deve ser
visualmente clara. recomendvel que ela tenha algum
equilbrio esttico, pois vamos trabalhar muitas horas e dias com
ela, e isso pode afetar nossa viso e nosso humor, o que no
pouca coisa. No simples discutir sobre os aspectos visuais de
bases de dados sem fazer referncia a um programa especfico,
j que isso varia conforme o software. Em pacotes comerciais,
como Filemaker e Microsoft Access, essas opes so bastante
acessveis e o leque de cores, de formas, de contornos e de
outros detalhes muito grande. A situao diferente para

[64]
quem usa bases SQL. Ou o utilizador usa as formas normais da
maioria dos programas, geralmente muito simples, ou precisa
criar um formulrio em linguagem de programao (PHP, CSS)
que permite praticamente tudo, mas com um custo de tempo e
esforo enorme.
Mesmo com as dificuldades apontadas acima,
atrevo-me a apresentar algumas sugestes para quem vai criar
sua base, independentemente da plataforma escolhida. Vamos
comear com as diferentes formas de ver os dados, passando
para as cores, as formas e outros elementos.

Formas diferentes de visualizar dados


Ainda que isso varie de acordo com o programa
utilizado, muito comum diferenciarmos tabelas, formulrios e
listas. Ateno, caro leitor, para no ter dvidas! Tabela aqui
diferente do que usamos at agora. No sinnimo de
entidade, como aquele lugar onde guardamos contedos de
diferentes tipos atravs de campos. a imagem comum da
tabela, uma forma de ver dados em que se usam linhas e
colunas. Eles podem ter (e geralmente tem) relao direta com
aquela outra tabela - a das entidades. Mas pode NO ter.
Podemos criar uma tabela-visual para apresentar dados de
diferentes tabelas-entidades, usando um relacionamento. Por
isso, vou usar a expresso tabela-visual, como usarei
formulrio-visual e lista-visual, para que fique claro que estou
falando das formas de exibir os contedos na tela do
computador (ou na impressora), e no, o conjunto completo de
dados.

[65]

Figura 13 Exemplo de diferenciao entre tabelas "entidade" e tabelas


"visuais"

Na imagem acima vemos que foram usadas trs


diferentes tabelas-entidade, cada uma com seus dados, para
criar uma nica tabela-visual. Porm nem todos os dados de
cada tabela-entidade foram usados, apenas alguns. Isso mostra
a diferena entre as duas.
Se estivermos consultando uma base de dados,
geralmente o que vemos so os registros dispostos na forma de
uma tabela-visual ou de uma lista-visual. Eles podem mas no
precisam exibir todos os dados da tabela-entidade. Outros
podem ficar ocultos, disponveis somente quando observarmos a
ficha de um registro. Se estivermos abastecendo uma base com
dados, temos o cenrio oposto: geralmente comeamos com o
formulrio-visual em branco, preenchemos os campos e s ento
poderemos ver esse registro em uma tabela-visual. Usamos
esses recursos para facilitar nosso uso. Se todos os dados
aparecerem em todos os registros de uma tabela-visual, a
imagem ser catica e confusa, salvo se nosso banco tiver
pouqussimos campos, entre dois e dez, por exemplo, e nenhum
deles mais longo que 50 caracteres. Se algum for maior,
ocupar muito espao e ser visualmente condenvel.

[66]

Figura 14 - Exemplo de formulrio

Figura 15 - Exemplo de tabela

Assim, podemos estabelecer esta regra: na tabelavisual, exibimos apenas os dados que permitem identificar as
coisas e separar os registros entre si. Deixamos os detalhes para
os formulrios-visuais, que tambm so usados para o
preenchimento das fichas. Isso talvez no se aplique a tabelasvisuais com menos de oito campos curtos. Nesse caso, talvez
seja mais fcil nem usar formulrios: a tabela j exibe tudo o
que importa. Se voc gosta de imprimir, lembre-se das florestas,
do lixo e das grandes corporaes por trs das poluentes
fbricas de celulose que destroem rios para clarear o papel. Se
ainda assim quiser imprimir, talvez o mais inteligente seja criar
listas-visuais, que apresentam poucos campos, apenas os
essenciais para alguma finalidade. Vimos, pois, que convm
elaborar tantos visuais quantos forem necessrios para facilitar a
consulta dos dados. Como a tabela-visual diferente da tabelaentidade, poderemos ver seus dados de mltiplas maneiras. Essa
uma das grandes vantagens do modelo relacional.
Em alguns programas, as tabelas-visuais tm
contedos distribudos de modo mais complexo, de tal maneira
que possamos ter campos direita e esquerda de outros,
como j espervamos, mas tambm acima e abaixo de outros,
como se tivssemos andares de campos. Esse recurso pode ser
til em alguns visuais. Podemos, por exemplo, colocar os nomes
dos pais do noivo acima do campo noivo e os nomes dos pais

[67]
da noiva acima do campo noiva, em um registro que informa
casamentos. Tambm podemos ter um registro com trs
andares, de tal modo que tenhamos de cima para baixo, em
um registro de batismo, a data do batismo, a data do
nascimento e o nmero de dias entre a primeira e a segunda,
como se fosse uma subtrao matemtica mesmo, apresentada
com clareza. Se voc achar exagerado que as linhas de sua
tabela tenham andares, pode guardar essas funcionalidades
para os formulrios. Mas pode ser vantajoso.

Figura 16 - Exemplo de tabela-visual com "andares"

Cores
Mesmo que saibamos que o vermelho sempre
mais bonito do que o azul, parece-me conveniente escolher esta
ltima cor para o pano de fundo da base. Para ser mais preciso,
eu usaria um tom claro de azul, com a medida RGB
244,244,255.56 Essa cor tem algumas qualidades: quebra o
fundo branco, que pode ofuscar quem trabalha por muitas horas,
56

O sistema RGB indica a mistura de R (red, vermelho), G (green, verde) e B


(blue, azul) numa ordem que vai de 0 a 255. No caso, um 244, 244, 255, indica
um azul, j que o B tem o maior valor. O fato de todos estarem com valores
bem altos indica que a cor clara, j que o branco 255, 255, 255 e o preto 0,
0, 0.

[68]
especialmente em monitores muito iluminados, mas no escura
o suficiente para atrapalhar a leitura. uma cor associada
tranquilidade, ao mar, vastido do cu, entre outras coisas que
voc no ver durante seu trabalho na base. Testei muito com
outras cores e no tive resultados melhores.
Convm usar as cores como aliadas na criao dos
visuais, tanto formulrios quanto tabelas. Se usarmos aquele
azul clarinho, que indiquei acima, para uma tabela, devemos
intercalar as linhas das tabelas usando outra cor - eu diria o
branco - para facilitar a observao, especialmente se for uma
tabela com muitas colunas. Isso melhor do que usar contornos,
que poluem tanto quanto o excesso de campos visveis. Da
mesma forma, nos formulrios-visual, convm usar diferentes
tons de azul, como aquele, e o mesmo branco para certos
campos. Isso ajuda a disciplinar o olho na tela, de tal maneira
que possamos acelerar a identificao de dados e, at, encontrar
coisas fora do lugar com maior facilidade. O cozinheiro precisa
achar seus instrumentos com preciso e rapidez na hora de
preparar seus pratos!
Como queremos usar as cores como aliadas nesse
processo de disciplinar o olho, podemos usar outras gamas,
preferencialmente se forem claras. No convm usar amarelo,
tem efeito pior do que o branco. Recomendo usar rosa-claro,
verde-claro (RGB 244,255,244), laranja-claro e marrom-claro.
Mas importante ter cuidado para no abusar e transformar a
base num programa infantil. Isso vai criar um efeito de confuso
e pode atrapalhar a observao dos dados. Parece mais
prudente usar as cores somente em campos muito especficos,
para destacar certas informaes. De resto, um fundo azul-claro,
com campos com a cor branca, usando um contorno cinzaescuro parece uma pedida melhor. Quem quiser experimentar,
recomenda-se reflexo sobre as horas que ficar na frente da
tela. Quem no quiser, j tem a uma sugesto bem clara.

[69]

Figura 17 - Exemplo do uso de cores e contrastes (o cinza-claro substitui o azul-claro


que recomendei)

Formas
H dois problemas que envolvem as formas. O
primeiro diz respeito ao tamanho da tela do computador. Poucos
softwares permitem o ajuste automtico da tela. E disso
desdobram-se dois outros problemas: a convenincia de ter uma
tela grande para poder ver mais coisas ao mesmo tempo (o que
timo) e a inconvenincia causada pelo fato de os outros
usurios terem outro tamanho de tela. difcil agradar a todos
nesse quesito. Todavia, importante pensar no universo de
monitores disponveis e nos formatos de tela utilizados (1280
X800; 800 X 600; etc). Este ltimo dado o que mais interessa,
pois o tamanho real em pixels que importa na maioria dos
programas, e no, em polegadas (como so medidos os
monitores). Convm deixar uma margem para evitar diferenas
muito grandes, tal como uma base que no pode ser vista em
alguns monitores por falta de tela.
O outro problema a organizao dos campos

[70]
dentro da tela. Aqui vale a mesma coisa dita sobre as cores:
convm usar, mas no convm abusar. importante distribuir os
campos como quem desenha a planta de uma casa. Os
moradores precisam achar as peas e os usurios precisam
encontrar os campos que procuram. importante distribuir os
campos por critrios claros, temticos, por exemplo, ou por tipo
de dado. Se criamos uma base source-oriented, baseada na
fonte, ento o melhor, me parece, tentar reproduzir o mais
possvel a prpria ordem da fonte. Vejamos como ficaria isso em
um formulrio-visual quase anedtico, mas igualmente vlido:

Figura 18 - Exemplo de formulrio baseado na ordem da fonte

certo que o texto varia e que no precisamos


exagerar na adequao do formulrio fonte. Mas convm
colocar os campos na ordem das informaes, pelo menos na
coleta dos dados. Para a anlise, podemos criar outros visuais,
feitos segundo outros critrios.

[71]

Entre a tcnica e a teoria: problemas cotidianos


e decises prticas
No me parece prudente discutir sobre bases de
dados em Histria pensando no uso de softwares, alis, parece
que essas duas coisas tm completa relao, o que no
verdade. Podemos fazer bases sem software algum, apenas com
fichas, inclusive bases relacionais (o trabalho ser intenso, mas
possvel). O que precisamos sempre de programao, no
sentido amplo da palavra: o de fazer um programa de tarefas,
uma ordem de aes. E na hora de planejar, convm estar
atento a certos pontos que nem sempre so objetos de reflexo.
57
H quem fale em boas prticas nas bases de dados. Prefiro
no adotar esse vocabulrio, mas vou criar uma lista de
problemas com algumas ideias de como resolv-los, justificando,
com argumentos tericos e tcnicos, meus motivos.
Homnimos
Identificar pessoas algo to complexo que j foi
tema de um livro clssico: Identifying people in the past, de E.
Wrigley. A obra foca em pesquisas voltadas para o cruzamento
58
de fontes e o uso sistemtico do nome como base do trabalho.
Ele no foi o nico. Carlo Ginzburg disse a mesma coisa em
artigo dos anos 1980, em que destacava o nome como o fio de
59
ariana pelo qual o historiador construiria seu caminho. H
outras metodologias para as quais a identificao dos nomes das
57

MANDEMAKERS, Kees; DILLON, Lisa, Best practices with large databases on


historical populations, Historical Methods, v. 37, n. 01, 2004.
58
WRIGLEY, E. A., Identifying people in the past, London: Edward Arnold,
1973.
59
GINZBURG, Carlo, O nome e o como: troca desigual e mercado
historiogrfico, in: GINZBURG, Carlo (Org.), Micro-histria e outros ensaios,
Lisboa/Rio de Janeiro: DIFEL/Bertrand Brasil, 1989.

[72]
pessoas fundamental, mesmo em estudos demogrficos.
Anlises genealgicas, estudos de onomstica, tudo depende do
bom preenchimento desse campo.
Um espectro, contudo, ronda os investigadores do
nome: o espectro da homonmia. relativamente comum que
algumas pessoas tenham o mesmo nome de outras. Eu, por
exemplo, sei de pelo menos outros quatro Tiago Gil e pelo
menos outro Tiago Lus Gil e no precisei gastar tempo para
encontr-los. Como podemos saber quem quem? Como
distinguir os atos de pessoas potencialmente diferentes que tm
o mesmo nome, vivem na mesma poca e, talvez, na mesma
regio? No tarefa simples e a soluo vai depender dos tipos
de fontes que temos e de certas caractersticas de cada
sociedade. Com isso podemos, por exemplo, verificar elementos
prprios do ciclo de vida das pessoas: h idade para casar, para
abrir negcio, para vrias coisas. Isso pode ajudar na
identificao. Afora isso, h elementos que diminuem a incerteza
como os nomes de pessoas prximas mencionadas na fonte:
pais, filhos e cnjuges; a idade; a profisso; a regio especfica.
A identificao bem feita de homnimos (ou o
contrrio, dizer que duas pessoas at ento tidas como
diferentes so, na verdade, uma nica) fruto de um artesanato
e, muitas vezes, no teremos como separar ou juntar as pessoas
por falta de informao. Para facilitar este procedimento, a
melhor coisa criar uma tabela para matricular todas as
pessoas que fazem parte do meu universo de anlise. Isso
significa atribuir um nmero para cada agente histrico que
estudamos. Esse nmero ser usado sempre junto com o nome,
em um campo separado, ao lado, preferencialmente. Com as
duas possibilidades - a de busca pelo nome e pela matrcula poderei checar, de tanto em tanto, as possibilidades de juntar ou
separar as pessoas, tendo em conta suas aes e referncias
cruzadas. Porm, s podemos fazer bem esse artesanato de

[73]
encontrar pessoas quando cruzamos muitas fontes diferentes.
Usar apenas as matrculas vai diminuir as chances
de juntarmos os pedaos da mesma pessoa que estavam
separados devido a algumas dvidas que tnhamos. Usar
somente o nome vai confundir, manter todas as informaes
juntas e no ser possvel realizar certas anlises automticas
que s podemos fazer quando j estamos convencidos da
integridade dos nossos agentes, como as anlises de redes
sociais. possvel automatizar isso, mas somente depois de um
longo artesanato de preparao de dados. Com uma tabela de
nomes matriculados, podemos centralizar vrias informaes
que permitem a identificao correta das pessoas: cnjuges,
pais, filhos, data e local de nascimento, apelidos, variaes
conhecidas do nome, etc.
H, ainda, um agravante: algumas pessoas tm
variaes de nome, e no estou falando de Antonio com ou sem
acento no o. Estou pensando em possibilidades como
Alencastro, AlencastrE, LencastrO e LencastrE. Todos esto
corretos e podem fazer referncia ao mesmo sujeito. certo que
podemos normatizar, como veremos adiante, mas fontes
diferentes podem trazer variaes do mesmo nome. Nesse caso,
seria importante criar, se o programa permitir, formas
automticas de tomar o primeiro nome com as ltimas letras do
ltimo (o que faria coincidir Jos Lencastre com Jos
Alencastre) ou o primeiro nome com as primeiras do ltimo (o
que faria coincidir Jos Alencastro com Jos Alencastre). Com
esse procedimento, poderamos minimizar um problema que j
sabemos crnico em nosso trabalho.
Esforos assim poderiam tambm ajudar a
encontrar um sujeito que se chama Joo Pedro da Silva, mas
que costuma aparecer na documentao apenas como Joo
Pedro. Concluso parcial: devemos ter um sistema de controle

[74]
dos nossos agentes e que deve ser feito de modo a permitir a
descoberta de homnimos.
Atualizar, normatizar ou manter o original?
O melhor normatizar os nomes e atualizar a
linguagem. Sempre. E tenho bons companheiros que comungam
60
dessa opinio, como o prprio Alan Macfarlane. Reconheo que
isso tem um custo: preciso ter pessoas capacitadas para
transcrever, que no leiam algo diverso do que est no original e
saibam desdobrar corretamente as tradicionais abreviaturas.
mais demorado e trabalhoso, mas, feitas a atualizao e
normatizao, dentro do banco de dados, o material j estar
pronto para anlise e ser possvel submeter os dados a muitas
metodologias e perguntas com resultados rpidos. Ou seja,
depois de um longo esforo, os ganhos sero imediatos e
podero ser utilizados por muito tempo. Gasta-se de um lado,
economiza-se de outro, sem perder o principal.
Manter os textos no original quase como no tlos em uma base. quase como ter apenas a foto do
documento. No adianta ter dados assim. Entendo os
argumentos de quem prefere manter o original: o de que, com
isso, ser possvel encontrar erros de atualizao e de
desdobramento de abreviaes. Mas preciso um trabalho
duplo, para o qual, muitas vezes, no temos tempo ou recursos.
E transcrever, por si s, j demanda muito tempo. Mas tendo em
mente essa opo, a de manter no original, vou apresentar
algumas ideias que podem automatizar o artesanato da
paleografia.
A proposta comea assim: ter um campo texto
60

MACFARLANE, Computer input of Historical Records for multi-source record


linkage.

[75]
original para cada excerto informatizvel da fonte, para cada
pedao de texto do documento original que possa virar um
registro dentro de uma tabela. Por exemplo, os livros de batismo
tm pginas e pginas de descries daquele ritual, um atrs do
outro. Podemos ter um registro para cada batizado anotado pelo
padre. Esses sero nossos excertos informatizveis, so pedaos,
excertos, e so informatizveis, porquanto podem ser
desmontados em campos de um database. Este campo texto
original vai receber, durante a transcrio, o contedo tal como
est na fonte, anotado, em campos separados, de qual livro,
qual pgina e a ordem do excerto na pgina (se era o primeiro
registro de batismo, o segundo ou terceiro, etc.).
Ento, teremos uma base de batismos composta
apenas por trechos inteiros de registros. O passo seguinte, e a
entra a astcia, ser o de criar um campo texto atualizado",
que vai conter os mesmos dados do texto original, mas de
modo atualizado. A forma mais simples (e mais trabalhosa) seria
repetir o trabalho de digitao com a atualizao, mas no a
recomendo. Utilizando recursos disponveis apenas nos
modernos bancos de dados, seria possvel criar um campo de
clculo que repetisse o contedo do campo, mas substituindo
valores antigos por atuais. Um clculo que repetisse e atualizasse
ao mesmo tempo, substituindo Joseph por Jos, sem que
fosse necessria a interveno humana. Ela teria ocorrido antes,
na criao de uma tabela (longa) de substituies programadas.
Outra sada possvel, seria copiar o contedo do
original para o atualizado e mandar substituir, palavra por
palavra, as palavras velhas pelas atuais. Isso tem um grande
risco: uma vez cometido um erro, ele seria propagado por todos
os registros, demandando um novo esforo. No caso da
utilizao do cdigo, bastaria acertar o clculo, e nada se
perderia. Assim teramos duas verses, sem perder dados
originais e com contedos homogeneizados e normatizados

[76]
prontos para uso. Vejamos:

Original

Viso do campo com clculo

Aos treis dias do ms de


agosto do ano de mil
setessentos e secenta e seis
annos nesta paroquial igreja de
So Bento baptizei e pus os
sanctos leos a innocente
Benedicta, filha legtima de
Joseph dos Sanctos e de
Benedicta da Conceiam...

Aos trs dias do ms de


agosto do ano de mil
setecentos e sessenta e seis
anos nesta paroquial igreja de
So Bento batizei e pus os
santos leos a inocente
Benedita, filha legtima de
Jos dos Santos e de
Benedita da Conceio...

Clculo utilizado:
Substituir:

treis = trs
setessentos = setecentos
Secenta = sessenta
nn = n
pti = ti
ncto = nto
ict = it
Joseph = Jos
Conceiam = Conceio

Nesse momento, quem estava convencido pela


normatizao e atualizao j deve estar se perguntando: no
mais vantagem deixar no original e usar aqueles recursos? Minha
resposta continua sendo no. E vou apresentar uma nova
sugesto: associar cada ficha, atravs de um campo, com o
endereo (digital, url) do arquivo de imagem (png, jpg, tif, etc)
que contm o documento original fotografado. Desse modo, ser
possvel cotejar sempre os dados na base com os originais, sem
risco para o trabalho e de modo auditvel.

[77]
Formatos de data
A melhor opo, no meu ponto de vista, usar o
sistema AAAA-MM-DD, 1798-07-14. Independentemente do
software que escolhermos, esse sistema vai funcionar. Se for
preciso exportar os dados para anlise, o programa pode no
entender o formato 'data', mas entender o formato 'nmero' e
ser possvel colocar em ordem. Igualmente, ser possvel usar
campos de clculo para tomar o dia, o ms e o ano isoladamente
- se for conveniente por alguma razo. Com o campo do tipo
'data' diferente, pois, nem sempre, d certo. E h ainda o risco
de confundirmos o sistema americano com o do resto do mundo,
que troca o ms pelo dia. H certos programas que so capazes
de calcular a diferena de tempo entre dois momentos, medida
em nmero de dias. Para isso, necessrio usar o formato de
data. Assim, nossa defesa do padro AAAA-MM-DD estaria em
xeque. Convm saber se o mesmo programa no permite tomar
partes desse ltimo formato e isolar ano, ms e dia e reuni-los
no formato de data tradicional. Se permitir, timo, caso
contrrio, resta saber se essa funcionalidade necessria e se
vale a pena optar por esse ou aquele caminho. Se tudo deu
errado, no se preocupe: planilhas eletrnicas so capazes de
resolver esse problema, para qualquer das opes. Basta saber
usar bem os clculos disponveis.
Texto integral ou fragmentos?
Manter os textos na ntegra sempre a melhor
opo. Se no for possvel, bom estabelecer um critrio claro
de seleo e informar isso no Dicionrio de dados ou no dirio
da pesquisa (sobre o qual falaremos depois). A integralidade dos
textos permite a longevidade do uso da base. Se, em algum
momento, percebermos (e ser inevitvel) que deixamos de lado
trechos relevantes, por algum fator que no podamos prever (o

[78]
que igualmente crnico), teremos que refazer tudo ou
abandonar a base. Outra opo a de preparar a base para
acrscimos futuros, diante de uma realidade que impede a coleta
total das fontes. Mas, para isso, necessrio planejamento.
Reutilizao de dados
Um dos grandes desafios das bases de dados a
possibilidade de usar a base por longo tempo. Isso implica duas
questes: uma tcnica e outra terico-metodolgica. A tcnica
simples: preciso planejar contnuas mudanas de formato para
os dados, migrando de sistema conforme os antigos vo sendo
substitudos, e os padres forem sendo alterados. Isso
geralmente acontece com rapidez em informtica, mas nem
tanto. O modelo de dados SQL, relacional, atualmente o mais
utilizado, data de meados dos anos 1970 e o modelo anterior,
hierrquico, foi utilizado desde os anos de 1950 at os de 1990.
Programas mudam, mas relativamente fcil migrar entre os
sistemas, porm preciso estar atento. O sistema criado pelo
Padre Roberto Busa no incio dos anos 1950, existe at hoje e
passou de cartes perfurados para uma base SQL na internet.
O problema terico-metodolgico mais complexo.
Tem relao com o modelo conceitual que escolhemos para
nossa base. Esse modelo pode prever uma longevidade para a
proposta ou ignorar essa etapa. Isso acontece devido mudana
nos problemas de pesquisa em histria, na mudana de temas,
objetos e at de paradigmas, ainda que em outro ritmo. Um
exemplo simples pode ilustrar isso: criamos uma base de dados
para inventrios post-mortem e, por escolhas prprias da nossa
realidade de pesquisa (as hipteses apontavam outro caminho,
tnhamos pouco tempo, poucos recursos, demanda por artigos,
etc.), optamos por no incluir dados sobre os herdeiros
apontados logo no incio do documento. No meio da

[79]
investigao, percebemos que as informaes sobre os herdeiros
eram fundamentais. Essa situao, absolutamente possvel no
cotidiano da pesquisa, teria duas sadas possveis: voltar s
fontes e corrigir o banco de dados com muito trabalho (teramos
que deslocar pessoal para o arquivo duas vezes, com gastos de
transporte, de tempo e, talvez, de pagamentos) ou abdicar da
resposta que agora parecia ser a melhor, informando ao leitor
que h um elemento no considerado que poderia ter sido
61
importante.
O exemplo dado simples, mas ilustrativo. A
mesma dificuldade pode ter uma manifestao mais fina. A
opo que defendo, de atualizar a grafia e normatizar os nomes,
inviabiliza qualquer uso da base para estudos de lingustica de
grafias arcaicas. Nesse caso particular, parece-me que vale a
pena pagar o preo, quando no temos condies de criar um
campo de clculo chamado texto atualizado. Concordo com
62
Kevin Schrer quando argumenta que impossvel prever
todos os usos futuros de uma base. Mas seria conveniente, pelo
menos, pensar em certas metodologias mais prprias do tipo de
histria que cada um faz, avaliando se podemos planejar a base
tendo em conta algumas possibilidades reais. No podemos
prever o futuro, mas seria constrangedor esquecer algumas
demandas do presente por falta de planejamento.

Fuzzy information
Histria
61

Talvez seja a maior especificidade da relao entre


Informtica: os dados dos historiadores,

PRATESI, Alessandro, Limiti e difficolt delluso dellinformatica per lo studio


della forma diplomatica e giuridica dei documenti medievali, in: FOSSIER,
Lucie; VAUCHEZ, Andr; VIOLANTE, Cinzio (Orgs.), Informatique et histoire
mdivale, Roma: cole Franaise de Rome, 1977, p. 187190.
62
SCHRER, Historical demography, social structure and the computer.

[80]
diferentemente do que geralmente se demanda da informtica,
so geralmente imprecisos, incertos e escorregadios. Como
posso preencher o campo idade de uma base feita para coletar
"listas nominativas de habitantes" se a fonte me diz que Fulano
de Tal disse ter 50 anos mais ou menos? E como preencho o
campo data se o ano est borrado e s tenho dia e ms? No
primeiro caso, no basta colocar 50 no campo idade e perder
o mais ou menos no poo do esquecimento chamado de
campo Observaes. Feito isso, estaremos dando por exata
uma coisa que os coevos, os nativos do tempo, consideravam
imprecisa. E eles nem sonhavam com a preciso dos nossos dias.
A soluo desse problema pode ser fcil, para
alguns casos, e complicada, para outros. Para mencionar uma
data da qual no temos os dados completos, utilizando o sistema
AAAA-MM-DD, basta preencher usando um coringa, como o 0
no lugar da informao perdida: 1789-00-00. Assim, possvel
aproveitar os contedos disponveis, sem forar o restante.
Podemos usar sinais indicadores quando temos condies de
detalhar mais. Sabendo, por exemplo, o ano do acontecido e que
foi depois de agosto, podemos usar a seguinte norma: 1789>0800. O sinal de maior indica que foi depois de agosto, embora no
saibamos o dia. Se no sabemos o ano, podemos inserir o
mesmo sinal na frente do conjunto: >1789-00-00. Na hora de
processar dados em srie, basta mandar eliminar os registros
com datas imprecisas, o que no seria possvel colocando a
informao sobre preciso no famigerado campo Observaes.
O outro exemplo que dei, da idade, pode ter uma
soluo semelhante, ainda que me parea mais difcil. Um sinal
grfico pode indicar a dvida como estava na fonte (por
exemplo, um * para mais ou menos, um > para mais de
etc.). Contudo, isso seria igualmente perigoso, pois, em alguns
casos, as fontes informam as dvidas dos contemporneos com
a prpria idade, em outros no, mesmo quando tinham. Nesse

[81]
caso, no colocaramos o *, por falta da prpria fonte. Essa
uma das suas caractersticas que deve ser considerada na hora
do planejar o banco.
Outra sada seria deixar na tabela lista nominativa
um campo idade dita sobre cuja irregularidade no teramos
dvida. Se essas informaes fossem realmente relevantes para
nossa pesquisa, penso que pareceria vlido criar outra tabela
que juntasse os dados cruzados da mesma fonte na srie, alm
de outras, com os quais se poderiam comparar vrios
documentos, com o objetivo de saber as variaes disponveis
para cada sujeito. Isso nos ajudaria, inclusive, a estimar o grau
de impreciso da poca e seus desdobramentos, como um
possvel envelhecimento rpido ou a idade social das pessoas,
expressa numericamente por falta de outra medida.
Por fim, no deixa de ser interessante, se o
planejamento julgar conveniente, criar campos de avaliao da
qualidade da informao, inclusive para cada campo, se parecer
adequado. Eu no faria isso para todos os campos, mas,
dependendo da fonte e do caso, pode ser uma soluo.
Os campos Observaes, comentrios e notas
O leitor atento j percebeu a antipatia desse que
escreve pelo campo observaes. isso mesmo. Geralmente
usado como um saco de gatos, o campo observaes e seus
amigos comentrios e notas mais atrapalham do que ajudam.
Eles, comumente, so a vala comum onde todas as falhas do
projeto vo parar. E muitas dessas falhas poderiam ter rendido
grandes ideias e concluses. Nosso foco precisa estar em evitar
o campo observaes. Antes de preench-lo, seria melhor
discutir com a equipe, ou pensar sozinho, se for o caso, na
possibilidade de criar algum campo ou soluo que resolva

[82]
aquele problema e outros potenciais, vindouros, da mesma
natureza.
Esse campo, contudo, indispensvel. Ele pode ser
importante para anotaes temporrias. Nesse caso, sua
utilidade bem grande. Mas eu no o chamaria de
observaes,
nome
convidativo
para
procedimentos
preguiosos de trabalho, e criaria um campo chamado de notas
temporrias de pesquisa, mais apropriado para sua real e
valorosa funo.

CLIQUE AQUI
PARA ADQUIRIR
A VERSO
IMPRESSA DESSE
LIVRO

[83]

Engenharia de pesquisa
O engenheiro recebe uma tarefa, avalia, projeta,
calcula, executa e entrega. Nesse meio tempo, o historiador
continua polemizando sobre a arbitrariedade da tarefa. Eu
entendo e compartilho os porns dos historiadores. Mas
tambm fato que no sabemos organizar grandes projetos ou
pesquisas que exijam mais flego. Digo isso em comparao com
o que fazem os pesquisadores das cincias duras (mas no s
eles), em que procedimentos de pesquisa e de autoria coletiva e
domnio de recursos de financiamento so, h muito tempo,
normatizados e domesticados. No pretendo seguir com a
reclamao, mas acho que o desenvolvimento de uma base de
dados bem feita envolve um grande planejamento. Por isso, vou
apresentar alguns problemas e sugestes para conduzir
trabalhos individuais e coletivos, dando nfase a estes ltimos. O
leitor saber adaptar os conceitos para os casos particulares.

Levantamento inicial
Convm sempre fazer um levantamento amplo da
documentao total que ser analisada, incluindo variveis de
resposta de campos, nomes e lugares, bem como a variao
63
mnima e mxima de pginas por documento. Por exemplo, se
pretendo trabalhar com processo-crime de uma localidade ao
longo de 20 anos, importante saber, de antemo, de quantos
processos estou falando. O conhecimento do conjunto vai ajudar
a selecionar a amostra que utilizarei ou a demanda de recursos e
63

AUTRAND, Franoise, Le personnel du parlement de Paris: traitement


automatique dune prosopographie en vue dune tude sociale, in: FOSSIER,
Lucie; VAUCHEZ, Andr; VIOLANTE, Cinzio (Orgs.), Informatique et histoire
mdivale, Roma: cole Franaise de Rome, 1977, p. 239243.

[84]
pessoal que terei para levantar todos os documentos. Por outro
lado, saber o volume estimado dos processos ajuda a decidir
sobre seu uso integral ou parcial. Para a maior parte desse
levantamento, h catlogos e ndices de arquivos, mas, nem
sempre, assim e, no raras vezes, ns mesmos precisaremos
fazer nossos instrumentos de consulta.
difcil fazer o prprio catlogo, ainda mais com as
demandas que salientei aqui, que incluem, alm da informao
sobre o nmero total de processos, dados sobre seu volume
estimado. Convm tomar amostras para facilitar. impreciso,
mas alguma informao. Aqui convm avaliar o custo e o
benefcio. Caso a documentao ultrapasse certo volume, mais
de 100, por exemplo, devem-se tomar umas vinte amostras. Se
for mais de 1000, eu tomarei 50 amostras. Menos de 50, nem
convm tomar amostras, pois melhor j levantar todas. Mesmo
que voc no utilize todos esses documentos, importante,
inclusive para sua pesquisa, saber o universo particular do qual
fazem parte. Isso nos ajuda a saber que aquilo que julgamos
incrvel era, na verdade, algo comum. Poupa-nos de dizer
besteiras. Sempre diremos, mas melhor evitar as mais
ingnuas e deixar somente s as melhores para os crticos.
Montagem de equipes
A seleo dos membros da equipe importante,
mas no vou entrar nesse mrito. Cada um saber como
selecionar seus colegas, conforme puder, pois geralmente isso
no est disponvel. Escolhendo ou no, resta organizar a equipe
de modo eficaz, a fim de que todos entendam perfeitamente os
objetivos da pesquisa e o funcionamento da base, se possvel,
participando do seu desenvolvimento. importante criar um
clima de colaborao e de debate sobre o desenvolvimento da
pesquisa. Certas incongruncias entre a documentao e a base

[85]
podem ser percebidas com perspiccia pelo mais novato dos
auxiliares. importante que ele se sinta livre para discutir com
colegas e coordenadores. Da mesma forma, podem conceber
eventuais funcionalidades que agilizem o trabalho, sem
prejudicar a qualidade do abastecimento.
Uma vez pronta, hora de testar a base, como j
vimos. Passado o perodo de treinamento, vamos comear o
abastecimento dos dados. Nesse momento, importante medir a
produtividade mdia dos abastecedores. Com essa informao,
podemos ter uma ideia mais precisa sobre como ser o futuro do
trabalho. No projeto que resultou em Reconstructing historical
Communities, Macfarlane j falava do planejamento dos
trabalhos e usava uma medida particular para avaliar a demanda
por trabalho. Segundo ele, o projeto acabou em 1983 com uma
mdia de 30 pessoas-ano. Era a produtividade estimada de um
auxiliar de pesquisa ao longo de um ano.
A montagem de uma equipe passa por esse tipo de
clculo. bem verdade que no podemos contratar as pessoas
sem dinheiro, mas importante saber a demanda real de mo
de obra cientfica qualificada para o projeto. Com isso saberemos
se o projeto durar poucos ou muitos anos, se ter reais
condies de ser finalizado ou se precisar de cortes na
proposta. Sabendo do que a equipe capaz, podemos estimar o
trmino do perodo de abastecimento, identificando, inclusive,
certos excessos, como aquele auxiliar que preenche muito
rpido, talvez com erros, e o que muito lento e que poderia
melhorar.
Acho que uma boa equipe no precisa ser
hierarquizada, salvo se houver um coordenador que distribua as
tarefas e administre a base de dados, inclusive na
implementao de melhorias. A experincia me indica que, se
criado um clima de colaborao, os membros da equipe sero

[86]
capazes de se engajar de modo pleno. Se isso vale para a
qualidade da pesquisa, j no estou certo se vale para a gesto
do tempo de trabalho e da produtividade, que no podem ser
64
esquecidos. Para isso, h o coordenador.

Treinamento
O treinamento fundamental. Sua realizao,
contudo, vai depender de cada projeto. Parece que o melhor
meio de treinar a equipe criar uma base paralela, cpia da
original, que funcionar como um simulador de voo. Os dados
inseridos sero perdidos, propositalmente, mas haver diferena
grande com a prtica, salvo o fato de no ser de verdade. H
algumas coisas que podem ajudar. Criar um manual especfico
para uma base no me parece uma boa ideia. Ele pode ser
consultado por uns, mas por outros no, que vo tocar de
ouvido no preenchimento. Ele pode ser usado algumas vezes,
mas no todas, e isso vai comprometer a qualidade do
preenchimento da base. O melhor criar bases autoexplicativas
e, se for necessrio, inserir certas regras de procedimentos ao
lado do campo especfico. Alm disso, pode ser til a criao de
vdeos demonstrativos. Eles tm grande vantagem em relao
aos manuais: mostram onde o sujeito deve clicar exatamente,
sem obrig-lo a procurar um mitolgico boto Salvar (que,
nesse momento, j poderia ter sido renomeado para Enviar,
para piorar tudo...)

64

Dupaquier j falava, em 1968, de importncia de um animateur da equipe,


que faria aquilo que apresentei como responsabilidade do coordenador. Ver:
DUPAQUIER, Jacques, Suggestions pour lorganisation du travail dquipe en
histoire sociale, in: Lhistoire sociale: sources et mthodes, Paris: Presses
Universitaires de France, 1967.

[87]

Coletando os dados e abastecendo a base


Considerando que construmos uma base tendo uma
boa noo do conjunto das fontes que vamos usar e que
previmos seu uso com variada e conhecida metodologia e j a
testamos com uma boa amostra das fontes, corrigindo suas
imperfeies, chegado o momento de iniciar o abastecimento.
Essa a fase que mais demanda engenharia. preciso decidir
qual o melhor (ou possvel) meio de coletar os dados e coloc-los
na base. uma pergunta muito antiga nesse mtier. Thaller j
65
apresentava essa preocupao em 1985.
Geralmente, os
arquivos esto longe dos computadores, ainda que isso tenha
mudado muito desde a inveno e popularizao de laptops e
cmaras digitais. Mas nem todos os arquivos permitem estes
equipamentos, e h, inclusive, arquivos que no tm tomada
disponvel para pesquisadores.
Outra questo que se coloca a hospedagem do
banco de dados, sobre onde ele deve estar armazenado. Se for
uma pesquisa individual, a soluo fcil: no computador dessa
pessoa. Mas quando temos dois, a pergunta j qualificada.
Devemos criar duas cpias do arquivo e juntar tudo depois?
Devemos colocar o arquivo num servidor da internet? S um
abastece a base?, etc. Essas so questes que se complicam
quando trabalhamos com grupos maiores e se complicam ainda
mais quando dependemos de informaes adicionais para tomar
decises (identificar um sujeito, por exemplo, que pode estar
sendo identificado, ao mesmo tempo, por outro colega). Nesses
casos, importante ter sincronia no trabalho para evitar perda
de tempo e redundncia de informao.
Antes de iniciar, creio que dois pontos devem ser
ressaltados: importante ter sincronia no abastecimento, com
65

THALLER, Can we afford to use the computer; can we afford not to use it?.

[88]
uma nica base, que deve ser preenchida ao mesmo tempo, e a
coleta deve ser o mais completa possvel, de tal modo que no
haja necessidade de voltar ao arquivo. Mas como fazer isso? As
solues para esses problemas so vastas, mas devo advertir o
leitor de que minha resposta estar, inevitavelmente, datada em
poucos anos. No h questes de flego por trs nem
perspectiva terica alguma que nos ajude a dar longevidade para
essas solues. Logo surgiro solues melhores, e isso muito
bom.
Estratgias de coleta
Fotografar os originais com cmeras digitais o
melhor caminho. Boas fotos so, geralmente, para o historiador,
melhores do que o original, e por uma razo muito simples:
podemos tratar as imagens, mudar o contraste e ler melhor
aquela tinta apagada ou tentar ver algo alm do borro. Se a
tinta est esmaecida, a fotografia digital ajuda. Hoje, qualquer
pessoa tem acesso a programas gratuitos de edio de imagem,
fceis de usar. Com a fotografia digital possvel, inclusive, ver a
marca dgua do papel, se isso parecer importante e s vezes .
Vou seguir este texto com dois caminhos: o dos que podem usar
a cmera e o dos que no podem. Comecemos pelos primeiros.
Para que as fotos sejam melhores do que os
originais, tendo em conta a pesquisa em Histria, preciso
algum cuidado. No difcil. Basta lembrar que fotografia o
registro da luz. preciso luz. E os Arquivos (acervos) geralmente
no tm uma boa iluminao. Logo, ou conseguimos iluminao
por nossa conta (com autorizao do Arquivo) ou usamos uma
ligeira astcia: regular o diafragma da cmera, deixando-o mais
aberto (para a entrada de mais luz) e aumentando o tempo de
exposio da foto (para que a luz entre por mais tempo). Como
o documento fica parado, ser fcil. S nos resta uma coisa: no

[89]
tremer. Se tremermos, a imagem ficar sem foco. Ou temos
firmeza nas mos e nos braos ou usamos um trip (com
autorizao do Arquivo).
O trip garante estabilidade, mas convm us-lo
bem. No h mistrio, mas h uma dica: os trips tm ps
retrteis. Convm expandir apenas um deles, de tal maneira que
fique apoiado no cho, enquanto os outros dois ficam apoiados
na mesa de trabalho. Isso vai dar espao de trabalho e gerar um
ngulo bom para colocar o documento por baixo da cmera.
Contudo, ateno para o contrapeso! A cmera geralmente
pesada, e o uso do trip, nesse ngulo, pode fazer cair o
conjunto. Use um contrapeso. Eu gosto de usar um saco de
moedas amarrado no p expandido.
Outra dica importante sempre fotografar a
referncia, a cota do documento, antes de capturar o conjunto
para, depois, organizar as fotos em pastas corretamente
identificadas. Como a notao, comumente, pequena e usamos
programas em que podemos ver as miniaturas das fontes
(gerenciador de arquivo), convm usar um divisor adicional,
algo que indique a mudana de documento, alm da foto da
cota. Pode ser uma folha em branco ou a mesa do arquivo.
Minha dica tirar foto da mo bem aberta. Com a certeza de
que um novo documento est naquelas fotos, poderei facilmente
arrastar todos os arquivos para a pasta do computador que lhes
cabe. to prosaico quanto prtico.
Vejamos, agora, o caso de quem no pode usar
uma cmera digital no Arquivo. No h motivo para desnimo.
Se for uma pesquisa individual, o problema menor. Basta fazer
um bom planejamento da base, estimar bem o volume de
informao que ser tratado e comear o trabalho. Nesse caso,
vou comear considerando que um laptop (ou outro
equipamento porttil com teclado) est disponvel para a tarefa.

[90]
fundamental transcrever o texto todo dos documentos para
evitar a volta ao Arquivo, que sempre mais custosa. Se a base
j foi feita prevendo a transcrio de partes, tudo estar
resolvido. O importante ter o controle da informao e pensar
tudo de tal modo a evitar o retorno constante aos Arquivos.
Em se tratando de uma pesquisa coletiva, com um
banco de dados utilizado por vrias pessoas, convm pensar
melhor. muito arriscado trabalhar com vrios abastecimentos
simultneos e independentes, salvo se houver uma diviso muito
clara de trabalhos, com fontes muito diferentes ou pocas muito
claras. possvel tambm criar um sistema que importe as
diversas verses da base checando se h repetio. Isso pode
ser muito simples, se a base for orientada pela fonte, pois cada
um cuidar da sua fonte, que geralmente nica. O perigo se
apresenta quando a fonte no nica, como jornais, livros, fotos
e panfletos. Diferentes caixas do mesmo acervo podem conter
cpias que sero duplicadas na base e podem ser classificadas
de modo diferente, gerando redundncia.
H um perigo maior, quando as bases so
orientadas pelo mtodo. Para as biografias, por exemplo, o
mesmo personagem pode aparecer vrias vezes e com
informaes diferentes em cada uma. Unificar isso tudo
demandaria um trabalho manual muito grande. Um sistema de
importao poderia resolver, mas, se for feito com algum erro,
pode embaralhar tudo. A melhor soluo, no atual estado da
tecnologia, evitar bases mltiplas (divididas para vrios
pesquisadores abastecerem separadamente). Considerando a
popularizao dos aparelhos de internet mvel e dos servidor de
dados nas nuvens, parece-me mais fcil investir nisso do que
em correes e importaes sem fim. Alm disso, com uma base
nica, todos podero saber o que os outros j recolheram (ou
esto recolhendo), e essa informao pode ajudar, inclusive, no
abastecimento de novos dados. Por fim, qualquer alterao nos

[91]
campos ou na estrutura da base ser automaticamente
disponvel para todos, sem seja preciso corrigir todas as bases
paralelas.
A situao de no dispor de um equipamento
(laptop, tablet, etc) no Arquivo uma situao cada vez mais
rara, mas pode ocorrer. sempre bom ter um caderninho, mas a
melhor sada imprimir o formulrio da base numa folha A4 e
levar muitas cpias. Usar canetas de cores diferentes e
marcadores de texto, dando significado para as cores, pode ser
importante. Era assim que os historiadores que aplicavam o
mtodo Henry faziam antes da vulgarizao dos computadores
pessoais. E foi no auge do uso dessa metodologia que a
companhia francesa BIC lanou, em 1970, sua verso de quatro
cores. At onde sei, no h nenhuma relao, mas deve ter feito
a alegria dos historiadores demgrafos.
Vejamos, agora, uma soluo bem mais cmoda e
que eu sequer supus no incio do texto: as fontes disponveis na
internet. No h muito para dizer, mas no poderia esquec-las.
claro que h materiais digitalizados com qualidades muito
variadas, algumas delas duvidosas. Mas diversos acervos
digitalizam seus documentos e a maioria utiliza scanners
planetrios, o que excelente. Sobre esses ltimos, to vlido
quanto estar no arquivo e, em termos de praticidade, at
melhor. H que se ter o cuidado de no esquecer outros
documentos que estejam no mesmo arquivo e que ainda no
foram digitalizados, se forem importantes.
H documentos online de qualidade duvidosa: fotos
de baixa resoluo, textos transcritos suspeitos e rvores
genealgicas feitas por descendentes dos nossos agentes, por
fs ou curiosos. Sobre isso tudo, entendo que devemos agir com
aquilo que mais trabalhamos ao longo de um curso de Histria: a
crtica. No descarto nenhuma informao de antemo - nem as

[92]
do arquivo - nem as do pior site da internet. De algum modo,
todos esto errados, e todos so pistas que podem ou no fazer
sentido diante de um nmero muito maior de material emprico,
de uma boa metodologia e de muita reflexo terica. Resta,
contudo, tratar fontes de tipos e origens diferentes, tal como
fazemos com as fontes dos Arquivos, separando cada uma delas
e dando um tratamento adequado.
O preenchimento manual da base
O preenchimento manual, com digitao, ainda o
sistema mais comum e deve continuar sendo por muitos anos.
Sabendo disso e tendo em conta o custo elevado desse tipo de
mo de obra, convm otimizar ao mximo esse trabalho,
automatizando algumas coisas e reduzindo o tempo que poderia
ser gasto na leitura dos manuscritos e na escrita, simplesmente.
Neste sentido, bases muito complexas, difceis de preencher,
devem ser evitadas. Por exemplo, aquelas que demandam que
os nomes dos agentes histricos sejam cadastrados antes de ser
citadas na transcrio de um documento. melhor inventar um
sistema de cadastro automtico que ser checado
posteriormente, com o acumulado dos dados, e que permitir
comparaes e acertos. Mas h outras tticas, especialmente nos
programas atuais de gerenciamento de bases de dados.
Um recurso bastante prtico, que deve ser usado
com algum cuidado, o autocompletar. Muitos programas tm
isso. O lado bom que poupa tempo e o ruim que o sistema
pode sugerir igual prximo, mas no igual, e o digitador no
perceber, devido quantidade de repeties que deve fazer.
Melhor do que o autocompletar o campo de opes mltiplas,
do qual o digitador pode escolher uma ou vrias. Convm no
deixar nada pr-marcado e dificultar um pouco a escolha, de tal
modo que ela tenha sido fruto de uma deciso clara, e no, de

[93]
um descuido. Outra opo pode ser a criao de avisos de alerta.
Se um campo numrico preenchido com texto, o computador
avisa ao digitador e questiona se est certo disso.
Alguns programas mais elaborados permitem
manobras mais ousadas. possvel, por exemplo, criar certas
programaes, tambm conhecidas como macros que vo
realizar tarefas repetitivas previstas pelos usurios a partir do
acionar de um boto ou de um comando de teclado (tecla F4,
por exemplo). Em uma base de batismos, implementei um
sistema assim para casos comuns com aquela documentao,
como padrinho filho do capito..., madrinha casada
com..., de tal maneira que bastava completar com a informao
faltante. Esse procedimento agilizou o trabalho sem prejudicar a
qualidade. Reforamos a ideia de que preciso automatizar o
artesanato, pois ainda realizamos todo o trabalho, mas usando
facilidades aportadas pelo computador.
Importando dados (digitais)
Muitas vezes, temos materiais que foram produzidos
para outras pesquisas ou, simplesmente, transcritos no editor de
texto e que gostaramos de importar para uma base de dados.
Nem sempre fcil, mas, quase sempre, possvel. Com um
pouco de engenhosidade, possvel fazer manobras incrveis.
Para tanto, importa conhecer algumas coisas. A primeira o
sistema de importao dos softwares de planilha eletrnica, por
meio dos quais se pode importar dados de texto para tabelas,
com cada coisa em seu lugar. Para fazer isso, devemos colocar o
texto que queremos em um arquivo com extenso ".txt" ou
.csv. Contudo, isso no basta. O computador faz coisas
incrveis, mas no adivinho. Ele precisa saber onde comea
uma informao e onde acaba a anterior. Para tal, necessrio
colocar alguns marcos indicadores, como a vrgula ou o ponto e

[94]
vrgula. Geralmente esta ltima melhor, pois muito comum
usarmos vrgulas em textos. Fazendo isso, basta seguir um guia
do prprio software e importar todos os dados.
Essa facilidade est disponvel em vrios programas
e pode ser incrementada com o uso de campos de clculo. Se o
texto que estamos importando j um pouco estruturado, fica
mais fcil. Temos, por exemplo, uma lista de nomes, com o
telefone e o endereo. Podemos separar esses trs tipos de
informao em campos distintos sem precisar de muito esforo.
Se os telefones estiverem com o prefixo, fica ainda mais fcil.
Isso porque vamos verificar que nosso documento tem a
seguinte estrutura: texto, nmero, texto. Vejamos um exemplo:
Joaquim Nina. (61) 3624-3452. Rua das Graas, 72
Severino. (61) 5262-2352. Rua Haddock Lobo, 23
Se usarmos um campo de clculo, podemos mandar
o campo capturar tudo o que houver entre o primeiro e o
segundo ponto (note-se que, nesse exemplo, o nmero sempre
acaba com um ponto). O que houver at o primeiro ponto
nome e o que vier depois do segundo, endereo. Nem sempre,
h tantos pontos para facilitar a vida, mas comum
encontrarmos algum elemento para estabelecer as regras para
nosso campo de clculo. Se estivermos com apenas duas linhas,
no vale a pena fazer isso, mas quando temos centenas, poupa
muitas horas de trabalho. O mesmo pode ser feito para catalogar
fotos do computador. Basta escolher a pasta onde esto as
imagens, copiar o endereo delas (o caminho que indica sua
pasta) e colar no navegador de internet, o qual vai apresentar
uma lista de todos os arquivos da pasta. Basta copiar e colar
numa planilha eletrnica. Com isso, teremos um banco de dados
de arquivos da pasta, que pode ser usado para organizar fotos
de documentos, inclusive relacionando as fotos com as
transcries, com o banco de dados, etc.

[95]
Importando dados (analgicos)
Podemos fazer algo semelhante com documentos
impressos (e sem manchas ou imperfeies grficas). Basta usar
o scanner e um programa de OCR (Optical character recognition,
ou reconhecimento ptico de caracteres). Esse programa vai
reconhecer o texto, com algumas imperfeies, mas bem no
conjunto. Se os dados estiverem estruturados no original, como
uma tabela, uma lista, ou pontuados de modo coerente, como
no exemplo que apresentamos acima, sero facilmente
importados para um banco de dados. Depois de escaneados e
reconhecidos, basta aplicar as mesmas regras que apresentei
para capturar as informaes.

Administrao da base
Uma base coletiva, em um projeto de pesquisa
maior, deve ter um sistema de administrao, tanto se for nica,
na internet, quanto se for uma base mltipla (com vrias cpias
sendo abastecidas simultaneamente). As duas demandam
ateno, mas cada uma de modo particular. Uma base mltipla
demanda grande ateno sobre a importao dos dados e a
sincronizao dessas informaes. preciso distribuir as tarefas
e coordenar quem ficou responsvel pelo que, tendo em conta o
levantamento prvio do conjunto da documentao. Por seu
turno, uma base nica, online, demanda o cadastro de usurios,
atribuio de poderes para cada participante (do que pode ou
no fazer) e a distribuio de tarefas. No caso de uma base
nica, preciso criar campos para registrar quem preencheu a
ficha e quando. Isso ajuda a identificar erros e a controlar o
trabalho.
Independentemente do tipo de base escolhida,
interessante criar um dirio de campo, um espao para que

[96]
todos os membros da equipe descrevam diariamente o trabalho.
prefervel que ele seja pblico e que todos possam ler os
dirios dos colegas, acompanhando o andamento dos trabalhos.
Isso d unidade ao grupo e unifica as decises, ressaltando, de
imediato, prticas mais individualizadas (o famoso "fiz do meu
jeito"). Alm disso, esse dirio pode servir como base para um
relatrio ou ser usado como um memorial do trabalho realizado,
permitindo uma auditagem em qualquer tempo. Se a base for
online, conveniente que o dirio tambm seja. Para isso h
diversos blogs disponveis.
Checagem de dados
Trabalhar com equipes demanda cuidado com a
qualidade dos registros, no somente por causa da falta de
cuidado potencial de algum dos colegas como tambm da
potencial falta de homogeneidade na tomada de deciso no
momento do preenchimento. Informaes inesperadas aparecem
o tempo todo, e cada um as classifica como quer. Assim,
importante criar dispositivos e protocolos de checagem de dados.
H formas tradicionais de fazer isso, como conferir uma amostra
da base com os dados originais. Mas h erros simples e
frequentes que podem ser resolvidos de modo automatizado. Um
deles consiste em exibir os registros em forma de uma tabela e
verificar, visualmente, se os informaes de cada campo so
coerentes com o esperado. Isso pode ser feito com grandes
quantidades de registro, e essa simples verificao visual j
destaca muitos problemas.
Outra sada possvel hierarquizar os registros,
campo por campo. Erros de data, por exemplo, so rapidamente
visveis com esse tipo de procedimento. Espaos antes de texto
tambm so ressaltados. Isso tudo pode ser amplificado
exportando-se os dados para uma planilha eletrnica.

[97]
Informaes fora do lugar ou muito discrepantes podem ser
identificadas com facilidade. claro que algumas podem virar
grandes descobertas, digamos assim, mas pode ser um simples
erro de digitao. Com os dados exportados para uma planilha
eletrnica, podemos mandar eliminar (apenas na planilha) os
elementos repetidos e obter apenas as variaes disponveis.
Isso permite verificar pequenos erros, como Tera-feira e
Terca_feira. Esse pequeno detalhe geraria duas informaes
diferentes. Os campos de clculo podem ser igualmente teis
para essa tarefa, assim como o uso das tabelas dinmicas. Tudo
isso sem perder o nosso artesanato.

[98]

Montando bases: alguns exemplos


concretos
Muitos historiadores que vimos defendem que as
bases, em Histria, deveriam ser source-oriented, ou seja, feitas
a partir da estrutura das fontes. Essa afirmao - que defendo pode ser polmica por dois motivos. O primeiro que ela tem
cheiro de positivismo. Aprendemos na universidade a no nos
deixarmos levar pelas fontes, ou que toda a fonte
enganadora ou que a teoria que abre a caixa-preta das
fontes. Tudo isso me parece correto e no vou divergir. O
problema que, para fazer a nossa virada epistemolgica e ver
alm do que diz a nossa empiria, preciso conhec-la. preciso,
ainda, conhecer os informantes: saber como as fontes foram
construdas, por quem, com que propsito, que interesses
estavam em jogo. Enfim, preciso saber como arrancar a
informao de quem pretendia falar de outra coisa ou, como
dizia Certeau, "transformar em 'documentos' determinados
66
objetos distribudos de outra forma." certo que partimos de
um problema de pesquisa, mas o caminho inclui uma parada
para um longo contato com a empiria.
O segundo motivo para a polmica que muitas
pessoas j usam ou pretendem construir bases direcionadas para
certos objetivos, sem um grande desmonte da empiria ou sem
um foco maior nesse esforo. Para ajudar o argumento dessas
pessoas, vou at citar um bom exemplo de base de dados desse
67
tipo: o projeto The Trans-Atlantic Slave Trade Database. Tratase de um banco de dados com mais de 35.000 viagens de navios
66

DE CERTEAU, A operao histrica, p. 30.


Voyages Database. 2009., Voyages: The Trans-Atlantic Slave Trade
Database., disponvel em: <http://www.slavevoyages.org>, acesso em:
4 jan. 2014.
67

[99]
negreiros na poca moderna. Um projeto que no pretende a
preciso exata do nmero de viagens e de seres humanos
transportados. Ele pretende estimar o volume total ou, para
empregar o conceito correto, a grandeza daquela prtica, que
no tinha nenhuma grandeza, mas contava com dezenas de
milhares de viagens com mais de uma dezena de milho de
almas conduzidas para o trabalho escravo. A exatido aqui no
o objetivo nem poderia ser. A crtica documental foi pouco
considerada e h motivos para isso. Se fosse bem feita, como
quem faz uma tese usando uma nica fonte, o projeto jamais
seria concludo. E uma crtica bem feita pode mudar o nmero
exato de navios e escravos que cruzaram o Oceano Atlntico,
mas no a grandeza. Por outro lado, o nmero exato seria uma
esperana assaz ingnua.
A pouca preocupao relativa com a crtica da fonte
no The Trans-Atlantic Slave Trade Database se justifica pela
dimenso do projeto. Poucas vezes ela est to bem amparada.
No vou criar aqui uma regra ou mesmo dar uma sugesto que
proponha os limites desse expediente. Isso depende das
caractersticas de cada pesquisa, mas deve ser levado em conta.
Em geral, eu recomendaria sempre conhecer bem as fontes,
especialmente as que so centrais para nossa pesquisa.
Convm enfatizar que no apenas com uma
pergunta ou problema que conduzimos uma pesquisa sem ter a
fonte como eixo central. H certas metodologias que podem se
valer de um leque muito amplo de fontes, como os estudos
prosopogrficos e de anlise de redes sociais. Em ambos os
casos, podemos compor um mosaico de informaes sobre cada
um dos personagens que fazem parte do nosso estudo, tendo
como fonte dezenas ou centenas de fragmentos com as mais
diversas origens. E seria quase impossvel fazer a crtica
completa de todas. Veremos, agora, algumas aplicaes
possveis de bases de dados tomando exemplos elaborados a

[100]
partir de fontes diversas, metodologias e temticas.
Antes de continuar, gostaria de insistir em algo que
me parece fundamental: as bases de dados podem ser usadas
em qualquer pesquisa, e no, apenas, em estudos quantitativos
ou seriais. certo que estes ltimos dependem de bases para
ser realizados, mas a recproca no verdadeira. Podemos usar
bases para qualquer tipo de estudo. claro que nem todos os
estudos ou abordagens precisam desse tipo de ferramenta, mas
o simples fato de organizar as informaes, mesmo notas de
pesquisa, torna as bases de dados teis para qualquer situao.

Bases centradas na fonte


Esse o tipo preferido de grandes nomes, como
Manfred Thaller e Alan Macfarlane. Ambos adotaram como
padro de trabalho uma espcie de transcrio estruturada,
atravs da qual o documento era transcrito normalmente, mas
certos fragmentos, palavras, nmeros e datas, eram rotulados
para que o computador pudesse process-los. O mesmo tambm
defendido por Carvalho, que disse que "os melhores mtodos
de entrada de dados oriundos de fontes histricas so aqueles
68
que preservam a estrutura original da informao". Usando
desse recurso ou no, precisamos criar tabelas e campos para
transformar nossos papis velhos em bytes. Vejamos alguns
exemplos.
Registros de batismo
Comecemos com uma fonte bastante tradicional nas
aplicaes informatizadas: os registros de batismo. Sei que os
68

CARVALHO, Joaquim, Soluzioni informatiche per microstorici, Quaderni


Storici, v. XXVI, n. 03, 1991(Traduo nossa. O original est em italiano).

[101]
mais antigos conservados so de algumas cidades italianas e que
podemos encontr-los em toda a Europa, na frica e na Amrica.
Como vou trabalhar com essa fonte, li vrios artigos e livros
sobre o uso que fizeram dela e das variaes possveis (ou, pelo,
menos as mais comuns) em seu formato. Sei que h vasta
metodologia desenvolvida para sua anlise e que elas podem se
revelar teis em algum momento da pesquisa, pois minha
pergunta inicial pode se revelar insuficiente e demandar outras
abordagens no previstas inicialmente. Para tanto, precisarei
adequar a pesquisa. Quando isso acontecer, ser bom ter
preparado a base de maneira a prever algumas possibilidades.
Isso no significa criar uma base para tudo, mas desmontar de
tal modo que os dados dos batismos possam ser remontados de
diversos modos e no apenas da forma originalmente pensada.
Vamos pensar na forma como os registros esto
dispostos. Sempre sero na forma de livros, no apenas pelo
fato de isso ser comum, mas porque h uma demanda oficial
atravs de normativas internas da Igreja, que no vou explorar
aqui. Todos os arquivos tm volumes onde ficam registrados os
batismos que couberam ali. O nmero de registros de batismo
possvel em cada tomo n. No h mnimo ou mximo. Eles no
tm diviso interna estabelecida. Os batismos geralmente so
listados na ordem cronolgica, um aps o outro. possvel
encontrar divises em alguns casos, como metade do livro para
pessoas livres e a outra metade para escravos, em sociedades
escravistas. H, igualmente, separao para indgenas. Mas so
especificidades de alguns exemplares e no regras da fonte.
Precisamos, contudo, considerar esta possibilidade e saber incluir
isso no nosso modelo conceitual.
Mesmo que os registros estejam dentro de livros,
eles se constituem em uma srie. Os livros so o suporte para
que a srie exista e fique organizada, mas se fosse possvel ter
um livro infinito, ele teria todos os registros. Assim, o livro

[102]
importante, mas no central. O centro das atenes est no
registro propriamente dito que tem uma estrutura interna
relativamente regular. comum que comece com a data, que
fale imediatamente o nome do batizando com sua legitimidade, e
os responsveis por ela, seus pais. Pode mencionar os avs,
mas, nem sempre, isso ocorre. Ele informa os padrinhos e acaba
com a assinatura do padre. comum que sejam acrescidas
observaes sobre cada um dos participantes, especialmente
sobre o estatuto das pessoas, a residncia, a naturalidade e o
local do batizado.
Observando a descrio acima, sabemos que h
elementos constantes e esperados, como o nome do batizando,
dos pais e dos padrinhos. Seria igualmente esperada a
informao sobre os avs, mas ela no to regular. H ainda
contedos completamente irregulares, que podem ou no ser
mencionados para alguns (e no, para todos) dentro de um
mesmo registro. Pode haver duas informaes de qualidade
diferente ("filho do capito" nos diz de quem filho e que o pai
capito) para um nico participante e nenhuma para os demais.
Por ter visto muitos registros, sei que possvel que os batizados
aconteam em um lugar diferente da Igreja Matriz, como em
uma propriedade agrria ou na casa de algum. Da mesma
maneira, a criana pode ter sido batizada in extremis, por temor
de sua morte, mas sobrevivido para ter com o padre e receber
os santos leos posteriormente. O padre pode ser um e a pessoa
que batiza, outra, assim como o batismo pode ser dado por um
padre e o registro ser feito por outro.
Podemos comear nosso trabalho. Tomamos o
papel e anotamos todas essas observaes. Sabemos tambm o
volume que vamos abordar - se um, dois ou trs livros, por
exemplo. Contamos que cada pgina tem, em mdia, quatro
registros e que os trs volumes que vamos usar tem, somados,
650 pginas. Isso nos permite estimar a grandeza do nmero de

[103]
registros: uns 2600. Tendo isso apontado, podemos seguir em
frente. O passo seguinte pensar sobre quantas tabelas sero
necessrias. Pelo que foi dito at aqui, quantas voc, leitor,
pensaria? Eu diria que, pelos menos, trs: uma para registrar os
livros, outra, a mais importante, para registrar os batismos, e
uma terceira para registrar as informaes irregulares sobre os
participantes do batismo, sua condio social, seu estatuto, sua
residncia, etc. Elas merecem, em minha opinio, uma tabela
separada e relacionada com a dos batismos. Vejamos:

Figura 19 - Modelo Conceitual de uma base para registros de batismos

Criamos tabelas quando os fragmentos que


identificamos em nossos materiais tm relevncia e
especificidades suficientes para ganhar um espao exclusivo feito
sob medida. Vamos pensar, agora, nos campos de cada uma das
tabelas, comeando pela de livros. O primeiro campo que
sempre devemos criar o cdigo, um campo que vai identificar
inequivocamente cada registro, nesse caso, cada livro. Alguns
usam a expresso Identificador ou ID. H quem use
Matrcula. Eu prefiro chamar de cdigo, especialmente pelo
fato de que ali ser inserido um cdigo alfanumrico que ser
facilmente identificado como uma fonte. No caso dos batismos,
eu faria algo como SAnt_bat_001 para identificar o livro de
batismos nmero 1 da Parquia de Santo Antnio. Os
programadores chamam esse tipo de campo de chave primria.
Depois, veremos que os registros de batismos desse mesmo livro
tero tambm esse rtulo, acrescido da pgina e da ordem do

[104]
registro dentro dela. O campo seguinte o nome da parquia,
um campo de texto; o prximo o nmero do volume, e o
seguinte, um campo de texto para informar o ano inicial e o final
do tomo. tambm importante fazer um campo para informar o
nmero de registros total desse livro, assim como o de pginas.
Eu ainda faria um campo para a abertura do livro (isso feito,
quase sempre, na primeira folha) e outro para seu fechamento
(fica na ltima). Acabaria com um campo de observaes. Talvez
seja o caso de criar um campo para o nome do volume, pois, em
algumas vezes so identificados com um ttulo como Livros dos
Pretos da Candelria. Assim, temos:
TABELA LIVROS
CAMPO
Cdigo_livro*

TIPO
OBS
Texto (chave Mximo de 12 caracteres
primria)
Parquia
Texto
Livre
Nmero do livro
Nmero
Mximo de 3 caracteres
Data inicial
Data
(ou AAAA
texto)
Data final
Data
(ou AAAA
texto)
Total de registros
Nmero
Mximo de 5 caracteres
Total de pginas
Nmero
Mximo de 4 caracteres
Abertura
Texto
Livre
Fechamento
Texto
Livre
Observaes
Texto
Livre
* Indica que o campo ter um relacionamento com outra tabela.
Agora precisamos dar conta da tabela Batismos
propriamente dita, que requer mais trabalho. Comeamos
novamente com o campo cdigo_livro, que vai receber o
cdigo do livro em todos os registros, de modo a permitir seu
relacionamento. como se carimbssemos o cdigo do livro em
cada registro para associ-los. Com isso, no precisamos digitar

[105]
nenhum dado do livro no registro, que j herdar todos do seu
pai. Essa filiao to marcante que muitos programadores
costumam chamar os campos de ID (identificador) e
ID_parent (identificado do pai) para enfatizar isso. Pode ser
uma opo. Eu prefiro utilizar a palavra cdigo, seguida de
outra que indica o que est sendo codificado. E nesse caso
particular, importante usar o mesmo nome, pois logo criaremos
outro campo cdigo para outro relacionamento que a base
ter, agora, com os detalhes relativos aos participantes do
batismo. Esse campo ser chamado de cdigo_registro. O
prximo campo pode ser o de transcrio, que receber o texto
do batismo na ntegra. uma alternativa, no necessrio, mas
pode ser til para evitar novas viagens ao arquivo. Eu o usaria
pensando no problema apresentado na pgina 27, quando falei
que Martha Hameister encontrou um registro de batismo
excepcional. No preciso criar um campo para o texto
inesperado, mas no vamos perder essa preciosidade. Ele ficar
junto com as outras informaes seriveis, mas integralmente
transcrito. Vejamos que outros campos seriam necessrios:
TABELA BATISMOS
CAMPO
Cdigo_livro*
Cdigo_registro*
Transcrio
Local de nascimento
Local do batizado
Padre celebrante
Quem redigiu
Data do batismo
Data do nascimento
Nome do batizando

TIPO
Texto
Texto
Texto
Texto
Texto
Texto
Texto
Data
Texto
Data
Texto
Texto

ou

OBS
Mximo 12 carac.
Mximo 19 carac.
Livre
Livre
Livre
Caixa de escolha
Caixa de escolha
Livre

ou

Livre
Livre

[106]
Sexo
Texto
Caixa de escolha (M, F)
Legitimidade
Texto
Caixa de escolha (L, N)
Pai
Texto
Livre
Me
Texto
Livre
Padrinho
Texto
Livre
Madrinha
Texto
Livre
Av paterno
Texto
Livre
Av paterna
Texto
Livre
Av materno
Texto
Livre
Av materna
Texto
Livre
Observaes
Texto
Livre
* Indica que o campo ter um relacionamento com outra tabela.
Comecemos observando o campo Cdigo_registro
que deve ter at 19 caracteres para que possa receber o
cdigo_livro integralmente e ser acrescido de nmeros que
indiquem a pgina e a ordem do batismo na dita mesma. Ficar
algo como SAnt_bat_001_023v_3. Nesse caso, vai significar:
Parquia de Santo Antnio, 1 livro de Batismos na pgina 23
verso, 3o registro na ordem da folha, de cima para baixo. Com
isso, cada registro ter seu endereo completo no Arquivo da
Igreja, de uma forma compacta e fcil de entender (e de citar,
pois pode ser usada como referncia nos textos que forem feitos
com o registro. Basta copiar e colar).
O sexo no dito, mas pode ser uma informao
fcil de se obter, tendo em conta apenas o nome. Uma opo, j
usada e aprovada pelo autor, criar um pequeno aplicativo que
faa uma varredura pelos registros para procurar nomes
masculinos e femininos e preencher automaticamente o sexo.
Para isso, preciso ter uma lista prvia dos nomes para cada
sexo. D trabalho e deve ser feita para cada contexto, regio e
poca, pois muda bastante, mas, depois, basta aplicar para
qualquer outra fonte ou registro novo. Essa aplicao depende
do programa e da habilidade do usurio em cri-la. No vamos
ensinar aqui, pois depende de cada software.

[107]
Por fim, temos a terceira tabela, Detalhes que
ser muito enxuta para permitir alguma maleabilidade, para que
possamos receber qualquer tipo de dado adicional. Comeamos
com nosso velho amigo cdigo, nesse caso, cdigo_registro,
que associar todos os detalhes com os batismos respectivos. O
seguinte um campo que classifica o tipo de informao que
ser includa e que vai depender dos critrios que cada equipe
ou pesquisador adotar. Eu criaria opes como Batizado em,
Casado com, Filho de, Qualificativo, etc, tendo em conta o
que aparece na fonte, mas de modo minimamente estruturado.
Depois poderemos reagrupar esses rtulos em outras categorias
e analisar como quisermos. Uma postura mais indutiva permite
isso. O campo seguinte nos diz sobre de qual dos participantes
ser a informao, se do pai, da me, dos padrinhos ou dos
avs. O quarto campo ser para indicar o nome do referido, para
associar o detalhe com a pessoa. O quinto, que chamarei de
informao, permitir detalhar de modo descritivo o que est
sendo registrado. Vejamos:
TABELA DETALHES
CAMPO
TIPO
OBS
Cdigo_registro*
Texto
Mximo 12 carac.
Tipo de informao
Texto
Caixa de opes
Qual posio
Texto
Caixa de opes
Quem
Texto
Livre
Informao
Texto
Livre
Observaes
Texto
Livre
* Indica que o campo ter um relacionamento com outra tabela.
Com isso, j temos o modelo conceitual de nossa
base e elementos para construir os modelos lgico e fsico. A
construo desses dois vai depender do software escolhido, mas
ser apenas uma tarefa mecnica depois de todas estas
decises. Mas, com isso, temos apenas uma base individual,

[108]
para um nico usurio. Se quisssemos gerar um sistema com
controle de usurios, distribuio de tarefas e auditoria,
precisaramos fazer outra tabela, para cadastrar os usurios, e
criar os campos usurio e data de criao em cada uma das
outras tabelas, para que registrasse quem fez o que e quando.
Vale a mesma lgica apresentada at aqui.
Com essa estrutura, podemos fazer coisas muito
complexas com essa fonte. Podemos, por exemplo, selecionar
apenas os livros que contenham registros nos quais o padrinho
era filho de capito. Com isso quero dizer que resguardando as
especificidades de cada tipo de informao ao criar trs tabelas,
podemos ainda fazer buscas cruzadas considerando que as trs
tabelas esto relacionadas. Respeitamos a estrutura da fonte e
ainda temos como recuperar dados com rapidez e complexidade.
Se fizssemos apenas uma tabela, teramos muita dificuldade de
guardar esses dados como padrinho era filho de capito e
tenderamos a perder a informao, colocando-a em um campo
muito especfico ou, simplesmente, ignorando-a. O planejamento
permitiu, como vimos, um uso amplo dos dados . Mais adiante,
veremos como essa base poderia se integrar com outras, de
batismo e de bitos, para a aplicao do mtodo Henry.
Correspondncias
Vimos (na pgina 24) que as correspondncias
podem ser vistas como um tipo de fonte sem estrutura, diferente
dos batismos. Isso no quer dizer que no possamos fazer bases
delas. O que no podemos forar uma estruturao onde no
h. As correspondncias sequer tm uma forma padronizada de
preservao, como os livros, no caso dos batismos. A nica coisa
que garante a especificidade do gnero sua ampla utilizao
nos ltimos sculos, ainda que seja imemorial. H alguma
bibliografia sobre esse tipo de fonte, ainda que no seja to

[109]
vasta quanto aquela dedicada aos registros paroquiais e h
inmeros estudos que usam este tipo de fonte, mas sempre
dando um tratamento semelhante a livros, inclusive com a
publicao de sries de correspondncias.
O que realmente regular ou esperado, previsto
so informaes como remetente, destinatrio, data, local
do remetente, local do destinatrio e o texto da carta. Com
isso faremos nossa base. Poderamos acrescentar outros campos
por capricho, para aproveitar bem mais a fonte: pessoas
citadas, locais citados e temas. So trs campos que
evidenciam a interveno direta do historiador, mas sem
perturbar a fonte. Poderamos tambm acrescentar um campo
para incluir o perodo que a carta cobre, se faz referncia a
coisas passadas ou expectativas futuras, campos para resumo,
recortes e outro para identificar recursos discursivos utilizados.
Assim, estaramos desmontando de forma mais adequada a
fonte, como devemos fazer. Vejamos:
TABELA CORRESPONDNCIAS
CAMPO
Remetente
Local do remetente
Destinatrio
Local do destinatrio
Data
Texto da carta
Cdigo_carta

TIPO
Texto
Texto
Texto
Texto
Data ou texto
Texto
Texto

OBS
Livre
Livre
Livre
Livre
AAAA-MM-DD
Livre
Livre

Campos opcionais que podem ser teis:


CAMPO
Pessoas citadas
Locais citados

TIPO
Texto
Texto

OBS
Livre
Livre

[110]
Temas

Texto

Perodo abarcado
Resumo
Recortes
Recursos discursivos

Texto
Texto
Texto
Texto

Livre ou caixa de
opes
Livre
Livre
Livre
Livre

Haveria, ainda, outra possibilidade, a de criar um


campo adicional para recolher dados sobre outras cartas
mencionadas na prpria carta. Isso seria interessante, porque,
muitas vezes, as cartas so respostas a outras anteriores, que
por sua vez foram respostas de outras mais e isso
freqentemente mencionado (Respondo por esta a sua do
dia... ou frmulas semelhantes). Com esse controle, podemos
ver o tempo de resposta entre uma carta e outra e observar uma
srie delas, quase uma conversa, entre duas pessoas. Para isso,
bastaria o campo em resposta carta de e, talvez, um campo
de clculo que medisse a diferena entre as duas datas, ainda
que possa ser feito em uma planilha, uma vez exportados esses
dados, o que j facilitaria a preparao de um grfico. Contudo,
nem sempre, a carta responde a apenas uma original. Pode ser o
caso de, analisando a documentao, percebermos que h
missivas que respondem a duas ou trs anteriores, que so
claramente mencionadas. Nesse caso, no basta um campo de
"em resposta carta de...". preciso criar outra tabela que
contenha aquele campo e as datas das originais e da atual.
Fontes dialgicas
Tomei a expresso "dialgicas" do texto O
69
inquisidor como antroplogo, de Carlo Ginzburg. Serve para
69

GINZBURG, Carlo, O inquisidor como antroplogo: uma analogia e as suas


implicaes, in: Micro-histria e outros ensaios, 1989.

[111]
designar as fontes que foram produzidas a partir de um dilogo,
como interrogatrios da igreja ou da polcia. claro que so
frutos de pocas muito diferentes, mas o que faz Ginzburg
aproxim-las que elas tm uma estrutura semelhante e tendem
a formar corpi documentais mais organizados do que as
correspondncias e formar sries completas, tanto nos locais
onde so produzidas quanto nos Arquivos. H muitos estudos
sobre esse tipo de fonte, ainda que a maioria dos trabalhos que
as utilizem no faa nenhuma reflexo sobre sua produo. A
produo dessas fontes segue um ritual semelhante, com a
instaurao do processo, que transcrito do incio ao fim (com
ausncias, talvez, mas com um incio e um final). regular
tambm o fato de haver depoimentos em srie e, para cada caso
particular, uma lista de perguntas que foram feitas aos
interrogados. Ou seja, temos duas camadas de regularidades:
uma prpria da fonte, com o processo, os depoimentos e as
listas de perguntas; outra, prpria de cada conjunto, com a
lgica prpria das perguntas, de acordo com a dinmica do
processo, com o momento de sua produo e com o caso em
questo.
Precisamos, ento, de uma tabela para o processo
na qual haver campos como data inicial e data final, alm
de uma smula do caso, de uma lista de acusados e de
testemunhas. certo que dados mais bsicos sero necessrios,
como o local do inqurito e os nomes dos investigadores e dos
juzes. Nesse caso, seria importante ter informaes sobre cada
uma das instncias pelas quais passou, sabendo que
recorrente que haja hierarquias na Justia desde longo tempo.
bem verdade que nosso processo pode ter sido arquivado na
origem, numa delegacia de interior, mas o simples fato de
pensarmos que poderia ter tido uma longa trajetria, mas que
no teve j nos faz aprimorar nossa reflexo sobre a fonte e o
problema histrico em si. Era normal ser arquivado ou foi uma

[112]
deciso arbitrria? Quais os trmites mais recorrentes? So
questes que colocamos diante da demanda por organizar nosso
material em caixinhas (campos) de uma tabela.
A primeira coisa a descobrir o fluxograma possvel
do processo, o caminho do inqurito do incio ao final. Isso varia
de acordo com o contexto. preciso tambm saber se h
diferenas entre essas instncias, no que toca ao processamento
dos casos. Se no houver, basta uma tabela Processos na qual
podemos marcar com um campo sim ou no todo o caminho
possvel de um caso. Isso resolveria. Deste modo, cada
interrogatrio seria colocado em uma tabela relacionada
chamada interrogatrios, uma vez que cada processo pode ter
n sesses de perguntas, ou dilogos, para manter o vocabulrio.
E como o nmero de perguntas tambm sempre n, seria
importante criar uma tabela Perguntas, que teria, alm do
campo cdigo, os campos pergunta e resposta.
Parece-me no ser preciso repetir as tabelas com os
dados organizados, como fiz com o exemplo dos batismos e das
cartas. Nesse momento, o leitor j pode bolar o prprio esquema
a partir das reflexes iniciais aqui apontadas. O importante no
simplificar aquilo que merece desdobramentos. Nosso trabalho
de historiador j uma simplificao. Colocar em bases de
dados, tambm, mas uma simplificao que organiza. No
precisamos simplificar mais nem temos motivo para isso,
porquanto temos ferramentas que nos permitem tratar as fontes
com cuidado.

Bases centradas no mtodo


Na pgina 47 vimos algo sobre o sistema "Fichoz".
Trata-se de um bom exemplo de base de dados method-centred,
que, apesar de no permitir a incorporao integral de fontes,

[113]
permitia o desdobramento de interaes sociais (descritas nas
fontes) em uma grande variedade de pedaos reagrupveis
conforme a necessidade. No caso da base "Fichoz", a
possibilidade de desmontar as fontes to grande que,
dependendo da obstinao do pesquisador, nem seria to
perigoso ficar sem elas. E seria relativamente fcil reutilizar a
base, tendo em vista sua plasticidade diante de inmeras
metodologias conhecidas na atualidade. Como sou um defensor
das bases source-centred, tenho receio de recomendar bases
centradas no mtodo, mas entendo que, quando bem feitos,
esses bancos de dados so preciosos. Vejamos alguns exemplos
de metodologias e como seria a criao de bases com essa
perspectiva.
Prosopografia
Assim como preciso conhecer a fonte para fazer
uma base centrada nelas, preciso conhecer bem a
metodologia. Para a prosopografia, por exemplo, fundamental
conhecer o clssico de Lawrence Stone sobre a aristocracia
70
inglesa , assim como seu artigo de 1971, que j apresentamos
no incio desta obra. H outros livros importantes, inclusive
muitas coletneas nacionais, mas seria muito longo apresentar
todas aqui. Isso uma tarefa do desenvolvedor da base, que
dever tomar essas referncias em conta.
Sabemos que prosopografia a biografia de um
grupo, que pode ou no ser homogneo, e que preciso ter
uma ferramenta com a qual possamos armazenar os dados de tal
maneira que possamos utilizar a base circulando entre os
indivduos e o grupo. A prosopografia j previa uma variao de
escala (pelo menos duas), muito antes de esse assunto entrar
70

STONE, The Crisis of the Aristocracy, 1558-1641.

[114]
com fora no debate historiogrfico a partir da micro-histria.
Ser o caso de termos duas bases, uma para o grupo e outra
para os agentes? Devemos ter uma ficha para cada
personagem, com sua data de nascimento, de casamento, de
morte, etc.?
J vimos um modelo interessante para a
prosopografia, a mesma base Fichoz, de Jean-Pierre Dedieu.
Ela no tinha fichas individuais e sua concepo era totalmente
oposta a esse sistema. A ideia, como j vimos, era de
desmembrar a vida das pessoas em eventos, para que pudessem
ser reagrupados depois em forma de uma biografia (numa busca
pelo sujeito) ou por meio de algum outro critrio. Com a mesma
base, seria possvel relacionar o acontecimento com outras
pessoas, permitindo anlises de redes. Isso foi possvel porque,
mesmo sem demandar inicialmente este tipo de anlise, tal
possibilidade foi pensada no incio da construo da base. O
modelo conceitual da base Fichoz me parece muito adequado
aos estudos prosopogrficos e seria difcil criar um sistema mais
eficiente e flexvel. No preciso ter uma cpia desse sistema
para reproduzir seu conceito, basta conhecer sua descrio e
71
aplic-la com os devidos crditos.
Um sistema de fichas individuais poderia ser uma
boa sada, mas tem alguns limites difceis de contornar. O
primeiro a montagem da histria de vida da pessoa. Como
desdobr-la de modo cronolgico? Mesmo que no nos agrade a
cronologia, ser que nunca precisaremos dela? Nunca teremos
algum comportamento humano marcado pelo ciclo de vida, como
idade para casar, idade para entrar no mundo do trabalho, idade
para ser deputado etc.? Outro limite que, para cada campo,
precisaramos de outro correlato para a fonte que usamos para
71

DEDIEU, Les grandes bases de donnes: une nouvelle approche de lhistoire


sociale. Le systme Fichoz.

[115]
preencher aquele campo. Por fim, deveramos ter um campo
profisso at para aqueles que nunca tiveram uma? Um campo
de matrimnio mesmo para quem nunca se casou? verdade
que importa perceber as ausncias, o que s seria possvel sem
um campo que exigisse isso de todos.
Anlise demogrfica (Mtodo Henry)
Criado ao longo dos anos 1950 como um caminho
para os estudos demogrficos de pocas conhecidas como prestatsticas, quando no havia o registro sistemtico de dados
sobre as populaes, o Mtodo Henry formou geraes de
pesquisadores e outras tantas escolas de estudos demogrficos,
de Cambridge ao Minho. A proposta era relativamente simples:
se no dispomos de estatsticas oficiais para os sculos
passados, juntemos todos os registros de batismo, casamento e
bito e tentemos reconstituir as famlias dessas pocas, atravs
do cruzamento dos dados. Trabalho sem fim! E tudo isso usando
fichas de papel. O tempo passou e somente em 1968 foi
apresentado ao mundo o primeiro grande resultado da proposta,
72
a tese de Pierre Goubert sobre Beauvais. Desde ento, foram
feitos muitssimos acrscimos concepo original, variaes,
inclusive, softwares variados para aplicar o famoso mtodo. 73
Para criar uma base de dados em que se utilize o
Mtodo Henry, o ideal seria comear com trs bases de fontes:
uma para os batismos, uma para os casamentos e outra para os
bitos. Adaptaes posteriores do mtodo, feito pelo prprio
72

GOUBERT, Pierre, Cent Mille Provinciaux au XVIIe Sicle. Beauvais et le


Beauvaisis de 1600 1730, Paris: Flammarion, 1968.
73
Na Universidade do Minho (NEPS), por exemplo, foi criado o MRP, baseado
nas variaes desenvolvidas por Maria Norberta Amorim. AMORIM, Maria
Norberta et al, Reconstituio de parquias e formao de uma base de dados
central, in: , Castelo Branco: [s.n.], 2001.

[116]
Henry para o caso do Brasil, permitiriam uma quarta base, para
74
as listas nominativas. E isso no significa ignorar a opo de
quem prefere trabalhar sem bases source-centred. A questo
que o prprio mtodo prev o tratamento diferenciado para cada
fonte. O passo seguinte envolve unicamente abordagens
method-centred.
preciso criar algumas tabelas e muitos campos
para dar conta dessa metodologia. Parece-me adequado pensar
em pelo menos trs tabelas: localidade, famlia e indivduo.
Localidade, porque convm pensar que a base poder ser
utilizada para diferentes localidades, vizinhas, talvez, ou mesmo
muito distantes (para estudar migrao, por exemplo); famlia,
por ser a unidade domstica o centro do mtodo. Indivduo
permitir isolar os casos e informar suas datas de nascimento,
casamento e morte. Da mesma forma, no podemos prever
quantas pessoas formaro a famlia, o nmero de membros ,
logo, sempre n.
Se
temos
todos
os
dados
organizados
adequadamente nas bases de casamento, bito e batismo, basta
exportar todos os pares de pai e me, no caso dos batismos, e
de noivos, nos casamentos. Feito isso, basta eliminar os
duplicados e teremos todos os casais disponveis naquela
amostra. Convm fazer uma varreadura para encontrar
problemas com nomes. Por exemplo, a Rita Maria de Oliveira,
casada com Raimundo da Silva, pode ter sido incorretamente
transcrita como Rosa Maria de Oliveira, por conta de um nome
borrado. Um bom estudo da nossa lista resultante da exportao
pode resultar em muitas correes necessrias.
Como nossos dados estavam organizados e j foram
74

HENRY, Louis, Tcnicas de anlise em demografia histrica, Curitiba: UFPR,


1977.

[117]
corrigidos, basta relacionar nossa nova tabela com as bases de
casamento e de batismo para que tragam informaes
complementares que formaro a ficha de cada uma das famlias.
Esse um procedimento bem menos trabalhoso do que digitar
novamente todos os casos. melhor gastar esse tempo
revisando, o que deveria ser feito de qualquer jeito. Assim, j
temos a tabela das famlias, formada por campos como pai e
me, basicamente, alm de campos que criem relacionamento
com as localidades, com as famlias e com as fichas individuais. A
tabela localidades ter os dados do conjunto que sero
herdados por todas as famlias e todos os indivduos.
Assim, resta criar a tabela indivduos, o que
poder ser feito a partir dos batismos, exportando
separadamente todos os pais, mes, padrinhos e madrinhas,
alm da criana, claro. A exportao dos dados dos avs ponto
de reflexo, pois em comunidades jovens, recm-criadas, por
exemplo, eles no costumam estar presentes. Mas pode ser
relevante se assim for considerado pela equipe. Convm exportar
esses dados junto com outros estruturantes da informao,
como o nome do casal, a data, localidade e o cdigo-fonte. No
caso dos batizandos, convm exportar tambm a data de
nascimento, se disponvel, alm da do batismo. Deste modo,
cada indivduo ser associado a um casal, mas tambm a uma
localidade, dadas as outras relaes, como o compadrio. Para
relacionar os bitos, ser preciso criar o relacionamento a partir
do nome.
Com esses procedimentos, teremos um sistema
complexo de anlise de famlias que permitir vrios outros
cruzamentos, de tal maneira que possamos saber o intervalo
intergensico e, os compadrios, as famlias sem pai, entre uma
multiplicidade de outros fenmenos sociais. Mas preciso que
fique claro que isso s ser possvel com boas bases de fontes
que daro algum trabalho, mas valero a pena. Feito isso,

[118]
teremos condies de automatizar um bocado nosso esforo, de
tal maneira que muito do que ser necessrio j estar feito. A
automao e a criao de tabelas de famlia ajudaro a revisar o
material previamente abastecido. Gasta-se tempo na preparao,
mas, no momento da anlise, os dados estaro disponveis em
poucos cliques.

Anlise de redes sociais


Os estudos de anlise de redes sociais surgiram
entre os anos de 1950 e 1960, com o trabalho pioneiro de
Elizabeth Bott, e as pesquisas de Mitchell, Boissevain e Barnes.
uma metodologia que enfatiza as interaes humanas como
objeto primordial de anlise e destaca os tipos e as formas dos
laos criados e mantidos por determinadas unidades de anlise
(que podem ser pessoas, empresas, cidades ou palavras) e como
estas relaes podem interferir no comportamento e nas
escolhas dessas unidades.75
Talvez a maior justificativa para o uso dessa
metodologia, alm das questes epistemolgicas atinentes, seja
a possibilidade de visualizar matrizes e grficos que destacam
com clareza os vnculos entre as partes e observar aspectos no
perceptveis por outros caminhos. Cada matriz e seu grfico
correspondente apresentam um instantneo dos vnculos de um
grupo. O grfico formado por ns (que representam as
75

MITCHELL, J. Clyde; BOISSEVAIN, Jeremy, Network analisys. Studies in


Human Interaction, The Hague/Paris: Mouton, 1973; MITCHELL, J. Clyde,
Social Networks, Annual Review of Anthropology, v. 03, p. 279299, 1974;
BARNES, J. A., Networks and political process, in: MITCHELL, J. Clyde (Org.),
Social Networks in urban situations: Analysis of personel relationships in
Central Africa Towns, Manchester: The University Press, 1969; BOTT,
Elizabeth, Famlia e rede social. Papis, normas e relacionamentos externos
em famlias urbanas comuns, Rio de Janeiro: Francisco Alves, 1976.

[119]
unidades), linhas (que simbolizam as relaes) e setas (que
indicam os sentidos das ligaes). De acordo com as informaes
sobre esses elementos, os desenhos e as cores do conjunto
podem variar, indicando agrupaes ou especificidades de certas
unidades ou laos. Para a criao desses grficos, existem
softwares interessantes e prticos como o Gephi e o Ucinet.
Preparar bases de dados para esse tipo de estudo
demanda tabelas com as quais se possam destacar as relaes
entre as partes, ou seja, coletar dados sobre os personagens
associados "em duplas" por tipo de relao. certo que, muitas
vezes, temos grupos que ultrapassam as duplas, mas eles devem
ser desmontados aos pares, at que todos tenha relao com
todos, pois, somente assim, ser possvel destacar esses vnculos
dentro de uma matriz. No caso hipottico de um grupo de
pessoas, temos um cenrio onde quase todos se conhecem.
Paulinho, por exemplo, conhece todos, mas a forma de
representar isso nas anlises de redes sociais requer que eu
apresente os dados destacando com 1 ou 0 (1 = conhece; 0 =
no conhece), quem amigo de quem, ou seja, dupla por dupla.

Figura 20 - Matriz matemtica das relaes de um grupo

[120]

Figura 21 - Grfico de rede criado com a matriz acima indicada

Assim, basta criar uma tabela em que se organizem


os dados com essa estrutura e tudo ficar resolvido. No caso de
registros de batismos, por exemplo, seria preciso decompor as
relaes de compadrio aos pares: pai com padrinho, pai com
madrinha, me com padrinho, me com madrinha. Mas no
basta s exportar os dados de uma base paroquial para um
programa de anlise de redes, porquanto as interaes se
repetem (um mesmo sujeito pode ser compadre de outro por
vrias vezes, por exemplo) e preciso ter esse controle e
certificar a qualidade dessas relaes. Com isso, podemos
colocar, ao invs de 1 ou 0, vrios nmeros, para indicar a
repetio dos laos ou a qualidade deles - se de compadrio, de
amizade, de vizinhana - etc. Quase todos os programas
permitem apresentar isso visualmente.
Seriais
Um sistema para fontes seriais ou seriveis j seria,
por si s, source-centred, pois, na maioria das vezes
quantificamos uma fonte nica, s bens de inventrios, por
exemplo, ou apenas os registros de compra e venda de alguma

[121]
localidade. Contudo, algumas bases no so feitas com uma
fonte nica. No significa que sejam ruins. A base Slave
Voyages, da Emory University um bom exemplo. Ela foi feita
com fontes muito variadas que mereceriam crticas muito
diversas. Mas, fazendo isso, a base no ficaria pronta nunca e
jamais teramos ideia do volume de pessoas foradas a cruzar o
Atlntico.
Em alguns casos - e isso vai depender do
planejamento da equipe - pode ser preciso criar uma base serial
que no esteja vinculada a uma nica fonte primria, que seja
um mosaico deformado, mas que nos apresente uma imagem,
ao menos borrada do que queremos saber. Para esse tipo de
abordagem, valem alguns aspectos que j pontuamos:
planejamento, discusso, experincia com a base e testes. Isso
pode garantir um bom desenvolvimento. Contudo, preciso
fazer como os coordenadores do Slave Voyages e como nos diria
Marc Bloch: preciso ter critrio. No h bom senso em Histria.
Se definirmos bons critrios, nossa base ter coerncia e ser
til. Mas o problema no se resolve a. Lembremos-nos do
debate iniciado em 1965 com Adeline Daumart: nossas hipteses
mudam ao longo da pesquisa (e, muitas vezes, elas devem
mudar), devido s prprias descobertas feitas ao longo dela.
Essas so questes sobre as quais a equipe dever refletir.

[122]

Concluso
Uma obra como esta no precisaria de concluso,
porquanto entendo que ela fica por conta do leitor, que far sua
base, talvez com a nossa ajuda. Acredito, contudo, que muito
mais do que foi dito aqui poder ser feito e pensado sobre o
assunto, com o foco especificamente direcionado para as
pesquisas na rea de Histria.
Apresentei algumas bases de dados voltadas para
fontes, e outras, para a metodologia, depois de uma breve
reflexo sobre alguns dos problemas prprios da informatizao
do conhecimento histrico, mas no falei que seria possvel criar
um grande sistema que auxilie todas as etapas do trabalho. J
h algumas iniciativas em curso, paralelas, em vrios pases, mas
todas ainda esto em fase de testes. Certamente, em alguns
meses ou anos, este texto ser acrescido de algumas novas
experincias e uma nova concluso. Espero que sim.

[123]

Bibliografia
ADELINE DAUMARD. Structures sociales et classement socioprofessionnel. Lapport des archives notariales au XVIIIe et
au XIXe sicle. Revue Historique, v. 86, n. CCXXVII, 1962.
ADELINE DAUMARD. Une rfrence pour ltude des socites
urbaines en France aux XVIIIe et XIXe sicles projet de code
socio-professionnel. Revue dHistoire Moderne et
contemporaine, v. X, p. 185210, 1963.
AMORIM, Maria Norberta; FERREIRA, Antero; RODRIGUES,
Ftima; et al. Reconstituio de parquias e formao de
uma base de dados central. In: Castelo Branco: [s.n.], 2001.
AUTRAND, Franoise. Le personnel du parlement de Paris:
traitement automatique dune prosopographie en vue
dune tude sociale. In: FOSSIER, Lucie; VAUCHEZ, Andr;
VIOLANTE, Cinzio (Orgs.). Informatique et histoire
mdivale. Roma: cole Franaise de Rome, 1977, p. 239
243.
BARNES, J. A. Networks and political process. In: MITCHELL, J.
Clyde (Org.). Social Networks in urban situations: Analysis
of personel relationships in Central Africa Towns.
Manchester: The University Press, 1969.
BOTT, Elizabeth. Famlia e rede social. Papis, normas e
relacionamentos externos em famlias urbanas comuns.
Rio de Janeiro: Francisco Alves, 1976.
BUSA, Roberto. The Annals of Humanities Computing: The Index
Thomisticus. Computers and the Humanities, v. 14, p. 83
90, 1980.
CARVALHO, Joaquim. Soluzioni informatiche per microstorici.
Quaderni Storici, v. XXVI, n. 03, 1991.
CHARLE, Christophe. Problemes de traitement informatique
dune enquete sur trois lites en 1901. In: MILLET, Hlne
(Org.). Informatique et prosopographie. [s.l.]: CNRS, 1985.
DE CERTEAU, Michel. A operao histrica. In: LE GOFF, Jacques;

[124]
NORA, Pierre (Orgs.). Histria: novos problemas. So
Paulo: Livraria Francisco Alves Editora, 1978.
DE VRIES, Jan. Population. In: BRADY JR., Thomas; OBERMAN,
Heiko; TRACY, James (Orgs.). Handbook of European
History 1400-1600. Late Middle Ages, Renaissance and
Reformation. Leiden / New York / Koln: E. J. Brill, 1994.
DEDIEU, Jean Pierre. Les grandes bases de donnes: une
nouvelle approche de lhistoire sociale. Le systme Fichoz.
Revista da Facultade de Letras- Histria, v. 05, 2004.
DUPAQUIER, Jacques. Suggestions pour lorganisation du travail
dquipe en histoire sociale. In: Lhistoire sociale: sources
et mthodes. Paris: Presses Universitaires de France, 1967.
FAURE, Robert. Machines et programmes. Quelques vues sur
lutilisation des machines traiter linformation en histoire
sociale. In: Lhistoire sociale: sources et mthodes. Paris:
Presses Universitaires de France, 1967.
FAURE, Robert. Mquinas e programas. Pontos de vista sobre a
utilizao das mquinas destinadas a elaborar a informao
em histria social. In: A Histria Social: problemas, fontes e
mtodos. Lisboa: Edies Cosmos, 1973.
FRAGOSO, Joo; PITZER, Renato Rocha. Bares, homens livres
pobres e escravos - notas sobre uma fonte mltipla. Os
Inventrios Post-mortem. Revista Arrabaldes, v. 1, n. 2,
p. 2952, 1988.
GENET, Jean-Philippe. Histoire, informatique, mesure. Histoire
& Mesure, v. 01, n. 01, p. 0718, 1986.
GINZBURG, Carlo. O inquisidor como antroplogo: uma analogia
e as suas implicaes. In: Micro-histria e outros ensaios.
[s.l.: s.n.], 1989.
GINZBURG, Carlo. O nome e o como: troca desigual e mercado
historiogrfico. In: GINZBURG, Carlo (Org.). Micro-histria e
outros ensaios. Lisboa/Rio de Janeiro: DIFEL/Bertrand
Brasil, 1989.
GOUBERT, Pierre. Cent Mille Provinciaux au XVIIe Sicle.
Beauvais et le Beauvaisis de 1600 1730. Paris:

[125]
Flammarion, 1968.
HAMEISTER, Martha Daisson. Para dar calor nova povoao:
Estudo sobre estratgias sociais e familiares a partir dos
registros batismais da Vila do Rio Grande (1738-1763).
UFRJ, Rio de Janeiro, 2006.
HARVEY, Charles; PRESS, Jon. Databases in Historical Research.
Theory, Methods and Applications. London: Macmillan
Press, 1996.
HENRY, Louis. Tcnicas de anlise em demografia histrica.
Curitiba: UFPR, 1977.
JACQUES DUPAQUIER. Problmes de la codification socioprofessionelle. In: Lhistoire sociale: sources et mthodes.
Paris: Presses Universitaires de France, 1967.
JEAN-PIERRE DEDIEU. Entrevista, realizada em outubro de 2013.
ENS, Lyon.
LUZZATI, Michele. La reconstruction nominative et
prosopographique de la population dune ville mdivale:
projet de constituition dune banque de donnes pour
lhistoire de Pise au XVe sicle. In: MILLET, Hlne (Org.).
Informatique et prosopographie. [s.l.]: CNRS, 1985.
MACFARLANE, Alan. Computer input of Historical Records for
multi-source record linkage. In: Proceedings of the Seventh
International Economic History Conference. Edinburgh:
[s.n.], 1979.
MACFARLANE, Alan. Reconstructing historical Communities.
Cambridge: Cambridge University Press, 1977.
MACFARLANE, Alan. The computer revolution and local history.
Disponvel
em:
<http://www.alanmacfarlane.com/FILES/local.htm>.
MANDEMAKERS, Kees; DILLON, Lisa. Best practices with large
databases on historical populations. Historical Methods,
v. 37, n. 01, 2004.
MITCHELL, J. Clyde. Social Networks. Annual Review of
Anthropology, v. 03, p. 279299, 1974.
MITCHELL, J. Clyde; BOISSEVAIN, Jeremy. Network analisys.

[126]
Studies in Human Interaction. The Hague/Paris: Mouton,
1973.
PRATESI, Alessandro. Limiti e difficolt delluso dellinformatica
per lo studio della forma diplomatica e giuridica dei
documenti medievali. In: FOSSIER, Lucie; VAUCHEZ, Andr;
VIOLANTE, Cinzio (Orgs.). Informatique et histoire
mdivale. Roma: cole Franaise de Rome, 1977, p. 187
190.
ROWLAND, Robert. L`informatica e il mestiere dello storico.
Quaderni Storici, v. 78, n. 03, p. 693 720, 1991.
SCHRER, Kevin. Historical demography, social structure and the
computer. In: DENLEY, Peter; HOPKIN, Deian (Orgs.).
History and Computing. Manchester: Manchester
University Press, 1987.
SHORTER, Edward. The historian and the Computer. A practical
guide. New Jersey: Prentice-Hall, 1971.
STONE, Lawrence. Prosopografia. Revista de Sociologia e
Poltica, v. 19, n. 39, p. 115137, 2011.
STONE, Lawrence. The Crisis of the Aristocracy, 1558-1641.
Oxford: Oxford University Press, 1965.
STONE, Lawrence. The revival of narrative: reflections on a new
old history. Past and Present, n. 85, p. 324, 1979.
THALLER, Manfred. Can we afford to use the computer; can we
afford not to use it? In: MILLET, Hlne (Org.).
Informatique et prosopographie. [s.l.]: CNRS, 1985.
THALLER, Manfred. Methods and techniques of historical
computation. In: DENLEY, Peter; HOPKIN, Deian (Orgs.).
History and Computing. Manchester: Manchester
University Press, 1987.
THOMAS, William. Computing and the Historical Imagination. In:
SCHREIBMAN, Susan; SIEMENS, Ray; UNSWORTH, John
(Orgs.). A Companion to Digital Humanities. Oxford:
Blackwell, 2004.
UNIVERSIT DE MONTRAL INSTITUT DTUDES MDIVALES.
Computers and Medieval Data Processing: Informatique Et

[127]
Etudes Medievales. [s.l.]: Universit de Montreal, Institut
dtudes medievales., 1971.
VAN DER WOUDE, A.M.; SCHUURMAN, A. Probate inventories:
a new source for the historical study of wealth, material
culture, and agricultural development: papers presented
at the Leeuwenborch conference (Wageningen, 5-7 May
1980). [s.l.]: Hes, 1980. (A.A.G. bijdragen).
VOVELLE, Michel. Ideologias e mentalidades. So Paulo:
Brasiliense, 1987.
WRIGLEY, E. A. Identifying people in the past. London: Edward
Arnold, 1973.
Base
de
donnes
Wikipdia.
Disponvel
em:
<http://fr.wikipedia.org/wiki/Base_de_donn%C3%A9es>.
Acesso em: 27 set. 2013.
Database
Wikipedia.
Disponvel
em:
<http://it.wikipedia.org/wiki/Database>.
Acesso
em:
27 set. 2013.
Database - Wikipedia, the free encyclopedia. Disponvel em:
<http://en.wikipedia.org/wiki/Database>. Acesso em:
27 set. 2013.
Index
Thomisticus.
Disponvel
em:
<http://www.corpusthomisticum.org/it/index.age>. Acesso
em: 27 set. 2013.
Voyages Database. 2009. Voyages: The Trans-Atlantic Slave
Trade
Database.
Disponvel
em:
<http://www.slavevoyages.org>. Acesso em: 4 jan. 2014.