Você está na página 1de 73

UNIVERSIDADE FEDERAL FLUMINENSE

INSTITUTO DE CIÊNCIAS HUMANAS E SOCIAIS


CURSO DE GRADUAÇÃO EM DIREITO

RAFAEL PEREIRA DE SOUZA

JURIMETRIA: TABELAS DE CONTIGÊNCIA E ASSOCIAÇÕES NO DIREITO

VOLTA REDONDA – RJ
2019
RAFAEL PEREIRA DE SOUZA

JURIMETRIA: TABELAS DE CONTIGÊNCIA E ASSOCIAÇÕES NO DIREITO

Monografia Jurídica apresentada ao Curso de


Direito do Instituto de Ciências Humanas e Sociais
de Volta Redonda, pertencente à Universidade
Federal Fluminense, como requisito parcial à
obtenção do título de Bacharel em Direito.

Orientador:
Matheus Vidal Gomes Monteiro

VOLTA REDONDA – RJ
2019
FICHA CATALOGRÁFICA
RAFAEL PEREIRA DE SOUZA

JURIMETRIA: TABELAS DE CONTIGÊNCIA E ASSOCIAÇÕES NO DIREITO

Monografia Jurídica apresentada ao Curso de


Direito do Instituto de Ciências Humanas e Sociais
de Volta Redonda, pertencente à Universidade
Federal Fluminense, como requisito parcial à
obtenção do título de Bacharel em Direito

Aprovado em 03 de julho de 2019.

BANCA EXAMINADORA:

_____________________________________
Prof. Dr. Matheus Vidal Gomes Monteiro – Orientador – UFF

_____________________________________
Prof. Dr. Marcus Wagner de Seixas – UFF

_____________________________________
Prof. Dr. Getúlio Nascimento Braga Júnior – IBMEC

VOLTA REDONDA – RJ
2019
Aos meus pais e à minha irmã, que são tudo para
mim.
AGRADECIMENTOS

Chegou o momento de agradecer a todos que contribuíram para que eu completasse essa
importante etapa da minha vida.
Aos meus pais, Mônica e Rodrigo, por terem feito mais sacrifícios do que eu, por muito
tempo, tive maturidade para enxergar. Aprendi com vocês que ser correto é o segredo da felicidade
e da prosperidade, e que se deve amar incondicionamente aqueles que querem seu bem,
especialmente na adversidade.
À minha irmã, Clarissa, com quem morei no último ano. Obrigado pelo incentivo e por ter
me ajudado de todas as formas que você podia. Sou abençoado por ter alguém tão especial como
irmã.
Ao resto de meus familiares, que notaram meu distanciamento mas que, nem por isso,
deixaram de incentivar minha jornada profissional, me apoiando e festejando todas as minhas
conquistas.
Ao time jurídico comercial da Raízen, em especial a Yve Carpi e a Tamara Bardí, por terem
me selecionado para o programa de estágio de férias e me apresentado a Jurimetria, e ao Lucas, por
ter sido o melho buddy que um novo estagiário poderia querer.
Ao Julio Trecenti, que mesmo fazendo mil e uma coisas respondeu com carinho às minhas
dúvidas e me indicou uma imensa bibliografia, que eu ainda não terminei de ler.
Aos meus companheiros da LegAut, pelo aprendizado e por me incentivarem a ser melhor
a cada dia.
A todos que foram meus professores no curso de Direito da UFF, meu máximo respeito e
admiração.
Aos meus antigos companheiros da Ímpeto Empresa Júnior Jurídica, o projeto que abriu as
portas para tudo que está acontecendo comigo hoje.
À professora Andressa Torquato, pelo apoio no início do TCC.
Finalmente, ao meu orientador, o Professor Matheus, que temperou minha empolgação com
profissionalismo e técnica.
“The essential feature of statistics is a
prudent and systematic ignoring of details.”

Erwin Schrödinger
RESUMO

A Jurimetria está se consolidando como uma importante ferramenta de investigação do fenômeno


jurídico. Particularmente para empresas privadas, quando utilizada para a análise de processos
judiciais, permite a identificação de padrões que possam ser explorados estrategicamente. Para
juristas, usualmente não acostumados a fazer uso das ciências exatas, a utilização de técnicas
básicas da estatística pode ser um desafio. As relações de associação, identificáveis por meio de
tabelas de contingência, têm o potencial de indicar a necessidade de investigações mais
aprofundadas. Há o risco de serem mal compreendidas, caso se interprete que com elas se pode
comprovar relações de causalidade no Direito. A simulação de situações vividas por advogados,
ao utilizar a Jurimetria, ajuda a estabelecer as regras fundamentais para a utilização das tabelas de
contingência e para a interpretação de seus resultados na advocacia.

Palavras-Chave: Jurimetria. Tabela de Contingência. Relações de Associação


ABSTRACT

Jurimetrics is consolidating itself as an important research tool of the legal phenomena. Particularly
for private companies, when used for the analysis of lawsuits, it allows the identification of patterns
that could guide strategies. For jurists, usually not accustomed to dealing with the exact sciences,
the use of basic statistical techniques can be a challenge. Associations, identifiable by means of
contingency tables, have the potential to indicate the need for further research. There is a risk that
they will be misunderstood, if it is interpreted that they can prove causal relations in Law. The
simulation of situations experienced by lawyers, when using Jurimetrics, helps to establish the
fundamental rules for the use of contingency tables and for the interpretation of their results in the
advocacy.

Keywords: Jurimetrics. Contingency Table. Associations.


SUMÁRIO

INTRODUÇÃO ........................................................................................................................ 12

CAPÍTULO 1 - JURIMETRIA ............................................................................................... 14

1.1.Origem e Conceito ...............................................................................................................14

1.2. Aplicações .......................................................................................................................... 21

CAPÍTULO 2 – ESTATÍSTICA BÁSICA E TABELAS DE CONTIGÊNCIA .................... 28

2.1. Etapas do Método Estatístico ............................................................................................... 28

2.2. Indivíduos e Variáveis .........................................................................................................31

2.3. Distribuição de Frequências ................................................................................................ 34

2.4. Tabelas de Contigência .......................................................................................................38

2.5. Tabelas de Contingência e Associações ...............................................................................40

CAPÍTULO 3 – OS DADOS JURIMÉTRICOS .....................................................................44

3.1. O desafio para conseguir dados jurídicos .............................................................................44

3.2. Variáveis Categóricas no Direito ......................................................................................... 49

3.2.1. Transformando variáveis quantitativas em variáveis categóricas .......................................50

3.2.2. Cuidados na seleção de variáveis categóricas ....................................................................52

3.2.2.1. Variações Subjetivas .....................................................................................................53

3.2.2.2. Variações Textuais ........................................................................................................54

CAPÍTULO 4 – INTERPRETANDO ESTUDOS JURIMÉTRICOS ....................................58

4.1. Imparcialidade..................................................................................................................... 58

4.2. Associação não implica causalidade .................................................................................... 59

CONSIDERAÇÕES FINAIS ...................................................................................................66

REFERÊNCIAS BIBLIOGRÁFICAS .................................................................................... 69


LISTA DE TABELAS

Tabela 1 - Frequência dos processos bancários por assunto ....................................................... 36

Tabela 2 - Frequência dos processos bancários por cidade ......................................................... 37

Tabela 3.1 - Frequência dos processos bancários na Cidade A, por assunto ............................... 37

Tabela 3.2 - Frequência dos processos bancários na Cidade B, por assunto ............................... 38

Tabela 3.3 - Frequência dos processos bancários na Cidade B, por assunto ............................... 38

Tabela 4 - Cidade e tipo de causa .............................................................................................. 39

Tabela 5 - Cidade e tipo de relativa em relação ao total ............................................................. 40

Tabela 6 - Tipo de causa por resultado ....................................................................................... 41

Tabela 7 - Tipo de causa por resultado (proporcional) ................................................................ 42

Tabela 8 - Quantidade de condenação por dano moral, por inscrição indevida, por capitais .......53

Tabela 9 - Resultado dos processos, por escritório terceirizado................................................... 64


12

INTRODUÇÃO

A Jurimetria é a disciplina que trata da utilização da Estatística no âmbito jurídico. Essa


nova perspectiva permite aos juristas observar quantitativamente um enorme rol de aspectos do
fenômeno jurídico, com diferentes propósitos.
Torna-se possível, com essa metodologia, investigar processos judiciais em busca de
padrões decisórios, de informações sobre as partes envolvidas e sobre os fatos discutidos nos autos.
Isso ocorre porque, diferentemente da prática jurídica tradicional, a Jurimetria não se interessa por
um caso concreto, isoladamente, mas por conjuntos deles.
A prática da Jurimetria foi muito facilitada pela digitalização dos processos judiciais, e
pelo surgimento de softwares de raspagem e processamento de dados. Por isso, apesar de ser
possível encontrar registros muito antigos de estudos estatísticos no Direito, nunca se viveu uma
situação tão propícia a essa abordagem.
Na esfera privada, a análise quantitativa tem se disseminado principalmente nos
departamentos jurídicos de grandes companhias, que, habitualmente, respondem a milhares de
processos judiciais em diferentes áreas. Com a compreensão estatística de uma carteira de
processos, é possível gerar dados que orientem a advocacia preventiva, permitam a instituição de
políticas de acordo e, principalmente, a adoção de estratégias processuais mais efetivas.
Infelizmente, no entanto, a maioria dos advogados não domina os conhecimentos básicos
sobre Estatística. Conceitos fundamentais, como os de variável e frequência, são pouco conhecidos.
Vive-se, por conta dessa situação, um momento em que muitos se interessam por fazer Jurimetria,
mas talvez falte à maioria conhecimentos técnicos mínimos para realizá-la corretamente. Essa
circunstância pode atrapalhar a evolução da disciplina, porque sem conhecimentos fundamentais
sobre estatística não é possível sequer compreender seu potencial de aplicação no Direito.
Uma possibilidade é que, ainda que sem noção de estatística básica, advogados comecem
a realizar estudos jurimétricos, inclusive sem a assessoria de estatísticos. Isso pode gerar ou estudos
com pouca, ou nenhuma utilidade, ou interpretações erradas sobre o que os números dizem.
Um equívoco comum de pesquisadores ao utilizar a estatística é confundir associações
com causalidade. Enquanto a associação significa uma variação simultânea, a causalidade significa
que uma variação é a causa de outra. São duas relações bem diferentes, mas que só são assimiladas
quando se reflete um pouco sobre a metodologia estatística, sobre o que ela é capaz de evidenciar
e por quais meios.
13

A melhor maneira para se compreender a diferença entre associação e causalidade, nos


parece, seria observar e analisar estudos jurimétricos reais. Ocorre que as únicas pesquisas
disponíveis para consulta são as voltadas para a análise de políticas públicas, em especial as
realizadas pela Associação Brasileira de Jurimetria, que, apesar de disponibilizarem um acervo
valioso sobre a metodologia jurimétrica, se afastam dos questionamentos e situações vivida por
gestores jurídicos.
Por isso se objetiva, com o trabalho, explorar, através de situações hipotéticas, mas
relacionadas às experiências dos advogados, as formas possíveis para se acessar dados jurídicos, a
metodologia de criação e análise de tabelas de contingência e também estabelecer quais inferências
não se poder ter a partir de relações de associação, comentando, no percurso, conceitos basilares
estatísticos e jurídicos.
14

CAPÍTULO 1 – JURIMETRIA

1.1. ORIGEM E CONCEITO

Cunhado no final da década de quarenta, por um advogado estadunidense, o termo


“Jurimetria” desperta curiosidade em juristas que vêem a palavra pela primeira vez. O vocábulo
surgiu da composição de dois radicais. O primeiro deriva de “ius”1, em latim, que significa
“pertencente ao Direito”, e o segundo de “métron”2, de origem grega, que significa medida.
O conceito que se extrai exclusivamente da estrutura da palavra, dada sua composição,
poderia ser: a área do conhecimento que cuida da medição do fenômeno jurídico. Essa definição,
contudo, não comunica o que exatamente será medido e, apesar de hoje estar correta, não surgiu
exatamente com esse significado.
Em “Jurimetrics: the next step forward” 3, obra que sedia as primeiras menções ao termo
- a primeira foi logo no título - Lee Loevinger, criador do termo Jurimetria, tece vigorosas críticas
ao sistema jurídico norte-americano, e a parte de seus colegas juristas. Ele denuncia muito
enfaticamente que o produto da atividade jurisdicional, naquele momento, teria se tornado tão
complexo e obscuro que seria incompreensível ao público. Os movimentos dos tribunais seriam
imprevisíveis, segundo ele, porque o processo decisório não era enunciado através de lógicas que
pudessem ser rastreadas, fazendo com que a prática jurídica da época fosse comparável a um ritual
místico, no qual os profissionais do ramo seriam os sacerdotes.
No sistema Common Law, a falta de coerência e clareza na prática judicial tem o potencial
de ser ainda mais desastrosa que em países de sistema Civil Law. A tradição anglo-saxã, leciona
Miguel Reale4, se caracteriza pelo predomínio da jurisprudência sobre o elemento legislativo. Se,
no sistema romano, há primazia das leis como fonte do Direito, nos países de Common law, o
Direito se consolida em precedentes judiciais.
Quando esses precedentes se tornam confusos, a consequência é que as regras que
deveriam emanar da lógica aplicada para resolver os casos concretos, delimitando o lícito, também
se tornam confusas.

1
ONLINE ETYLOLOGY DICTIONARY. Disponível em:<https://www.etymonline.com/word/juridical>. Acesso
em: 25 de fevereiro de 2019.
2
BIBLE HUB. Disponível em:<https://biblehub.com/greek/3358.htm>. Acesso em: 25 de fevereiro de 2019.
3
LOEVINGER, Lee. Jurimetrics the next step forward. Minnesota Law Review, April 1949.
4
REALE, Miguel. Lições Preliminares de Direito. – 27 ed. – São Paulo: Saraiva, 2002. p. 141.
15

Para reabilitar o sistema jurídico, Loevinger sugere a adoção da metodologia científica.


Isso ensejaria a criação de uma nova abordagem do Direito, contraposta a “Jurisprudence” - que
ele diz se tratar de “mere speculation about law”. Oportunamente, nomeia essa nova disciplina
Jurimetria e a define como sendo “scientific investigation of legal problems”.
Ela representaria a aproximação entre o Direito e as ciências modernas, favorecendo a
investigação no lugar da especulação e da arbitrariedade das construções teórico-jurídicas
tradicionais. Ao contrário de “Jurisprudence”, a Jurimetria se ocuparia de perguntas que pudessem
ser respondidas por meio de métodos perquiritórios, através dos quais fossem alcançadas respostas
amparadas em evidências empíricas.
Para Loevinger 5, seria impossível prever os contornos que a disciplina tomaria, e a quais
questões ela tentaria responder. Apesar disso, ele acreditou conseguir antecipar as mais prováveis,
e forneceu alguns exemplos, que traduzimos livremente:

a) Sobre o comportamento das testemunhas: qual a confiabilidade estatística dos


métodos de detecção de fraude? Qual nova, ou novas técnicas, fornecerão melhores
métodos de detecção de mentiras?
b) Sobre o comportamento dos juízes: quais medidas estatísticas irão, mais
convenientemente, sumarizar o comportamento individual dos juízes em vários
tipos de casos? Como investigar o comportamento dos júris, medindo suas reações
a evidências e instruções, para descobrir quais considerações são determinantes para
se chegar ao veredito?
c) Sobre o comportamento dos legisladores: quais medidas podem ser instituídas para
investigar e acompanhar padrões nos comportamentos legislativos?
d) Sobre linguagem jurídica e comunicação: quais termos legais possuem um núcleo
de significação e quais são inexpressivos depois de feita uma análise semântica?
Quais dispositivos semânticos podem ser usados para fazer jargões jurídicos um
meio útil de comunicação?
e) Sobre procedimentos legais e registro: como controvérsias podem ser apresentadas
aos tribunais da maneira mais simples e rápida? Como “business machines” podem

5
LOEVINGER, Lee. Jurimetrics the next step forward. Minnesota Law Review, April 1949. p. 32-35.
16

ser adaptadas para tornar acessíveis dados públicos de processos judiciais,


julgamentos, títulos de propriedade (...) e outros materiais semelhantes?

Essas são apenas cinco das nove aplicações que Loevinger apresenta naquele trabalho,
mas bastam para que façamos nossas primeiras considerações.
A primeira conclusão a que chegamos é a de que a Jurimetria não é excessivamente
restritiva quanto ao seu objeto. Os problemas que ele elaborou contemplam desde o nascimento
das leis, passando pelo comportamento das testemunhas e dos juízes, até o acesso aos autos dos
processos judiciais. Isso faz-nos entender que qualquer tema, desde que pertinente do ponto de
vista jurídico, seria, para Loevinger, potencialmente estudável pela abordagem jurimétrica.
Outra observação que fazemos é que, embora a Jurimetria tenha em seu cerne o método
científico, algumas das perguntas formuladas pelo autor não são solucionáveis cientificamente, ou,
pelo menos, não da maneira como foram colocadas.
O quarto item, por exemplo, é explícito em prescrever a análise semântica das palavras,
para saber se possuem ou não significado. Ora, a análise semântica foge à estrutura de um problema
científico. O significado de uma palavra não é algo falseável. Não se poderia comprovar
empiricamente que uma palavra não possui significado, ou que esta ou aquela são equivalentes,
senão, talvez, estudar sua utilização e a percepção das pessoas, que podem, ou não, estar corretas.
A inadequação de algumas das perguntas seria remediável por suas reformulações, no entanto.
Nossa terceira ponderação, e que talvez seja uma extensão da segunda, é que faltou ao
autor exemplificar como a Jurimetria contribuiria especificamente para reduzir a irracionalidade
das decisões judiciais, que o deixou tão consternado. É difícil imaginar como um juiz recorreria ao
método científico para imprimir mais lógica ao processo decisório. Ele poderia acessar os
precedentes, perscrutar sobre os efeitos da decisão, avaliar o efeito probatório de uma prova,
melhorar métodos de detecção de testemunhos fraudulentos, que poderiam embasar algumas de
suas ponderações, mas a formação da ratio decidendi compreende outros processos, interpretativos
e valorativos, não sujeitos a causalidade, e que, portanto, não poderiam ser valer do método
científico e da observação empírica. A razão que Loevinger disse que faltava não poderia vir da
ciência. Não, pelo menos, sem que a atividade jurisdicional fosse transformada na aplicação de
regras lógicas objetivas.
17

O mais próximo que chegamos disso talvez tenha sido com Kelsen, e sua Teoria Pura do
Direito. Tércio Sampaio 6 explica que Kelsen explorou a possibilidade de criar uma teoria científica
de interpretação jurídica, de modo que fosse possível avaliar a verdade de uma interpretação. Nesse
sentido, seria possível haver a falseabilidade também em interpretações jurídicas.
Ainda, no entanto, que Loevinger estivesse visando a algo parecido com a Teoria Pura -
o que não é o caso -, as relações de imputação descritas por Kelsen existiriam somente num plano
teórico, do dever ser, e, portanto, escapariam completamente a qualquer tipo de observação
empírica, que um é traço imprescindível para a utilização do método científico.
Esse é um dos principais motivos para que o Direito, assim como as outras ciências sociais,
seja classificado como uma “soft science. Não possui o rigor científico que a matemática, física ou
química, que se amparam em leis universais e experimentos replicáveis, de forma que, quando se
sabe o que aconteceu antes, é possível antecipar o que irá acontecer depois.
Por mais que se busque respeitar preceitos lógicos - nas decisões judiciais, por exemplo -
nenhuma construção teórico-jurídica pode ser comprovada ou desmentida nos mesmos termos em
que é possível nas hard sciences, onde a falseabilidade está presente sempre e onde a relação é de
causalidade.
Por isso, acreditamos que Lee Loevinger, em “Jurimetrics: the next step foward”, talvez
tenha extrapolado a extensão do método científico em algumas de suas elaborações, sendo
excessivamente otimista quanto à sua aplicabilidade e à sua propensão de resolver todas as
imperfeições que o afligiam.
Talvez por reconhecer isso, quatorze anos depois da publicação do seu primeiro artigo
sobre o tema, Loevinger, em outra obra, surge com um tom conciliador, aparando as arestas que
ficaram de suas primeiras proposições. Numa das passagens, ele diz:

[...] jurimetrics does not seek to oust jurisprudence, philosophy, or faith from
men’s life. These, too, have their place. There will always be assumptions and
choices to be made by the free spirit of a man, and no scientific operation or test
can properly make or constrain such choices. 7

6
FERRAZ JÚNIOR, Tércio Sampaio. Introdução ao Estudo do Direito: técnicam decisão, dominação – 7 ed. –
São Paulo: Atlas, 2013. p. 227.
7
LOEVINGER, Lee.The methodology of legal inquiry. Minnesota Law Review, Winter, 1963. p. 34-35.
18

Outra passagem de sua autoria é ainda mais incisiva em negar a possibilidade da ciência resolver
o problema da decisão jurídica:

To begin with we must be clear that science offers us neither ultimate nor certain
answers to legal problems. The dream that science might some day tell us wich of
several competing interests was the more important is a vain one. Science essay
no such answers in any field. Science does not assign social or ethical values.
Science may, indeed, provide data from which social or ethical judgements may
be made; but the judgements will remain with man. 8

Não é possível saber se essa era a visão de Loevinger desde o início, e se ele simplesmente
não teve o cuidado de expressar ela no seu primeiro artigo, ou se se trata de uma percepção que ele
desenvolveu posteriormente. O que sabemos com segurança é que o intuito da Jurimetria não é
matematizar processos decisórios, e que ela se dedica, na verdade, ao fornecimento de evidências
empíricas.
Estudos empíricos são baseados na observação dos fenômenos e podem ser replicados.
Podem ser, também, qualitativos ou quantitativos. Loevinger, como vimos, sabia do potencial da
estatística - os dois primeiros exemplos que ele fornece são estudos estatísticos -, e a exaltou em
várias passagens, relacionando-a às atividades dos cientistas9. Numa delas, diz que se trata do ramo
da matemática mais adequado no campo do Direito10.
Apesar disso, ele jamais restringiu a Jurimetria exclusivamente à utilização da estatística.
Ele persiste definindo Jurimetria como a aplicação do método científico ao Direito.
Essa relutância em fornecer uma definição mais clara se deve, provavelmente, à vontade
de Loevinger de manter a amplitude da disciplina que ele havia criado. Nós dizemos isso porque,
no meio da vagueza conceitual, a única coisa de que ele parecia estar certo, e que pode ser admitida
sem equívoco, era de que a Jurimetria deveria englobar muitas coisas. Prova disso são os exemplos
de aplicação que o autor enumerou - dos quais trouxemos cinco - que abarcam até a utilização de
aparatos computacionais para recuperação de acervos jurisprudenciais.
A definição que relaciona a Jurimetria às pesquisas empíricas e, mais especificamente, à
estatística, no entanto, foi a que prosperou aqui no Brasil. Por isso dissemos no início do capítulo
que antes Jurimetria não significava somente medir o Direito, mas que, hoje, a definição está certa.

8
LOEVINGER, Lee. Science preditiction in the field of law. Minnesota Law Review, September 1962. p. 200
9
LOEVINGER, Lee.The methodology of legal inquiry. Minnesota Law Review, Winter, 1963. p.5.
10
LOEVINGER, Lee. Science preditiction in the field of law. Minnesota Law Review, September 1962. p. 193
19

É difícil, apesar disso, embasar essa escolha somente na da obra de Loevinger. Ele,
claramente, tinha pretensões maiores, e, apesar de não o verbalizar, sugeria um conceito muito mais
abrangente em suas colocações.
Apesar de toda essa situação, a redução da Jurimetria à utilização da estatística não nos
parece errada, porque o empirismo e a investigação científica dos problemas do Direito 11 eram os
alicerces do que Loevinger dizia. Além disso, a nova definição acaba por contornar, talvez
inintencionalmente, o otimismo exacerbado de Loevinger em relação ao método científico,
aproveitando, contudo, suas recomendações quanto à utilização da estatística.
O fenômeno jurídico não se desembaraça teoricamente, apenas. Ele é observável em
muitos de seus aspectos, e o maior legado de Loevinger talvez tenha sido simplesmente apontar a
necessidade de mais dessa observação. A linha de pesquisa jurimétrica possui fortes laços com o
realismo jurídico, no sentido de que se volta para o plano concreto do Direito 12.
Essa perspectiva herda todas as críticas sofridas pelo realismo jurídico. Quando se impõe
que o objeto de estudo são os aspectos observáveis de um fenômeno social, toda a dimensão
filosófica e conceitual se distancia, e isso pode gerar suspeitas sobre as intenções desse tipo de
estudo.
Outras ciências sociais, no entanto, já se defrontaram com as restrições que a busca por
evidências empíricas traz e souberam encontrar seus espaços. Foi, justamente, o processo de
amadurecimento dessas outras disciplinas empíricas sociais que permitiu que elas evoluíssem e se
estabelecessem.
A psicometria, por exemplo, circunscreve-se à aplicação de questionários e testes para
mensurar habilidades e traços de personalidade 13. O que se está tentando avaliar - inteligência,
extroversão, etc - são conceitos imateriais, mas que, quando enxergados como atributos das
pessoas, adquirem uma faceta numérica depois que se estipula uma escala de valores relacionados
ao resultado de testes. Ou seja, os fenômenos psíquicos são medidos indiretamente, por suas
expressões concretas, e não se cogita sobre juízos de valor ou conceituações.
A Jurimetria, da mesma forma, não pretende negar ou substituir os mecanismos de
contrapesos teóricos e subjetivos em ação. Ela estava destinada a se ocupar apenas da mensuração

11
LOEVINGER, Lee. Jurimetrics the next step forward. Minnesota Law Review, April, 1949. p. 31
12
NUNES, Marcelo Guedes. Jurimetria: como a estatística pode reinventar o Direito – São Paulo: Editora Revista
dos Tribunais, 2016. p. 112.
13
PSYCHOMETRIC SOCIETY. Whats is Psychometric. Disponível em:<
https://www.psychometricsociety.org/content/what-psychometrics>. Acesso em: 04 de março de 2019.
20

das manifestações concretas do fenômeno jurídico, e não a revolucionar o processo decisório -


ainda que possa orientá-lo, em certa medida.
Daí a importância da estatística, uma metodologia validada e que pode, muito bem, ser
aplicada corretamente também no Direito, trazendo a técnica que Loevinger disse que faltava,
preservando, no entanto, o jurídico no seu centro de interesse. É exatamente com essa identidade
que a disciplina vem sendo apresentada.
Marcelo Guedes Nunes14, presidente da Associação Brasileira de Jurimetria (ABJ), autor
do primeiro livro sobre o assunto no país e grande responsável pela disseminação da disciplina, diz
em seu livro, após considerações: “posso definir Jurimetria como a disciplina do conhecimento que
utiliza a metodologia estatística para investigar o funcionamento de uma ordem jurídica. ”
Entendemos que podemos estender um pouco mais a definição, sem querer superá-la,
apenas para recuperar alguns outros pontos de que tratamos até aqui: por Jurimetria, deve-se
entender a disciplina do Direito que cuida do estudo empírico das manifestações observáveis do
fenômeno jurídico, com auxílio da estatística.
Antes de dar por terminada a definição, é importante dizer que a utilização dos métodos
quantitativos aproxima a Jurimetria da Análise Econômica do Direito, da Ciência de Dados
aplicada ao Direito e da Pesquisa Empírica em Direito – a última parece ser especialmente forte
nas faculdades dos Estados Unidos15. É tarefa difícil distingui-las da Jurimetria, porque posuem
muitos pontos de convergência. Cada uma possui seu próprio ecossistema e agenda, mas são
realmente próximas, conceitual e metodologicamente.
Talvez haja uma sutil diferença das outras em relação à Análise Econômica do Direito,
que parecer ser identitariamente preocupada com a investigação das influências sociais e
econômicas no funcionamento da ordem jurídica.
A metodologia, contudo, pode-se dizer, é a mesma em todas elas. Há que se comentar, no
entanto, o vanguardismo da Análise Econômica do Direito, que importou metodologias de análise

14
NUNES, Marcelo Guedes. Jurimetria: como a estatística pode reinventar o Direito – São Paulo: Editora Revista
dos Tribunais, 2016. p. 115.
15
HARVARD LAW SCHOOL. Harvard Empirical Legal Studies Series. Disponível em:<
https://hls.harvard.edu/dept/graduate-program/harvard-empirical-legal-studies-series/>. Acesso em: 04 de março de
2019.
21

quantitativas diretamente da microeconomia.16 A esses conhecimentos vêm se juntando as


contribuições inéditas dos estatísticos jurimetristas.

1.2. APLICAÇÕES

A Jurimetria, como se viu, mesmo depois da restrição à utilização da estatística, ainda


permanece um conceito vago. O principal motivo para isso é que não dissemos o que, no fenômeno
jurídico, pode ser objeto de estudos estatísticos, nem com quais propósitos. Por isso é necessário
conhecer as aplicações práticas encontradas pelos desbravadores da Jurimetria.
A associação entre Estatística e Direito é bem mais antiga do que Loevinger. O primeiro
estudo sobre o tema de que se tem notícia é uma tese de doutorado 17, defendida em 1.709 A.D.,
por um matemático suíço.
Intitulado “De Usu Artis Conjectandi in Jure”, o trabalho de Nicolaus Bernoulli é
inspirado, como ele conta no primeiro capítulo, num tratado sobre Teoria das Probabilidades,
escrito por seu tio e professor, o também matemático Jakob Bernoulli. Foi de onde, inclusive, pegou
emprestado o título para compor parte do nome do seu próprio trabalho.
Nicolaus aborda oito grandes questões relevantes para a prática jurídica da época -
algumas são pertinentes até hoje - e aplica modelos probabilísticos para tentar resolvê-las.
No capítulo três18, a título de exemplo, Bernoulli refere-se à problemática envolvendo o
instituto da ausência. Ante a controvérsia sobre a estipulação de critérios objetivos para que se
decretasse um ausente falecido, Bernoulli sugere, entre outras coisas, a utilização da expectativa
de vida média, mediante a qual seria possível calcular a probabilidade de que um desaparecido
estivesse efetivamente morto. A questão era importante porque dessa decisão repercutiam, já na
época, os efeitos sucessórios.
O juiz, ao final do cálculo, poderia realizar um julgamento diretamente sobre a
probabilidade de o falecimento ter ocorrido. Quando ele achasse que a cifra fosse suficientemente
alta, poderia decretar o que hoje, aqui, se chama de morte presumida 19.

16
INVESTOPIA. Econometrics Definition. Disponível em:<
https://www.investopedia.com/terms/e/econometrics.asp>. Acesso em: 05 de março de 2019.
17
BERNOULLI, Nicolaus M. The use of the Art of conjecturing in Law. Doctorate Degree in both Roman and Canon
law legitimately acquired. Fatherland’s University. On the day 14 June A.C. MDCCIX. p. 19.
18
Ibid., p. 19.
19
Artigo 7º, Código Civil: “Pode ser declarada a morte presumida, sem decretação de ausência:
I - se for extremamente provável a morte de quem estava em perigo de vida;
22

Outro trabalho expressivo no campo da estatística e Direito, Luciana Yeung, em artigo


publicado na revista Pesquisar Empiricamente o Direito20, nos traz a informação, também envolve
a teoria de probabilidades. Desta vez, em 1.837 A.D., voltada exclusivamente para o cálculo de
probabilidades de resultados de processos judiciais criminais.
Nesse trabalho, intitulado “recherches sur la probabilité des jugements en matière
criminelle et en matière civile”, Siméon Denis Poisson, outro estatístico, sugeriu modelos
probabilísticos para se calcular as chances de um acusado ser condenado ou inocentado,
considerando a conformação do júri.
Essas últimas duas aplicações, como se vê, envolvem Teoria das Probabilidades. O foco
da pesquisa quantitativa jurídica, contudo, não tem sido esse. Tem-se preferido análises estatísticas
descritivas - que podem, eventualmente, orientar análises probabilísticas, mas que não têm nessas
uma finalidade obrigatória.
Nos Estados Unidos, ganhou força sob o nome de “Empirical Legal Research”. Com essa
denominação, boa parte das pesquisas têm buscado descrever impactos legislativos e regulatórios,
influências político-ideológicas sobre juízes e diferenças nos julgamentos de pessoas de etnias
diferentes.
A jurimetria, como idealizada por Loevinger, por outro lado, se perdeu no tempo, e parte
da culpa, como deve ser possível imaginar a partir do que foi mostrado no primeiro capítulo, é do
próprio Loevinger.
Marcelo Guedes explica que Loevinger foi muito impreciso nas suas definições e tinha
uma visão exacerbadamente determinista do conhecimento, repudiando no seu primeiro trabalho a
validade de qualquer articulação conceitual21. Essa inexatidão e incompatibilidade com as práticas
jurídicas convencionais fez com que a ideia se tornasse pouco atrativa à maioria dos advogados e
juízes, que não viam como conciliar suas atividades com a Jurimetria intransigente que havia sido
proposta.

II - se alguém, desaparecido em campanha ou feito prisioneiro, não for encontrado até dois anos após o término da
guerra.
Parágrafo único. A declaração da morte presumida, nesses casos, somente poderá ser requerida depois de esgotadas as
buscas e averiguações, devendo a sentença fixar a data provável do falecimento. ”
20
MACHADO, Maíra Rocha. Pesquisar Empiricamente o Direito. São Paulo: Redes de Estudos Empíricos em
Direito, 2017. p. 249.
21
NUNES, Marcelo Guedes. Jurimetria: como a estatística pode reinventar o Direito – São Paulo: Editora Revista
dos Tribunais, 2016. p.100
23

Outros autores, como Franken22, chegaram, mesmo, a formular definições menos


restritivas para jurimetria, focando a definição nos métodos quantitativos, mais do que noutras
características, mas isso não foi suficiente para mitigar o problema.
A situação é tão grave que nem o periódico Jurimetrics, the Journal of Law, Science, and
Technology23 - que traz, inclusive, uma citação de Loevinger logo na página inicial - se dedica
unicamente à Jurimetria, hospedando, na verdade, uma gama bem menos restrita de publicações.
Entre os papers admitidos estão os relacionados a “engineering, aerospace, communications, and
computers”, o que não tem nada a ver com Jurimetria - mesmo se a considerarmos nos termos
amplos de Loevinger.
Mas os ventos vêm mudando no Direito e, pelo mundo todo, os advogados estão se
voltando para a tecnologia e para a estatística. Essa guinada não é uma iniciativa espontânea de
juristas e segue, é bem verdade, uma tendência global. A utilização inteligente da informação
revolucionou, no sentido da palavra, vários mercados, como o da publicidade e o de transportes, e
se tornou um diferencial competitivo. Com os dados certos, analisados corretamente, é possível
descobrir como se comportar em situações de incerteza, como traçar estratégias baseadas em
prognósticos, reduzir custos e aprimorar processos.
Esse movimento começou em alguns setores específicos, sempre impulsionado pelo uso
de tecnologia, mas irradiou para todos os outros, que não se sabe se foram inspirados ou
pressionados a seguir pelo mesmo caminho. O mais provável é que tenha ocorrido um pouco dos
dois, e que isso tenha se intensificado, primeiramente, no meio corporativo.
Aqui no Brasil, contudo, as primeiras articulações estatísticas no Direito parecem ter vindo
da esfera pública, e de instituições privadas preocupadas com políticas públicas.
É publicado, todos os anos, desde dois mil e quatro, o relatório Justiça em Números 24, do
Conselho Nacional de Justiça (CNJ). Nesse documento, são sintetizados em gráficos os dados do
funcionamento do Poder Judiciário, em todo o país. As informações contemplam o volume de
processos, suas durações, causas mais numerosas e cálculos de eficiência dos órgãos judiciais. O

22
EJLT EUROPEAN JOURNAL OF LAW AND TECHNOLOGY. Jurimetrics Please! Disponível em:<
http://ejlt.org/article/view/13>. Acesso em: 08 de março de 2019.
23
ARIZONA STATE UNIVERSITY. Jurimetrics Journal. Disponível em:< https://law.asu.edu/jurimetrics>. Acesso
em: 08 de março de 2019.
24
BRASIL. Conselho Nacional de Justiça. Justiça em Números. Disponível em:< http://www.cnj.jus.br/pesquisas-
judiciarias/justicaemnumeros/2016-10-21-13-13-04/pj-justica-em-numeros>. Acesso em: 09 de março de 2019.
24

Justiça em Números é apenas uma das inúmeras pesquisas realizadas pelo CNJ, que possui um
extenso acervo25.
Também podemos citar o relatório Supremo em números26, produzido pela Fundação
Getúlio Vargas do Rio de Janeiro e, finalmente, a Associação Brasileira de Jurimetria. Esta última
merece especial atenção.
Fundada em 2011, a Associação Brasileira de Jurimetria realiza pesquisas contundentes
sobre a efetividade das leis e sobre o funcionamento do Poder Judiciário. Suas indagações, no
entanto, se diferenciam das do CNJ por serem centradas, usualmente, em problemas específicos,
aspirando à apresentação de soluções.
Dentre esses estudos, alguns são mais emblemáticos pela gravidade, se é que podemos
assim dizer, de suas descobertas. Um deles27, nosso favorito, sobre reformas de decisão nas câmaras
de direito criminal de São Paulo, descobriu que as taxas de reforma variam consideravelmente entre
as câmaras, indo de dezesseis por cento na décima segunda câmara a oitenta e um por cento na
quarta câmara.
Considerando que os processos são randomicamente distribuídos, isso sugere uma
diferença importante no perfil das câmaras.
Outra informação reveladora trazida nesse mesmo trabalho foi que baixas taxas de reforma
de decisões da primeira instância estavam associadas a alguns tipos penais específicos, como o
homicídio qualificado, em que 66,9% dos recursos são negados. Crimes de trânsito, na outra ponta,
têm somente 36,4% por cento dos recursos rejeitados.
De sua fundação para cá, a ABJ mantém um ritmo acelerado de publicações de grande
impacto28, como o que foi citado, e também se ocupa da disseminação acadêmica da Jurimetria,
visando à sua consolidação como disciplina do Direito.
Na esfera privada, por outro lado, é comum a interação de advogados com executivos de
outras áreas, sejam clientes, sejam outros funcionários da empresa em que atuam. Escritórios e
departamentos internos são constrangidos a fornecer previsões assertivas sobre resultados de

25
BRASIL. Conselho Nacional de Justiça. Pesquisas Judiciárias. Disponível em:<http://www.cnj.jus.br/pesquisas-
judiciarias>. Acesso em: 10 de março de 2019.
26
FUNDAÇÃO GETÚLIO VARGAS. Supremo em Números. Disponível
em:<http://www.fgv.br/supremoemnumeros/>. Acesso em: 10 de março de 2019.
27
BRASIL. ABJ – Associação Brasileira de Jurimetria. Reformas de decisão nas câmaras de direito criminal em
São Paulo. Disponível em: <https://abj.org.br/cases/camaras-2/>. Acesso em 10 de março de 2019.
28
BRASIL. ABJ – Associação Brasileira de Jurimetria. Atuação. Disponível em: <https://abj.org.br/cases/>. Acesso
em: 10 de março de 2019.
25

processos, a perder menos disputas judiciais e a colaborar para outras áreas do negócio, o que faz
com que advogados tenham que aprender a analisar dados, a utilizar ferramentas e métodos de
gestão, a introduzir KPIs e metas em suas atividades e a construir gráficos.
É como se a prática jurídica tivesse ganhado uma nova dimensão, afeita ao conceito de
business intelligence29, que não se importa só com os casos concretos isoladamente, mas com o
impacto estratégico e financeiro que têm todos eles juntos.
Nos Estados Unidos, essa perspectiva adotou o nome de Legal Analytics, mas aqui no
Brasil essa tendência coincidiu com a recuperação e projeção do conceito de Jurimetria, encabeçada
por Marcelo Guedes.
Apesar de receber nomes diferentes, nos dois países nascem anualmente uma profusão de
empresas que oferecem serviços desse nicho, geralmente voltados à análise de carteiras de
processos judiciais de empresas. São as LawTechs e LegalTechs, que combinam conhecimento
jurídico com soluções tecnológicas, inclusive para análise de dados judiciais 30.
Esse mercado deve crescer à medida que a competição entre escritórios for se estreitando,
e que alguns departamentos comecem a se destacar no cenário nacional como departamentos
inovadores, e a tendência, com isso, é que advogados que saibam lidar com números se tornem
indispensáveis para a tomada de decisões estratégicas.
Não se admite mais, em grandes bancas e companhias, que um advogado não saiba
manejar planilhas, gerar demonstrativos e coordenar equipes. As habilidades tradicionais de um
advogado permanecem necessárias, mas, se antes eram aplicáveis pontualmente, agora precisam
ser utilizadas para mapear e determinar quais processos e circunstâncias dos processos mais
importam, para que sejam estudados quantitativamente.
Nesse sentido, voltada para a análise de carteiras de processos, a Jurimetria faz mais
sentido para empresas que respondam a muitas demandas judiciais, especialmente as trabalhistas e
consumeristas, e para escritórios que trabalhem com esses tipos de causas, usualmente chamadas
de demandas de massa.
A análise conjunta de processos oferece uma nova perspectiva do fenômeno jurídico,
diferente da pesquisa jurisprudencial convencional, porque substitui o estudo das teses e arranjos

29
OLLAP. What is Business Intelligence (BI)? Disponível em: <http://olap.com/learn-bi-olap/olap-bi-
definitions/business-intelligence/>. Acesso em: 11 de março de 2019.
30
CONVEX. Inteligência de negócios para performance e eficiência. Disponível em:<
https://www.softplan.com.br/convex/o-convex/>. Acesso em: 11 de março de 2019.
26

teóricos aplicáveis a cada caso concreto pelo estudo coletivo dos processos, em busca de padrões
que possam ser explorados estrategicamente.
Por meio da estatística, é possível localizar tendências relacionadas aos tipos de causa, às
localidades, às partes envolvidas, à legislação aplicada, aos órgãos julgadores e ao tempo em que
as decisões foram proferidas. Esses são insumos para se gerar probabilidades de perdas
relacionadas a demandas específicas, com base nos seus históricos; identificar curvas de aumento
e diminuição do número e valores de processos durante os anos, para provisionar adequadamente
o dinheiro que será usado para custear condenações judiciais; antecipar processos de risco e
anomalias envolvendo produtos e serviços; traçar estratégias de vitória considerando
particularidades locais; gerir melhor escritórios terceirizados e implementar políticas de acordo que
considerem as especificidades dos casos.
O crescimento dessa área é tão grande que já são oferecidos cursos específicos para
advogados que queiram se especializar na análise de dados31, e algumas faculdades de Direito
começaram a ofertar Jurimetria como curso de extensão 32.
A facilitação no acesso aos autos e às informações processuais, decorrente da
digitalização, é, certamente, um dos principais fatores para Jurimetria esteja se desenvolvendo tão
rapidamente.
Outro fator, peculiar do Brasil, que o torna, possivelmente, o melhor país do mundo para
se fazer Jurimetria, é sua enorme quantidade de processos judiciais. O último relatório Justiça em
Números33, publicado em dois mil e dezoito, referente ao ano de dois mil e dezessete, mostrou que,
naquele ano, o Poder Judiciário recebeu vinte e nove milhões e cem mil novos processos judiciais.
Somados aos processos que ainda aguardavam julgamento, perfizeram a totalidade de oitenta
milhões de processos aguardando julgamento, no final de dois mil e dezessete.
Essas informações são empolgantes, mas há muitas barreiras a serem transpostas até que
todo o potencial dos estudos jurimétricos seja revelado, e também até que seus limites sejam
delimitados. Esse caminho passa pelo aprendizado conjunto de juristas e estatísticos sobre quais
fenômenos são observáveis quantitativamente, e por que meios, quais o são indiretamente, e em

31
FUTURE LAW. Cursos e Atividades. Disponível em:< http://futurelaw.com.br/>. Acesso em 11 de março de 2019.
32
HARVARD LAW SCHOOL. Analytical Methods for Lawyers. Disponível
em:<https://hls.harvard.edu/academics/curriculum/catalog/index.html?o=64299>. Acesso em 11 de março de 2019.
33
BRASIL. Conselho Nacional de Justiça. Justiça em Números 2018: ano-base 2017. Disponível
em:<http://www.cnj.jus.br/files/conteudo/arquivo/2018/09/8d9faee7812d35a58cee3d92d2df2f25.pdf> Acesso em 11
de março de 2018.
27

que medida, e quais fogem à alçada da estatística. Isso influi, decisivamente, na retidão
metodológica e no sucesso das decisões que serão tomadas baseadas nessas pesquisas.
28

CAPÍTULO 2 - ESTATÍSTICA BÁSICA E TABELAS DE CONTINGÊNCIA

2.1. ETAPAS DO MÉTODO ESTATÍSTICO 34

Partindo da premissa de que a Jurimetria faz uso de estatística, é preciso conhecer seus
fundamentos e principais fases antes de fazer considerações sobre sua aplicação no Direito. Por
isso vamos enumerar as etapas do método estatístico exemplificando, quando possível, como se
desenrolariam numa pesquisa jurimétrica sobre processos judiciais.

A) Definição do Problema
A primeira do método estatístico é a fase de colocação do problema, quando se deve
formular a pergunta que será respondida pela pesquisa. A pesquisa jurimétrica, particularmente, se
estrutura em torno da busca por evidências estatísticas que ajudem a elucidar alguma questão
importante para o Direito.
Antes de se especificar, contudo, quais indivíduos e variáveis que devem ser analisados
para responder à questão problema, é imprescindível estabelecer um modelo conceitual do
fenômeno que será estudado, para que se possa enxergar quais relações são possíveis 35 e, só depois,
filtrar as que possam ser analisadas estatisticamente, e por que meios.
Isso serve para evitar, no caso da Jurimetria, que questões teóricas se tornem objeto de
estudos jurimétricos. Como viemos dizendo, a Jurimetria só acessa os aspectos observáveis do
fenômeno jurídico. Em relação à hermenêutica, uma pergunta do tipo “Qual é a melhor técnica de
interpretação: a sistemática ou a teleológica? ”, jamais poderia ser respondida empiricamente.
Seria possível, no entanto, perguntar: “Qual método de interpretação constitucional foi
mais invocado pelos ministros do Supremo Tribunal Federal no último ano: o sistemático ou o
teleológico? ”. Há uma diferença importante entre as duas, porque a segunda pode ser respondida
empiricamente e a primeira não.
O problema, além disso, precisa ser claro, preciso e delimitado às possibilidades da
pesquisa. Na pergunta que trouxemos como exemplo, sem restringir a análise ao STF, e a um ano,
é pouco provável que a questão pudesse ser respondida em tempo satisfatório.

34
CORREA, Sônia Maria Bastos. Probabilidade e estatística – 2ª ed. - Belo Horizonte: PUC Minas Virtual, 2003.
Dosponível em:< http://estpoli.pbworks.com/f/livro_probabilidade_estatistica_2a_ed.pdf>. Acesso em: 13 de março
de 2019.
35
HAIR JR, Joseph F. et al. Análise Multivariada de Dados – 6ª ed. – Porto Alegre: Bookman, 2009.
29

Todas essas circunstâncias devem ser consideradas antes de se formular um problema


jurimétrico. Um estudo que não é possível não é útil, e uma observação que não possa replicada
não pode ser objeto da estatística.
Além disso, nessa fase, também se costuma antecipar os dados que são acessíveis e a
possibilidade de eles elucidarem, efetivamente, o problema, antes de propô-lo em definitivo.

B) Planejamento
Depois de formulada a pergunta, é necessário delinear os caminhos que levarão à sua
resolução. Do ponto de vista estatístico, isso compreende definir se o estudo deve ser um estudo
populacional ou amostral, e quais variáveis devem ser analisadas.
Posteriormente, tem-se que identificar os meios para se conseguir os dados que serão
analisados. Num estudo sobre processos judiciais, como veremos mais à frente, há poucas
possibilidades para se conseguir acesso a eles: ou se baixa diretamente dos sites dos tribunais ou
se utiliza uma base pronta, fornecida por algum órgão judicial ou por uma empresa privada.
Isso deve estar previsto no planejamento porque pode ser necessário fazer requerimentos,
ou realizar preparações técnicas. Quando se planeja o passo a passo da pesquisa, pode-se acabar
por descobrir que os dados necessários, apesar de disponíveis, sejam difíceis de se conseguir, e é
melhor que se dê conta disso o quanto antes.
Do ponto de vista logístico, na fase de planejamento deve-se calcular os custos envolvidos
na pesquisa, avaliar a necessidade de contratações e também definir o cronograma. Esses cuidados
são importantes especialmente se se tratar de um estudo jurimétrico contratado 36.

C) Coleta de Dados
Nesse momento, os pesquisadores devem colher, efetivamente, as informações que serão
analisadas. Como dissemos há pouco, tratando-se de processos judiciais, é possível acessá-los
diretamente nos portais dos tribunais ou consultar um banco de dados interno de alguma empresa.
É possível, ainda, que seja necessário procurar por dados diretamente nos autos, caso não estejam
disponíveis fora deles.

36
BRASIL. Conselho Nacional de Justiça. Pesquisas Contratadas. Disponível em: <http://www.cnj.jus.br/pesquisas-
judiciarias#Pesquisas-contratadas. > Acesso em: 14 de março de 2019.
30

Essa etapa costuma ser a mais tecnológica de todas, demandando aparatos computacionais
sofisticados, mas não se deve eliminar a possibilidade da realização de levantamentos manuais.
Falaremos mais sobre isso adiante.
D) Apuração dos dados37
A fase de apuração consiste numa etapa de tratamento dos dados. Isso geralmente é feito
pela contagem da frequência das variáveis.
Num estudo jurimétrico, por exemplo, a fase de apuração compreenderia calcular em
quantos dos processos trabalhistas pesquisados foi encontrado o pedido de indenização por assédio
moral.
Esse procedimento depende do formato em que as informações foram armazenadas
durante a fase de coleta, geralmente distribuídas em planilhas, e da quantidade de variáveis que
foram levantadas, o que pode implicar mais ou menos categorias.
Para aligeirar essa fase, costuma-se utilizar aparatos computacionais, que podem envolver
desde a utilização de tabelas dinâmicas no Excel até a construção de algoritmos específicos para
organização e limpeza de dados.

E) Apresentação dos Dados38


Algumas vezes, logo depois de ter feito a contagem dos dados, já é possível que se tenha
uma noção do que eles mostram, dependendo da simplicidade da pesquisa. Apesar disso, as
informações dificilmente já vão estar dispostas da melhor maneira possível.
Dados bem estruturados, que sigam critérios inteligentes de organização, são
compreendidos mais facilmente pelos pesquisadores. Além disso, o cuidado com a visualização
potencializa a busca por padrões menos óbvios, que passariam despercebidos se as informações
estivessem bagunçadas.
As principais formas de se apresentar os dados são através de tabulações e de gráficos.
Neste trabalho, nós abordaremos somente a visualização tabular, que se dá pela disposição de
números em linhas e colunas.

37
BERGAMASHI, D.; SOUZA, J.; MENEZES, R. Bioestatística Básica. São Paulo: USP, 2016. Disponível em:
<http://www.fsp.usp.br/~denisepb/es5101/Apostila.pdf>. Acesso em: 13 de março de 2019.
38
CORREA, Sônia Maria Bastos. Probabilidade e estatística – 2ª ed. - Belo Horizonte: PUC Minas Virtual, 2003.
Disponível em:< http://estpoli.pbworks.com/f/livro_probabilidade_estatistica_2a_ed.pdf>. Acesso em: 13 de março de
2019.
31

Essa modalidade tem como vantagem a possibilidade de reunir numa mesma apresentação
um volume grande de informações, mas, por outro lado, é mais trabalhosa de ser interpretada em
relação à apresentação gráfica.

F) Análise e Interpretação dos dados39


Depois de colher, contar e organizar os dados, os pesquisadores devem se debruçar sobre
os resultados dos levantamentos e tirar conclusões a respeito do problema que havia sido proposto.
Na Jurimetria, o recomendável é escutar pareceres tanto de juristas quanto de estatísticos.
Dissemos isso porque, enquanto os estatísticos dominam as técnicas de testes de hipóteses,
os juristas detêm o conhecimento teórico sobre o fenômeno objeto de estudo. Dessa maneira,
podem se complementar, para se aproximarem ao máximo da interpretação mais adequada.

2.2. INDIVÍDUOS E VARIÁVEIS

As pesquisas estatísticas diferenciam-se de outras formas de conhecimento porque


consideram mais de um indivíduo 40, simultaneamente, buscando conhecer quantos são e localizar
relações entre eles.
Trata-se de uma perspectiva pouco utilizada por nós, juristas, que estamos habituados a
realizar, quando muito, comparações entre um caso concreto e um precedente, às vezes para
justificar que o entendimento aplicado àquele deva ser aplicado também a esse, às vezes em
exercício de distinguishing, acentuando as diferenças entre os dois, para afastar a reprodução da
ratio decidendi.
Raras são as oportunidades em que um jurista envolvido no contencioso - quiçá mesmo
entre os doutrinadores! - realiza pesquisas quantitativas para fortalecer uma tese ou indicar a
necessidade da pacificação de uma dissidência, por exemplo.
Há, certamente, limites para a utilização de números como embasamento para decisões no
campo jurídico, e por isso é necessário ter algumas reservas. Loevinger iniciou, timidamente, uma
reflexão a respeito disso, como se viu.

39
BISQUERRA, Rafael. Introdução à Estatística: enfoque informático com o pacote estatístico SPSS – Porto
Alegre: Artmed, 2004.
40
WATKINS, Joseph C. An Introduction to the Science of Statistics: From Theory to Implementation. Disponível
em: <https://www.math.arizona.edu/~jwatkins/statbook.pdf>. Acesso em: 14 de março de 2019.
32

O problema é que a repulsa de juristas a números os afastou tanto de qualquer pesquisa


quantitativa que recentemente é que começamos a delimitar as utilidades e os perigos das análises
quantitativas aplicadas ao Direito.
Retomando o raciocínio, os indivíduos de que falamos podem ser os mais diversos
possíveis. O objeto da estatística, são, justamente, indivíduos suscetíveis de serem enumerados ou
medidos41.
O motivo do critério ser esse é que se algo pode ser contado, é porque pertence a uma
classe que, sob certos critérios, possui mais de um exemplar. Se há uma pluralidade de indivíduos,
eles podem ser estudados estatisticamente.
Não é difícil encontrar, no Direito, coisas, acontecimentos e aspectos desses
acontecimentos que possam ser enumerados. Os tribunais podem ser enumerados, as partes, os
processos, os pedidos, os fatos do caso concreto, as sentenças, etc. Quer dizer, são todos
enumeráveis porque, antes disso, são observáveis. Estudos estatísticos são, sobretudo, estudos
empíricos, é importante lembrar.
O ponto é que a definição de quais serão os indivíduos das pesquisas depende do que se
está tentando descobrir. Por esse motivo, no método estatístico, a fase de planejamento é posterior
a de definição do problema.
Se o intuito é conhecer o perfil das pessoas que cometem crimes, o objeto de estudo
poderia ser os réus nas ações penais. Já se a intenção é avaliar a deficiência na prestação de serviços,
seria adequado olhar as demandas consumeristas.
O problema deve ser claro, também, em relação à sua dimensão. Pode-se querer analisar
o comportamento de certos processos em uma comarca, em um estado ou até mesmo no país inteiro.
Da mesma forma, pode-se realizar recortes temporais, quando só os processos de um certo período
sejam de interesse.
Quando uma pesquisa estatística observar todos os indivíduos pertencentes a uma
determinada classe, objeto do estudo, tem-se o que se chama de população. Quando for observada
apenas uma fração dos indivíduos daquela população, tem-se um estudo amostral.

41
ESCOTET, 1973, p. 11 apud BISQUERRA, Rafael; SARRIERA, Jorge C., MATÍNEZ, Francesc. Introdução a
Estatística: Enfoque informático com o pacote estatístico SPSS. Porto Alegre: Artmed, 2004. p. 17.
33

Isso não tem nada a ver, é importante dizer, com os recortes de que falamos. Uma vez que
se tenha feito um recorte, tudo o que sobra é a população. A noção de amostra é, portanto, posterior
a dos recortes.
Para a seleção de amostras há, inclusive, metodologías específicas. A mais comum é a de
amostragem probabilística, em que os indivíduos são selecionados ao acaso dentro da população.
Dessa maneira, ensina Rafael Bisquerra, et al, “todos os indivíduos da população têm as mesmas
probabilidades de fazerem parte da amostra”.42
Cada indivíduo, no entanto, costuma se diferenciar dos demais em relação a algumas de
suas características, e cada uma dessas catecterísticas, para a estatística, é uma variável. A definição
apresentada por Rafael Bisquerra é: “Uma variável é uma característica que pode adotar diferentes
valores”.43
Por exemplo: todos os processos judiciais possuem uma causa raiz - vamos ignorar, por
ora, que possam envolver mais de uma. Por isso se pode dizer que a causa raíz é uma variável dos
processos judiciais.
Os processos criminais, por exemplo, podem tratar de tipos penais diversos, de forma que
se fossem selecionados processos penais ao acaso, nesse conjunto se encontraria indivíduos
relacionados aos mais variados crimes, como roubo, homicídio e tráfico de drogas.
Ainda em matéria penal, outras variáveis dos processos poderiam ser a data em que a
denúncia ou a queixa foi apresentada, a etnia do réu e se ele já possui antecedentes.
Dependendo dos valores que as variáveis possam assumir, segundo o critério sistema de
medição, classifica-se elas como uma de duas categorias possíveis: se a variável assumir valores
quantificáveis, trata-se de uma variável quantitativa. Se a variável não puder ser quantificada, trata-
se de uma variável qualitativa, usualmente chamada de categórica44.
A seguir, vamos elencar alguns tipos indivíduos jurimétricos e as variáveis a eles
relacionadas, apontando a categoria em que elas estariam inseridas, para que fique intuitiva a
compreensão:
A) Variáveis quantitativas: em relação aos indivíduos condenações por danos
morais, o seu valor; em relação aos indivíduos tribunais do júri, a quantidade de

42
BISQUERRA, Rafael; SARRIERA, Jorge C., MATÍNEZ, Francesc. Introdução a Estatística: Enfoque
informático com o pacote estatístico SPSS. Porto Alegre: Artmed, 2004. p. 19.
43
Ibid., p. 20.
44
Ibid., p. 22-23.
34

testemunhas presentes; em relação a cobranças indevidas, os meses de atraso para seu


reembolso.

B) Variáveis qualitativas: em relação aos indivíduos processos, as causas


raízes; em relação também a processos, o escritório representante da parte autora; em
relação aos juizes, seus gêneros; em relação às sentenças, se foram condenatórias ou
absolutórias

Saber diferenciar entre essas duas categorias de variáveis - qualitativa e quantitativa - é


importante porque para cada tipo de variável analisada existem técnicas estatísticas mais ou menos
indicadas.
No campo do Direito, especificamente, a utilização de variáveis categóricas é inevitável
para contemplar seus muitos aspectos não quantificáveis, por conta disso priorizaremos elas neste
trabalho.

2.3. DISTRIBUIÇÕES DE FREQUÊNCIAS

Sobre as frequências, Pedro Morettin e Wilton Bussab dispõem que “quando se estuda
variáveis, o maior interesse do pesquisador é conhecer seus comportamentos, analisando a
ocorrência de suas realizações”.45 Essas realizações podem ser numericamente expressas pois,
assim como os indivíduos que as portam, também podem ser contadas. O valor numérico associado
à quantidade de ocorrências de uma variável é, justamente, o que se chama de frequência.
Uma maneira especialmente prática de visualizar frequências é distribuindo-as em tabelas.
Nesse tipo de tabela - cujo nome é tabela de frequência -, encontram-se dois tipos de frequências:
as absolutas e as relativas.
As frequências absolutas indicam as ocorrências de cada uma das categorias. Ou seja, a
frequência absoluta diz quantas vezes aquela variável existiu.
Já as frequências relativas indicam a razão entre as ocorrências de uma categoria e as
ocorrências de todas as categorias somadas 46, e são comumente expressas em porcentagens.

45
MORETTIN, Pedro Alberto. Estatística Básica – 6. ed. – São Paulo : Saraiva, 2010. p. 11.
46
ISOTALO, Jarkko. Basics of Statistics. Disponível em: <https://www.mv.helsinki.fi/home/jmisotal/BoS.pdf>.
Acesso em: 14 de março de 2019.
35

No Direito, há diversas finalidades para as quais se pode imaginar utilizar tabelas com
frequências relativas e absolutas. Uma das aplicações mais promissoras da Jurimetria, no entanto,
é enquanto ferramenta de gestão inteligente de processos judiciais, por isso concentraremos nossos
exemplos, a partir de agora, em situações vividas por gestores jurídicos.
Considerando, hipoteticamente, que um banco possua agências em três cidades - apenas
uma em cada -, e que responda a 4 tipos diferentes de processos em cada uma delas, um gerente
jurídico poderia se perguntar quais demandas são mais comuns, e quais são menos, para iniciar um
esforço de diminuição de processos judiciais.
Essa postura do advogado se chama advocacia preventiva, e se caracteriza pela proposição
de boas práticas internas, pela sugestão de adequações na prestação dos serviços e pelo
oferecimento de treinamentos aos funcionários, visando à diminuição das situações ensejadoras de
litígios antes que eles ocorram.
Seria possível construir, para facilitar essa tarefa, uma tabela de frequências em que se
observaria a variável causa raíz e a distribuição de frequência de suas categorias:

Tabela 1: Frequência dos processos bancários por assunto

Assunto Frequência Absoluta Frequência Relativa


Cobrança Indevida 2000 40,00%
Tempo fila de espera 1500 30,00%
Envio cartão de crédito não solicitado 1000 20,00%
Constrangimento porta giratória 500 10,00%
Total 5000 100,00%

Fonte: Dados Hipotéticos

Como se vê acima, cada linha corresponde a uma modalidade possível da variável causa
raíz, de modo que na coluna do meio estejam dispostas suas frequências absolutas e, na terceira
coluna, suas frequências relativas.
O gerente poderia, ainda, estar interessado na distribuição desses processos entre as
cidades, porque tem a intuição de que numa delas há uma quantidade maior. Com essa finalidade,
ele poderia construir outra tabela, considerando a variável cidade:
36

Tabela 2: Frequência dos processos bancários por cidade

Cidade Frequência Absoluta Frequência Relativa


Cidade A 2220 44,40%
Cidade B 2250 45,00%
Cidade C 530 10,60%
Total 5000 100,00%

Fonte: Dados Hipotéticos

As duas tabelas, apesar de muito úteis, oferecem possibilidades limitadas de análise. Isso
ocorre porque ambas são tabelas univariadas, em que somente o comportamento de uma variável
é observado.
Se o gerente estivesse empenhado em diminuir drasticamente a quantidade de processos
judiciais, e para isso pretendesse iniciar promovendo um treinamento com os funcionários de um
único setor de uma das agências, ele, com as duas últimas tabelas, não saberia aonde ir.
Com esse propósito, ele talvez construisse três tabelas univariadas, em que listasse a
quantidade de processos por causa em cada uma das cidades. As tabelas ficariam assim:

Tabela 3.1: Frequência dos processos bancários na Cidade A, por assunto

Frequência Frequência
Assunto
Absoluta Relativa
Cobrança Indevida 600 27,03%
Tempo fila de espera 950 42,79%
Envio cartão de crédito não solicitado 500 22,52%
Constrangimento porta giratória 170 7,66%
Total 2220 100,00%

Fonte: Dados Hipotéticos


37

Tabela 3.2: Frequência dos processos bancários na Cidade B, por assunto

Frequência Frequência
Assunto
Absoluta Relativa
Cobrança Indevida 1300 57,78%
Tempo fila de espera 450 20,00%
Envio cartão de crédito não solicitado 350 15,56%
Constrangimento porta giratória 150 6,67%
Total 2250 100,00%

Fonte: Dados Hipotéticos

Tabela 3.3: Frequência dos processos bancários na Cidade C, por assunto

Frequência Frequência
Assunto
Absoluta Relativa
Cobrança Indevida 100 18,87%
Tempo fila de espera 100 18,87%
Envio cartão de crédito não solicitado 150 28,30%
Constrangimento porta giratória 180 33,96%
Total 530 100,00%

Fonte: Dados Hipotéticos

Observa-se que as frequências relativas, em situações como essa, se tornam inúteis, e que,
além disso, seria preciso realizar buscas em várias tabelas, comparando, por vezes, os números de
uma com as de outra, dependendo da análise que se quisesse fazer.
Se a tarefa não parece tão difícil, é porque estamos considerando poucas categorias. Com
muitas, a análise de tabelas univariadas pode se tornar simplesmente impraticável.
Felizmente, para facilitar a observação conjunta do comportamento de duas variáveis,
existe um tipo de tabela de frequência específico.
38

2.4. TABELAS DE CONTINGÊNCIA

As tabelas de contingência, também chamadas de tabulações cruzadas, e de tabelas de


duas entradas47, são tabelas nas quais cada elemento das células representa a frequência observada
das realizações simultâneas de duas variáveis 48.
Isto é possível porque, ao invés de se nomear categorias de variáveis somente na primeira
coluna - como nas tabelas univariadas que vimos há pouco -, tem-se também categorias de uma
segunda variável na parte superior da tabela.
Nas linhas e colunas dos totais, que ficam nos extremos opostos aos dos nomes das
categorias - portanto abaixo e à direita na tabela -, se escreve a distribuição total de cada uma das
categorias, sendo chamadas essas frequências tecnicamente de distribuições marginais. 49
Dentre as maneiras de se construir uma tabela de contingência, a mais simples é utilizar
duas variáveis que digam respeito a um mesmo tipo de indivíduo, e é isso que faremos aqui.
Os dados sobre os processos judiciais bancários que vimos, por exemplo, tratam de duas
variáveis dos processos judiciais - cidade e causa raiz.
Numa única tabela de contingência, seria possível representar ambas as variáveis, da
seguinte maneira:
Tabela 4: Cidade e tipo de causa

Tipo de causa
Cidade Cartão Total
Cobrança Fila de Porta
não
indevida espera giratória
solicitado
Cidade
A 600 950 500 170 2220
Cidade
B 1300 450 350 150 2250
Cidade
C 100 100 150 180 530
Total 2000 1500 1000 500 5000

Fonte: Dados Hipotéticos

47
MORETTIN, Pedro Alberto. Estatística Básica – 6. ed. – São Paulo : Saraiva, 2010. p. 69.
48
Ibid., p. 70.
49
Ibid., p. 70.
39

Essa é uma tabela 3 x 4, o que significa que a primeira variável pode assumir três
modalidades e a segunda quatro, mas isso não é uma regra. As tabelas de contingência mais
utilizadas são, na verdade, as 2 x 2.
Nessa tabela, observa-se, estão distribuídas frequências absolutas. Seria possível, contudo,
melhorar a percepção desses dados, utilizando, para isso, novamente frequências relativas, ao invés
de frequências absolutas.
Pedro Alberto Morettin, em relação às tabelas de contingência, ensina que as frequências
relativas podem se dar pela razão em relação ao total geral - soma dos valores de todas as células
do corpo da tabela -, ou em relação ao total de cada linha ou cada coluna, e uma delas será mais
conveniente, dependendo do problema em estudo.50
Como estamos interessados em descobrir a origem da maior quantidade de processos
judiciais, considerando a causa raiz e a localidade, o que nos importa é a proporção em relação ao
todo. A tabela ficaria da seguinte forma

Tabela 5: Cidade e tipo de relativa em relação ao total

Tipo de causa
Cidade Cartão Total
Cobrança Fila de Porta
não
indevida espera giratória
solicitado
Cidade A 12,00% 19,00% 10,00% 3,40% 44,40%
Cidade B 26,00% 9,00% 7,00% 3,00% 45,00%
Cidade C 2,00% 2,00% 3,00% 3,60% 10,60%
Total 40,00% 30,00% 20,00% 10,00% 100,00%

Fonte: Dados Hipotéticos

Cada uma das porcentagens do corpo da tabela - portanto exclui-se do que estamos prestes
a dizer as frequências nas linhas e colunas dos totais - foi feita dividindo a frequência absoluta de
cada célula pelo total da soma de todas as células. Quer dizer, para computar a proporção das causas
envolvendo cobrança indevida na cidade A, a conta realizada foi 600 / 5000 × 100, o que gerou um
percentual de 12%. O procedimento foi replicado nas demais células.
É possível visualizar, finalmente, que os processos sobre cobrança indevida na cidade B
representam 26% do volume total de processos do banco, tratando-se da situação mais crítica.

50
MORETTIN, Pedro Alberto. Estatística Básica – 6. ed. – São Paulo : Saraiva, 2010. p. 70.
40

2.5. TABELAS DE CONTINGÊNCIA E ASSOCIAÇÕES

Outras análises, no entanto, podem estar menos interessadas em conhecer o


comportamento das variáveis em relação ao todo e buscar, em vez disso, descobrir associações
entre elas, de modo que se possa prever melhor o resultado de uma quando conhecermos a
realização da outra51.
Por isso imaginemos, ainda hipoteticamente, que, ao invés de querer diminuir ao máximo
possível, com uma única atitude, a quantidade total de processos bancários, o gerente jurídico esteja
interessado em descobrir se os resultados dos processos estão relacionados ao tipo de causa, para,
encontrando essa relação, tomar medidas não em relação ao nascimento de processos, mas em
relação aos seus resultados.
Nesse caso, pouco importa quais tipos de causas são mais numerosas, ou quais são as que
acumulam mais perdas em termos absolutos. O que se quer saber, na verdade, é se as variáveis das
colunas estão de alguma forma relacionadas com das linhas.
Quando isso ocorre, há o que, em estatística, se chama de relações de associação, ou de
relações de dependência.
Para essa análise seria necessário, evidentemente, conhecer, além da causa raiz, o
resultado de cada um dos processos.
Como trata-se de duas variáveis categóricas - causa raíz e resultado do processo -, a tabela
de contingência seria, novamente, a metodologia mais adequada para visualizar o comportamento
das variáveis. O primeiro passo é sempre construir a tabela com as frequências absolutas:

Tabela 6: Tipo de causa por resultado

Tipo de causa
Resultado Cartão Total
Cobrança Fila de não Porta
Indevida espera solicitado giratória
Procedente 1300 600 600 100 2600
Improcedente 700 900 400 400 2400
Total 2000 1500 1000 500 5000

Fonte: Dados Hipotéticos

51
MORETTIN, Pedro Alberto. Estatística Básica – 6. ed. – São Paulo : Saraiva, 2010. p. 7.
41

Quando o propósito é constatar a possibilidade de existirem associações entre as variáveis,


entretanto, deve-se comparar as frequências relativas das variáveis não em relação à soma de todas
as células, mas em relação aos totais das colunas, ou das linhas.
Nesse caso, diz-se que se trata de uma distribuição condicionada de frequências 52, porque
só é possível descobrir se há ou não dependência entre duas variáveis quando se fixa uma das
proporções.
Como a variável explicativa está nas colunas - o tipo de causa é a variável explicativa
porque, caso haja uma relação, é a variável causa raíz que influencia o resultado do processo -, a
melhor forma é comparar os percentuais é em relação aos totais das linhas, que ficam no extremo
direito da tabela. A tabela ficaria assim:

Tabela 7: Tipo de causa por resultado (proporcional)

Tipo de causa
Resultado Cartão Total
Cobrança Fila de não Porta
Indevida espera solicitado giratória
Procedente 65,00% 40,00% 60,00% 20,00% 52,00%
Improcedente 35,00% 60,00% 40,00% 80,00% 48,00%
Total 100,00% 100,00% 100,00% 100,00% 100,00%

Fonte: Dados Hipotéticos

Como o banco é o réu nessas ações, os resultados procedentes representam as situações


em que houve derrota nos processos.
Comparando as frequências dos resultados em cada uma das colunas com as frequências
totais dos resultados dos processos - no extremo direito da tabela -, vê-se que há sinais indicativos
da presença de associação entre o tipo de causa e o resultado porque, enquanto as porcentagens
totais de vitórias e derrotas são equiparáveis - giram ambas em torno de 50%, visualizáveis na
coluna dos totais -, essa mesma proporção varia importantemente quando discriminada por tipo de
causa, chegando a 80% de improcedência das demandas sobre portas giratórias e a 65% de
procedência nas demandas sobre cobranças indevidas.

52
ISOTALO, Jarkko. Basics of Statistics. Disponível em: <https://www.mv.helsinki.fi/home/jmisotal/BoS.pdf>.
Acesso em: 14 de março de 2019.
42

Caso, independentemente do tipo de causa, fossem observadas taxas de vitória e derrota


por volta de 50% cada uma, poderíamos dizer que não há associação entre a variável causa raíz e
a variável resultado do processo. Sobre essa situação, Bisquerra elucida que “a hipótese nula
sustenta que as duas variáveis são independentes, isto é, não guardam nenhuma relação” 53.
Convém pontuar que a equivalência entre derrotas e vitórias foi uma coincidência.
Poderiam haver mais vitórias, ou mais derrotas, importando somente se, em relação às
porcentagens totais, as porcentagens de vitórias e derrotas em relação a cada uma das causas raiz
varia.
Entretanto, porque as porcentagens variam tão perceptivelmente em diferentes colunas,
pode-se dizer que há sinais de que as duas variáveis estão associadas, ou que há dependência entre
elas.
São inúmeras as possibilidades de investigação utilizando essa técnica que, de certa forma,
é bastante simples, até para advogados. A tabela de contingência faz ainda mais sentido quando se
lida com variáveis que tenham mais categorias que apenas três ou quatro, como nos estudos de
caso da Associação Brasileira de Jurimetria54, nos quais, por vezes, se recorre a essa metodologia
para condensar informações muito mais volumosas e significativas que as que trouxemos aqui.
Outra vantagem da construção das tabelas de contingência, ao invés de se gerar percentuais
separadamente, é que, além de propiciar a comparação simultânea das diversas combinações
possíveis entre as variáveis, permite a realização de testes estatísticos para se chegar a conclusões
técnicas sobre o comportamento delas.
O teste mais famoso envolvendo tabelas de contingência é a prova de qui-quadrado. Dentre
suas aplicações, estão a comparação de uma distribuição observada com uma teórica, a comparação
de distribuições observadas com dados independentes e prova de independência 55.
A prova de qui-quadrado, quando utilizada como prova de independência, Bisquerra
leciona, serve “para confirmar a hipótese de independência, isto é, para saber se duas variáveis
categóricas estão relacionadas”.56 Esses testes, no entanto, são complexos e demandam a

53
BISQUERRA, Rafael; SARRIERA, Jorge C., MATÍNEZ, Francesc. Introdução a Estatística: Enfoque
informático com o pacote estatístico SPSS. Porto Alegre: Artmed, 2004. p. 105.
54
BRASIL. ABJ – Associação Brasileira de Jurimetria. Atuação. Disponível em: <https://abj.org.br/cases/>. Acesso
em: 15 de março de 2019.
55
Ibid., p. 103.
56
Ibid., p 105.
43

aplicação de conhecimentos específicos sobre estatística, bem mais profundos do que os


conceitos que vimos até aqui.
A análise das porcentagens, apesar de existirem metodologias mais assertivas, ainda é
eficaz e pode ser utilizada na maioria das situações.
Uma vez confirmada a associação entre duas variáveis categóricas, através do teste de
independência, pode-se querer quantificá-la57 , e saber qual é sua direção, através de outros
indicadores, como o coeficiente de contingência.

57
MORETTIN, Pedro Alberto. Estatística Básica – 6. ed. – São Paulo : Saraiva, 2010. p. 75.
44

CAPÍTULO 3 – OS DADOS JURIMÉTRICOS

3.1. O DESAFIO PARA CONSEGUIR DADOS JURÍDICOS

A terceira etapa do método estatístico, conforme a metodologia apresentada no capítulo


2, é a etapa de coleta de dados. Essa fase costuma ser a mais trabalhosa de todas e é necessária não
importa o tratamento que os dados receberão depois, inclusive quando o objetivo for a construção
de tabelas de frequência univariadas ou de contingência.
No Direito, o levantamento das informações que serão analisadas pode ser mais ou menos
trabalhoso, dependendo dos indivíduos e das variáveis que serão observadas. Como a Jurimetria
diz respeito a qualquer estudo estatístico pertinente do ponto de vista jurídico, inúmeros são os
indivíduos de seu interesse e inúmeros também são os locais onde se deve buscar as informações
sobre esses indivíduos.
Os indivíduos mais abordados, contudo, são os processos judiciais, que figuram nos
relatórios do CNJ, nas pesquisas da ABJ e também nos estudos realizados por empresas privadas
sobre suas carteiras de processos - esses últimos, naturalmente, não são publicados, mas o
surgimento de muitas empresas especializadas na prestação do serviço de jurimetria denuncia um
mercado em expansão.58
Com exceção do CNJ, que, podemos pressupor, possui acesso facilitado às bases de dados
dos órgãos públicos, e das empresas, que, dependendo da organização do departamento jurídico, já
têm os processos em que foi parte à disposição para consulta, todos os outros pesquisadores
precisam coletar os dados dos processos de alguma forma.
As maneiras convencionais são ou solicitar o envio de bases prontas aos órgãos, ou baixar
os dados diretamente dos sites dos tribunais de justiça e diários oficiais.
A segunda alternativa é necessária porque, apesar dos dados já estarem, evidentemente,
compilados nas bases de dados dos órgãos - sejam as informações lançadas pelos servidores, sejam
os documentos -, a forma como eles são disponibilizados aos usuários não é a mais célere, nem a
mais completa possível.
Pode-se imaginar alguns motivos para isso. O principal talvez seja que não há interesse
público em disponibilizar os dados todos reunidos, organizados, a quem quer que seja, porque há

58
BRASIL. Associação Brasileira de Lawtechs & Legaltechs. Radar de Lawtechs e Legaltechs. Disponível em:
<https://www.ab2l.org.br/radar-lawtechs/>. Acesso em 15 de março de 2019.
45

muito conhecimento contido nos processos judiciais que poderia ser utilizado para finalidades
escusas, que poderiam ir de encontro à segurança pública, à livre concorrência e mesmo à soberania
nacional59.
Outro possível motivo são os custos envolvidos na construção de sistemas que
suportassem o enorme tráfego de informações, caso muitos usuários decidissem baixar os dados
todos de uma vez. Fala-se, inclusive, sobre a possibilidade de futura cobrança pelo download das
informações dos tribunais, como uma medida para mitigar os efeitos negativos desses acessos e
restringir, de certa forma, quem tem acesso a eles.
Por conta disso, os sites dos tribunais não são preparados para se comunicarem com
programas de computador, por meio de APIs 60, somente para serem acessados por seres humanos,
que, em tese, fariam pesquisas pontuais, apenas sobre os processos de seus interesses diretos.
Para contornar essa limitação proposital das páginas, os jurimetristas vêm utilizando uma
tecnologia chamada Web Scraping, que, basicamente, simula o comportamento de um usuário
humano, só que o faz repetidas vezes, automaticamente.
As ferramentas de Web Scraping costumam ser programadas nas linguagens R e Python
e são capazes de acessar os sites dos tribunais e dos diários oficiais 61, fazer buscas e realizar o
download de informações. A esse processo dá-se o nome de raspagem de dados.
Para ilustrar a utilização dessa tecnologia, podemos citar o estudo sobre reformas de
decisão nas câmaras de direito criminal do estado de São Paulo 62, realizado pela ABJ, no qual a
tecnologia de Web Scraping foi utilizada nas páginas do e-SAJ63 daquele estado. O aparato foi
programado para localizar todos os processos dos órgãos julgadores definidos na seção “Direito
Criminal”, fazendo apenas um recorte temporal - o estudo considerou apenas julgados no ano de
2014.

59
SANTIAGO, Fernando. Contrato entre TJ-SP e Microsoft pode atropelar Lei Geral de Proteção de Dados.
Disponível em: <https://politica.estadao.com.br/blogs/fausto-macedo/contrato-entre-tj-sp-e-microsoft-pode-atropelar-
lei-geral-de-protecao-de-dados/>. Acesso em 15 de março de 2019.
60
Para mais informações sobre o funcionamento das APIs, recomenda-se a leitura da seguinte reportagem:
<https://www.tecmundo.com.br/programacao/1807-o-que-e-api-.htm>. Acesso em: 17 de março de 2019.
61
BRASIL. Tribunal de Justiça de São Paulo. Diário de Justiça Eletrônico. Disponível em: <
http://www.dje.tjsp.jus.br/cdje/index.do>. Acesso em 17 de março de 2019.
62
BRASIL. ABJ – Associação Brasileira de Jurimetria. Reformas de decisão nas câmaras de direito criminal em
São Paulo. Disponível em: <https://abj.org.br/cases/camaras-2/>. Acesso em 20 de março de 2019.
63
BRASIL. Tribunal de Justiça de São Paulo. Consulta de Julgados de 1º Grau. Disponível em:
<https://esaj.tjsp.jus.br/cjpg/>. Acesso em 20 de março de 2019.
46

As ferramentas de Web Scraping, no entanto, precisam ser especializadas em um


determinado tribunal, porque seu funcionamento se dá, de forma bastante simplificada, pela
execução repetitiva de rotinas pré-programadas, simulando, como dissemos, um acesso ordinario.
O problema é que essas rotinas variam de um site para outro, o que acaba exigindo ferramentas
customizadas para cada um deles.
No Brasil, contamos com mais de 90 sites de tribunais diferentes 64. Podemos, a partir
dessa informação, dimensionar por alto a dificuldade que é realizar buscas processuais em mais de
um estado, instância ou justiça especializada. Uma pesquisa com esses contornos seria um desafio
que exigiria muito esforço, tanto para acessar as informações, pois demandaria a criação de
ferramentas especializadas em cada um dos sites, quanto porque depois seria necessário unificar
os dados, compatibilizando eventuais diferenças nos seus formatos.
Além disso, é necessário contornar barreiras como os captchas 65, implantados com o
intuito de impedir ou, ao menos, dificultar esses acessos realizados computadorizadamente. Parte
do tempo dos pesquisadores é dedicado, portanto, a quebrá-los.
Apesar de já enormes, as barreiras não terminam por aí. Em relação às buscas nos sites
dos tribunais, uma vez localizados os processos, seja por conta de uma parte envolvida, matéria ou
período de tempo, torna-se possível acessar as informações que já estão estruturadas nas páginas
iniciais dos processos eletrônicos, por força da Resolução 121 do CNJ66, e baixar as que forem
importantes para a pesquisa.
Essas informações, previamente estruturadas e dispostas em campos na página inicial de
cada processo eletrônico, contudo, são bastante limitadas. O são porque se tratam de informações
de livre acesso - inclusive a quem não for parte, representante legal ou advogado regularmente
inscrito na OAB67. São elas: número, classe e assuntos do processo; nome das partes e de seus
advogados; movimentação processual; inteiro teor das decisões, sentenças, votos e acórdãos.

64
BRASIL. Conselho Nacional de Justiça. Link dos Tribunais. Disponível em: <http://www.cnj.jus.br/poder-
judiciario/portais-dos-tribunais>. Acesso em 20 de março de 2019.
65
GOOGLE. O que é CAPTCHA?. Disponível em: <https://support.google.com/a/answer/1217728?hl=pt-BR>.
Acesso em 22 de março de 2019.
66
Artigo 2º, Resolução nº 121, Conselho Nacional de Justiça: “Os dados básicos do processo de livre acesso são:
I- número, classe e assuntos do processo;
II- nome das partes e seus advogados;
III- movimentação processual;
IV- inteiro teor das decisões, sentenças, votos e acórdãos.
67
Os advogados passaram a ter, recentemente, acesso ao inteiro teor de todos os processos judiciais, mesmo daqueles
em que não estiver atuando. BRASIL. Lei 13.793/2019. Altera as Leis n os 8.906, de 4 de julho de 1994, 11.419, de 19
de dezembro de 2006, e 13.105, de 16 de março de 2015 (Código de Processo Civil), para assegurar a advogados o
47

Para padronizar os dados do Poder Judiciário, especialmente os tipos e assuntos das ações,
o CNJ implantou o Sistema de Gestão de Tabelas Processuais Unificadas68, que determina uma
numeração correspondente a cada tipo de procedimento, assunto e movimento dos processos
judiciais em todo o país, o que facilita, em muito, o manuseio das informações que são
disponibilizadas pelos tribunais nos sites.
Outra iniciativa recente do CNJ, com vistas ao melhoramento da qualidade dos dados
disponibilizados nas “capas dos processos” eletrônicos, é utilização de técnicas de inteligência
artificial para identificação de inconsistências no registro de classes, assuntos, movimentações,
datas, nome das partes, entre outros69, e, apesar de estar apenas se iniciando, pode ser muito positiva
a longo prazo.
A maioria dos estudos jurimétricos, por ora, têm se restringido à análise desses dados -
aqueles enumerados na Resolução 121. Ocorre que eles não atendem a todas as finalidades, por
serem um tanto superficiais. Quer dizer, com essas informações é possível realizar estudos sobre
distribuição de causas por localidade, por período, por andamento, e, em certa medida, por assunto
e resultado - o que já é um enorme desafio -, mas quantas outras informações sobre as causas
judiciais não existem para além dessas que acabamos de enumerar?
Os autos processuais são documentos riquíssimos em dados, porque comportam as
diversidades das próprias questões sub judice, o que implica não somente procedimentos diferentes,
mas também a incidência de dispositivos legais, a utilização de argumentos, fundamentações e,
principalmente, a descrição de fatos diferentes, que têm um grande potencial estratégico se
adequadamente analisados.
Para informações detalhadas sobre as causas é necessário, inexoravelmente, realizar
buscas muito mais refinadas que aquelas feitas pelos Web Scrappers. É preciso adentrar nos
documentos e identificar a presença ou ausência de circunstâncias.

exame e a obtenção de cópias de atos e documentos de processos e de procedimentos eletrônicos.Disponível em


<http://www.planalto.gov.br/ccivil_03/_ato2019-2022/2019/lei/L13793.htm>. Acesso em 22 de março de 2019.
68
BRASIL. Conselho Nacional de Justiça. Consulta Pública de Assuntos. Disponível em:
<https://www.cnj.jus.br/sgt/consulta_publica_assuntos.php>. Acesso em 23 de março de 2019.
69
BRASIL. Conselho Nacional de Justiça. Inteligência artificial será usada para verificar qualidade de dados
processuais. Disponível em: <https://www.cnj.jus.br/noticias/cnj/89053-inteligencia-artificial-sera-usada-para-
verificar-qualidade-de-dados-processuais>. Acesso em: 23 de março de 2019.
48

Alguns desses documentos permitem a pronta análise do seu teor. São os chamados
documentos “pesquisáveis”70, nos quais é possível selecionar e copiar partes do texto, e também
utilizar o atalho “crtl + f” para realizar buscas por palavras.
Outros arquivos, no entanto, se forem, por exemplo, resultado de registros fotográficos
convertidos em formato PDF, são de arquivos de imagem, apenas, e não permitem a seleção e
copiagem de seu conteúdo. Esses documentos necessitam de um tratamento que transforme seu
texto em um texto pesquisável.
Geralmente se utiliza uma tecnologia chamada OCR (Optical Character Recognition 71),
que reconhece os caracteres formadores das palavras, pelos formatos característicos de cada letra,
além de sinais gráficos, pontuações e espaçamentos, para gerar um outro arquivo, usualmente no
formato txt, onde é possível, finalmente, fazer buscas automatizadas em seu conteúdo. O que a
tecnologia OCR faz, basicamente, é identificar cada uma das letras e transcrevê-las em um outro
documento, pesquisável.
Uma vez que o conteúdo esteja acessível a buscas, utiliza-se tecnologias de processamento
de linguagem natural e de text mining72 que, dentre outras possibilidades, permitem a localização
de informações dispersas em textos. Essas técnicas variam desde modalidades mais rudimentares,
como a busca por expressões regulares73, até a utilização de redes neurais artificiais para
treinamento e localização de entidades 74.
Essas metodologias, é importante lembrar, só são necessárias quando as informações que
se deseja não estiverem estruturadas nos sites dos tribunais de justiça ou nas bases de processos
internas das empresas. Elas possibilitam localizar processos que digam respeito a um determinado
assunto, em que conste determinado tipo de parte, ou digam respeito a um produto ou serviço
específico.

70
ABBYY. Saiba como funcionam as tecnologias da ABBYY e como elas ajudam a aumentar sua produtividade.
Disponível em: <https://www.abbyy.com/pt-br/finereader/pdf-types/>. Acesso em 23 de março de 2019.
71
ABBYY. Learn how ABBYY technologies work and how they help boost productivity. Disponível em:
<https://www.abbyy.com/en-apac/finereader/what-is-ocr/>. Acesso em 23 de março de 2019.
72
SEARCH TECNOLOGY. Natural Language Processing (NLP) Techniques for Extracting Information.
Disponível em: <https://www.searchtechnologies.com/blog/natural-language-processing-techniques>. Acesso em: 23
de março de 2019.
73
REGEXBUDDY. What Is a Regular Expression, Regexp, or Regex?. Disponível em:
<https://www.regexbuddy.com/regex.html>. Acesso em: 23 de março de 2019.
74
BANERJEE, Suvro. Introduction to Named Entity Recognition. Disponível em: <https://medium.com/explore-
artificial-intelligence/introduction-to-named-entity-recognition-eda8c97c2db1>. Acesso em: 23 de março de 2019.
49

A utilização de expressões regulares, apesar de arcaica, pode bastar se a informação que


estiver sendo procurada puder ser expressa somente de algumas poucas formas, e se sua presença
ou ausência forem um indicativo seguro da presença ou ausência de alguma circunstância. Há
notícia, por exemplo, de estudos jurimétricos que buscaram expressões regulares para identificar a
procedência ou improcedência das ações, procurando trechos como “julgo procedente” em
sentenças.
Esse método, no entanto, deve ser utilizado com cautela, porque os termos procurados
podem aparecer em contextos imprevistos e não significar o que se esperava. Num levantamento
estatístico, isso poderia, dependendo da quantidade de erros, alterar completamente o resultado da
pesquisa.
Por isso é que, para certos estudos, dada a limitação tecnológica das técnicas de
processamento de text mining, deve-se considerar a viabilidade da utilização de mão-de-obra
humana para a coleta de dados textualmente pouco padronizados.
Os custos e os riscos devem ser sopesados, e também a possibilidade e a necessidade desse
procedimento. Estudos com bases de dados gigantescas dificilmente fariam bom uso da coleta
humana, porque ou se gastaria muito dinheiro contratando e treinando pesquisadores ou se levaria
demasiado tempo na análise, com uma equipe pequena.

3.2. VARIÁVEIS CATEGÓRICAS NO DIREITO

Como vimos no segundo capítulo, variáveis categóricas são aquelas que expressam um
aspecto não quantificável do indivíduo objeto do estudo estatístico. Através delas, é possível
explorar a noção de frequência, inclusive por meio de tabelas de contingência.
Também dissemos que algumas informações dos processos judiciais, principalmente
aquelas estruturadas nas páginas dos processos eletrônicos, e também em planilhas de
acompanhamento processual de departamentos jurídicos, já estão sendo amplamente utilizadas em
estudos jurimétricos.
Estamos, no entanto, num estágio inicial do desenvolvimento da Jurimetria no Brasil, de
modo que, muito provavelmente, não exploramos todas as possibilidades de variável jurimétrica.
Acreditamos, por isso, que nos próximos anos, com o crescimento do setor, mais estudos sejam
encomendados e que a diversidade das variáveis observadas também aumente.
50

Os pesquisadores se perguntarão: o que pode, no contexto dos processos judiciais, ser


tratado como variável categórica? Quantas categorias cada uma dessas variáveis pode ter? O que
não deve ser tratado como variável categórica?
Essas são, também, as perguntas que nos motivaram a escrever este subcapítulo,
cujas considerações talvez sejam úteis para outras técnicas estatísticas que utilizem variáveis
categóricas, além das tabelas de contingência.

3.2.1. Transformando variáveis quantitativas em qualitativas

Na nossa primeira reflexão, vamos abordar as sentenças condenatórias que impõem o


pagamento de alguma quantia para ilustrar como transformar variáveis quantitativas em variáveis
qualitativas.
Dos processos judiciais cíveis podem decorrer, segundo a doutrina majoritária, três tipos
de sentenças: as constitutivas, as condenatórias e as meramente declaratórias 75, dependendo do que
estiver sendo discutido e dos efeitos que decorrerão da decisão.
As sentenças constitutivas, leciona Fredie Didier, são as decisões que certificam e
efetivam um direito potestativo 76, como as sentenças que rescindem ou anulam um contrato,
instituem uma servidão ou autorizam a revisão da pensão alimentícia 77.
As sentenças declaratórias, à diferença das constitutivas, apenas certificam a existência,
inexistência ou modo de ser de uma situação jurídica. 78
As sentenças condenatórias, finalmente, são aquelas que “reconhecem a existência de um
direito a uma prestação e permitem a realização de atividade executiva no intuito de efetivar
materialmente essa mesma prestação”79, impondo ao réu, portanto, um dever, como o dever de
pagar uma quantia em dinheiro a título de indenização por danos morais, por exemplo.
Considerando, portanto, que ações judiciais com vistas unicamente à indenização por
danos morais possam ter por resultado sentenças improcedentes, e procedentes com valores
diversos, o tratamento de todas essas últimas somente como “procedente” significaria a

75
DIDIER JR, Fredie. Curso de Direito Processual Civil: Teoria da Prova, Direito Probatório, Ações Probatórias,
Decisão, Precedente, Coisa Julgada e Antecipação dos Efeitos da Tutela – 11ª ed. – Salvador: Ed Jus Podivm,
2016.
76
Ibid., p. 429.
77
Ibid., p. 429.
78
Ibid., p. 432
79
Ibid., p. 427.
51

desconsideração de uma nuance importantíssima, que poderia ser explorada em tabelas de


contingência: o valor da condenação.
Valores monetários, é importante lembrar, se enquadram, conforme foi visto no capítulo
2, no conceito de variáveis quantitativas, porque possuem um caráter suscetível de ser medido
numericamente80.
As tabelas de contingência, por outro lado, funcionam muito bem com variáveis
categóricas, porque sua finalidade é a percepção da realização simultânea de mais de uma variável,
através da observação de frequências.
As variáveis quantitativas, não obstante, podem assumir inúmeros valores 81, mais ou
menos, dependendo do que estiver sendo medido - algumas medições podem envolver casas
decimais, quando as categorias são chamadas de contínuas, e outras podem assumir apenas valores
inteiros, quando são chamadas de discretas.
As condenações por danos morais, por exemplo, podem ser de 1 até centenas de milhares
de reais. Como, portanto, utilizar tabelas de contingência que comportem essas variações sem ter
que criar uma infinidade de categorias, uma para cada valor observado?
Uma possível solução para esse problema é enquadrar os valores assumidos pelas
condenações em classes82. Com esse artifício, converte-se as variáveis quantitativas em variáveis
qualitativas - talvez seja importante lembrar que variáveis qualitativas e categóricas são sinônimas.
Vejamos uma tabela hipotética relacionando os valores das condenações em danos morais
por inscrição indevida em algumas capitais brasileiras.

Tabela 8: Valor de condenação por dano moral, por inscrição indevida, por capitais

Faixas de valores das condenações


Capitais Até R$ De R$5.001 a De R$10.001 a Acima de Total
5000,00 R$10.000 R$15.000 R$ 15.000
Capital A 25 (13,44%) 48 (25,81%) 91 (48,92%) 22 (11,83%) 186 (100%)
Capital B 10 (8,13%) 80 (65,04%) 30 (24,39%) 3 (2,44%) 123 (100%)
Capital C 47 (32,19%) 75 (51,37%) 15 (10,27%) 9 (6,16%) 146 (100%)
Total 82 (18,02%) 203 (44,62%) 136 (29,89%) 34 (7,47%) 455 (100%)

80
BISQUERRA, Rafael; SARRIERA, Jorge C., MATÍNEZ, Francesc. Introdução a Estatística: Enfoque
informático com o pacote estatístico SPSS. Porto Alegre: Artmed, 2004. p. 23
81
Ibid., p. 23.
82
FERRARI, Fabrício. Estatística Básica. Disponível em: <http://www.ferrari.pro.br/home/documents/FFerrari-
Curso-Estatistica-Basica.pdf>. Acesso em 25 de março de 2019.
52

Fonte: Dados Hipotéticos

As classes, situadas no topo da tabela, como se nota, compreendem intervalos de variação


de uma variável quantitativa83, o que a transforma em uma variável qualitativa.
Cada classe possui um limite inferior e um limite superior. Assim é possível superar, em
certa medida, o problema decorrente da alta variabilidade das sentenças condenatórias, sem
precisar tratá-las apenas como procedentes ou improcedentes.
Quanto aos intervalos escolhidos, Pedro Alberto Morettin esclarece:

A escolha dos intervalos é arbitrária e a familiaridade do pesquisador com os


dados é que lhe indicará quantas e quais classes devem ser usadas. Entretanto,
deve-se observar que, com um pequeno número de classes, perde-se informação,
e com um número grande de classes, o objetivo de resumir os dados fica
prejudicado. 84

Ou seja, num estudo sobre condenações por dano moral em diferentes capitais, se as
classes fossem ainda mais abrangentes, indo a primeira, por exemplo, de 1 a 10 mil reais,
considerando, hipoteticamente, que a distribuição dos valores fosse igual à apresentada acima,
muitas decisões acabariam recebendo um mesmo tratamento quando, na verdade, seria útil, e
possível, considerar mais classes, para visualizar ainda mais precisamente o fenômeno.
O interessante, e que deve ser destacado, é que esse artifício, de distribuir variáveis
quantitativas em classes, para que sejam manuseados enquanto variáveis categóricas, pode ser
utilizado, em tese, para quaisquer variáveis quantitativas presentes no Direito, como durações dos
processos, tempo decorrido de um fato a outro e outros valores além das condenações, como os
valores dos pedidos.

3.2.2. Cuidados na seleção de variáveis categóricas

Como se deve ter notado até aqui, o conceito de variável categórica é extremamente
versátil. Isso não significa, contudo, que quaisquer aspectos possam ser tratados assim.
Em relação às categorias que uma variável categórica possa assumir, há a seguinte regra:
elas devem estar bem definidas, ser mutuamente excludentes e ser exaustivas. 85

83
Ibid.
84
MORETTIN, Pedro Alberto. Estatística Básica – 6. ed. – São Paulo : Saraiva, 2010. p. 13.
85
BISQUERRA, Rafael; SARRIERA, Jorge C., MATÍNEZ, Francesc. Introdução a Estatística: Enfoque
informático com o pacote estatístico SPSS. Porto Alegre: Artmed, 2004. p. 23.
53

Esses requisitos, no Direito, podem ser um tanto problemáticos, e inviabilizar a utilização


de algumas variáveis.

3.2.2.1. Variações subjetivas

Nós, operadores do Direito, que estamos acostumados a considerar os menores dos


detalhes, precisamos, entre muitas coisas, aprender a lidar com a simplificação da informação
quando fizermos Jurimetria. As análises detidas sobre um só caso concreto e suas circunstâncias
são, e vão permanecer, objeto de análises jurídicas, apenas. Esse nem é, muito menos, o propósito
da Jurimetria.
Apesar disso, podemos ter dificuldade em compreender que o que, para nós, é relevante,
para a estatística talvez não sirva. Uma dessas situações são os aspectos subjetivos envolvidos nos
processos judiciais.
Um advogado de um banco, visando à criação de uma tabela de contingência, poderia
realizar a contagem dos processos levando em consideração alguns detalhes, sem ser excessivo.
Por exemplo, ao invés de tratar os travamentos em portas-giratórias de agências bancárias
como uma coisa só, poderia utilizar a variável tempo, e considerar categorias para cada período do
dia em que o fato aconteceu, para ver se os fatos que originaram os processos estão associados aos
horários de pico - o que, por conta do volume de trânsito, é bastante provável.
Também seria possível utilizar a variável motivo do travamento, caso a informação esteja
disponível, cujas categorias seriam se havia uma prótese, uma fivela de cinto, ou qualquer outro
objeto, ou se o travamento foi injustificado ou desconhecido, para sugerir, por exemplo, a fixação
de informativos com orientações aos clientes sobre os objetos que costumam fazer a porta travar,
ou indicar a necessidade de manutenções mais regulares.
Até esse nível de detalhamento, ainda é possível considerar a utilização de uma variável
que compreenda as variações, porque as circunstâncias apresentadas são, por assim dizer, objetivas.
Houve fatos constatáveis que poderiam, por conta disso, ser enquadrados em categorias bem
definidas, e que excluíssem umas às outras.
Agora, se o advogado, em vez disso, quisesse considerar uma variável sobre o
comportamento dos seguranças no momento do ocorrido, seria necessário aplicar critérios muito
pouco confiáveis para diferenciar uma categoria da outra.
54

Como mensurar a intensidade da ação humana com base em descrições feitas por pessoas?
Para o segurança, ele poderia estar calmo, e ter sido perfeitamente profissional, enquanto que, para
o cliente, o segurança pode ter sido rude, ou ter parecido pouco preocupado em solucionar o
problema.
Mesmo as palavras ditas na hora do ocorrido podem ter sido proferidas com entonações
ou em contextos inacessíveis a quem apenas lê uma descrição, ou assiste a um vídeo de câmera de
segurança sem áudio.
Esse é um exemplo de variação que, para o Direito, é absolutamente importante, mas que
traz um subjetivismo incompatível com a metodologia estatística. A variável comportamento, ou
temperamento dos seguranças, portanto, dificilmente poderia seguir critérios objetivos de
diferenciação entre suas categorias, o que poderia inviabilizar sua utilização em estudos
jurimétricos.
Nesse sentido, é importante que se tenha muita cautela ao selecionar as variáveis
categóricas. Por conhecermos as dinâmicas dos processos judiciais, temos a obrigação de propor
variáveis que permitam a observação de fenômenos interessantes do ponto de vista jurimétrico. No
entanto, por falta do conhecimento técnico, talvez sejamos incapazes de avaliar corretamente a
pertinência da utilização de uma variável categórica. Por isso, antes de fechar um problema de
estudo, é recomendável escutar o parecer de especialistas da área de estatística.

3.2.2.2. Variações textuais

Finalmente, a maior tentação entre operadores do Direito, além de explorar as nuances


dos fatos concretos, pode ser tentar quantificar a utilização de argumentos ou fundamentações
jurídicas utilizadas em processos judiciais.
São inúmeras as aplicações imagináveis desses tipos de estudo, mas, principalmente, para
se tentar avaliar o poder persuasivo das teses aventadas na inicial e na defesa, confrontando, por
exemplo, as vezes em que um argumento foi invocado com as vezes em que o juiz o citou na
fundamentação das decisões. No entanto, aqui entram em jogo alguns complicadores, em especial
a linguagem.
Sobretudo no Direito, em que, não raramente, se vê ideias sendo expressas de forma
prolixa, pode ser difícil comparar dois parágrafos, que seja, e dizer, com certeza, que eles tratam
do mesmo raciocínio. Isso, para estudos de frequência, é uma grande barreira, porque, como
55

demonstramos, a frequência de uma variável pressupõe a possibilidade de sua repetição. Como


dizer que uma ideia foi expressa dezenas, centenas de vezes, por pessoas diferentes, em contextos
diferentes?
É importante reconhecer, desde já, que muitas situações enfrentadas em processos
judiciais demandam construções argumentativas intrincadas, com ponderações e comparações,
porque o Direito é, sobretudo, também um fenômeno comunicativo. Ele se efetiva a partir da
comunicação e da confrontação de ideias. Se um texto longo, com várias idas e vindas, for a melhor
forma para que um profissional do Direito desempenhe sua função, seja de advogado, seja de juíz,
não há que se clamar pela simplificação do texto, ou do vocabulário, afinal o Direito não existe
para ser pesquisado. As metodologias de pesquisa é que precisam se adequar a ele, e não o
contrário.
As críticas que são feitas à linguagem jurídica devem ser direcionadas a preciosismos
contraproducentes, que não aumentam a precisão do texto e só dificultam sua interpretação. No
entanto, mesmo sem rebuscar demais, são inúmeras as formas de se expressar uma mesma ideia, e
esse não é um fenômeno jurídico, mas linguístico, e que, portanto, está presente em qualquer tipo
de comunicação, não só as legais.
Um efeito colateral disso é, como dissemos, a dificuldade que se tem para identificar o
uso repetido de um mesmo argumento, ou de uma mesma fundamentação.
Apesar dessa situação, demandas jurídicas de massa, que costumam ensejar processos
judiciais rotineiros, em que os mesmos fatos e os mesmos dispositivos são discutidos sempre,
possibilitam, em certa medida, esse estudo.
Ora, a própria legislação admite, quando institui mecanismos de uniformização
jurisprudencial, como as Orientações Jurisprudenciais, súmulas, e, mais recentemente, o Incidente
de Resolução de Demanda Repetitivas, que, ainda que cada caso seja um caso, alguns deles são
suficientemente próximos para que, disso, decorra a necessidade de que recebam o mesmo
tratamento.
O Incidente de Demandas Repetitivas, por exemplo, é o incidente por meio do qual através
do qual transfere-se a competência do julgamento de vários casos a um tribunal, para que ele possa
fixar o entendimento aplicável a todos os casos de uma só vez 86.

86
DIDIER JR. Fredie. Curso de Direito Processual Civil: o processo civil nos tribunais, recursos, ação de
competência originária de tribunal e querela nullitatis, incidentes de competência originária de tribunal – 13
ed. reform. – Salvador: ed Jus Podivm, 2016. p. 625.
56

Não há crime em se dizer, portanto, que algumas causas, para certos efeitos, são
absolutamente parecidas, ao ponto de suscitarem invariavelmente os mesmos argumentos.
Essa é a realidade de muitas causas de massa, que discutem fatos praticamente idênticos,
e que ainda não foram uniformizadas, em que os advogados utilizam modelos prontos de peças e
argumentos - às vezes disponíveis na internet e, cada vez mais, em programas de redação
automática87-, alterando somente as informações do autor, datas e, eventualmente, algum outro
detalhe, para receberem uma sentença também pré-formatada, muitas vezes adaptada por
assessores e estagiários88.
Não que essa degradação deva ser comemorada, mas o fato é que, nesses tipos de
processos, é comum ver uma variedade limitada de articulações teórico-jurídicas, que invocam
quase sempre os mesmos dispositivos legais, com as mesmas considerações.
É possível imaginar, nessa seara, formas de assimilar e localizar vários dos argumentos e
fundamentações que são repetidamente utilizados, pois costumam, também, ser enunciados sem
muita variação textual.
Esse último aspecto é importante porque, caso se cogite a utilização de aparatos
computacionais para realização de text mining, quanto mais padronizada uma mensagem, mais fácil
de localizá-la automaticamente. As tecnologias de mineração de dados textuais dependem
fortemente do emprego repetido de frases e palavras, pois não são capazes de interpretar. Elas
apenas identificam, algebricamente, padrões textuais.
A interpretação, aliás, é boa, porque permitiria compreender quando uma coisa foi dita de
várias formas, mas, ao mesmo tempo, é ruim, porque macula, novamente, de subjetividade o
processo de coleta dos dados.
Por todos esses motivos, tratando-se de mensagens em texto, não importa quais sejam, é
necessário, no mínimo e, ainda assim, com muita cautela, definir critérios objetivos de
identificação, utilizando, sempre, codebooks89 para documentá-los.

87
LOOPLEX. Tecnologia para transformar know-how, processos e documentos. Disponível em:<
/https://looplex.com.br/plataforma/#tecnologia>. Acesso em: 13 de março de 2019.
88
RIBEIRO, Ivan Morais. Afinal, quem elabora a sentença? O juiz, o assessor ou o estagiário?. Disponível
em:<https://canalcienciascriminais.com.br/afinal-quem-elabora-a-sentenca-o-juiz-o-assessor-ou-o-estagiario/>.
Acesso em 28 de março de 2019.
89
ICPSR. Find & Analyze Data. What is a Codebook? Disponível em:
<https://www.icpsr.umich.edu/icpsrweb/content/shared/ICPSR/faqs/what-is-a-codebook.html>. Acesso em 28 de
março de 2019.
57

Essa é uma forma, inclusive, de filtrar um pouco as variáveis utilizáveis, porque se não
for possível instituir critérios objetivos para diferenciar as categorias, provavelmente a
circunstância que se quer medir não se repita uniformemente o bastante. Há, contudo, mensagens
que, não importa a forma como são expressas, podem ser recebidas como significativas da mesma
coisa.
Por exemplo, se um juíz diz numa decisão interlocutória que falta verossimilhança das
alegações para que ele conceda a tutela provisória, esse posicionamento, ainda que possa decorrer
de situações diferentes que venham ser apresentadas a ele, é uma conclusão - uma conclusão que
virá a fundamentar a decisão - facilmente identificável e que, nesses termos, não pretende abraçar
nenhuma complexidade.
E porque o contexto se torna irrelevante, desde que a mensagem possa ser
inequivocamente identificada e seja representativa de alguma circunstância bem definida, ela pode
ser enumerada. Ora se isso não é, justamente, o que já se faz com os resultados dos processos, que
são também expressos textualmente, nas sentenças, mas que assumem categorias bem definidas e
mutuamente excludentes.
Seria possível, dessa maneira, contar quantas vezes os juízes negaram pedidos de tutela
provisória por falta de verossimilhança, ou indeferiram preliminarmente uma inicial por reconhecer
um pedido contrário a precedente obrigatório. Também argumentos que sintetizem a conclusão de
raciocínios lógico-jurídicos extensos podem, em tese, ser analisados por meio de estatística
descritiva. Alegações de quebra de contrato, de vícios, atrasos e nulidades, por exemplo, são todos
argumentos que, não importa com que contornos, têm um mesmo significado jurídico.
Argumentos mais elaborados, que não possam, por exemplo, ser sintetizados em uma
frase, ou ser comunicadas através de um instituto jurídico, evidentemente não podem ser
distribuídos em categorias.
Assim, apesar de promissora, a observação estatística dos argumentos e fundamentações
aplicados à lide é um desafio. Isso compromete, de certa forma, também a análise dos padrões
decisórios, que, por ora, fica restrita à comparação de informações básicas dos processos, como a
causa de pedir, o juiz e as partes, com seus desfechos, como fizemos em algumas de nossas tabelas
de contingência até aqui.
58

CAPÍTULO 4 - INTERPRETANDO ESTUDOS JURIMÉTRICOS

4.1 - IMPARCIALIDADE

Demonstramos no último capítulo que o êxito da Jurimetria depende fortemente da


compreensão do papel que a variável categórica desempenha nos estudos estatísticos, e que suas
escolhas devem ser feitas com muita cautela, para que se possa extrair dos estudos jurimétricos o
máximo de utilidade sem deixar de lado, no entanto, a retidão metodológica - sem o que, na
verdade, nenhum estudo pode ser verdadeiramente útil.
Nesse sentido, porque é, essencialmente, estatística, a metodologia jurimétrica precisa
preservar sua imparcialidade no momento da análise dos resultados das pesquisas, para que não se
tenda a enxergar além do que os números permitem.
Essa é, contudo, uma postura que a maioria dos operadores do Direito não pratica no
exercício da profissão, afinal somos contratados para representar as partes em processos judiciais,
onde a imparcialidade é dever apenas do juiz.
Isso interfere, importantemente, na nossa relação com os dados. Se alguma informação
prejudica a defesa do nosso cliente, a omitimos. Se uma outra é favorável aos seus interesses, a
destacamos. Ou seja, nosso mindset é direcionado à parcialidade e à manipulação dos dados em
nosso benefício. Essa postura é, definitivamente, o que pode haver de pior em estudos jurimétricos.
Enquanto advogados, procuradores e promotores se preocupam em fortalecer teses, os
estatísticos estão interessados nas melhores maneiras de testar hipóteses. Sobre o assunto, Rafael
Bisquerra traz mais informações:

“Em estatística inferencial, é comum a aplicação de provas de significação


estatística, também chamadas de provas de contratase ou de decisão. Essas provas
servem para determinar a existência de diferenças entre grupos, a dependência
entre variáveis, o ajuste de distribuições observadas a distribuições teóricas,
etc.”90

A prova qui-quadrado, citada no capítulo 2, que pode ser utilizada para testar a
independência das variáveis categóricas de uma tabela de contingência, é um exemplo de prova de
significação.

90
BISQUERRA, Rafael; SARRIERA, Jorge C., MATÍNEZ, Francesc. Introdução a Estatística: Enfoque
informático com o pacote estatístico SPSS. Porto Alegre: Artmed, 2004. p. 71.
59

Os estatísticos profissionais estão habituados a lidar nesses testes com aproximações,


intervalos de confiança e probabilidades, e por isso sabem como ninguém que a estatística não
comprova nada, apenas oferece evidências de alguma hipótese91. Essa é a percepção desejável que
se tenha também das análises jurimétricas.
As tabelas de contingência, especialmente nas mãos de pessoas sem instrução técnica,
podem dar azo a interpretações equivocadas sobre seus dados, ou, pior ainda, ser utilizadas
parcialmente por juristas com vistas a “provar” situações que lhes sejam benéficas, e essa conduta
deve ser rechaçada.

4.2. ASSOCIAÇÃO NÃO IMPLICA CAUSALIDADE

Dissemos no segundo capítulo que as tabelas de contingência permitem a observação de


relações de associação entre duas variáveis categóricas. Essa relação, também chamada de relação
de dependência, vale a pena reforçar, significa apenas que as categorias de uma variável geralmente
ocorrem juntamente com certas categorias da outra variável. 92
Um erro comum, sobretudo de profissionais de fora das ciências exatas, quando analisam
estudos estatísticos, é inferir relações de causalidade a partir das relações de associação.
As relações de causalidade, diferentemente das de associação, ocorrem quando um evento
é o resultado da ocorrência de outro evento. Ou seja, a causalidade indica uma relação de causa-
efeito.93
Esse não é um conceito que nos é completamente estranho. No Direito Civil, discutimos
o nexo de causalidade como requisito essencial para configuração da responsabilidade civil94. Para
Caio Mário, o nexo causal está presente quando “sem a verificação do comportamento contrário a
direito não teria havido o atentado ao bem jurídico”. 95

91
MORETTIN, Pedro Alberto. Estatística Básica – 6. ed. – São Paulo : Saraiva, 2010. p. 330
92
THE ANALYSIS FACTOR. The Difference Between Interaction and Association. Disponível
em:<https://www.theanalysisfactor.com/interaction-association/> Acesso em 02 de abril de 2019.
93
AUSTRALIAN BUREAU OF STATISTICS. Statistical Language - Correlation and Causation. Disponível
em:<https://www.abs.gov.au/websitedbs/a3121120.nsf/home/statistical+language+-+correlation+and+causation>.
Acesso em 02 de abril de 2019.
94
Artigo. 927, Código Civil: “Aquele que, por ato ilícito (arts. 186 e 187), causar dano a outrem, fica obrigado a repará-
lo. ”
95
PEREIRA, Caio Mário da Silva. Instituições de Direito Civil – 27 ed – Rio de Janeiro: Forense, 2014. p. 554.
60

No Direito Penal, a definição do nexo de causalidade é enxergada diferentemente por


diversas teorias.96
Apesar disso, devemos nos preocupar, aqui, com o conceito técnico de causalidade, como
visto pela estatística, afinal a Jurimetria não é uma disciplina dogmática do Direito.
Em livros e artigos sobre a diferenciação sobre relações de causalidade e de associação, é
muito comum citarem o exemplo do cigarro como causa do câncer de pulmão. A situação é
interessante porque, ainda que, hoje, se saiba haver uma relação entre o fumo a o desenvolvimento
do câncer de pulmão, cientificamente - ou estatisticamente -, só se poderia afirmar a relação de
causalidade se todas as pessoas que fumassem desenvolvessem a doença. Por conta disso, alguns
estatísticos preferem dizer, simplesmente, que há uma forte relação entre fumar e desenvolver
câncer.97
Marcelo Guedes, no seu livro sobre Jurimetria, no entanto, traz um conceito
interessantíssimo sobre causalidade. Ele conta que a causalidade determinística - quer dizer, a
causalidade numa acepção absolutamente estrita, em que a relação de causa-efeito deve ser
obrigatória para ser confirmada - foi superada pela ideia de causalidade probabilística. 98
Essa noção de causalidade, elucida o autor, pressupõe apenas que um efeito está
provavelmente associado à causa. Dessa forma, o efeito não é imprescindível sempre, desde que a
realização de uma variável seja capaz de aumentar significativamente a probabilidade de realização
de outra variável99.
Nesse sentido, visto pelo conceito de causalidade probabilística, “o fumo é causa
probabilística de câncer no pulmão, não porque ele seja suficiente para predeterminar a doença,
mas porque o seu consumo aumenta a probabilidade de incidência de câncer nesse órgão” 100.

96
BITENCOURT, César Roberto. Tratado de Direito Penal: parte geral 1 – 20 ed rev. ampl. e atual. – São Paulo:
Saraiva,2014. p.317.
97
STATISTICS HOW TO. What is Causation? Disponível
em:<https://www.statisticshowto.datasciencecentral.com/causation/>. Acesso em 02 de abril de 2019.
98
NUNES, Marcelo Guedes. Jurimetria: como a estatística pode reinventar o Direito – São Paulo: Editora Revista dos
Tribunais, 2016. p.71.
99
Ibid., p. 71.
100
Ibid., p. 72.
61

De qualquer forma, ainda que probabilística, a identificação de relações de causalidade


por meio da estatística é extremamente complicada. As metodologias mais eficazes são as que
utilizam grupos de controle101.
Nesses testes, os pesquisadores separam duas amostras, ambas com indivíduos
homogêneos em relação a quase todas as características. Depois, dispensam tratamentos
diferenciados a cada uma delas, para avaliar posteriormente se dessa medida resultou uma
diferenciação no comportamento dos indivíduos das diferentes amostras.
Essa metodologia é amplamente utilizada nas ciências médicas. As pesquisas clínicas
sobre medicamentos, por exemplo, são compostas de testes com grupos de controle. Geralmente a
determinadas pessoas se oferece um medicamento habitual - que tenha a melhor eficácia
comprovada entre os disponíveis -, ou um placebo, e a outras se oferece o novo medicamento, que
se está tentando descobrir se é superior aos que já estão no mercado 102.
Quer dizer, se é complicado identificar causalidades em fenômenos bioquímicos, em
situações controladas, que dirá em fenômenos sociais, como o Direito, em que a utilização de
grupos de controle está simplesmente fora de alcance, e cujos efeitos são, usualmente, resultado de
inúmeros fatores, parte deles não observáveis empiricamente.
Pressupondo, hipoteticamente, que uma empresa com filiais em 3 cidades contrate um
escritório local em um cada uma delas para realizar suas defesas, um gerente jurídico poderia
construir uma tabela de contingência relacionando cada um desses escritórios aos resultados dos
processos em que representaram a empresa. A tabela ficaria da seguinte maneira:

101
AUSTRALIAN BUREAU OF STATISTICS. Statistical Language - Correlation and Causation. Disponível
em:<https://www.abs.gov.au/websitedbs/a3121120.nsf/home/statistical+language+-+correlation+and+causation>.
Acesso em 02 de abril de 2019.
102
FACULDADE DE CIÊNCIAS MÉDICAS. Quais são as fases da pesquisa clínica? Disponível
em:<https://www.fcm.unicamp.br/fcm/cpc-centro-de-pesquisa-clinica/pesquisa-clinica/quais-sao-fases-da-pesquisa-
clinica>. Acesso em 04 de abril de 2019.
62

Tabela 9: Resultado dos processos, por escritório terceirizado

Número de processos, por escritório


Resultado Total
Escritório 1 Escritório 2 Escritório 3
Vitória 50 (76,92%) 70 (84,34%) 23 (29,87%) 143 (63,56%)
Derrota 15 (23,08%) 13 (15,66%) 54 (70,13%) 82 (36,44%)
Total 65 (100%) 83 (100%) 77 (100%) 225 (100%)

Fonte: Dados Hipotéticos

Observa-se, nessa tabela, que dois dos escritórios têm índices muito bons de
aproveitamento, enquanto o outro acumula mais derrotas que vitórias. Há, portanto, uma associação
entre a variável resultado do processo e a variável escritório.
Uma interpretação precipitada desses dados, no entanto, seria a de que o escritório com
mau desempenho é o único, ou principal, motivo das derrotas, porque provavelmente apresenta
contestações mal redigidas, ou porque seus advogados não têm um bom relacionamento com os
juízes da comarca.
Está-se inferindo, a partir de uma relação de associação, uma relação de causalidade entre
o escritório e os desfechos dos processos. Por esse equívoco ser tão comum, um ditado estatístico
diz “correlação não implica causalidade” 103.
Destacamos primeiro a situação do escritório com resultados negativos, porque as
inferências erradas são feitas, geralmente, para se responsabilizar alguém por algo. Quase nunca se
vê estatísticas sendo utilizadas da forma errada para parabenizar quem quer que seja - a não ser
quando utilizadas no próprio interesse - porque, ao que parece, nestas situações costuma-se ser bem
mais criterioso. Apesar disso, a conclusão de que os outros escritórios vencem mais porque são
melhores, com base na tabela de contingência, seria, igualmente, uma asserção sem fundamento.
O erro começa quando se pressupõe que única circunstância, a imperícia ou a falta de
intimidade dos advogados para com o juiz, poderia condicionar o resultado de inúmeros processos.
Não que essa não seja uma possibilidade, mas a dinâmica processual, sabemos, envolve outros
fatores potencialmente mais decisivos que esses.
A dificuldade dos dois escritórios em vencer, em relação aos demais, poderia ser
justificada porque eles lidam com mais causas em que, independentemente da estratégia de defesa,

103
ISOTALO, Jarkko. Basics of Statistics. Disponível em:<https://www.mv.helsinki.fi/home/jmisotal/BoS.pdf>.
Acesso em 04 de abril de 2019.
63

não se tinha muitas chances de vitória, enquanto que os outros podem ter atuado em processos onde
faltava amparo legal aos pedidos do reclamante.
Além disso, sequer se considerou as áreas dos processos em que cada escritório atuou. O
escritório que teve resultados negativos pode ter atuado somente em causas trabalhistas, talvez mais
difíceis que as demais causas e, às vezes, proporcionalmente, até ter tido resultados melhores do
que os outros dois nessa área.
Outras associações, fora da advocacia estratégica, podem propiciar erros ainda mais
levianos. Um dos estudos da Associação Brasileira de Jurimetria, sobre o comportamento das
Câmaras Criminais de São Paulo 104, que, inclusive, já foi citado aqui, montou uma tabela de
contingência comparando os resultados dos recursos criminais de 2014 em relação aos quinze
relatores com maior volume de processos.
Enquanto a frequência relativa total das decisões que negaram os recursos foi de 53,9%,
alguns dos relatores apresentaram porcentagens de mais de 80% de improvimento nas causas em
que atuaram naquela posição.
Os números indicam, portanto, uma associação entre o relator e o resultado do recurso e
são, certamente, propícios para juízos de valor e acusações. Os pesquisadores da ABJ, no entanto,
logo abaixo da referida tabela, deram o seguinte parecer:

“É importante ressaltar que esses casos devem ser investigados mais a fundo, pois
a diferença observada poderia ser explicada tanto por uma diferença de
interpretação, quanto por diferença dos perfis dos processos de cada julgador. ”
105

Esse é o equilíbrio que se espera que os juristas tenham quando lidarem com evidências
de associações.
A reserva com que se deve enxergar as relações de associação, apesar disso, não significa
que elas sejam inúteis. São, na verdade, extremamente poderosas, porque, num cenário em que é
difícil inferir estatisticamente relações de causalidade, como o do Direito - devido tanto à
multicolinearidade quanto à limitação das próprias variáveis consideradas -, as associações talvez
sejam a melhor maneira de se identificar padrões que apontem onde procurá-las.

104
BRASIL. ABJ – Associação Brasileira de Jurimetria. Reformas de decisão nas câmaras de direito criminal em
São Paulo. Disponível em: <https://abj.org.br/cases/camaras-2/>. Acesso em 20 de março de 2019.
105
Ibid.
64

Quer dizer, é possível analisar um processo por vez e dizer quais foram as causas da
vitória, ou da derrota. O problema é que, sem uma análise estatística, em situações onde se deva
tomar posicionamentos frente a uma pluralidade de processos, lidando, principalmente, com
escassez de tempo e recursos, seria improvável que se descobrisse quais problemas são maiores e,
entre estes, quais, possivelmente, estão seguindo um padrão que possa ser, além de identificado,
compreendido e explorado.
No segundo capítulo, trouxemos o exemplo do gerente jurídico que constatou uma
associação importante entre os tipos de causa e os resultados dos processos. Ora, vez que tenha
tomado ciência dessa relação, ele poderia instituir uma política de acordo, ou contratar advogados
especializados para tentar diminuir as derrotas, o que talvez trouxesse resultados positivos. O mais
importante, no entanto, seria investigar a fundo o motivo para que alguns tipos de causa estejam
associados a tantas mais derrotas.
Igualmente, uma vez que se dê conta que um escritório tem mais dificuldade em ganhar
os processos, se poderia investigar os motivos para que a situação seja essa. Há uma diferença no
perfil dos processos com que cada escritório terceirizado lida? São os fatos que são diferentes, e
mais complicados em certos locais? Há uma diferença nas teses de defesa adotadas, ou da
jurisprudência? As contestações estão bem fundamentadas, ou faltam argumentos imprescindíveis?
Não que seja o caso dessas perguntas, exatamente, mas é possível que muitos
questionamentos só sejam feitos, ou só sejam considerados relevantes, depois que se tenha
observado uma relação de associação.
Por isso, antes de diagnosticar o que está acontecendo, responsabilizar alguém ou algo, ou
mesmo propor soluções, o desejável é realizar pesquisas mais profundas.
Dessa forma, a estatística permite enxergar padrões nos fenômenos que só poderiam ser
observados quantitativamente, com uma perspectiva superficial, do ponto de vista de cada
indivíduo isoladamente considerando, mas depois, quando se chega mais próximo dos motivos
daqueles padrões, pode-se fazer análises jurídicas e, eventualmente, até considerá-las novamente
sob um viés estatístico.
Por exemplo, no caso dos relatores dos recursos criminais, se realmente se quisesse fazer
um juízo de valor sobre seus comportamentos enquanto relatores, o mais adequado - e, ainda assim,
tarefa muito subjetiva -, seria avaliar se ele foi muito ou pouco rígido em cada um dos processos e
depois considerar a proporção entre uma e outra conduta, para, finalmente, emitir uma opinião.
65

Reiteramos que uma avaliação dessas não seria completamente significativa, por conta da ausência
de referenciais objetivos.
Assim, nos parece que, apesar de não se tratar da técnica estatística mais elaborada, e
mesmo sem realizar o cálculo das medidas de associação, é possível explorar as relações de
associação de forma útil no Direito, através das tabelas de contingência, desde que se esteja ciente
do que significam essas relações e de quais posturas se deve tomar diante delas.
66

CONSIDERAÇÕES FINAIS

O presente trabalho percorreu longo caminho até chegar ao último capítulo, em que se fez
uma constatação que, sem as questões previamente abordadas, não seria compreendida da mesma
forma. Ainda que se tenha chegado a uma conclusão, espera-se que o maior proveito da pesquisa
seja gerar o debate acerca da Jurimetria, e de sua aplicabilidade como ferramenta gerencial em
departamentos jurídicos.
Iniciou-se as reflexões recuperando a origem do termo Jurimetria, que remonta ao final da
década de quarenta. Expomos, nessa passagem, o fato de que, ainda que seja, hoje, compreendida
como estatística aplicada ao Direito, a disciplina, como idealizada por Loevinger, não se restringia
a isso. Entretanto, por ser demasiadamente otimista a visão de Loevinger a respeito da metodologia
científica, a possibilidade mais razoável, de pesquisa empírica, foi a que permaneceu.
Vimos, após isso, que existem outras escolas que também utilizam metodologias
quantitativas para observar o fenômeno jurídico, e que diferenciar entre elas pode ser um desafio.
Quanto à aplicabilidade da Jurimetria, enumeramos uma série de instituições ocupadas em
gerar dados sobre o funcionamento do Poder Judiciário, em especial o CNJ e a Associação
Brasileira de Jurimetria.
Apontamos, também, que a investigação de políticas públicas não era a única finalidade
para qual a Jurimetria vem sendo utilizada, e que, na verdade, há um mercado privado em expansão
voltado para a análise de dados sobre processos judiciais, com vistas ao aprimoramento de
estratégias processuais, à instituição de políticas de acordo e à advocacia preventiva.
A metodologia jurimétrica, contudo, jamais poderia ser visualizada de uma perspectiva
puramente jurídica, tornando-se imprescindível, por conta disso, adentrar no mundo da estatística
e aprender seus fundamentos.
Iniciamos nossa exposição enumerando as etapas do método estatístico, apontando, na
medida do possível, como elas se desenrolariam em estudos jurimétricos sobre processos judiciais.
Cuidou-se, em seguida, de apresentar o conceito de indivíduos estatísticos, e de variáveis,
que são as bases de qualquer estudo estatístico. Em relação às variáveis, dedicamos um momento
especial para explicar o que são variáveis categóricas. Em seguida, demonstramos que é possível
observar a frequência com que se realizam através de tabelas de frequência.
67

As tabelas univariadas, contudo, são pouco práticas quando o objetivo for analisar duas
variáveis simultaneamente. Por isso trouxemos a tabela de contingência, que permite a observação
simultânea do comportamento de duas variáveis.
Construímos, em seguida, algumas tabelas de contingência, com dados hipotéticos, para
mostrar como são utilizáveis na investigação da existência de uma relação de associação entre as
duas variáveis categóricas.
Foi possível ver, com isso, que a diferenciação nas porcentagens relativas das tabelas de
contingência em relação às distribuições totais são um indicativo da possibilidade de relações de
associação, e definimos essas relações como sendo a observação de uma variação conjunta das
categorias de ambas as variáveis.
Como não se constrói tabelas de contingência sem dados, tornou-se necessário dedicar a
primeira parte do terceiro capítulo à descrição da metodologia de coleta de dados no ramo jurídico.
Viu-se que é possível utilizar aparatos computacionais para realizar raspagem de dados nos sites
dos tribunais da justiça, mas que, tratando-se de algumas informações, devido à limitação
tecnológica, deve-se considerar a possibilidade da realização de coleta manual.
Porque as tabelas de frequência são construídas a partir de variáveis categóricas, também
cuidamos de tecer algumas considerações sobre elas.
Demonstramos, primeiramente, que é possível considerar variáveis quantitativas em
tabelas de frequência através da realização do artifício de distribuição em classes, e que, dessa
forma, seria possível considerar ainda mais nuances dos processos judiciais em tabelas de
contingência, como valores de condenações por danos morais.
Nem todos os aspectos dos processos judiciais, contudo, podem ser tratados como
variáveis categóricas, na medida em que a diferenciação entre suas categorias poderia assumir
critérios subjetivos. Em especial os argumentos e as fundamentações jurídicas seriam
problemáticos de serem lidados enquanto variável categórica. Seria possível, apesar disso,
considerar argumentos e fundamentações que expressem uma situação jurídica bem definida, que
possam, por conta disso, ser identificadas inequivocamente em diferentes contextos.
No último capítulo, exploramos a etapa da análise dos estudos jurimétricos. Primeiro
explicamos porque ser imparcial diante dos números pode ser um desafio para os advogados.
Finalmente, concluímos o presente trabalho explicando que as associações não devem ser
interpretadas como causalidades. Trouxemos dois exemplos de situações em que havia relações de
68

associação, mas que inferir que uma categoria de uma das variáveis era a causa da categoria da
outra variável seria um grande erro, porque as tabelas de contingência não demonstram se há
causalidade.
Espera-se, ao final desse trabalho, que as considerações que foram feitas sejam
generalizáveis a outras técnicas estatísticas, em especial o que dissemos sobre as variáveis
categóricas, e que nossa conclusão sobre a aplicabilidade de tabelas de contingência no Direito, e
a impossibilidade de inferência de relação de causalidade, não seja compreendida entre os juristas
como um desincentivo à sua utilização. As relações de associação devem, na verdade, ser encaradas
como o ponto de partida para reflexões mais aprofundadas. Pode ser necessário, para isso, analisar
alguns casos concretos, à moda antiga, para compreender o que de fato está causando a associação
observada, para que, só então, se tome medidas a respeito.
69

REFERÊNCIAS BIBLIOGRÁFICAS

ABBYY. Learn how ABBYY technologies work and how they help boost productivity.
Disponível em: <https://www.abbyy.com/en-apac/finereader/what-is-ocr/>. Acesso em 23 de
março de 2019.

ARIZONA STATE UNIVERSITY. Jurimetrics Journal. Disponível em:<


https://law.asu.edu/jurimetrics>. Acesso em: 08 de março de 2019.

AUSTRALIAN BUREAU OF STATISTICS. Statistical Language - Correlation and


Causation. Disponível
em:<https://www.abs.gov.au/websitedbs/a3121120.nsf/home/statistical+language+-
+correlation+and+causation>. Acesso em 02 de abril de 2019.

BANERJEE, Suvro. Introduction to Named Entity Recognition. Disponível em:


<https://medium.com/explore-artificial-intelligence/introduction-to-named-entity-recognition-
eda8c97c2db1>. Acesso em: 23 de março de 2019.

BIBLE HUB. Disponível em:<https://biblehub.com/greek/3358.htm>. Acesso em: 25 de fevereiro


de 2019.

BERGAMASHI, D.; SOUZA, J.; MENEZES, R. Bioestatística Básica. São Paulo: USP, 2016.
Disponível em: <http://www.fsp.usp.br/~denisepb/es5101/Apostila.pdf>. Acesso em: 13 de março
de 2019.

BERNOULLI, Nicolaus M. The use of the Art of conjecturing in Law. Doctorate Degree in both
Roman and Canon law legitimately acquired. Fatherland’s University. On the day 14 June A.C.
MDCCIX.

BISQUERRA, Rafael. Introdução à Estatística: enfoque informático com o pacote estatístico


SPSS – Porto Alegre: Artmed, 2004.

BITENCOURT, César Roberto. Tratado de Direito Penal: parte geral 1 – 20 ed rev. ampl. e
atual. – São Paulo: Saraiva,2014. p.317.

BRASIL. Lei nº 10.406, de 10 de janeiro de 2002. Institui o Código Civil. Disponível em:<
http://www.planalto.gov.br/ccivil_03/leis/2002/l10406.htm>. Acesso em: 05 de março de 2019.

_______. Conselho Nacional de Justiça. Justiça em Números. Disponível em:<


http://www.cnj.jus.br/pesquisas-judiciarias/justicaemnumeros/2016-10-21-13-13-04/pj-justica-
em-numeros>. Acesso em: 09 de março de 2019.

_______. Conselho Nacional de Justiça. Pesquisas Judiciárias. Disponível


em:<http://www.cnj.jus.br/pesquisas-judiciarias>. Acesso em: 10 de março de 2019.
70

_______. ABJ – Associação Brasileira de Jurimetria. Reformas de decisão nas câmaras de


direito criminal em São Paulo. Disponível em: <https://abj.org.br/cases/camaras-2/>. Acesso em
10 de março de 2019.

_______. ABJ – Associação Brasileira de Jurimetria. Atuação. Disponível em:


<https://abj.org.br/cases/>. Acesso em: 10 de março de 2019.

_______. Conselho Nacional de Justiça. Justiça em Números 2018: ano-base 2017. Disponível
em:<http://www.cnj.jus.br/files/conteudo/arquivo/2018/09/8d9faee7812d35a58cee3d92d2df2f25.
pdf> Acesso em 11 de março de 2018.

_______. Conselho Nacional de Justiça. Pesquisas Contratadas. Disponível em:


<http://www.cnj.jus.br/pesquisas-judiciarias#Pesquisas-contratadas. > Acesso em: 14 de março de
2019.

_______.ABJ – Associação Brasileira de Jurimetria. Atuação. Disponível em:


<https://abj.org.br/cases/>. Acesso em: 15 de março de 2019.
BRASIL. Associação Brasileira de Lawtechs & Legaltechs. Radar de Lawtechs e Legaltechs.
Disponível em: <https://www.ab2l.org.br/radar-lawtechs/>. Acesso em 15 de março de 2019.

_______. Tribunal de Justiça de São Paulo. Diário de Justiça Eletrônico. Disponível em: <
http://www.dje.tjsp.jus.br/cdje/index.do>. Acesso em 17 de março de 2019.

_______. ABJ – Associação Brasileira de Jurimetria. Reformas de decisão nas câmaras de


direito criminal em São Paulo. Disponível em: <https://abj.org.br/cases/camaras-2/>. Acesso em
20 de março de 2019.

_______. Tribunal de Justiça de São Paulo. Consulta de Julgados de 1º Grau. Disponível em:
<https://esaj.tjsp.jus.br/cjpg/>. Acesso em 20 de março de 2019.

_______. Conselho Nacional de Justiça. Resolução nº 121 de 05 de Outubro de 2010.


Disponível:< http://www.cnj.jus.br/busca-atos-adm?documento=2585>. Acesso em: 22 de março
de 2019.

_______. Conselho Nacional de Justiça. Link dos Tribunais. Disponível em:


<http://www.cnj.jus.br/poder-judiciario/portais-dos-tribunais>. Acesso em 20 de março de 2019.

_______.CONVEX. Inteligência de negócios para performance e eficiência. Disponível em:<


https://www.softplan.com.br/convex/o-convex/>. Acesso em: 11 de março de 2019.

_______. Lei 13.793/2019. Altera as Leis n os 8.906, de 4 de julho de 1994, 11.419, de 19 de


dezembro de 2006, e 13.105, de 16 de março de 2015 (Código de Processo Civil), para
assegurar a advogados o exame e a obtenção de cópias de atos e documentos de processos e
71

de procedimentos eletrônicos. Disponível em <http://www.planalto.gov.br/ccivil_03/_ato2019-


2022/2019/lei/L13793.htm>. Acesso em 22 de março de 2019.

_______. Conselho Nacional de Justiça. Consulta Pública de Assuntos. Disponível em:


<https://www.cnj.jus.br/sgt/consulta_publica_assuntos.php>. Acesso em 23 de março de 2019.

_______. Conselho Nacional de Justiça. Inteligência artificial será usada para verificar
qualidade de dados processuais. Disponível em: <https://www.cnj.jus.br/noticias/cnj/89053-
inteligencia-artificial-sera-usada-para-verificar-qualidade-de-dados-processuais>. Acesso em: 23
de março de 2019.

_______.ABJ – Associação Brasileira de Jurimetria. Reformas de decisão nas câmaras de direito


criminal em São Paulo. Disponível em: <https://abj.org.br/cases/camaras-2/>. Acesso em 20 de
março de 2019.

CORREA, Sônia Maria Bastos. Probabilidade e estatística – 2ª ed. - Belo Horizonte: PUC Minas
Virtual, 2003. Dosponível em:<
http://estpoli.pbworks.com/f/livro_probabilidade_estatistica_2a_ed.pdf>. Acesso em: 13 de março
de 2019.

DIDIER JR, Fredie. Curso de Direito Processual Civil: Teoria da Prova, Direito Probatório,
Ações Probatórias, Decisão, Precedente, Coisa Julgada e Antecipação dos Efeitos da Tutela
– 11ª ed. – Salvador: Ed Jus Podivm, 2016.

DIDIER JR. Fredie. Curso de Direito Processual Civil: o processo civil nos tribunais, recursos,
ação de competência originária de tribunal e querela nullitatis, incidentes de competência
originária de tribunal – 13 ed. reform. – Salvador: ed Jus Podivm, 2016. p. 625

EJLT EUROPEAN JOURNAL OF LAW AND TECHNOLOGY. Jurimetrics Please! Disponível


em:< http://ejlt.org/article/view/13>. Acesso em: 08 de março de 2019.

ESCOTET, 1973, p. 11 apud BISQUERRA, Rafael; SARRIERA, Jorge C., MATÍNEZ, Francesc.
Introdução a Estatística: Enfoque informático com o pacote estatístico SPSS. Porto Alegre:
Artmed, 2004. p. 17.

FACULDADE DE CIÊNCIAS MÉDICAS. Quais são as fases da pesquisa clínica? Disponível


em:<https://www.fcm.unicamp.br/fcm/cpc-centro-de-pesquisa-clinica/pesquisa-clinica/quais-sao-
fases-da-pesquisa-clinica>. Acesso em 04 de abril de 2019.

FERRARI, Fabrício. Estatística Básica. Disponível em:


<http://www.ferrari.pro.br/home/documents/FFerrari-Curso-Estatistica-Basica.pdf>. Acesso em
25 de março de 2019.

FERRAZ JÚNIOR, Tércio Sampaio. Introdução ao Estudo do Direito: técnicam decisão,


dominação – 7 ed. – São Paulo: Atlas, 2013.
72

FUNDAÇÃO GETÚLIO VARGAS. Supremo em Números. Disponível


em:<http://www.fgv.br/supremoemnumeros/>. Acesso em: 10 de março de 2019.
FUTURE LAW. Cursos e Atividades. Disponível em:< http://futurelaw.com.br/>. Acesso em 11
de março de 2019.

GOOGLE. O que é CAPTCHA?. Disponível em:


<https://support.google.com/a/answer/1217728?hl=pt-BR>. Acesso em 22 de março de 2019.

HAIR JR, Joseph F. et al. Análise Multivariada de Dados – 6ª ed. – Porto Alegre: Bookman,
2009.

HARVARD LAW SCHOOL. Harvard Empirical Legal Studies Series. Disponível em:<
https://hls.harvard.edu/dept/graduate-program/harvard-empirical-legal-studies-series/>. Acesso
em: 04 de março de 2019.

HARVARD LAW SCHOOL. Analytical Methods for Lawyers. Disponível


em:<https://hls.harvard.edu/academics/curriculum/catalog/index.html?o=64299>. Acesso em 11
de março de 2019.

ICPSR. Find & Analyze Data. What is a Codebook? Disponível em:


<https://www.icpsr.umich.edu/icpsrweb/content/shared/ICPSR/faqs/what-is-a-codebook.html>.
Acesso em 28 de março de 2019.

INVESTOPIA. Econometrics Definition. Disponível em:<


https://www.investopedia.com/terms/e/econometrics.asp>. Acesso em: 05 de março de 2019

ISOTALO, Jarkko. Basics of Statistics. Disponível em:


<https://www.mv.helsinki.fi/home/jmisotal/BoS.pdf>. Acesso em: 14 de março de 2019.

LOEVINGER, Lee. Jurimetrics the next step forward. Minnesota Law Review, April 1949.

LOEVINGER, Lee.The methodology of legal inquiry. Minnesota Law Review, Winter, 1963. p.
34-35.

LOEVINGER, Lee. Science preditiction in the field of law. Minnesota Law Review, September
1962.

MACHADO, Maíra Rocha. Pesquisar Empiricamente o Direito. São Paulo: Redes de Estudos
Empíricos em Direito, 2017.

MORETTIN, Pedro Alberto. Estatística Básica – 6. ed. – São Paulo : Saraiva, 2010. p. 11

NUNES, Marcelo Guedes. Jurimetria: como a estatística pode reinventar o Direito – São Paulo:
Editora Revista dos Tribunais, 2016. p. 112.
73

OLLAP. What is Business Intelligence (BI)? Disponível em: <http://olap.com/learn-bi-olap/olap-


bi-definitions/business-intelligence/>. Acesso em: 11 de março de 2019.

PEREIRA, Caio Mário da Silva. Instituições de Direito Civil – 27 ed – Rio de Janeiro: Forense,
2014. p. 554.

PSYCHOMETRIC SOCIETY. Whats is Psychometric. Disponível em:<


https://www.psychometricsociety.org/content/what-psychometrics>. Acesso em: 04 de março de
2019.

REALE, Miguel. Lições Preliminares de Direito. – 27 ed. – São Paulo: Saraiva, 2002. p. 141.

REGEXBUDDY. What Is a Regular Expression, Regexp, or Regex?. Disponível em:


<https://www.regexbuddy.com/regex.html>. Acesso em: 23 de março de 2019.
RIBEIRO, Ivan Morais. Afinal, quem elabora a sentença? O juiz, o assessor ou o estagiário?.
Disponível em:<https://canalcienciascriminais.com.br/afinal-quem-elabora-a-sentenca-o-juiz-o-
assessor-ou-o-estagiario/>. Acesso em 28 de março de 2019.

SANTIAGO, Fernando. Contrato entre TJ-SP e Microsoft pode atropelar Lei Geral de
Proteção de Dados. Disponível em: <https://politica.estadao.com.br/blogs/fausto-
macedo/contrato-entre-tj-sp-e-microsoft-pode-atropelar-lei-geral-de-protecao-de-dados/>. Acesso
em 15 de março de 2019.

SEARCH TECNOLOGY. Natural Language Processing (NLP) Techniques for Extracting


Information. Disponível em: <https://www.searchtechnologies.com/blog/natural-language-
processing-techniques>. Acesso em: 23 de março de 2019.

STATISTICS HOW TO. What is Causation? Disponível


em:<https://www.statisticshowto.datasciencecentral.com/causation/>. Acesso em 02 de abril de
2019.

TECMUNDO. O que é APIs? Disponível em:< www.tecmundo.com.br/programacao/1807-o-


que-e-api-.htm>. Acesso em: 17 de março de 2019.

THE ANALYSIS FACTOR. The Difference Between Interaction and Association. Disponível
em:<https://www.theanalysisfactor.com/interaction-association/> Acesso em 02 de abril de 2019.

WATKINS, Joseph C. An Introduction to the Science of Statistics: From Theory to


Implementation. Disponível em: <https://www.math.arizona.edu/~jwatkins/statbook.pdf>.
Acesso em: 14 de março de 2019.

Você também pode gostar