Escolar Documentos
Profissional Documentos
Cultura Documentos
VOLTA REDONDA – RJ
2019
RAFAEL PEREIRA DE SOUZA
Orientador:
Matheus Vidal Gomes Monteiro
VOLTA REDONDA – RJ
2019
FICHA CATALOGRÁFICA
RAFAEL PEREIRA DE SOUZA
BANCA EXAMINADORA:
_____________________________________
Prof. Dr. Matheus Vidal Gomes Monteiro – Orientador – UFF
_____________________________________
Prof. Dr. Marcus Wagner de Seixas – UFF
_____________________________________
Prof. Dr. Getúlio Nascimento Braga Júnior – IBMEC
VOLTA REDONDA – RJ
2019
Aos meus pais e à minha irmã, que são tudo para
mim.
AGRADECIMENTOS
Chegou o momento de agradecer a todos que contribuíram para que eu completasse essa
importante etapa da minha vida.
Aos meus pais, Mônica e Rodrigo, por terem feito mais sacrifícios do que eu, por muito
tempo, tive maturidade para enxergar. Aprendi com vocês que ser correto é o segredo da felicidade
e da prosperidade, e que se deve amar incondicionamente aqueles que querem seu bem,
especialmente na adversidade.
À minha irmã, Clarissa, com quem morei no último ano. Obrigado pelo incentivo e por ter
me ajudado de todas as formas que você podia. Sou abençoado por ter alguém tão especial como
irmã.
Ao resto de meus familiares, que notaram meu distanciamento mas que, nem por isso,
deixaram de incentivar minha jornada profissional, me apoiando e festejando todas as minhas
conquistas.
Ao time jurídico comercial da Raízen, em especial a Yve Carpi e a Tamara Bardí, por terem
me selecionado para o programa de estágio de férias e me apresentado a Jurimetria, e ao Lucas, por
ter sido o melho buddy que um novo estagiário poderia querer.
Ao Julio Trecenti, que mesmo fazendo mil e uma coisas respondeu com carinho às minhas
dúvidas e me indicou uma imensa bibliografia, que eu ainda não terminei de ler.
Aos meus companheiros da LegAut, pelo aprendizado e por me incentivarem a ser melhor
a cada dia.
A todos que foram meus professores no curso de Direito da UFF, meu máximo respeito e
admiração.
Aos meus antigos companheiros da Ímpeto Empresa Júnior Jurídica, o projeto que abriu as
portas para tudo que está acontecendo comigo hoje.
À professora Andressa Torquato, pelo apoio no início do TCC.
Finalmente, ao meu orientador, o Professor Matheus, que temperou minha empolgação com
profissionalismo e técnica.
“The essential feature of statistics is a
prudent and systematic ignoring of details.”
Erwin Schrödinger
RESUMO
Jurimetrics is consolidating itself as an important research tool of the legal phenomena. Particularly
for private companies, when used for the analysis of lawsuits, it allows the identification of patterns
that could guide strategies. For jurists, usually not accustomed to dealing with the exact sciences,
the use of basic statistical techniques can be a challenge. Associations, identifiable by means of
contingency tables, have the potential to indicate the need for further research. There is a risk that
they will be misunderstood, if it is interpreted that they can prove causal relations in Law. The
simulation of situations experienced by lawyers, when using Jurimetrics, helps to establish the
fundamental rules for the use of contingency tables and for the interpretation of their results in the
advocacy.
INTRODUÇÃO ........................................................................................................................ 12
4.1. Imparcialidade..................................................................................................................... 58
Tabela 3.1 - Frequência dos processos bancários na Cidade A, por assunto ............................... 37
Tabela 3.2 - Frequência dos processos bancários na Cidade B, por assunto ............................... 38
Tabela 3.3 - Frequência dos processos bancários na Cidade B, por assunto ............................... 38
Tabela 8 - Quantidade de condenação por dano moral, por inscrição indevida, por capitais .......53
INTRODUÇÃO
CAPÍTULO 1 – JURIMETRIA
1
ONLINE ETYLOLOGY DICTIONARY. Disponível em:<https://www.etymonline.com/word/juridical>. Acesso
em: 25 de fevereiro de 2019.
2
BIBLE HUB. Disponível em:<https://biblehub.com/greek/3358.htm>. Acesso em: 25 de fevereiro de 2019.
3
LOEVINGER, Lee. Jurimetrics the next step forward. Minnesota Law Review, April 1949.
4
REALE, Miguel. Lições Preliminares de Direito. – 27 ed. – São Paulo: Saraiva, 2002. p. 141.
15
5
LOEVINGER, Lee. Jurimetrics the next step forward. Minnesota Law Review, April 1949. p. 32-35.
16
Essas são apenas cinco das nove aplicações que Loevinger apresenta naquele trabalho,
mas bastam para que façamos nossas primeiras considerações.
A primeira conclusão a que chegamos é a de que a Jurimetria não é excessivamente
restritiva quanto ao seu objeto. Os problemas que ele elaborou contemplam desde o nascimento
das leis, passando pelo comportamento das testemunhas e dos juízes, até o acesso aos autos dos
processos judiciais. Isso faz-nos entender que qualquer tema, desde que pertinente do ponto de
vista jurídico, seria, para Loevinger, potencialmente estudável pela abordagem jurimétrica.
Outra observação que fazemos é que, embora a Jurimetria tenha em seu cerne o método
científico, algumas das perguntas formuladas pelo autor não são solucionáveis cientificamente, ou,
pelo menos, não da maneira como foram colocadas.
O quarto item, por exemplo, é explícito em prescrever a análise semântica das palavras,
para saber se possuem ou não significado. Ora, a análise semântica foge à estrutura de um problema
científico. O significado de uma palavra não é algo falseável. Não se poderia comprovar
empiricamente que uma palavra não possui significado, ou que esta ou aquela são equivalentes,
senão, talvez, estudar sua utilização e a percepção das pessoas, que podem, ou não, estar corretas.
A inadequação de algumas das perguntas seria remediável por suas reformulações, no entanto.
Nossa terceira ponderação, e que talvez seja uma extensão da segunda, é que faltou ao
autor exemplificar como a Jurimetria contribuiria especificamente para reduzir a irracionalidade
das decisões judiciais, que o deixou tão consternado. É difícil imaginar como um juiz recorreria ao
método científico para imprimir mais lógica ao processo decisório. Ele poderia acessar os
precedentes, perscrutar sobre os efeitos da decisão, avaliar o efeito probatório de uma prova,
melhorar métodos de detecção de testemunhos fraudulentos, que poderiam embasar algumas de
suas ponderações, mas a formação da ratio decidendi compreende outros processos, interpretativos
e valorativos, não sujeitos a causalidade, e que, portanto, não poderiam ser valer do método
científico e da observação empírica. A razão que Loevinger disse que faltava não poderia vir da
ciência. Não, pelo menos, sem que a atividade jurisdicional fosse transformada na aplicação de
regras lógicas objetivas.
17
O mais próximo que chegamos disso talvez tenha sido com Kelsen, e sua Teoria Pura do
Direito. Tércio Sampaio 6 explica que Kelsen explorou a possibilidade de criar uma teoria científica
de interpretação jurídica, de modo que fosse possível avaliar a verdade de uma interpretação. Nesse
sentido, seria possível haver a falseabilidade também em interpretações jurídicas.
Ainda, no entanto, que Loevinger estivesse visando a algo parecido com a Teoria Pura -
o que não é o caso -, as relações de imputação descritas por Kelsen existiriam somente num plano
teórico, do dever ser, e, portanto, escapariam completamente a qualquer tipo de observação
empírica, que um é traço imprescindível para a utilização do método científico.
Esse é um dos principais motivos para que o Direito, assim como as outras ciências sociais,
seja classificado como uma “soft science. Não possui o rigor científico que a matemática, física ou
química, que se amparam em leis universais e experimentos replicáveis, de forma que, quando se
sabe o que aconteceu antes, é possível antecipar o que irá acontecer depois.
Por mais que se busque respeitar preceitos lógicos - nas decisões judiciais, por exemplo -
nenhuma construção teórico-jurídica pode ser comprovada ou desmentida nos mesmos termos em
que é possível nas hard sciences, onde a falseabilidade está presente sempre e onde a relação é de
causalidade.
Por isso, acreditamos que Lee Loevinger, em “Jurimetrics: the next step foward”, talvez
tenha extrapolado a extensão do método científico em algumas de suas elaborações, sendo
excessivamente otimista quanto à sua aplicabilidade e à sua propensão de resolver todas as
imperfeições que o afligiam.
Talvez por reconhecer isso, quatorze anos depois da publicação do seu primeiro artigo
sobre o tema, Loevinger, em outra obra, surge com um tom conciliador, aparando as arestas que
ficaram de suas primeiras proposições. Numa das passagens, ele diz:
[...] jurimetrics does not seek to oust jurisprudence, philosophy, or faith from
men’s life. These, too, have their place. There will always be assumptions and
choices to be made by the free spirit of a man, and no scientific operation or test
can properly make or constrain such choices. 7
6
FERRAZ JÚNIOR, Tércio Sampaio. Introdução ao Estudo do Direito: técnicam decisão, dominação – 7 ed. –
São Paulo: Atlas, 2013. p. 227.
7
LOEVINGER, Lee.The methodology of legal inquiry. Minnesota Law Review, Winter, 1963. p. 34-35.
18
Outra passagem de sua autoria é ainda mais incisiva em negar a possibilidade da ciência resolver
o problema da decisão jurídica:
To begin with we must be clear that science offers us neither ultimate nor certain
answers to legal problems. The dream that science might some day tell us wich of
several competing interests was the more important is a vain one. Science essay
no such answers in any field. Science does not assign social or ethical values.
Science may, indeed, provide data from which social or ethical judgements may
be made; but the judgements will remain with man. 8
Não é possível saber se essa era a visão de Loevinger desde o início, e se ele simplesmente
não teve o cuidado de expressar ela no seu primeiro artigo, ou se se trata de uma percepção que ele
desenvolveu posteriormente. O que sabemos com segurança é que o intuito da Jurimetria não é
matematizar processos decisórios, e que ela se dedica, na verdade, ao fornecimento de evidências
empíricas.
Estudos empíricos são baseados na observação dos fenômenos e podem ser replicados.
Podem ser, também, qualitativos ou quantitativos. Loevinger, como vimos, sabia do potencial da
estatística - os dois primeiros exemplos que ele fornece são estudos estatísticos -, e a exaltou em
várias passagens, relacionando-a às atividades dos cientistas9. Numa delas, diz que se trata do ramo
da matemática mais adequado no campo do Direito10.
Apesar disso, ele jamais restringiu a Jurimetria exclusivamente à utilização da estatística.
Ele persiste definindo Jurimetria como a aplicação do método científico ao Direito.
Essa relutância em fornecer uma definição mais clara se deve, provavelmente, à vontade
de Loevinger de manter a amplitude da disciplina que ele havia criado. Nós dizemos isso porque,
no meio da vagueza conceitual, a única coisa de que ele parecia estar certo, e que pode ser admitida
sem equívoco, era de que a Jurimetria deveria englobar muitas coisas. Prova disso são os exemplos
de aplicação que o autor enumerou - dos quais trouxemos cinco - que abarcam até a utilização de
aparatos computacionais para recuperação de acervos jurisprudenciais.
A definição que relaciona a Jurimetria às pesquisas empíricas e, mais especificamente, à
estatística, no entanto, foi a que prosperou aqui no Brasil. Por isso dissemos no início do capítulo
que antes Jurimetria não significava somente medir o Direito, mas que, hoje, a definição está certa.
8
LOEVINGER, Lee. Science preditiction in the field of law. Minnesota Law Review, September 1962. p. 200
9
LOEVINGER, Lee.The methodology of legal inquiry. Minnesota Law Review, Winter, 1963. p.5.
10
LOEVINGER, Lee. Science preditiction in the field of law. Minnesota Law Review, September 1962. p. 193
19
É difícil, apesar disso, embasar essa escolha somente na da obra de Loevinger. Ele,
claramente, tinha pretensões maiores, e, apesar de não o verbalizar, sugeria um conceito muito mais
abrangente em suas colocações.
Apesar de toda essa situação, a redução da Jurimetria à utilização da estatística não nos
parece errada, porque o empirismo e a investigação científica dos problemas do Direito 11 eram os
alicerces do que Loevinger dizia. Além disso, a nova definição acaba por contornar, talvez
inintencionalmente, o otimismo exacerbado de Loevinger em relação ao método científico,
aproveitando, contudo, suas recomendações quanto à utilização da estatística.
O fenômeno jurídico não se desembaraça teoricamente, apenas. Ele é observável em
muitos de seus aspectos, e o maior legado de Loevinger talvez tenha sido simplesmente apontar a
necessidade de mais dessa observação. A linha de pesquisa jurimétrica possui fortes laços com o
realismo jurídico, no sentido de que se volta para o plano concreto do Direito 12.
Essa perspectiva herda todas as críticas sofridas pelo realismo jurídico. Quando se impõe
que o objeto de estudo são os aspectos observáveis de um fenômeno social, toda a dimensão
filosófica e conceitual se distancia, e isso pode gerar suspeitas sobre as intenções desse tipo de
estudo.
Outras ciências sociais, no entanto, já se defrontaram com as restrições que a busca por
evidências empíricas traz e souberam encontrar seus espaços. Foi, justamente, o processo de
amadurecimento dessas outras disciplinas empíricas sociais que permitiu que elas evoluíssem e se
estabelecessem.
A psicometria, por exemplo, circunscreve-se à aplicação de questionários e testes para
mensurar habilidades e traços de personalidade 13. O que se está tentando avaliar - inteligência,
extroversão, etc - são conceitos imateriais, mas que, quando enxergados como atributos das
pessoas, adquirem uma faceta numérica depois que se estipula uma escala de valores relacionados
ao resultado de testes. Ou seja, os fenômenos psíquicos são medidos indiretamente, por suas
expressões concretas, e não se cogita sobre juízos de valor ou conceituações.
A Jurimetria, da mesma forma, não pretende negar ou substituir os mecanismos de
contrapesos teóricos e subjetivos em ação. Ela estava destinada a se ocupar apenas da mensuração
11
LOEVINGER, Lee. Jurimetrics the next step forward. Minnesota Law Review, April, 1949. p. 31
12
NUNES, Marcelo Guedes. Jurimetria: como a estatística pode reinventar o Direito – São Paulo: Editora Revista
dos Tribunais, 2016. p. 112.
13
PSYCHOMETRIC SOCIETY. Whats is Psychometric. Disponível em:<
https://www.psychometricsociety.org/content/what-psychometrics>. Acesso em: 04 de março de 2019.
20
14
NUNES, Marcelo Guedes. Jurimetria: como a estatística pode reinventar o Direito – São Paulo: Editora Revista
dos Tribunais, 2016. p. 115.
15
HARVARD LAW SCHOOL. Harvard Empirical Legal Studies Series. Disponível em:<
https://hls.harvard.edu/dept/graduate-program/harvard-empirical-legal-studies-series/>. Acesso em: 04 de março de
2019.
21
1.2. APLICAÇÕES
16
INVESTOPIA. Econometrics Definition. Disponível em:<
https://www.investopedia.com/terms/e/econometrics.asp>. Acesso em: 05 de março de 2019.
17
BERNOULLI, Nicolaus M. The use of the Art of conjecturing in Law. Doctorate Degree in both Roman and Canon
law legitimately acquired. Fatherland’s University. On the day 14 June A.C. MDCCIX. p. 19.
18
Ibid., p. 19.
19
Artigo 7º, Código Civil: “Pode ser declarada a morte presumida, sem decretação de ausência:
I - se for extremamente provável a morte de quem estava em perigo de vida;
22
II - se alguém, desaparecido em campanha ou feito prisioneiro, não for encontrado até dois anos após o término da
guerra.
Parágrafo único. A declaração da morte presumida, nesses casos, somente poderá ser requerida depois de esgotadas as
buscas e averiguações, devendo a sentença fixar a data provável do falecimento. ”
20
MACHADO, Maíra Rocha. Pesquisar Empiricamente o Direito. São Paulo: Redes de Estudos Empíricos em
Direito, 2017. p. 249.
21
NUNES, Marcelo Guedes. Jurimetria: como a estatística pode reinventar o Direito – São Paulo: Editora Revista
dos Tribunais, 2016. p.100
23
22
EJLT EUROPEAN JOURNAL OF LAW AND TECHNOLOGY. Jurimetrics Please! Disponível em:<
http://ejlt.org/article/view/13>. Acesso em: 08 de março de 2019.
23
ARIZONA STATE UNIVERSITY. Jurimetrics Journal. Disponível em:< https://law.asu.edu/jurimetrics>. Acesso
em: 08 de março de 2019.
24
BRASIL. Conselho Nacional de Justiça. Justiça em Números. Disponível em:< http://www.cnj.jus.br/pesquisas-
judiciarias/justicaemnumeros/2016-10-21-13-13-04/pj-justica-em-numeros>. Acesso em: 09 de março de 2019.
24
Justiça em Números é apenas uma das inúmeras pesquisas realizadas pelo CNJ, que possui um
extenso acervo25.
Também podemos citar o relatório Supremo em números26, produzido pela Fundação
Getúlio Vargas do Rio de Janeiro e, finalmente, a Associação Brasileira de Jurimetria. Esta última
merece especial atenção.
Fundada em 2011, a Associação Brasileira de Jurimetria realiza pesquisas contundentes
sobre a efetividade das leis e sobre o funcionamento do Poder Judiciário. Suas indagações, no
entanto, se diferenciam das do CNJ por serem centradas, usualmente, em problemas específicos,
aspirando à apresentação de soluções.
Dentre esses estudos, alguns são mais emblemáticos pela gravidade, se é que podemos
assim dizer, de suas descobertas. Um deles27, nosso favorito, sobre reformas de decisão nas câmaras
de direito criminal de São Paulo, descobriu que as taxas de reforma variam consideravelmente entre
as câmaras, indo de dezesseis por cento na décima segunda câmara a oitenta e um por cento na
quarta câmara.
Considerando que os processos são randomicamente distribuídos, isso sugere uma
diferença importante no perfil das câmaras.
Outra informação reveladora trazida nesse mesmo trabalho foi que baixas taxas de reforma
de decisões da primeira instância estavam associadas a alguns tipos penais específicos, como o
homicídio qualificado, em que 66,9% dos recursos são negados. Crimes de trânsito, na outra ponta,
têm somente 36,4% por cento dos recursos rejeitados.
De sua fundação para cá, a ABJ mantém um ritmo acelerado de publicações de grande
impacto28, como o que foi citado, e também se ocupa da disseminação acadêmica da Jurimetria,
visando à sua consolidação como disciplina do Direito.
Na esfera privada, por outro lado, é comum a interação de advogados com executivos de
outras áreas, sejam clientes, sejam outros funcionários da empresa em que atuam. Escritórios e
departamentos internos são constrangidos a fornecer previsões assertivas sobre resultados de
25
BRASIL. Conselho Nacional de Justiça. Pesquisas Judiciárias. Disponível em:<http://www.cnj.jus.br/pesquisas-
judiciarias>. Acesso em: 10 de março de 2019.
26
FUNDAÇÃO GETÚLIO VARGAS. Supremo em Números. Disponível
em:<http://www.fgv.br/supremoemnumeros/>. Acesso em: 10 de março de 2019.
27
BRASIL. ABJ – Associação Brasileira de Jurimetria. Reformas de decisão nas câmaras de direito criminal em
São Paulo. Disponível em: <https://abj.org.br/cases/camaras-2/>. Acesso em 10 de março de 2019.
28
BRASIL. ABJ – Associação Brasileira de Jurimetria. Atuação. Disponível em: <https://abj.org.br/cases/>. Acesso
em: 10 de março de 2019.
25
processos, a perder menos disputas judiciais e a colaborar para outras áreas do negócio, o que faz
com que advogados tenham que aprender a analisar dados, a utilizar ferramentas e métodos de
gestão, a introduzir KPIs e metas em suas atividades e a construir gráficos.
É como se a prática jurídica tivesse ganhado uma nova dimensão, afeita ao conceito de
business intelligence29, que não se importa só com os casos concretos isoladamente, mas com o
impacto estratégico e financeiro que têm todos eles juntos.
Nos Estados Unidos, essa perspectiva adotou o nome de Legal Analytics, mas aqui no
Brasil essa tendência coincidiu com a recuperação e projeção do conceito de Jurimetria, encabeçada
por Marcelo Guedes.
Apesar de receber nomes diferentes, nos dois países nascem anualmente uma profusão de
empresas que oferecem serviços desse nicho, geralmente voltados à análise de carteiras de
processos judiciais de empresas. São as LawTechs e LegalTechs, que combinam conhecimento
jurídico com soluções tecnológicas, inclusive para análise de dados judiciais 30.
Esse mercado deve crescer à medida que a competição entre escritórios for se estreitando,
e que alguns departamentos comecem a se destacar no cenário nacional como departamentos
inovadores, e a tendência, com isso, é que advogados que saibam lidar com números se tornem
indispensáveis para a tomada de decisões estratégicas.
Não se admite mais, em grandes bancas e companhias, que um advogado não saiba
manejar planilhas, gerar demonstrativos e coordenar equipes. As habilidades tradicionais de um
advogado permanecem necessárias, mas, se antes eram aplicáveis pontualmente, agora precisam
ser utilizadas para mapear e determinar quais processos e circunstâncias dos processos mais
importam, para que sejam estudados quantitativamente.
Nesse sentido, voltada para a análise de carteiras de processos, a Jurimetria faz mais
sentido para empresas que respondam a muitas demandas judiciais, especialmente as trabalhistas e
consumeristas, e para escritórios que trabalhem com esses tipos de causas, usualmente chamadas
de demandas de massa.
A análise conjunta de processos oferece uma nova perspectiva do fenômeno jurídico,
diferente da pesquisa jurisprudencial convencional, porque substitui o estudo das teses e arranjos
29
OLLAP. What is Business Intelligence (BI)? Disponível em: <http://olap.com/learn-bi-olap/olap-bi-
definitions/business-intelligence/>. Acesso em: 11 de março de 2019.
30
CONVEX. Inteligência de negócios para performance e eficiência. Disponível em:<
https://www.softplan.com.br/convex/o-convex/>. Acesso em: 11 de março de 2019.
26
teóricos aplicáveis a cada caso concreto pelo estudo coletivo dos processos, em busca de padrões
que possam ser explorados estrategicamente.
Por meio da estatística, é possível localizar tendências relacionadas aos tipos de causa, às
localidades, às partes envolvidas, à legislação aplicada, aos órgãos julgadores e ao tempo em que
as decisões foram proferidas. Esses são insumos para se gerar probabilidades de perdas
relacionadas a demandas específicas, com base nos seus históricos; identificar curvas de aumento
e diminuição do número e valores de processos durante os anos, para provisionar adequadamente
o dinheiro que será usado para custear condenações judiciais; antecipar processos de risco e
anomalias envolvendo produtos e serviços; traçar estratégias de vitória considerando
particularidades locais; gerir melhor escritórios terceirizados e implementar políticas de acordo que
considerem as especificidades dos casos.
O crescimento dessa área é tão grande que já são oferecidos cursos específicos para
advogados que queiram se especializar na análise de dados31, e algumas faculdades de Direito
começaram a ofertar Jurimetria como curso de extensão 32.
A facilitação no acesso aos autos e às informações processuais, decorrente da
digitalização, é, certamente, um dos principais fatores para Jurimetria esteja se desenvolvendo tão
rapidamente.
Outro fator, peculiar do Brasil, que o torna, possivelmente, o melhor país do mundo para
se fazer Jurimetria, é sua enorme quantidade de processos judiciais. O último relatório Justiça em
Números33, publicado em dois mil e dezoito, referente ao ano de dois mil e dezessete, mostrou que,
naquele ano, o Poder Judiciário recebeu vinte e nove milhões e cem mil novos processos judiciais.
Somados aos processos que ainda aguardavam julgamento, perfizeram a totalidade de oitenta
milhões de processos aguardando julgamento, no final de dois mil e dezessete.
Essas informações são empolgantes, mas há muitas barreiras a serem transpostas até que
todo o potencial dos estudos jurimétricos seja revelado, e também até que seus limites sejam
delimitados. Esse caminho passa pelo aprendizado conjunto de juristas e estatísticos sobre quais
fenômenos são observáveis quantitativamente, e por que meios, quais o são indiretamente, e em
31
FUTURE LAW. Cursos e Atividades. Disponível em:< http://futurelaw.com.br/>. Acesso em 11 de março de 2019.
32
HARVARD LAW SCHOOL. Analytical Methods for Lawyers. Disponível
em:<https://hls.harvard.edu/academics/curriculum/catalog/index.html?o=64299>. Acesso em 11 de março de 2019.
33
BRASIL. Conselho Nacional de Justiça. Justiça em Números 2018: ano-base 2017. Disponível
em:<http://www.cnj.jus.br/files/conteudo/arquivo/2018/09/8d9faee7812d35a58cee3d92d2df2f25.pdf> Acesso em 11
de março de 2018.
27
que medida, e quais fogem à alçada da estatística. Isso influi, decisivamente, na retidão
metodológica e no sucesso das decisões que serão tomadas baseadas nessas pesquisas.
28
Partindo da premissa de que a Jurimetria faz uso de estatística, é preciso conhecer seus
fundamentos e principais fases antes de fazer considerações sobre sua aplicação no Direito. Por
isso vamos enumerar as etapas do método estatístico exemplificando, quando possível, como se
desenrolariam numa pesquisa jurimétrica sobre processos judiciais.
A) Definição do Problema
A primeira do método estatístico é a fase de colocação do problema, quando se deve
formular a pergunta que será respondida pela pesquisa. A pesquisa jurimétrica, particularmente, se
estrutura em torno da busca por evidências estatísticas que ajudem a elucidar alguma questão
importante para o Direito.
Antes de se especificar, contudo, quais indivíduos e variáveis que devem ser analisados
para responder à questão problema, é imprescindível estabelecer um modelo conceitual do
fenômeno que será estudado, para que se possa enxergar quais relações são possíveis 35 e, só depois,
filtrar as que possam ser analisadas estatisticamente, e por que meios.
Isso serve para evitar, no caso da Jurimetria, que questões teóricas se tornem objeto de
estudos jurimétricos. Como viemos dizendo, a Jurimetria só acessa os aspectos observáveis do
fenômeno jurídico. Em relação à hermenêutica, uma pergunta do tipo “Qual é a melhor técnica de
interpretação: a sistemática ou a teleológica? ”, jamais poderia ser respondida empiricamente.
Seria possível, no entanto, perguntar: “Qual método de interpretação constitucional foi
mais invocado pelos ministros do Supremo Tribunal Federal no último ano: o sistemático ou o
teleológico? ”. Há uma diferença importante entre as duas, porque a segunda pode ser respondida
empiricamente e a primeira não.
O problema, além disso, precisa ser claro, preciso e delimitado às possibilidades da
pesquisa. Na pergunta que trouxemos como exemplo, sem restringir a análise ao STF, e a um ano,
é pouco provável que a questão pudesse ser respondida em tempo satisfatório.
34
CORREA, Sônia Maria Bastos. Probabilidade e estatística – 2ª ed. - Belo Horizonte: PUC Minas Virtual, 2003.
Dosponível em:< http://estpoli.pbworks.com/f/livro_probabilidade_estatistica_2a_ed.pdf>. Acesso em: 13 de março
de 2019.
35
HAIR JR, Joseph F. et al. Análise Multivariada de Dados – 6ª ed. – Porto Alegre: Bookman, 2009.
29
B) Planejamento
Depois de formulada a pergunta, é necessário delinear os caminhos que levarão à sua
resolução. Do ponto de vista estatístico, isso compreende definir se o estudo deve ser um estudo
populacional ou amostral, e quais variáveis devem ser analisadas.
Posteriormente, tem-se que identificar os meios para se conseguir os dados que serão
analisados. Num estudo sobre processos judiciais, como veremos mais à frente, há poucas
possibilidades para se conseguir acesso a eles: ou se baixa diretamente dos sites dos tribunais ou
se utiliza uma base pronta, fornecida por algum órgão judicial ou por uma empresa privada.
Isso deve estar previsto no planejamento porque pode ser necessário fazer requerimentos,
ou realizar preparações técnicas. Quando se planeja o passo a passo da pesquisa, pode-se acabar
por descobrir que os dados necessários, apesar de disponíveis, sejam difíceis de se conseguir, e é
melhor que se dê conta disso o quanto antes.
Do ponto de vista logístico, na fase de planejamento deve-se calcular os custos envolvidos
na pesquisa, avaliar a necessidade de contratações e também definir o cronograma. Esses cuidados
são importantes especialmente se se tratar de um estudo jurimétrico contratado 36.
C) Coleta de Dados
Nesse momento, os pesquisadores devem colher, efetivamente, as informações que serão
analisadas. Como dissemos há pouco, tratando-se de processos judiciais, é possível acessá-los
diretamente nos portais dos tribunais ou consultar um banco de dados interno de alguma empresa.
É possível, ainda, que seja necessário procurar por dados diretamente nos autos, caso não estejam
disponíveis fora deles.
36
BRASIL. Conselho Nacional de Justiça. Pesquisas Contratadas. Disponível em: <http://www.cnj.jus.br/pesquisas-
judiciarias#Pesquisas-contratadas. > Acesso em: 14 de março de 2019.
30
Essa etapa costuma ser a mais tecnológica de todas, demandando aparatos computacionais
sofisticados, mas não se deve eliminar a possibilidade da realização de levantamentos manuais.
Falaremos mais sobre isso adiante.
D) Apuração dos dados37
A fase de apuração consiste numa etapa de tratamento dos dados. Isso geralmente é feito
pela contagem da frequência das variáveis.
Num estudo jurimétrico, por exemplo, a fase de apuração compreenderia calcular em
quantos dos processos trabalhistas pesquisados foi encontrado o pedido de indenização por assédio
moral.
Esse procedimento depende do formato em que as informações foram armazenadas
durante a fase de coleta, geralmente distribuídas em planilhas, e da quantidade de variáveis que
foram levantadas, o que pode implicar mais ou menos categorias.
Para aligeirar essa fase, costuma-se utilizar aparatos computacionais, que podem envolver
desde a utilização de tabelas dinâmicas no Excel até a construção de algoritmos específicos para
organização e limpeza de dados.
37
BERGAMASHI, D.; SOUZA, J.; MENEZES, R. Bioestatística Básica. São Paulo: USP, 2016. Disponível em:
<http://www.fsp.usp.br/~denisepb/es5101/Apostila.pdf>. Acesso em: 13 de março de 2019.
38
CORREA, Sônia Maria Bastos. Probabilidade e estatística – 2ª ed. - Belo Horizonte: PUC Minas Virtual, 2003.
Disponível em:< http://estpoli.pbworks.com/f/livro_probabilidade_estatistica_2a_ed.pdf>. Acesso em: 13 de março de
2019.
31
Essa modalidade tem como vantagem a possibilidade de reunir numa mesma apresentação
um volume grande de informações, mas, por outro lado, é mais trabalhosa de ser interpretada em
relação à apresentação gráfica.
39
BISQUERRA, Rafael. Introdução à Estatística: enfoque informático com o pacote estatístico SPSS – Porto
Alegre: Artmed, 2004.
40
WATKINS, Joseph C. An Introduction to the Science of Statistics: From Theory to Implementation. Disponível
em: <https://www.math.arizona.edu/~jwatkins/statbook.pdf>. Acesso em: 14 de março de 2019.
32
41
ESCOTET, 1973, p. 11 apud BISQUERRA, Rafael; SARRIERA, Jorge C., MATÍNEZ, Francesc. Introdução a
Estatística: Enfoque informático com o pacote estatístico SPSS. Porto Alegre: Artmed, 2004. p. 17.
33
Isso não tem nada a ver, é importante dizer, com os recortes de que falamos. Uma vez que
se tenha feito um recorte, tudo o que sobra é a população. A noção de amostra é, portanto, posterior
a dos recortes.
Para a seleção de amostras há, inclusive, metodologías específicas. A mais comum é a de
amostragem probabilística, em que os indivíduos são selecionados ao acaso dentro da população.
Dessa maneira, ensina Rafael Bisquerra, et al, “todos os indivíduos da população têm as mesmas
probabilidades de fazerem parte da amostra”.42
Cada indivíduo, no entanto, costuma se diferenciar dos demais em relação a algumas de
suas características, e cada uma dessas catecterísticas, para a estatística, é uma variável. A definição
apresentada por Rafael Bisquerra é: “Uma variável é uma característica que pode adotar diferentes
valores”.43
Por exemplo: todos os processos judiciais possuem uma causa raiz - vamos ignorar, por
ora, que possam envolver mais de uma. Por isso se pode dizer que a causa raíz é uma variável dos
processos judiciais.
Os processos criminais, por exemplo, podem tratar de tipos penais diversos, de forma que
se fossem selecionados processos penais ao acaso, nesse conjunto se encontraria indivíduos
relacionados aos mais variados crimes, como roubo, homicídio e tráfico de drogas.
Ainda em matéria penal, outras variáveis dos processos poderiam ser a data em que a
denúncia ou a queixa foi apresentada, a etnia do réu e se ele já possui antecedentes.
Dependendo dos valores que as variáveis possam assumir, segundo o critério sistema de
medição, classifica-se elas como uma de duas categorias possíveis: se a variável assumir valores
quantificáveis, trata-se de uma variável quantitativa. Se a variável não puder ser quantificada, trata-
se de uma variável qualitativa, usualmente chamada de categórica44.
A seguir, vamos elencar alguns tipos indivíduos jurimétricos e as variáveis a eles
relacionadas, apontando a categoria em que elas estariam inseridas, para que fique intuitiva a
compreensão:
A) Variáveis quantitativas: em relação aos indivíduos condenações por danos
morais, o seu valor; em relação aos indivíduos tribunais do júri, a quantidade de
42
BISQUERRA, Rafael; SARRIERA, Jorge C., MATÍNEZ, Francesc. Introdução a Estatística: Enfoque
informático com o pacote estatístico SPSS. Porto Alegre: Artmed, 2004. p. 19.
43
Ibid., p. 20.
44
Ibid., p. 22-23.
34
Sobre as frequências, Pedro Morettin e Wilton Bussab dispõem que “quando se estuda
variáveis, o maior interesse do pesquisador é conhecer seus comportamentos, analisando a
ocorrência de suas realizações”.45 Essas realizações podem ser numericamente expressas pois,
assim como os indivíduos que as portam, também podem ser contadas. O valor numérico associado
à quantidade de ocorrências de uma variável é, justamente, o que se chama de frequência.
Uma maneira especialmente prática de visualizar frequências é distribuindo-as em tabelas.
Nesse tipo de tabela - cujo nome é tabela de frequência -, encontram-se dois tipos de frequências:
as absolutas e as relativas.
As frequências absolutas indicam as ocorrências de cada uma das categorias. Ou seja, a
frequência absoluta diz quantas vezes aquela variável existiu.
Já as frequências relativas indicam a razão entre as ocorrências de uma categoria e as
ocorrências de todas as categorias somadas 46, e são comumente expressas em porcentagens.
45
MORETTIN, Pedro Alberto. Estatística Básica – 6. ed. – São Paulo : Saraiva, 2010. p. 11.
46
ISOTALO, Jarkko. Basics of Statistics. Disponível em: <https://www.mv.helsinki.fi/home/jmisotal/BoS.pdf>.
Acesso em: 14 de março de 2019.
35
No Direito, há diversas finalidades para as quais se pode imaginar utilizar tabelas com
frequências relativas e absolutas. Uma das aplicações mais promissoras da Jurimetria, no entanto,
é enquanto ferramenta de gestão inteligente de processos judiciais, por isso concentraremos nossos
exemplos, a partir de agora, em situações vividas por gestores jurídicos.
Considerando, hipoteticamente, que um banco possua agências em três cidades - apenas
uma em cada -, e que responda a 4 tipos diferentes de processos em cada uma delas, um gerente
jurídico poderia se perguntar quais demandas são mais comuns, e quais são menos, para iniciar um
esforço de diminuição de processos judiciais.
Essa postura do advogado se chama advocacia preventiva, e se caracteriza pela proposição
de boas práticas internas, pela sugestão de adequações na prestação dos serviços e pelo
oferecimento de treinamentos aos funcionários, visando à diminuição das situações ensejadoras de
litígios antes que eles ocorram.
Seria possível construir, para facilitar essa tarefa, uma tabela de frequências em que se
observaria a variável causa raíz e a distribuição de frequência de suas categorias:
Como se vê acima, cada linha corresponde a uma modalidade possível da variável causa
raíz, de modo que na coluna do meio estejam dispostas suas frequências absolutas e, na terceira
coluna, suas frequências relativas.
O gerente poderia, ainda, estar interessado na distribuição desses processos entre as
cidades, porque tem a intuição de que numa delas há uma quantidade maior. Com essa finalidade,
ele poderia construir outra tabela, considerando a variável cidade:
36
As duas tabelas, apesar de muito úteis, oferecem possibilidades limitadas de análise. Isso
ocorre porque ambas são tabelas univariadas, em que somente o comportamento de uma variável
é observado.
Se o gerente estivesse empenhado em diminuir drasticamente a quantidade de processos
judiciais, e para isso pretendesse iniciar promovendo um treinamento com os funcionários de um
único setor de uma das agências, ele, com as duas últimas tabelas, não saberia aonde ir.
Com esse propósito, ele talvez construisse três tabelas univariadas, em que listasse a
quantidade de processos por causa em cada uma das cidades. As tabelas ficariam assim:
Frequência Frequência
Assunto
Absoluta Relativa
Cobrança Indevida 600 27,03%
Tempo fila de espera 950 42,79%
Envio cartão de crédito não solicitado 500 22,52%
Constrangimento porta giratória 170 7,66%
Total 2220 100,00%
Frequência Frequência
Assunto
Absoluta Relativa
Cobrança Indevida 1300 57,78%
Tempo fila de espera 450 20,00%
Envio cartão de crédito não solicitado 350 15,56%
Constrangimento porta giratória 150 6,67%
Total 2250 100,00%
Frequência Frequência
Assunto
Absoluta Relativa
Cobrança Indevida 100 18,87%
Tempo fila de espera 100 18,87%
Envio cartão de crédito não solicitado 150 28,30%
Constrangimento porta giratória 180 33,96%
Total 530 100,00%
Observa-se que as frequências relativas, em situações como essa, se tornam inúteis, e que,
além disso, seria preciso realizar buscas em várias tabelas, comparando, por vezes, os números de
uma com as de outra, dependendo da análise que se quisesse fazer.
Se a tarefa não parece tão difícil, é porque estamos considerando poucas categorias. Com
muitas, a análise de tabelas univariadas pode se tornar simplesmente impraticável.
Felizmente, para facilitar a observação conjunta do comportamento de duas variáveis,
existe um tipo de tabela de frequência específico.
38
Tipo de causa
Cidade Cartão Total
Cobrança Fila de Porta
não
indevida espera giratória
solicitado
Cidade
A 600 950 500 170 2220
Cidade
B 1300 450 350 150 2250
Cidade
C 100 100 150 180 530
Total 2000 1500 1000 500 5000
47
MORETTIN, Pedro Alberto. Estatística Básica – 6. ed. – São Paulo : Saraiva, 2010. p. 69.
48
Ibid., p. 70.
49
Ibid., p. 70.
39
Essa é uma tabela 3 x 4, o que significa que a primeira variável pode assumir três
modalidades e a segunda quatro, mas isso não é uma regra. As tabelas de contingência mais
utilizadas são, na verdade, as 2 x 2.
Nessa tabela, observa-se, estão distribuídas frequências absolutas. Seria possível, contudo,
melhorar a percepção desses dados, utilizando, para isso, novamente frequências relativas, ao invés
de frequências absolutas.
Pedro Alberto Morettin, em relação às tabelas de contingência, ensina que as frequências
relativas podem se dar pela razão em relação ao total geral - soma dos valores de todas as células
do corpo da tabela -, ou em relação ao total de cada linha ou cada coluna, e uma delas será mais
conveniente, dependendo do problema em estudo.50
Como estamos interessados em descobrir a origem da maior quantidade de processos
judiciais, considerando a causa raiz e a localidade, o que nos importa é a proporção em relação ao
todo. A tabela ficaria da seguinte forma
Tipo de causa
Cidade Cartão Total
Cobrança Fila de Porta
não
indevida espera giratória
solicitado
Cidade A 12,00% 19,00% 10,00% 3,40% 44,40%
Cidade B 26,00% 9,00% 7,00% 3,00% 45,00%
Cidade C 2,00% 2,00% 3,00% 3,60% 10,60%
Total 40,00% 30,00% 20,00% 10,00% 100,00%
Cada uma das porcentagens do corpo da tabela - portanto exclui-se do que estamos prestes
a dizer as frequências nas linhas e colunas dos totais - foi feita dividindo a frequência absoluta de
cada célula pelo total da soma de todas as células. Quer dizer, para computar a proporção das causas
envolvendo cobrança indevida na cidade A, a conta realizada foi 600 / 5000 × 100, o que gerou um
percentual de 12%. O procedimento foi replicado nas demais células.
É possível visualizar, finalmente, que os processos sobre cobrança indevida na cidade B
representam 26% do volume total de processos do banco, tratando-se da situação mais crítica.
50
MORETTIN, Pedro Alberto. Estatística Básica – 6. ed. – São Paulo : Saraiva, 2010. p. 70.
40
Tipo de causa
Resultado Cartão Total
Cobrança Fila de não Porta
Indevida espera solicitado giratória
Procedente 1300 600 600 100 2600
Improcedente 700 900 400 400 2400
Total 2000 1500 1000 500 5000
51
MORETTIN, Pedro Alberto. Estatística Básica – 6. ed. – São Paulo : Saraiva, 2010. p. 7.
41
Tipo de causa
Resultado Cartão Total
Cobrança Fila de não Porta
Indevida espera solicitado giratória
Procedente 65,00% 40,00% 60,00% 20,00% 52,00%
Improcedente 35,00% 60,00% 40,00% 80,00% 48,00%
Total 100,00% 100,00% 100,00% 100,00% 100,00%
52
ISOTALO, Jarkko. Basics of Statistics. Disponível em: <https://www.mv.helsinki.fi/home/jmisotal/BoS.pdf>.
Acesso em: 14 de março de 2019.
42
53
BISQUERRA, Rafael; SARRIERA, Jorge C., MATÍNEZ, Francesc. Introdução a Estatística: Enfoque
informático com o pacote estatístico SPSS. Porto Alegre: Artmed, 2004. p. 105.
54
BRASIL. ABJ – Associação Brasileira de Jurimetria. Atuação. Disponível em: <https://abj.org.br/cases/>. Acesso
em: 15 de março de 2019.
55
Ibid., p. 103.
56
Ibid., p 105.
43
57
MORETTIN, Pedro Alberto. Estatística Básica – 6. ed. – São Paulo : Saraiva, 2010. p. 75.
44
58
BRASIL. Associação Brasileira de Lawtechs & Legaltechs. Radar de Lawtechs e Legaltechs. Disponível em:
<https://www.ab2l.org.br/radar-lawtechs/>. Acesso em 15 de março de 2019.
45
muito conhecimento contido nos processos judiciais que poderia ser utilizado para finalidades
escusas, que poderiam ir de encontro à segurança pública, à livre concorrência e mesmo à soberania
nacional59.
Outro possível motivo são os custos envolvidos na construção de sistemas que
suportassem o enorme tráfego de informações, caso muitos usuários decidissem baixar os dados
todos de uma vez. Fala-se, inclusive, sobre a possibilidade de futura cobrança pelo download das
informações dos tribunais, como uma medida para mitigar os efeitos negativos desses acessos e
restringir, de certa forma, quem tem acesso a eles.
Por conta disso, os sites dos tribunais não são preparados para se comunicarem com
programas de computador, por meio de APIs 60, somente para serem acessados por seres humanos,
que, em tese, fariam pesquisas pontuais, apenas sobre os processos de seus interesses diretos.
Para contornar essa limitação proposital das páginas, os jurimetristas vêm utilizando uma
tecnologia chamada Web Scraping, que, basicamente, simula o comportamento de um usuário
humano, só que o faz repetidas vezes, automaticamente.
As ferramentas de Web Scraping costumam ser programadas nas linguagens R e Python
e são capazes de acessar os sites dos tribunais e dos diários oficiais 61, fazer buscas e realizar o
download de informações. A esse processo dá-se o nome de raspagem de dados.
Para ilustrar a utilização dessa tecnologia, podemos citar o estudo sobre reformas de
decisão nas câmaras de direito criminal do estado de São Paulo 62, realizado pela ABJ, no qual a
tecnologia de Web Scraping foi utilizada nas páginas do e-SAJ63 daquele estado. O aparato foi
programado para localizar todos os processos dos órgãos julgadores definidos na seção “Direito
Criminal”, fazendo apenas um recorte temporal - o estudo considerou apenas julgados no ano de
2014.
59
SANTIAGO, Fernando. Contrato entre TJ-SP e Microsoft pode atropelar Lei Geral de Proteção de Dados.
Disponível em: <https://politica.estadao.com.br/blogs/fausto-macedo/contrato-entre-tj-sp-e-microsoft-pode-atropelar-
lei-geral-de-protecao-de-dados/>. Acesso em 15 de março de 2019.
60
Para mais informações sobre o funcionamento das APIs, recomenda-se a leitura da seguinte reportagem:
<https://www.tecmundo.com.br/programacao/1807-o-que-e-api-.htm>. Acesso em: 17 de março de 2019.
61
BRASIL. Tribunal de Justiça de São Paulo. Diário de Justiça Eletrônico. Disponível em: <
http://www.dje.tjsp.jus.br/cdje/index.do>. Acesso em 17 de março de 2019.
62
BRASIL. ABJ – Associação Brasileira de Jurimetria. Reformas de decisão nas câmaras de direito criminal em
São Paulo. Disponível em: <https://abj.org.br/cases/camaras-2/>. Acesso em 20 de março de 2019.
63
BRASIL. Tribunal de Justiça de São Paulo. Consulta de Julgados de 1º Grau. Disponível em:
<https://esaj.tjsp.jus.br/cjpg/>. Acesso em 20 de março de 2019.
46
64
BRASIL. Conselho Nacional de Justiça. Link dos Tribunais. Disponível em: <http://www.cnj.jus.br/poder-
judiciario/portais-dos-tribunais>. Acesso em 20 de março de 2019.
65
GOOGLE. O que é CAPTCHA?. Disponível em: <https://support.google.com/a/answer/1217728?hl=pt-BR>.
Acesso em 22 de março de 2019.
66
Artigo 2º, Resolução nº 121, Conselho Nacional de Justiça: “Os dados básicos do processo de livre acesso são:
I- número, classe e assuntos do processo;
II- nome das partes e seus advogados;
III- movimentação processual;
IV- inteiro teor das decisões, sentenças, votos e acórdãos.
67
Os advogados passaram a ter, recentemente, acesso ao inteiro teor de todos os processos judiciais, mesmo daqueles
em que não estiver atuando. BRASIL. Lei 13.793/2019. Altera as Leis n os 8.906, de 4 de julho de 1994, 11.419, de 19
de dezembro de 2006, e 13.105, de 16 de março de 2015 (Código de Processo Civil), para assegurar a advogados o
47
Para padronizar os dados do Poder Judiciário, especialmente os tipos e assuntos das ações,
o CNJ implantou o Sistema de Gestão de Tabelas Processuais Unificadas68, que determina uma
numeração correspondente a cada tipo de procedimento, assunto e movimento dos processos
judiciais em todo o país, o que facilita, em muito, o manuseio das informações que são
disponibilizadas pelos tribunais nos sites.
Outra iniciativa recente do CNJ, com vistas ao melhoramento da qualidade dos dados
disponibilizados nas “capas dos processos” eletrônicos, é utilização de técnicas de inteligência
artificial para identificação de inconsistências no registro de classes, assuntos, movimentações,
datas, nome das partes, entre outros69, e, apesar de estar apenas se iniciando, pode ser muito positiva
a longo prazo.
A maioria dos estudos jurimétricos, por ora, têm se restringido à análise desses dados -
aqueles enumerados na Resolução 121. Ocorre que eles não atendem a todas as finalidades, por
serem um tanto superficiais. Quer dizer, com essas informações é possível realizar estudos sobre
distribuição de causas por localidade, por período, por andamento, e, em certa medida, por assunto
e resultado - o que já é um enorme desafio -, mas quantas outras informações sobre as causas
judiciais não existem para além dessas que acabamos de enumerar?
Os autos processuais são documentos riquíssimos em dados, porque comportam as
diversidades das próprias questões sub judice, o que implica não somente procedimentos diferentes,
mas também a incidência de dispositivos legais, a utilização de argumentos, fundamentações e,
principalmente, a descrição de fatos diferentes, que têm um grande potencial estratégico se
adequadamente analisados.
Para informações detalhadas sobre as causas é necessário, inexoravelmente, realizar
buscas muito mais refinadas que aquelas feitas pelos Web Scrappers. É preciso adentrar nos
documentos e identificar a presença ou ausência de circunstâncias.
Alguns desses documentos permitem a pronta análise do seu teor. São os chamados
documentos “pesquisáveis”70, nos quais é possível selecionar e copiar partes do texto, e também
utilizar o atalho “crtl + f” para realizar buscas por palavras.
Outros arquivos, no entanto, se forem, por exemplo, resultado de registros fotográficos
convertidos em formato PDF, são de arquivos de imagem, apenas, e não permitem a seleção e
copiagem de seu conteúdo. Esses documentos necessitam de um tratamento que transforme seu
texto em um texto pesquisável.
Geralmente se utiliza uma tecnologia chamada OCR (Optical Character Recognition 71),
que reconhece os caracteres formadores das palavras, pelos formatos característicos de cada letra,
além de sinais gráficos, pontuações e espaçamentos, para gerar um outro arquivo, usualmente no
formato txt, onde é possível, finalmente, fazer buscas automatizadas em seu conteúdo. O que a
tecnologia OCR faz, basicamente, é identificar cada uma das letras e transcrevê-las em um outro
documento, pesquisável.
Uma vez que o conteúdo esteja acessível a buscas, utiliza-se tecnologias de processamento
de linguagem natural e de text mining72 que, dentre outras possibilidades, permitem a localização
de informações dispersas em textos. Essas técnicas variam desde modalidades mais rudimentares,
como a busca por expressões regulares73, até a utilização de redes neurais artificiais para
treinamento e localização de entidades 74.
Essas metodologias, é importante lembrar, só são necessárias quando as informações que
se deseja não estiverem estruturadas nos sites dos tribunais de justiça ou nas bases de processos
internas das empresas. Elas possibilitam localizar processos que digam respeito a um determinado
assunto, em que conste determinado tipo de parte, ou digam respeito a um produto ou serviço
específico.
70
ABBYY. Saiba como funcionam as tecnologias da ABBYY e como elas ajudam a aumentar sua produtividade.
Disponível em: <https://www.abbyy.com/pt-br/finereader/pdf-types/>. Acesso em 23 de março de 2019.
71
ABBYY. Learn how ABBYY technologies work and how they help boost productivity. Disponível em:
<https://www.abbyy.com/en-apac/finereader/what-is-ocr/>. Acesso em 23 de março de 2019.
72
SEARCH TECNOLOGY. Natural Language Processing (NLP) Techniques for Extracting Information.
Disponível em: <https://www.searchtechnologies.com/blog/natural-language-processing-techniques>. Acesso em: 23
de março de 2019.
73
REGEXBUDDY. What Is a Regular Expression, Regexp, or Regex?. Disponível em:
<https://www.regexbuddy.com/regex.html>. Acesso em: 23 de março de 2019.
74
BANERJEE, Suvro. Introduction to Named Entity Recognition. Disponível em: <https://medium.com/explore-
artificial-intelligence/introduction-to-named-entity-recognition-eda8c97c2db1>. Acesso em: 23 de março de 2019.
49
Como vimos no segundo capítulo, variáveis categóricas são aquelas que expressam um
aspecto não quantificável do indivíduo objeto do estudo estatístico. Através delas, é possível
explorar a noção de frequência, inclusive por meio de tabelas de contingência.
Também dissemos que algumas informações dos processos judiciais, principalmente
aquelas estruturadas nas páginas dos processos eletrônicos, e também em planilhas de
acompanhamento processual de departamentos jurídicos, já estão sendo amplamente utilizadas em
estudos jurimétricos.
Estamos, no entanto, num estágio inicial do desenvolvimento da Jurimetria no Brasil, de
modo que, muito provavelmente, não exploramos todas as possibilidades de variável jurimétrica.
Acreditamos, por isso, que nos próximos anos, com o crescimento do setor, mais estudos sejam
encomendados e que a diversidade das variáveis observadas também aumente.
50
75
DIDIER JR, Fredie. Curso de Direito Processual Civil: Teoria da Prova, Direito Probatório, Ações Probatórias,
Decisão, Precedente, Coisa Julgada e Antecipação dos Efeitos da Tutela – 11ª ed. – Salvador: Ed Jus Podivm,
2016.
76
Ibid., p. 429.
77
Ibid., p. 429.
78
Ibid., p. 432
79
Ibid., p. 427.
51
Tabela 8: Valor de condenação por dano moral, por inscrição indevida, por capitais
80
BISQUERRA, Rafael; SARRIERA, Jorge C., MATÍNEZ, Francesc. Introdução a Estatística: Enfoque
informático com o pacote estatístico SPSS. Porto Alegre: Artmed, 2004. p. 23
81
Ibid., p. 23.
82
FERRARI, Fabrício. Estatística Básica. Disponível em: <http://www.ferrari.pro.br/home/documents/FFerrari-
Curso-Estatistica-Basica.pdf>. Acesso em 25 de março de 2019.
52
Ou seja, num estudo sobre condenações por dano moral em diferentes capitais, se as
classes fossem ainda mais abrangentes, indo a primeira, por exemplo, de 1 a 10 mil reais,
considerando, hipoteticamente, que a distribuição dos valores fosse igual à apresentada acima,
muitas decisões acabariam recebendo um mesmo tratamento quando, na verdade, seria útil, e
possível, considerar mais classes, para visualizar ainda mais precisamente o fenômeno.
O interessante, e que deve ser destacado, é que esse artifício, de distribuir variáveis
quantitativas em classes, para que sejam manuseados enquanto variáveis categóricas, pode ser
utilizado, em tese, para quaisquer variáveis quantitativas presentes no Direito, como durações dos
processos, tempo decorrido de um fato a outro e outros valores além das condenações, como os
valores dos pedidos.
Como se deve ter notado até aqui, o conceito de variável categórica é extremamente
versátil. Isso não significa, contudo, que quaisquer aspectos possam ser tratados assim.
Em relação às categorias que uma variável categórica possa assumir, há a seguinte regra:
elas devem estar bem definidas, ser mutuamente excludentes e ser exaustivas. 85
83
Ibid.
84
MORETTIN, Pedro Alberto. Estatística Básica – 6. ed. – São Paulo : Saraiva, 2010. p. 13.
85
BISQUERRA, Rafael; SARRIERA, Jorge C., MATÍNEZ, Francesc. Introdução a Estatística: Enfoque
informático com o pacote estatístico SPSS. Porto Alegre: Artmed, 2004. p. 23.
53
Como mensurar a intensidade da ação humana com base em descrições feitas por pessoas?
Para o segurança, ele poderia estar calmo, e ter sido perfeitamente profissional, enquanto que, para
o cliente, o segurança pode ter sido rude, ou ter parecido pouco preocupado em solucionar o
problema.
Mesmo as palavras ditas na hora do ocorrido podem ter sido proferidas com entonações
ou em contextos inacessíveis a quem apenas lê uma descrição, ou assiste a um vídeo de câmera de
segurança sem áudio.
Esse é um exemplo de variação que, para o Direito, é absolutamente importante, mas que
traz um subjetivismo incompatível com a metodologia estatística. A variável comportamento, ou
temperamento dos seguranças, portanto, dificilmente poderia seguir critérios objetivos de
diferenciação entre suas categorias, o que poderia inviabilizar sua utilização em estudos
jurimétricos.
Nesse sentido, é importante que se tenha muita cautela ao selecionar as variáveis
categóricas. Por conhecermos as dinâmicas dos processos judiciais, temos a obrigação de propor
variáveis que permitam a observação de fenômenos interessantes do ponto de vista jurimétrico. No
entanto, por falta do conhecimento técnico, talvez sejamos incapazes de avaliar corretamente a
pertinência da utilização de uma variável categórica. Por isso, antes de fechar um problema de
estudo, é recomendável escutar o parecer de especialistas da área de estatística.
86
DIDIER JR. Fredie. Curso de Direito Processual Civil: o processo civil nos tribunais, recursos, ação de
competência originária de tribunal e querela nullitatis, incidentes de competência originária de tribunal – 13
ed. reform. – Salvador: ed Jus Podivm, 2016. p. 625.
56
Não há crime em se dizer, portanto, que algumas causas, para certos efeitos, são
absolutamente parecidas, ao ponto de suscitarem invariavelmente os mesmos argumentos.
Essa é a realidade de muitas causas de massa, que discutem fatos praticamente idênticos,
e que ainda não foram uniformizadas, em que os advogados utilizam modelos prontos de peças e
argumentos - às vezes disponíveis na internet e, cada vez mais, em programas de redação
automática87-, alterando somente as informações do autor, datas e, eventualmente, algum outro
detalhe, para receberem uma sentença também pré-formatada, muitas vezes adaptada por
assessores e estagiários88.
Não que essa degradação deva ser comemorada, mas o fato é que, nesses tipos de
processos, é comum ver uma variedade limitada de articulações teórico-jurídicas, que invocam
quase sempre os mesmos dispositivos legais, com as mesmas considerações.
É possível imaginar, nessa seara, formas de assimilar e localizar vários dos argumentos e
fundamentações que são repetidamente utilizados, pois costumam, também, ser enunciados sem
muita variação textual.
Esse último aspecto é importante porque, caso se cogite a utilização de aparatos
computacionais para realização de text mining, quanto mais padronizada uma mensagem, mais fácil
de localizá-la automaticamente. As tecnologias de mineração de dados textuais dependem
fortemente do emprego repetido de frases e palavras, pois não são capazes de interpretar. Elas
apenas identificam, algebricamente, padrões textuais.
A interpretação, aliás, é boa, porque permitiria compreender quando uma coisa foi dita de
várias formas, mas, ao mesmo tempo, é ruim, porque macula, novamente, de subjetividade o
processo de coleta dos dados.
Por todos esses motivos, tratando-se de mensagens em texto, não importa quais sejam, é
necessário, no mínimo e, ainda assim, com muita cautela, definir critérios objetivos de
identificação, utilizando, sempre, codebooks89 para documentá-los.
87
LOOPLEX. Tecnologia para transformar know-how, processos e documentos. Disponível em:<
/https://looplex.com.br/plataforma/#tecnologia>. Acesso em: 13 de março de 2019.
88
RIBEIRO, Ivan Morais. Afinal, quem elabora a sentença? O juiz, o assessor ou o estagiário?. Disponível
em:<https://canalcienciascriminais.com.br/afinal-quem-elabora-a-sentenca-o-juiz-o-assessor-ou-o-estagiario/>.
Acesso em 28 de março de 2019.
89
ICPSR. Find & Analyze Data. What is a Codebook? Disponível em:
<https://www.icpsr.umich.edu/icpsrweb/content/shared/ICPSR/faqs/what-is-a-codebook.html>. Acesso em 28 de
março de 2019.
57
Essa é uma forma, inclusive, de filtrar um pouco as variáveis utilizáveis, porque se não
for possível instituir critérios objetivos para diferenciar as categorias, provavelmente a
circunstância que se quer medir não se repita uniformemente o bastante. Há, contudo, mensagens
que, não importa a forma como são expressas, podem ser recebidas como significativas da mesma
coisa.
Por exemplo, se um juíz diz numa decisão interlocutória que falta verossimilhança das
alegações para que ele conceda a tutela provisória, esse posicionamento, ainda que possa decorrer
de situações diferentes que venham ser apresentadas a ele, é uma conclusão - uma conclusão que
virá a fundamentar a decisão - facilmente identificável e que, nesses termos, não pretende abraçar
nenhuma complexidade.
E porque o contexto se torna irrelevante, desde que a mensagem possa ser
inequivocamente identificada e seja representativa de alguma circunstância bem definida, ela pode
ser enumerada. Ora se isso não é, justamente, o que já se faz com os resultados dos processos, que
são também expressos textualmente, nas sentenças, mas que assumem categorias bem definidas e
mutuamente excludentes.
Seria possível, dessa maneira, contar quantas vezes os juízes negaram pedidos de tutela
provisória por falta de verossimilhança, ou indeferiram preliminarmente uma inicial por reconhecer
um pedido contrário a precedente obrigatório. Também argumentos que sintetizem a conclusão de
raciocínios lógico-jurídicos extensos podem, em tese, ser analisados por meio de estatística
descritiva. Alegações de quebra de contrato, de vícios, atrasos e nulidades, por exemplo, são todos
argumentos que, não importa com que contornos, têm um mesmo significado jurídico.
Argumentos mais elaborados, que não possam, por exemplo, ser sintetizados em uma
frase, ou ser comunicadas através de um instituto jurídico, evidentemente não podem ser
distribuídos em categorias.
Assim, apesar de promissora, a observação estatística dos argumentos e fundamentações
aplicados à lide é um desafio. Isso compromete, de certa forma, também a análise dos padrões
decisórios, que, por ora, fica restrita à comparação de informações básicas dos processos, como a
causa de pedir, o juiz e as partes, com seus desfechos, como fizemos em algumas de nossas tabelas
de contingência até aqui.
58
4.1 - IMPARCIALIDADE
A prova qui-quadrado, citada no capítulo 2, que pode ser utilizada para testar a
independência das variáveis categóricas de uma tabela de contingência, é um exemplo de prova de
significação.
90
BISQUERRA, Rafael; SARRIERA, Jorge C., MATÍNEZ, Francesc. Introdução a Estatística: Enfoque
informático com o pacote estatístico SPSS. Porto Alegre: Artmed, 2004. p. 71.
59
91
MORETTIN, Pedro Alberto. Estatística Básica – 6. ed. – São Paulo : Saraiva, 2010. p. 330
92
THE ANALYSIS FACTOR. The Difference Between Interaction and Association. Disponível
em:<https://www.theanalysisfactor.com/interaction-association/> Acesso em 02 de abril de 2019.
93
AUSTRALIAN BUREAU OF STATISTICS. Statistical Language - Correlation and Causation. Disponível
em:<https://www.abs.gov.au/websitedbs/a3121120.nsf/home/statistical+language+-+correlation+and+causation>.
Acesso em 02 de abril de 2019.
94
Artigo. 927, Código Civil: “Aquele que, por ato ilícito (arts. 186 e 187), causar dano a outrem, fica obrigado a repará-
lo. ”
95
PEREIRA, Caio Mário da Silva. Instituições de Direito Civil – 27 ed – Rio de Janeiro: Forense, 2014. p. 554.
60
96
BITENCOURT, César Roberto. Tratado de Direito Penal: parte geral 1 – 20 ed rev. ampl. e atual. – São Paulo:
Saraiva,2014. p.317.
97
STATISTICS HOW TO. What is Causation? Disponível
em:<https://www.statisticshowto.datasciencecentral.com/causation/>. Acesso em 02 de abril de 2019.
98
NUNES, Marcelo Guedes. Jurimetria: como a estatística pode reinventar o Direito – São Paulo: Editora Revista dos
Tribunais, 2016. p.71.
99
Ibid., p. 71.
100
Ibid., p. 72.
61
101
AUSTRALIAN BUREAU OF STATISTICS. Statistical Language - Correlation and Causation. Disponível
em:<https://www.abs.gov.au/websitedbs/a3121120.nsf/home/statistical+language+-+correlation+and+causation>.
Acesso em 02 de abril de 2019.
102
FACULDADE DE CIÊNCIAS MÉDICAS. Quais são as fases da pesquisa clínica? Disponível
em:<https://www.fcm.unicamp.br/fcm/cpc-centro-de-pesquisa-clinica/pesquisa-clinica/quais-sao-fases-da-pesquisa-
clinica>. Acesso em 04 de abril de 2019.
62
Observa-se, nessa tabela, que dois dos escritórios têm índices muito bons de
aproveitamento, enquanto o outro acumula mais derrotas que vitórias. Há, portanto, uma associação
entre a variável resultado do processo e a variável escritório.
Uma interpretação precipitada desses dados, no entanto, seria a de que o escritório com
mau desempenho é o único, ou principal, motivo das derrotas, porque provavelmente apresenta
contestações mal redigidas, ou porque seus advogados não têm um bom relacionamento com os
juízes da comarca.
Está-se inferindo, a partir de uma relação de associação, uma relação de causalidade entre
o escritório e os desfechos dos processos. Por esse equívoco ser tão comum, um ditado estatístico
diz “correlação não implica causalidade” 103.
Destacamos primeiro a situação do escritório com resultados negativos, porque as
inferências erradas são feitas, geralmente, para se responsabilizar alguém por algo. Quase nunca se
vê estatísticas sendo utilizadas da forma errada para parabenizar quem quer que seja - a não ser
quando utilizadas no próprio interesse - porque, ao que parece, nestas situações costuma-se ser bem
mais criterioso. Apesar disso, a conclusão de que os outros escritórios vencem mais porque são
melhores, com base na tabela de contingência, seria, igualmente, uma asserção sem fundamento.
O erro começa quando se pressupõe que única circunstância, a imperícia ou a falta de
intimidade dos advogados para com o juiz, poderia condicionar o resultado de inúmeros processos.
Não que essa não seja uma possibilidade, mas a dinâmica processual, sabemos, envolve outros
fatores potencialmente mais decisivos que esses.
A dificuldade dos dois escritórios em vencer, em relação aos demais, poderia ser
justificada porque eles lidam com mais causas em que, independentemente da estratégia de defesa,
103
ISOTALO, Jarkko. Basics of Statistics. Disponível em:<https://www.mv.helsinki.fi/home/jmisotal/BoS.pdf>.
Acesso em 04 de abril de 2019.
63
não se tinha muitas chances de vitória, enquanto que os outros podem ter atuado em processos onde
faltava amparo legal aos pedidos do reclamante.
Além disso, sequer se considerou as áreas dos processos em que cada escritório atuou. O
escritório que teve resultados negativos pode ter atuado somente em causas trabalhistas, talvez mais
difíceis que as demais causas e, às vezes, proporcionalmente, até ter tido resultados melhores do
que os outros dois nessa área.
Outras associações, fora da advocacia estratégica, podem propiciar erros ainda mais
levianos. Um dos estudos da Associação Brasileira de Jurimetria, sobre o comportamento das
Câmaras Criminais de São Paulo 104, que, inclusive, já foi citado aqui, montou uma tabela de
contingência comparando os resultados dos recursos criminais de 2014 em relação aos quinze
relatores com maior volume de processos.
Enquanto a frequência relativa total das decisões que negaram os recursos foi de 53,9%,
alguns dos relatores apresentaram porcentagens de mais de 80% de improvimento nas causas em
que atuaram naquela posição.
Os números indicam, portanto, uma associação entre o relator e o resultado do recurso e
são, certamente, propícios para juízos de valor e acusações. Os pesquisadores da ABJ, no entanto,
logo abaixo da referida tabela, deram o seguinte parecer:
“É importante ressaltar que esses casos devem ser investigados mais a fundo, pois
a diferença observada poderia ser explicada tanto por uma diferença de
interpretação, quanto por diferença dos perfis dos processos de cada julgador. ”
105
Esse é o equilíbrio que se espera que os juristas tenham quando lidarem com evidências
de associações.
A reserva com que se deve enxergar as relações de associação, apesar disso, não significa
que elas sejam inúteis. São, na verdade, extremamente poderosas, porque, num cenário em que é
difícil inferir estatisticamente relações de causalidade, como o do Direito - devido tanto à
multicolinearidade quanto à limitação das próprias variáveis consideradas -, as associações talvez
sejam a melhor maneira de se identificar padrões que apontem onde procurá-las.
104
BRASIL. ABJ – Associação Brasileira de Jurimetria. Reformas de decisão nas câmaras de direito criminal em
São Paulo. Disponível em: <https://abj.org.br/cases/camaras-2/>. Acesso em 20 de março de 2019.
105
Ibid.
64
Quer dizer, é possível analisar um processo por vez e dizer quais foram as causas da
vitória, ou da derrota. O problema é que, sem uma análise estatística, em situações onde se deva
tomar posicionamentos frente a uma pluralidade de processos, lidando, principalmente, com
escassez de tempo e recursos, seria improvável que se descobrisse quais problemas são maiores e,
entre estes, quais, possivelmente, estão seguindo um padrão que possa ser, além de identificado,
compreendido e explorado.
No segundo capítulo, trouxemos o exemplo do gerente jurídico que constatou uma
associação importante entre os tipos de causa e os resultados dos processos. Ora, vez que tenha
tomado ciência dessa relação, ele poderia instituir uma política de acordo, ou contratar advogados
especializados para tentar diminuir as derrotas, o que talvez trouxesse resultados positivos. O mais
importante, no entanto, seria investigar a fundo o motivo para que alguns tipos de causa estejam
associados a tantas mais derrotas.
Igualmente, uma vez que se dê conta que um escritório tem mais dificuldade em ganhar
os processos, se poderia investigar os motivos para que a situação seja essa. Há uma diferença no
perfil dos processos com que cada escritório terceirizado lida? São os fatos que são diferentes, e
mais complicados em certos locais? Há uma diferença nas teses de defesa adotadas, ou da
jurisprudência? As contestações estão bem fundamentadas, ou faltam argumentos imprescindíveis?
Não que seja o caso dessas perguntas, exatamente, mas é possível que muitos
questionamentos só sejam feitos, ou só sejam considerados relevantes, depois que se tenha
observado uma relação de associação.
Por isso, antes de diagnosticar o que está acontecendo, responsabilizar alguém ou algo, ou
mesmo propor soluções, o desejável é realizar pesquisas mais profundas.
Dessa forma, a estatística permite enxergar padrões nos fenômenos que só poderiam ser
observados quantitativamente, com uma perspectiva superficial, do ponto de vista de cada
indivíduo isoladamente considerando, mas depois, quando se chega mais próximo dos motivos
daqueles padrões, pode-se fazer análises jurídicas e, eventualmente, até considerá-las novamente
sob um viés estatístico.
Por exemplo, no caso dos relatores dos recursos criminais, se realmente se quisesse fazer
um juízo de valor sobre seus comportamentos enquanto relatores, o mais adequado - e, ainda assim,
tarefa muito subjetiva -, seria avaliar se ele foi muito ou pouco rígido em cada um dos processos e
depois considerar a proporção entre uma e outra conduta, para, finalmente, emitir uma opinião.
65
Reiteramos que uma avaliação dessas não seria completamente significativa, por conta da ausência
de referenciais objetivos.
Assim, nos parece que, apesar de não se tratar da técnica estatística mais elaborada, e
mesmo sem realizar o cálculo das medidas de associação, é possível explorar as relações de
associação de forma útil no Direito, através das tabelas de contingência, desde que se esteja ciente
do que significam essas relações e de quais posturas se deve tomar diante delas.
66
CONSIDERAÇÕES FINAIS
O presente trabalho percorreu longo caminho até chegar ao último capítulo, em que se fez
uma constatação que, sem as questões previamente abordadas, não seria compreendida da mesma
forma. Ainda que se tenha chegado a uma conclusão, espera-se que o maior proveito da pesquisa
seja gerar o debate acerca da Jurimetria, e de sua aplicabilidade como ferramenta gerencial em
departamentos jurídicos.
Iniciou-se as reflexões recuperando a origem do termo Jurimetria, que remonta ao final da
década de quarenta. Expomos, nessa passagem, o fato de que, ainda que seja, hoje, compreendida
como estatística aplicada ao Direito, a disciplina, como idealizada por Loevinger, não se restringia
a isso. Entretanto, por ser demasiadamente otimista a visão de Loevinger a respeito da metodologia
científica, a possibilidade mais razoável, de pesquisa empírica, foi a que permaneceu.
Vimos, após isso, que existem outras escolas que também utilizam metodologias
quantitativas para observar o fenômeno jurídico, e que diferenciar entre elas pode ser um desafio.
Quanto à aplicabilidade da Jurimetria, enumeramos uma série de instituições ocupadas em
gerar dados sobre o funcionamento do Poder Judiciário, em especial o CNJ e a Associação
Brasileira de Jurimetria.
Apontamos, também, que a investigação de políticas públicas não era a única finalidade
para qual a Jurimetria vem sendo utilizada, e que, na verdade, há um mercado privado em expansão
voltado para a análise de dados sobre processos judiciais, com vistas ao aprimoramento de
estratégias processuais, à instituição de políticas de acordo e à advocacia preventiva.
A metodologia jurimétrica, contudo, jamais poderia ser visualizada de uma perspectiva
puramente jurídica, tornando-se imprescindível, por conta disso, adentrar no mundo da estatística
e aprender seus fundamentos.
Iniciamos nossa exposição enumerando as etapas do método estatístico, apontando, na
medida do possível, como elas se desenrolariam em estudos jurimétricos sobre processos judiciais.
Cuidou-se, em seguida, de apresentar o conceito de indivíduos estatísticos, e de variáveis,
que são as bases de qualquer estudo estatístico. Em relação às variáveis, dedicamos um momento
especial para explicar o que são variáveis categóricas. Em seguida, demonstramos que é possível
observar a frequência com que se realizam através de tabelas de frequência.
67
As tabelas univariadas, contudo, são pouco práticas quando o objetivo for analisar duas
variáveis simultaneamente. Por isso trouxemos a tabela de contingência, que permite a observação
simultânea do comportamento de duas variáveis.
Construímos, em seguida, algumas tabelas de contingência, com dados hipotéticos, para
mostrar como são utilizáveis na investigação da existência de uma relação de associação entre as
duas variáveis categóricas.
Foi possível ver, com isso, que a diferenciação nas porcentagens relativas das tabelas de
contingência em relação às distribuições totais são um indicativo da possibilidade de relações de
associação, e definimos essas relações como sendo a observação de uma variação conjunta das
categorias de ambas as variáveis.
Como não se constrói tabelas de contingência sem dados, tornou-se necessário dedicar a
primeira parte do terceiro capítulo à descrição da metodologia de coleta de dados no ramo jurídico.
Viu-se que é possível utilizar aparatos computacionais para realizar raspagem de dados nos sites
dos tribunais da justiça, mas que, tratando-se de algumas informações, devido à limitação
tecnológica, deve-se considerar a possibilidade da realização de coleta manual.
Porque as tabelas de frequência são construídas a partir de variáveis categóricas, também
cuidamos de tecer algumas considerações sobre elas.
Demonstramos, primeiramente, que é possível considerar variáveis quantitativas em
tabelas de frequência através da realização do artifício de distribuição em classes, e que, dessa
forma, seria possível considerar ainda mais nuances dos processos judiciais em tabelas de
contingência, como valores de condenações por danos morais.
Nem todos os aspectos dos processos judiciais, contudo, podem ser tratados como
variáveis categóricas, na medida em que a diferenciação entre suas categorias poderia assumir
critérios subjetivos. Em especial os argumentos e as fundamentações jurídicas seriam
problemáticos de serem lidados enquanto variável categórica. Seria possível, apesar disso,
considerar argumentos e fundamentações que expressem uma situação jurídica bem definida, que
possam, por conta disso, ser identificadas inequivocamente em diferentes contextos.
No último capítulo, exploramos a etapa da análise dos estudos jurimétricos. Primeiro
explicamos porque ser imparcial diante dos números pode ser um desafio para os advogados.
Finalmente, concluímos o presente trabalho explicando que as associações não devem ser
interpretadas como causalidades. Trouxemos dois exemplos de situações em que havia relações de
68
associação, mas que inferir que uma categoria de uma das variáveis era a causa da categoria da
outra variável seria um grande erro, porque as tabelas de contingência não demonstram se há
causalidade.
Espera-se, ao final desse trabalho, que as considerações que foram feitas sejam
generalizáveis a outras técnicas estatísticas, em especial o que dissemos sobre as variáveis
categóricas, e que nossa conclusão sobre a aplicabilidade de tabelas de contingência no Direito, e
a impossibilidade de inferência de relação de causalidade, não seja compreendida entre os juristas
como um desincentivo à sua utilização. As relações de associação devem, na verdade, ser encaradas
como o ponto de partida para reflexões mais aprofundadas. Pode ser necessário, para isso, analisar
alguns casos concretos, à moda antiga, para compreender o que de fato está causando a associação
observada, para que, só então, se tome medidas a respeito.
69
REFERÊNCIAS BIBLIOGRÁFICAS
ABBYY. Learn how ABBYY technologies work and how they help boost productivity.
Disponível em: <https://www.abbyy.com/en-apac/finereader/what-is-ocr/>. Acesso em 23 de
março de 2019.
BERGAMASHI, D.; SOUZA, J.; MENEZES, R. Bioestatística Básica. São Paulo: USP, 2016.
Disponível em: <http://www.fsp.usp.br/~denisepb/es5101/Apostila.pdf>. Acesso em: 13 de março
de 2019.
BERNOULLI, Nicolaus M. The use of the Art of conjecturing in Law. Doctorate Degree in both
Roman and Canon law legitimately acquired. Fatherland’s University. On the day 14 June A.C.
MDCCIX.
BITENCOURT, César Roberto. Tratado de Direito Penal: parte geral 1 – 20 ed rev. ampl. e
atual. – São Paulo: Saraiva,2014. p.317.
BRASIL. Lei nº 10.406, de 10 de janeiro de 2002. Institui o Código Civil. Disponível em:<
http://www.planalto.gov.br/ccivil_03/leis/2002/l10406.htm>. Acesso em: 05 de março de 2019.
_______. Conselho Nacional de Justiça. Justiça em Números 2018: ano-base 2017. Disponível
em:<http://www.cnj.jus.br/files/conteudo/arquivo/2018/09/8d9faee7812d35a58cee3d92d2df2f25.
pdf> Acesso em 11 de março de 2018.
_______. Tribunal de Justiça de São Paulo. Diário de Justiça Eletrônico. Disponível em: <
http://www.dje.tjsp.jus.br/cdje/index.do>. Acesso em 17 de março de 2019.
_______. Tribunal de Justiça de São Paulo. Consulta de Julgados de 1º Grau. Disponível em:
<https://esaj.tjsp.jus.br/cjpg/>. Acesso em 20 de março de 2019.
_______. Conselho Nacional de Justiça. Inteligência artificial será usada para verificar
qualidade de dados processuais. Disponível em: <https://www.cnj.jus.br/noticias/cnj/89053-
inteligencia-artificial-sera-usada-para-verificar-qualidade-de-dados-processuais>. Acesso em: 23
de março de 2019.
CORREA, Sônia Maria Bastos. Probabilidade e estatística – 2ª ed. - Belo Horizonte: PUC Minas
Virtual, 2003. Dosponível em:<
http://estpoli.pbworks.com/f/livro_probabilidade_estatistica_2a_ed.pdf>. Acesso em: 13 de março
de 2019.
DIDIER JR, Fredie. Curso de Direito Processual Civil: Teoria da Prova, Direito Probatório,
Ações Probatórias, Decisão, Precedente, Coisa Julgada e Antecipação dos Efeitos da Tutela
– 11ª ed. – Salvador: Ed Jus Podivm, 2016.
DIDIER JR. Fredie. Curso de Direito Processual Civil: o processo civil nos tribunais, recursos,
ação de competência originária de tribunal e querela nullitatis, incidentes de competência
originária de tribunal – 13 ed. reform. – Salvador: ed Jus Podivm, 2016. p. 625
ESCOTET, 1973, p. 11 apud BISQUERRA, Rafael; SARRIERA, Jorge C., MATÍNEZ, Francesc.
Introdução a Estatística: Enfoque informático com o pacote estatístico SPSS. Porto Alegre:
Artmed, 2004. p. 17.
HAIR JR, Joseph F. et al. Análise Multivariada de Dados – 6ª ed. – Porto Alegre: Bookman,
2009.
HARVARD LAW SCHOOL. Harvard Empirical Legal Studies Series. Disponível em:<
https://hls.harvard.edu/dept/graduate-program/harvard-empirical-legal-studies-series/>. Acesso
em: 04 de março de 2019.
LOEVINGER, Lee. Jurimetrics the next step forward. Minnesota Law Review, April 1949.
LOEVINGER, Lee.The methodology of legal inquiry. Minnesota Law Review, Winter, 1963. p.
34-35.
LOEVINGER, Lee. Science preditiction in the field of law. Minnesota Law Review, September
1962.
MACHADO, Maíra Rocha. Pesquisar Empiricamente o Direito. São Paulo: Redes de Estudos
Empíricos em Direito, 2017.
MORETTIN, Pedro Alberto. Estatística Básica – 6. ed. – São Paulo : Saraiva, 2010. p. 11
NUNES, Marcelo Guedes. Jurimetria: como a estatística pode reinventar o Direito – São Paulo:
Editora Revista dos Tribunais, 2016. p. 112.
73
PEREIRA, Caio Mário da Silva. Instituições de Direito Civil – 27 ed – Rio de Janeiro: Forense,
2014. p. 554.
REALE, Miguel. Lições Preliminares de Direito. – 27 ed. – São Paulo: Saraiva, 2002. p. 141.
SANTIAGO, Fernando. Contrato entre TJ-SP e Microsoft pode atropelar Lei Geral de
Proteção de Dados. Disponível em: <https://politica.estadao.com.br/blogs/fausto-
macedo/contrato-entre-tj-sp-e-microsoft-pode-atropelar-lei-geral-de-protecao-de-dados/>. Acesso
em 15 de março de 2019.
THE ANALYSIS FACTOR. The Difference Between Interaction and Association. Disponível
em:<https://www.theanalysisfactor.com/interaction-association/> Acesso em 02 de abril de 2019.