Você está na página 1de 62

TEXTO PARA DISCUSSÃO IPEA: Formatted: Justified, Space Before: 10 pt, After: 0 pt

Indicadores judiciais da aferição rápida das condições do Commented [MAFdHC1]: Precisa disso? Eu retiraria, pois a
meu ver os indicadores são mais do que isso (o fato de serem

mercado de crédito: definição, metodologia e resultados indicadores “rápidos” seria apenas uma das características dos
indicadores). Também não tenho certeza em relação a identificar os
indicadores como sendo “indicadores das condições do mercado de
crédito”. Isso porque os indicadores refletem também aspectos do
funcionamento do sistema judicial, bem como outros aspectos
Alexandre Samy de Castro institucionais e econômicos (inclusive cíclicos) não necessariamente
ligados ao que se costuma entender como “condições do mercado
de crédito” – conforme citado na seção 3. Mas não consigo pensar
Augusto Consulmagnos Romeiro em uma sugestão melhor para o nome; talvez simplesmente
“indicadores judiciais do mercado de crédito”.
Marco Antônio de Freitas de de Hollanda de Freitas Cavalcanti

1
Sumário

TEXTO PARA DISCUSSÃO IPEA: 1


Indicadores judiciais do mercado de crédito: definição, metodologia e resultados 1
Sumário 2
1. Introdução 54
2. Metodologia 87
3. Aspectos conceituais e limitações 119
Mudanças processuais 1210
Mudanças administrativas ou regulatórias 1211
4. Análise descritiva dos índices 1312
4.1. Defasagem de apuração dos índices 1312
4.1 . Indicadores da quantidade de processos distribuídos 1514
4.1.1. Indicadores agregados 1614
4.2. Indicadores de valor dos processos distribuídos 1716
4.2.1. Indicadores agregados 1716
4.2.2. Indicadores por segmento 2019
4.2.2.1. Devedor/requerido pessoa física versus pessoa jurídica 2120
4.2.2.2. Credor/requerente financeiro versus não-financeiro 2221
4.2.2.3. Setor de atividade econômica: serviços 2322
4.2.3. Indicador diário (títulos executivos somente) 2322
4.3. Discussão 2625
5. Validade externa 2827
6. Conclusões e próximos passos 36
Referências 3837
Apêndices 3938
A1. Descrição do Sistema IPEAJUS 3938
A2. Estrutura dos classificadores de partes e de decisões judiciais 4443
Consulta por documento da parte no Tribunal 4543
Pareamento de registros com a RAIS/MTE 4544
Expressões regulares 4544
Algoritmos de aprendizado de máquina ou Machine Learning 4644

2
A3. Apuração do indicador: estrutura de defasagem de publicações 4847
A.4. Relação completa dos indicadores 6160
TEXTO PARA DISCUSSÃO IPEA: 1

Indicadores judiciais para a aferição rápida das condições do mercado de crédito: Formatted: Do not check spelling or grammar, Highlight
definição, metodologia e resultados 1

Sumário 2

Introdução 4

Metodologia 7

Aspectos conceituais e limitações 9

Mudanças processuais 10

Mudanças administrativas ou regulatórias 11

Análise descritiva dos índices 12

4.1. Defasagem de apuração dos índices 12

4.1 . Indicadores da quantidade de processos distribuídos 14

4.1.1. Indicadores agregados 14

4.2. Indicadores de valor dos processos distribuídos 16

4.2.1. Indicadores agregados 17

4.2.2. Indicadores por segmento 19

4.2.2.1. Devedor/requerido pessoa física versus pessoa jurídica 20

4.2.2.2. Credor/requerente financeiro versus não-financeiro 21

4.2.2.3. Setor de atividade econômica: serviços 22

4.2.3. Indicador diário (títulos executivos somente) 23

4.3. Discussão 25

Validade externa 27

Conclusões e próximos passos 36

Referências 38

Apêndices 39

A1. Descrição do Sistema IPEAJUS 39

A2. Estrutura dos classificadores de partes e de decisões judiciais 44

Consulta por documento da parte no Tribunal 44

3
Pareamento de registros com a RAIS/MTE 45

Expressões regulares 45

Algoritmos de aprendizado de máquina ou Machine Learning 45

A3. Apuração do indicador: estrutura de defasagem de publicações 48

A.4. Relação completa dos indicadores 60

4
1. Introdução
O objetivo destdeste texto e texto é apresentar um conjunto inédito de indicadores “rápidos”
das condições do mercado de crédito no Brasil, produzidos a partir de registros judiciários Commented [MAFdHC2]: Ver comentáro anterior
publicados pelo Tribunal de Justiça do Estado de São Paulo. Por indicador “rápido” entende-se
um tipo de indicador cujoa o tempo de apuração, a partir do término do período de referência
(por exemplo, mês) é relativamente curto.

Os indicadores apresentados nesta pesquisa refletem o volume e o valor de disputas judiciais


relativas ao inadimplemento ou descumprimento de títulos e obrigações de crédito, além de
contratos comerciais diversos, como por exemplo, aluguéis. Na ótica dos registros judiciários,
tratam-se de ações judiciais nas seguintes classes processuais: execução de títulos executivos
extrajudiciais, monitórias, busca e apreensão em alienação fiduciária e despejo por falta de
pagamento.

A importância destes indicadores reside no fato de que parte expressiva dos instrumentos de
crédito, bancário ou não-bancário, pertencem a classe de títulos executivos extrajudiciais ou
monitórias. Além disso, as ações judiciais relativas a classes como busca e apreensão em
alienação fiduciária e despejo refletem situações de inadimplemento tipicamente associadas
ao estado de insolvência de famílias e empresas.

Este conjunto de indicadores é apurado a partir de um sistema complexo, denominado


IPEAJUS, que extrai, transforma e carrega informações processuais em diversos tribunais
brasileiros. Além de estabelecer um banco de dados que contém a totalidade das informações
da fonte primária1, o IPEAJUS executa uma série de tarefas para classificar “tipos” de partes
nos processos judiciais, utilizando outros bancos de dados, como a RAIS identificada/MTE2 e
diversos métodos de classificação de texto, incluindo expressões regulares e aprendizado de
máquina. Uma tipologia de partes nos processos judiciais permite-nos estabelecer recortes
para os indicadores judiciais agregados. Por exemplo, pessoas físicas versus pessoas jurídicas;
empresas financeiras versus não-financeiras; micro e pequenas empresas; e empresas de um
setor de atividade econômica específico, como o setor de serviços. Esta classificação das
partes em processos judiciais possibilita uma estratificação das amostras de processos,
segundo nichos ou segmentos específicos do mercado de crédito, enriquecendo o conjunto de
informação do painel3. Vale destacar que a tarefa de classificar as partes de um processo,
descrita neste documento, é desafiadora pois requer, em boa parte dos casos, a identificação
da parte do processo (ou seus respectivos atributos) a partir apenas do seu nome próprio.

A versão inicial dos indicadores judiciais apresentados nesta pesquisa circunscreve-se ao


estado de São Paulo, a partir da conversão e leitura do diário de justiça eletrônico e da coleta
de dados no sítio de acompanhamento processual público do TJSP4. Trata-se portanto, de um
base de informação inteiramente pública e acessível.

1
Isto é, a consulta pública do sítio de acompanhamento processual do tribunal de justiça.
2
Relação Anual de Informações Socioeconômicas, do Ministério do Trabalho e do Emprego.
3
Distintos segmentos do mercado de crédito podem apresentar trajetórias distintas ao longo dos ciclos
econômicos.
4
https://esaj.tjsp.jus.br/cpopg/open.do

5
Além de inéditos e conceitualmente bem-definidos, estes indicadores judiciários apresentam
ainda uma defasagem de apuração muito pequena em relação ao período de referência.
Dependendo do indicador específico, esta defasagem pode ser de apenas um dia. Trata-se de
uma característica atraente, pois grande parte dos indicadores econômicos tradicionais no
Brasil são divulgados com defasagens expressivas, tipicamente superiores a trinta dias.

Conforme demonstrado em estudos anteriores [Castro (2016)] e em andamento [Castro et al


(2018)], tais indicadores apresentam elevada aderência a indicadores econômicos
convencionais, como as taxas de inadimplência, divulgadas pelo Banco Central. Além disso, as
pesquisas mencionadas sugerem que os indicadores judiciais contribuem de forma robusta
para a redução de erros de previsão obtidas a partir de modelos macroeconômicos que
utilizam indicadores antecedentes ou coincidentes convencionais e especificações-padrão. Não Commented [MAFdHC3]: Caberia aqui citar outros esforços de
construção de indicadores semelhantes pelo mundo; ou não há??
fomos capazes de encontrar nenhum outro estudo na literatura ou indicador econômico que Caso negativo, vale destacar isso! (fiz uma busca mas não encontrei
utiliza indicadores deste tipo para o acompanhamento do mercado de crédito. nada semelhante; você certamente está melhor informado)

Para produzir indicadores, o sistema IPEAJUS extrai e trata informações do acompanhamento


processual de tribunais de justiça, com base na leitura de diários oficiais, que divulgam
diariamente informações cada processo judicial distribuído na primeira instância.
Especificamente, são listas contendo os feitos cíveis e criminais distribuídos em cada comarca
ou foro regional, em cada data. Para cada classe processual relevante, o sistema IPEAJUS
realiza a contagem do número de casos novos (processos distribuídos) em cada data,
armazenando o número identificador5, a classe processual e os nomes das partes e advogados
do processo. O assunto processual não consta das informações6. Com base nestas
informações, produz-se – para cada classe processual - dois tipos de indicador: 1- de volume
de processos; 2- de valor do processo (médio, mediano, desvio-padrão, etc.). Enquanto o
volume de processos é obtido de forma direta e trivial através da contagem de casos, os
indicadores de valor demandam mais informação (i.e., o valor da ação), o que requer uma
consulta ao processo, no banco de dados do tribunal. Dado que uma consulta processual
impõe custos de processamento, seria inviável e desnecessário consultar dezenas de milhares
de processos a cada mês. Portanto, os indicadores de valor se baseiam no sorteio e extração
de uma amostra aleatória de processos. Restrito a essas amostras aleatórias, o sistema “baixa”
informações processuais na íntegra, inclusive o valor da ação (isto é, do titulotítulo, do valor
inadimplido ou do contrato em questão). Ainda com relação ao segundo grupo de indicadores
(valor de processos), o sistema permite uma estratificação da amostra, segundo o tipo de
devedor (empresa ou pessoa física); o tipo de empresa (pequena ou grande); o tipo de credor
(banco e não-banco) e o setor de atividade econômica (setor de serviços somente, por
enquanto). Conforme apontado anteriormente, a identificação dos estratos é feita a partir dos
nomes das partes, dependendo de métodos de expressões regulares e aprendizado de
máquina, que serão detalhados nos apêndices. De posse dessas amostras estratificadas, o

5
Atualmente a Numeração Processual Unificada, NPU, seguindo o padrão do Conselho Nacional de
Justiça.
6
Por exemplo, “Ação penal, procedimento ordinário”, é uma classe processual, enquanto que “crime de
estupro” é um assunto processual relativo àquela classe. No caso dos processos de interesse desta
pesquisa, “título executivo extrajudicial” é uma classe processual, enquanto que “promissória” ou
“cheque” ou “ACC” são assuntos relativos àquela classe.

6
sistema apura indicadores judiciais para segmentos específicos, de acordo com a natureza das
partes (pessoa física, financeiro, etc.).

Este painel de indicadores pretende contribuir para uma melhor e mais rápida aferição de
condições econômicas em geral, podendo ser relevante para agentes de mercado em geral,
para o Banco Central e demais policy makers. Trata-se de indicadores complementares aos
indicadores tradicionais existentes. Dentre as vantagens destes indicadores em relação aos
indicadores tradicionais, destacam-se:

o Baixo custo de produção e atualização. Informações públicas e sistema


automatizado.
o Apuração quase instantânea, com defasagem de poucos dias (até cinco dias).
o Alta frequência (dados diários, em alguns casos).
o Boa cobertura temporal (time span), desde 2004, o que confere graus de liberdade
à modelagem estatística.
o Diferentemente dos indicadores do mercado de crédito oferecidos pelo Banco
Central, naturalmente circunscritos ao setor financeiro, estes indicadores
capturam também oscilações no mercado de crédito não-financeiro (crédito a
fornecedores , etc.)
o Trata-se de indicadores concretos, ou hard data, Isto é, não são indicadores
abstratos, interpretativos. Pelo contrário, são indicadores do volume de disputas
relacionadas a instrumentos de crédito ou situações contratuais específicas,
relativamente bem-definidas.
o Possibilidade de recortes regionais e de expansão para outras unidades da
federação.
o Possibilidade de adição de novos recortes, por exemplo, por tipo de instrumento
de crédito, tais como cheques, promissórias, ACC, etc.
Dentre as limitações dos indicadores, podemos destacar, conforme discutido na seção 3 do
texto, a influência de fatores institucionais sobre o comportamento do indicador.
Especificamente, a intensidade e o timing de como obrigações inadimplidas se refletem no Formatted: Font: Italic
movimento judiciário depende das estratégias de recuperação de créditos utilizadas pelos
potenciais reclamantes. Tais estratégias são diretamente influenciadas por fatores
institucionais, tais como leis processuais, e leis relativas a tributação e contabilidade. Para um
modelo canônico dos condicionantes da decisão de litigar judicialmente, ver Cooter e Ullen
(1995).

Esta nota apresenta detalhes de um subconjunto de todos os indicadores que o IPEAJUS será Commented [MAFdHC4]: Talvez aqui possamos citar
brevemente a discussão da seção 3 referente a Cooter e Allen.
capaz de produzir. Uma série de outros recortes estão sob análise, pois dependem do
desempenho dos classificadores de partes nos processos, ainda em fase de desenvolvimento.
Por exemplo, estamos desenvolvendo classificadores para identificar outros setores de
atividade econômica da parte, além do setor de serviços7. Com isso, poderemos produzir

7
Na presente versão do painel de indicadores, apresentamos somente os resultados para o setor de
serviços, pois testes apontam um bom desempenho dos classificadores relativos a esse segmento.
Contudo, nos setores de indústria e agropecuária, os métodos disponíveis até o momento têm
apresentado um desempenho insatisfatório, com taxas de acerto reduzidas. Esperamos aprimorar esses
classificadores, para em breve produzir outros indicadores setoriais.

7
indicadores de inadimplência segundo setores de atividade - agropecuário, indústria e
serviços. Outro tipo de indicador em desenvolvimento busca mensurar a inadimplência em
instrumentos específicos, como por exemplo cheques, promissórias, duplicatas, etc8. Em suma,
acreditamos que, com o painel atual e os desdobramentos futuros apontados, os indicadores
judiciais venha a constituir uma importante fonte de informação para a aferição das condições
econômicas presentes - acessível a policy makers e agentes econômicos em geral.

Este documento apresenta, na próxima seção, a definição e a metodologia dos índices. A seção
3 contém uma breve descrição de aspectos conceituais e limitações dos indicadores. A seção 4,
apresenta-se uma análise descritiva dos indicadores, em frequência diária e mensal. A seção 5
discute a validade externa dos indicadores judiciais, comparando-os a indicadores tradicionais
do mercado de crédito. A seção 6 apresenta conclusão e prováveis extensões para um futuro
próximo. Os Apêndices apresentam informações sobre o sistema, com um caráter mais
técnico: uma visão geral do sistema IPEAJUS; uma descrição da estrutura dos métodos de
classificação das partes; uma análise da estrutura de defasagem de publicação dos processos;
e por fim, uma relação completa dos indicadores disponíveis até o momento.

2. Metodologia
A produção dos indicadores judiciais se baseia em um sistema de coleta automatizada de
informações do Diário da Justiça Eletrônico9. O sistema processa as seguintes etapas:
“download” dos diários de justiça do TJSP; conversão dos documentos para formato de texto;
identificação das classes ou assuntos processuais de interesse e armazenamento das
informações do processo, na íntegra10, em um banco de dados relacional; sorteio de amostra
aleatória a cada mês; realização de consulta processual no TJSP, para extração de informações
processuais complementares, além daquelas disponibilizadas no diário oficial: valor da ação,
assunto, andamentos, etc. Além disso, a produção de indicadores estratificados requer um
processamento adicional de informações, visando a identificação do tipo e/ou do CNPJ das
partes, tanto no pólo ativo (requerente ou exequente) quanto no pólo passivo (requerido ou
executado), possibilitando atribuir o processo a um segmento específico: credor financeiro ou
não-financeiro; devedor pessoa jurídica ou pessoa física; setor de atividade econômica do
devedor (obtido através da RAIS/MTE, por estabelecimentos). O apêndice apresenta uma
descrição detalhada do sistema.

O processo de extração de dados se inicia com o download dos cadernos Diário da Justiça
Eletrônico. Esta publicação contém uma lista completa dos processos distribuídos, conforme

8
Nesse caso, a tarefa consiste apenas em determinar o assunto do processo, o que não é possível de se
fazer quando da publicação da distribuição do processo, mas apenas no momento em que é publicado
algum tipo de movimento no processo, como despacho, intimação, nota de expediente, relação,
decisão, sentença, etc.
9
https://www.dje.tjsp.jus.br/cdje/index.do. Anteriormente a Outubro de 2007, as2007, as publicações
da Justiça Estadual eram veiculadas através do Diário Oficial do Estado de São Paulo/Poder Judiciário,
acessível em https://www.imprensaoficial.com.br.

10
Na verdade, todos os processos são inseridos no banco de dados, independentemente de classe. A
filtragem para às classes processuais dos indicadores é realizada no banco de dados.

8
amostra ilustrativa da Figura 1 abaixo. A leitura destas listagens resulta na extração das
seguintes informações: o número do processo, a comarca, a vara, a data da distribuição, as
partes (autor e réu) e seus respectivos advogados e a classe processual. O sistema extrai todas
estas listas de distribuição integralmente, desde Outubro de 2001, perfazendo um total de
mais de 60 milhões de processos, em todas as competências (cível, crime, fazenda pública,
juizados, etc). Esta imensa tabela corresponde ao cadastro associado ao universo de processos,
a partir dos quais o sistema executa suas tarefas de processamento.

Figura 1: Amostra de Relação dos feitos distribuídos. DiarioDiário da JusticaJustiça


EletronicoEletrônico do Estado de São Paulo.

9
A partir do universo, contamos a quantidade de processos distribuídos a cada dia, segundo
classes processuais de interesse: execução de título extrajudicial, monitória, despejo e busca e
apreensão. Desta contagem resultam diretamente os indicadores de volume de processos.

O tempo de apuração dos indicadores na frequência mensal depende do lapso de tempo (dias)
entre a distribuição do processo e a respectiva publicação no diário oficial. O tempo médio é
de seis dias (ver Tabela 2 abaixo), mas após dez dias mais de 90% dos processos distribuídos no
mês anterior já tiveram sua distribuição publicada na imprensa oficial. Como não conseguimos
observar o universo dentro deste curto espaço de tempo, é necessário justificar que, a partir
desta visão parcial do universo, somos capazes de sortear amostras aleatórias e produzir
indicadores sem viés amostral. Para tal, no apêndice, apresentamos uma análise descritiva
detalhada, para entender que atributos observáveis dos processos e/ou da jurisdição explicam
a defasagem de publicação. Além disso, discutimos como, na prática, se comportariam os
indicadores, ao longo de todo o período amostral, dependendo da data de apuração escolhida
(isto é, dependendo do conjunto de informação utilizado).

Os indicadores são de dois tipos: de volume de processos (casos novos) e de valor dos
processos. O volume ou contagem de processos é simplesmente o número de casos
distribuídos ou que tiveram registro de publicação (indicador censitário), dentro do período de
referência. Os indicadores de valor, por sua vez, se referem a diversos momentos da
distribuição amostral do valor da ação: média mediana, percentis 10 e 90, amplitude
interquartílica e desvio-padrão. Os indicadores de valor são apurados a partir de amostras,
pois não há necessidade de se apurar o universo de processos. Se assim fosse, o sistema teria
que inserir diariamente no banco de dados, um volume muito grande de informações
associadas a cada processo. Esta tarefa demandaria um volume excessivo de processamento e
armazenamento.

Os indicadores de valor são ajustados para a exclusão de valores extremos, que podem
distorcer a média e produzir um desvio-padrão excessivo. Especificamente, optamos pela
exclusão de 1% dos processos da amostra, que contém os maiores valores11. Commented [MAFdHC5]: O leitor pode se perguntar se não
deveriam ser excluídos também os 1% menores valores. Talvez
caiba aqui uma justificativa de por que não fazer isso.
Os indicadores estratificados, ou referentes a recortes específicos, são apurados somente
Commented [AC6R5]: Feito o comentário em nota de rodape
como indicadores de valor, pois como os classificadores de partes são probabilísticos e sujeitos
a erros, nem todos os processos do cadastro tem suas partes devidamente classificadas. Com
isso não podemos realizar contagens da população segundo estratos. Porém podemos apurar
estatisticasestatísticas de valor associadas a amostras aleatórias dos processos cujas partes

11
As distribuições do valor das ações judiciais tipicamente apresentam valores extremos, de modo que
estes processos de valor muito elevado têm o potencial para aumentar significativamente o valor médio
dos pedidos judiciais. Por outro lado, valores muito pequenos não têm o poder de reduzir
significativamente a média, portanto não há necessidade de retirá-los da amostra. A exclusão de valores
demasiado elevados é arbitrária e pode ser questionada no sentido de que “grandes eventos” de
inadimplência guardam uma relação direta com as condições do mercado de crédito como um todo.
Embora não discordemos desta visão, acreditamos que “grandes eventos” têm o potencial para
distorcer o valor médio dos contratos inadimplidos, de modo que optamos por médias “aparadas” (isto
é, excluindo valores extremos).

10
foram devidamente classificadas. Os detalhes acerca dos classificadores de partes são
apresentados no Apêndice.

Tabela 1: Estrutura resumida do painel de indicadores judiciais


Tipo de indicador Classe processual Recortes

Volume Títulos Executivos extrajudiciais Agregado


Monitória Bancário x não-bancário

Valor (média, mediana, Busca e apreensão em alienação PF x PJ


p10, p90, desvio-padrão, fiduciária
Setor de serviços x não- Commented [MAFdHC7]: Seria serviços x não-serviços?
amplitude interquartílica) Despejo por falta de pagamento serviços
Commented [AC8R7]: Ok ok

3. Aspectos conceituais e limitações

Por se tratarem de indicadores inéditos, faz-se necessária uma discussão acerca da sua
natureza, bem como de eventuais fragilidades ou limitações.

Conceitualmente, os indicadores judiciários não mensuram diretamente as obrigações


inadimplidas (non performing loans), mas sim agregados relacionados a eles. Particularmente
em horizontes de tempo mais dilatados, deve existir uma preocupação com relação a
estabilidade dessas relações. Teoricamente podemos representar as demandas judiciais
(judicial claims), 𝐽𝑡 , no agregado, como uma função das obrigações inadimplidas (non
performing loans), 𝑁𝑃𝐿𝑡 :
𝑛

𝐽𝑡 = ∑ 𝛼𝑖 𝑁𝑃𝐿𝑡−𝑖
𝑖=1

O vetor 𝛼 = (𝛼1 , . . . , 𝛼𝑛 ) representa a estrutura de defasagens a partir da qual non performing Commented [MAFdHC9]: alfa deveria depender também do
tempo, não? Alfa(t), pois a decisão de ajuizar depende de fatores
loans resultam em judicial claims. Esse vetor 𝛼 depende, portanto, dos parâmetros da que variam no tempo.
demanda jurisdicional, condicional a inadimplência, isto é, da decisão (inclusive o timing12) de Commented [AC10R9]: Ok, inseri nota de rodapé comentando
ajuizar um processo judicial uma vez que o credor se defronta com a inadimplência13.

A decisão de ajuizar, a cada instante, um processo judicial relacionado a contratos de crédito


envolve uma série de ponderações como: a probabilidade de recuperar o crédito custo
(inclusive tempo) do procedimento judicial; o conhecimento da situação patrimonial da parte
executada; a propensão a fechar acordos, etc. Além disso, dependendo do tipo de parte,
questões de natureza tributária e contábeis, como balanços e demonstrativos de resultado
(provisionamento de perdas, etc.) podem pesar na decisão de ajuizamento, como é o caso dos

12
Em geral, um crédito inadimplido não resulta em uma ação judicial de forma imediata. Muito
pelo contrário, uma execução de título extrajudicial pode ser a última tentativa de recuperação
de um crédito inadimplido. É importante ressaltar, contudo, que a cobrança judicial não requer
que tenha sido feito um protesto do título anteriormente.
13
Por conta deste tipo de dependência, a rigor o parâmetro 𝛼 deveria depender do tempo, sendo
portanto, representado como 𝛼𝑡 .

11
bancos, por exemplo. Todos estes fatores são parte da estrutura de um modelo
microeconômico (ver modelo canônico da análise econômica do direito em Cooter e Ullen
(1995)).

Na prática, o vetor 𝛼 depende da estrutura do mercado de crédito e de fatores institucionais


latu sensu. A estrutura do mercado de crédito compreende fatores como, por exemplo, o grau
de concentração das operações, a participação de bancos estatais e a intensidade com a qual
carteiras de crédito em atraso são transacionadas no mercado. Quando uma carteira de
créditos muda de titular, o tratamento conferido ao devedor também muda, de modo que
este tipo de evento tem o potencial de modificar, no agregado, a relação entre non performing
loans e judicial claims. Por se tratar de um setor fortemente regulado, a estrutura de mercado
dependerá também da evolução da atuação regulatória. Os fatores institucionais, associados a
leis processuais, a estrutura judiciária e a marco regulatório. A seguir, discutimos aspectos
institucionais associados a mudanças processuais, administrativas e regulatórias.

Mudanças processuais
Este tipo de mudança ou choque de caráter permanente, pode alterar tempo e custos de
processos, potencialmente alterando a seleção de casos que chegam ao poder judiciário. Por
exemplo, a reforma de títulos executivos de 2006 (Lei 11.382 de Dezembro de 2006, que
alterou dispositivos do Código de Processo Civil) alterou substancialmente os procedimentos
de execução de títulos extrajudiciais através do combate às chicanas jurídicas14, para conferir
maior efetividade ao processo e, com isso, elevar a taxa de recuperação de créditos na esfera
judicial. Portanto, hipoteticamente, uma reforma que eleva a segurança jurídica do credor
poderia ter impactos imediatos na queda da inadimplência, ao mesmo tempo em que poderia
elevar o número de casos novos (já que a maior efetividade eleva as chances de sucesso da
execução) – um movimento oposto ao padrão esperado de movimento conjunto dos
indicadores. A Lei de Falências e Recuperação Judicial de Empresas (Lei 11.101 de 2005) criou
novos procedimentos, como a recuperação judicial, além de alterar parâmetros mínimos para
pedidos de falência - passando a exigir inadimplência mínima de 60 salários mínimos para o
ajuizamento. Tais mudanças resultam em quebras estruturais nas séries históricas. De forma
análoga, a Lei do Divórcio alterou os parâmetros da demanda por este tipo de ação, visto que
flexibilizou os requisitos para procedimentos extrajudiciais. A lei do inquilinato pode ter
impactado a demanda por ações de aluguéis e/ou despejo. Em suma, mudanças na lei
processual (ou leis específicas) devem alterar os custos/benefícios percebidos de se ajuizar um
processo, de modo que acreditamos que os indicadores judiciais sejam sensíveis a mudanças
significativas na lei processual. Portanto, sua trajetória ao longo do tempo fica sujeita a estes
choques permanentes de natureza institucional. Na prática, tais mudanças têm um potencial
de resultar em erros de previsão significativos.

Mudanças administrativas ou regulatórias


Além de mudanças processuais, outros tipos de mudança estrutural a ser considerados são:
mudanças legislativas ou regulatórias substantivas, mudanças na estrutura do judiciário

14
Chicanas neste contexto são procedimentos de caráter protelatório, como por exemplo,
embargos a execução e outras medidas que dificultam a citação do réu ou a determinação de
bens penhoráveis.
12
(administrativo), mudanças nos procedimentos de cobranças extrajudiciais e mudanças
estruturais no mercado de crédito.

Por fim, é necessário apontar que a relação entre os indicadores judiciais e os indicadores
tradicionais de inadimplência - como por exemplo, taxa de inadimplência, índice de custo do
crédito, spread médio, % da carteira com atrasos expressivos, etc - não é direta, precisando ser
tratada com cautela. O volume (ou o valor médio) dos créditos requeridos judicialmente
depende de dois fatores básicos: do tamanho do mercado (saldo das operações de crédito) e
da própria taxa de inadimplência. Assim, quando o volume (ou valor) das execuções aumenta,
pode ser simplesmente por que o volume das operações cresceu, mantida a inadimplência, ou
porque, mantido o tamanho do mercado, a taxa de inadimplência cresceu, ou ambos.
Portanto, na discussão sobre a validade externa dos indicadores na seção 5, adotamos um
procedimento para “limpar” o efeito do crescimento do saldo das operações de crédito15 sobre
a trajetória das ações judiciais. Este procedimento de de-trending, ou de de-trending ou
remoção da tendência consiste em utilizar, ao invés do indicador judicial original, o resíduo de
uma regressão deste indicador judicial contra o saldo das operações de crédito. Este resíduo
captura quanto os judicial claims estão excedendo o volume que seria previsto dada a
trajetória de expansão do mercado de crédito. Portanto, se o resíduo da regressão é positivo,
significa que os judicial claims estão crescendo mais rápido que o mercado de crédito e vice-
versa.

4. Análise descritiva dos índices


Esta seção apresenta os indicadores judiciais, do ponto de vista de suas propriedades de séries
temporais – tanto em frequência diária quanto em frequência mensal. Analisam-se os
indicadores de volume e de valor, agregados e segundo recortes relevantes. Adicionalmente,
busca-se demonstrar a validade interna e externa do conjunto de indicadores, através da
comparação de recortes específicos com índices agregados e do contraste com indicadores
externos, obtidos de outras fontes primárias.

4.1. Defasagem de apuração dos índices


Antes de analisar os indicadores judiciais propriamente ditos, é importante apresentar uma
descrição da defasagem de publicação dos processos no diário oficial. Conforme apontado na
introdução, uma das características mais interessantes destes novos indicadores é justamente
a rapidez de apuração. Portanto nesta seção descrevemos a defasagem de publicação dos
processos judiciais.

15
Esta “limpeza” apresenta alguns problemas, sendo o mais importante o fato de que os dados
disponíveis para o saldo de operações de crédito, provenientes do Banco Central, se referem
apenas a instituições financeiras, o que não ocorre para a maioria dos indicadores judiciais
propostos, que refletem a inadimplência agregada, que inclui também o segmento não-
financeiro.
13
O diário eletrônico da justiça de São Paulo é a base para a construção do cadastro ou universo
dos processos judiciais. Ocorre, contudo, que muitos processos distribuídos hoje (D0) não tem
a sua distribuição publicada de forma instantânea (isto é, com apenas um dia de defasagem);
muitos processos podem levar dias para serem publicados. Desta forma, a apuração dos
indicadores fica sujeita a este hiato de tempo entre a distribuição e a publicação, que
passamos a analisar agora.

Optamos por analisar a estrutura de defasagem de publicação apenas a partir de 2016. O


motivo é que a série histórica do índice pôde ser revisada, incorporando todas as informações
até o dia de hoje. Portanto, nossa preocupação é com a atualização dos indicadores e nesse
sentido, estamos preocupados apenas com o passado mais recente. É importante ressaltar que
de fato o atraso na publicação dos processos é essencialmente de caráter
administrativo/gerencial, de modo que a estrutura mais recente é a que importa para
compreender as limitações inerentes a apuração dos indicadores.

Na tabela 2, apresentamos a duração, em dias, entre a data da distribuição e a data em que a


mesma é divulgada através do diário oficial. Para o período considerado, constata-se, em
média, uma duração de quase 7 dias. Após 14 (24) dias, cerca de 90% (95%) dos processos
distribuídos já tiveram sua distribuição publicada. Intuitivamente, portanto, após 7 dias
poderíamos caracterizar o processo médio, com um grau de precisão aceitável. Importante
ressaltar também que, em 2018, com dados apurados até o mês de Julho, a defasagem de
publicação se reduz significativamente, caindo para cerca de 5 dias.

Tabela 2: Diferença entre a data da publicação e a data da distribuição, em dias.

Ano distribuição média p90 p95 N

2016 6.8 13 24 98,228

2017 7.2 15 25 89,272

2018 5.3 8 16 67,202

Total 6.5 13 22 254,702

A Figura 1 abaixo apresenta a função densidade cumulativa da defasagem de processos, para o


universo de processos relativos às classes dos indicadores. No apêndices apresentam-se as Commented [MAFdHC11]: Fiquei com algumas dúvidas. Você
se refere ao total de processos? O universo de processos para
mesmas funções, segundo classe processual e jurisdição (capital versus interior). Após 5 dias, aferição das classes é diferente do universo para aferição de
praticamente 80% dos processos já foram publicados; após dez dias, o índice sobe para 90%. recortes? Isso foi discutido antes? A tabela 1 se refere a um
universo diferente da Figura 1? Valeria explicitar algo a este
respeito na tabela e figura (no título ou como nota/observação)

14
Figura 1: Diferença entre a data da publicação e a data da distribuição, em dias. Função
densidade cumulativa.

Conforme análise mais detalhada no Apêndice A.3, demonstramos que a defasagem de


publicação está sujeita a efeitos de calendário, isto é, dependendo do mês e do dia do mês em
que o processo foi publicado, a defasagem de publicação irá variar. Visando identificar os
fatores que influenciam a defasagem de publicação, apresentamos neste apêndice uma
discussão econométrica acerca dos determinantes da probabilidade de um processo ser
amostrado após 5 e 10 dias da distribuição. A conclusão é que o valor da demanda judicial, isto
é, o valor da ação judicial, não têm influência sobre esta probabilidade. Desta forma,
decidimos por apurar os indicadores com informações até o quinto dia do mês, sem correr o
risco de viés de seleção.

Em suma, diante da defasagem de publicação inerente a fonte de dados (o diário eletrônico da


Justiça do estado de São Paulo), e com base na análise da estrutura de defasagens, concluímos
ser factível a apuração dos indicadores no sexto dia do mês subsequente ao período de
referência (dados publicados até o dia 5 do mês). Pesa nesta opção o fato de que, conforme
apresentado na tabela 1, a defasagem de publicação se reduziu significativamente em 2018.

4.1 . Indicadores da quantidade de processos distribuídos


Os indicadores de quantidade de processos são censitários. Isto é, baseiam-se na contagem de
processos segundo classe processual. A apuração destes indicadores fica sujeita a revisão no
fim do mês, pois, conforme apontado pelas funções densidade cumulativa, apenas após 30

15
dias é que 100% dos processos distribuídos foram de fato publicados. Contudo, a partir dos
padrões sazonais apresentados na seção anterior, podemos extrapolar os dados de contagem
apurados no início do mês para projetar o consolidado do mês com maior precisão.

4.1.1. Indicadores agregados


A Figura 2 abaixo apresenta a quantidade de casos novos distribuída mensalmente no TJSP.
Estes são os indicadores judiciais agregados, relativos a títulos executivos extrajudiciais,
monitórias, busca e apreensão em alienação fiduciária e despejo.

Visando comparar o comportamento destes indicadores entre si, na Figura 3 apresentamos a


trajetórias dos indicadores anualizados (média móvel de doze meses), na forma de índice com
base fixa (média de processos ao longo do ano de 2007). Percebe-se que a série de busca e
apreensão em alienação fiduciária oscila mais do que as demais séries.

Figura 2: Indicadores judiciais do volume de processos, segundo classe processual. São Paulo.

16
Figura 3: Indicadores judiciais do volume de processos, média móvel de 12 meses. Índice base
fixa (média de 2007=100). São Paulo.

4.2. Indicadores de valor dos processos distribuídos

A partir dos dados da distribuição amostral do valor da ação para cada processo, produzimos
um conjunto de indicadores, baseados em diferentes momentos da distribuição: média,
mediana, percentil 75%, percentil 90% e desvio padrão e amplitude interquartil. Cada uma
destas estatísticas é conceitualmente distinta e pode ter relevância única do ponto de vista de
refletir as condições econômicas, em particular aquelas associadas ao mercado de crédito. Os
índices são medidos em reais constantes, a preços médios do ano de 2007.

4.2.1. Indicadores agregados

A Figura Fig_4 abaixo apresenta a trajetória do valor médio para títulos executivos
extrajudiciais, monitórias, busca e apreensão e despejo. Embora as trajetórias apresentem
alguma similaridade, fica evidente que há diferenças no timing de alguns pontos de inflexão.

17
Podemos observar dois padrões: enquanto as monitórias e despejo apresentam uma
tendência de crescimento ao longo de todo o período amostral, os títulos executivos e busca e
apreensão apresentam um pico histórico, em torno do segundo semestre de 2014 para o
primeiro e início de 2013, para o segundo.

Figura 4: Índice de valor médio dos processos judiciais, em Reais constantes (média 2007=1).
São Paulo.

A Figura 5 apresenta índices de valor médio anualizados, em base fixa, para facilitar a
comparação entre indicadores. Destaca-se o fato de que o valor médio dos títulos executivos
extrajudiciais se descolou, após a crise de 2008, dos demais índices, atingindo um patamar
300% superior ao patamar pré-crise. As demais classes apresentaram alguma elevação, mas de
magnitude inferior a observada para títulos executivos.

18
Figura 5: Índice base fixa (2007=100) do valor real médio dos processos judiciais, média móvel
de 12 meses. São Paulo.

A Figura 6 apresenta, em um único gráfico, a trajetória de diferentes momentos da distribuição


do valor da ação, para processos judiciais de despejo. Escolhemos esta classe, pois gostaríamos
de investigar mais de perto o salto observado em Março de 201816. O gráfico revela que o
aumento do valor médio dos processos é decorrente de um forte aumento no percentil 90 da
distribuição. Isto é, aumentou a frequência de despejos com valor relativamente elevado, na
cauda da distribuição. Observa-se que a mediana teve um aumento apenas discreto. O
comportamento do volume das ações é descendente, conforme visto anteriormente na Figura
3, sugerindo uma redução da inadimplência. Este comportamento é compatível com a recente Commented [MAFdHC12]: Ou redução das operações totais
de crédito?
recuperação do mercado imobiliário em São Paulo.17
Commented [MAFdHC13]: Alguma referência a este respeito?

16
Por economia de espaço, optamos por não incluir tabelas e gráficos para outras classes processuais,
contendo descrição dos momentos da distribuição do valor dos processos.

17
Em momentos de crise, supõe-se um aumento no volume e uma queda no valor médio, pois a maioria
dos contratos inadimplentes advém dos estratos médios ou inferiores dos contratos.

19
Figura 6: Índice de valor das ações de despejo, em Reais constantes (2007=1). Média,
mediana, percentis 10 e 90. São Paulo.

4.2.2. Indicadores por segmento


Conforme a descrição da metodologia, os indicadores por segmento são disponíveis somente
para o valor da ação, e não para quantidade. Os segmentos do índice são: devedor pessoa
física versus pessoa jurídica; credor financeiro versus não-financeiro; setor de atividade-
serviços. Visando permitir uma comparação mais clara, os gráficos dos índices recortados
contêm também o índice agregado para a respectiva classe processual.

É importante ressaltar que os indicadores recortados ou por segmento não existem para todos
as classes processuais, simplesmente porque há segmentos que raramente utilizam
determinados instrumentos - de modo que as amostras de processos são “pequenas demais”
resultando em variância excessiva. Por exemplo, verificamos que as ações de despejo não se
aplicam a credores financeiros, pois estas instituições raramente ajuizam este tipo de ação.

20
4.2.2.1. Devedor/requerido pessoa física versus pessoa jurídica
A figura 7 abaixo apresenta a trajetória dos indicadores judiciais de acordo com o segmento
(pessoa física ou jurídica), para as classes pertinentes aos índices. Exceto por busca e
apreensão em alienação fiduciária, em todos os casos o valor médio das ações para pessoas
físicas é muito superior ao relativo às pessoas físicas. Este é um resultado intuitivo, de acordo
com o esperado. O caso de busca e apreensão pode se explicar pelo fato do objeto das ações
tratar tipicamente de veículos, o que deve explicar a semelhança no valor das ações. Exceto
por títulos executivos extrajudiciais, a trajetória dos índices apresenta uma tendência comum.
Observa-se um descolamento gradual da trajetória dos títulos executivos, entre PF e PJ, desde
a crise de 2008; o valor médio para PJ cresce de modo relativamente acelerado a partir de
2010, atingindo uma inflexão no fim de 2014, enquanto o valor para PF segue crescendo até o
fim de 2015.

Outro fato estilizado, aparente nos gráficos, é um comportamento relativamente mais “suave”
da trajetória do valor médio para pessoas físicas, comparadas às pessoas jurídicas.

Figura 7: Valor médio das ações judiciais (Reais constantes), segundo classe processual e
segmento (devedor/requerido pessoa física versus pessoa jurídica), média móvel de 12 meses.
São Paulo.

21
4.2.2.2. Credor/requerente financeiro versus não-financeiro
A Figura 8 apresenta a trajetória do valor médio das ações, segundo classe processual, para
bancos e não-bancos que sejam pessoas jurídicas (como requerentes ou credores). Conforme
apontado no início desta seção, excluem-se ações de despejo nas quais os bancos são
demandantes, pois trata-se de uma situação rara, não sendo possível nem pertinente o
cômputo de um indicador definido desta forma.

Os gráficos apontam para valores médios muito superiores no caso dos bancos ao longo de
toda a amostra, o que é esperado, pois estas instituições são mais seletivas e impõem
barreiras e custos fixos na concessão de crédito que resultam em uma elevação no valor médio
das operações, em relação aos outros segmentos do mercado.

Figura 8: Valor médio das ações judiciais (Reais constantes), segundo classe processual e
segmento (bancário versus não-bancário). São Paulo.

22
4.2.2.3. Setor de atividade econômica: serviços
A figura 9 abaixo apresenta uma comparação do indicador do valor médio dos pedidos judiciais
(judicial claims) no setor de serviços, em relação ao mesmo indicador para o agregado.
Diferentemente dos recortes anteriores, nesse caso as diferenças na média e na variância não
parecem tão evidentes.

Figura 9: Valor médio das ações judiciais (Reais constantes, 2007=1), segundo classe processual
e setor de atividade econômica: serviços e agregado (todos os setores). São Paulo.

4.2.3. Indicador diário (títulos executivos somente)


Para produzir um indicador rápido, com apuração diária, sorteamos diariamente 35 processos Commented [MAFdHC14]: Parece um número muito pequeno
para servir de base para um indicador confiável. Talvez possamos
na classe de títulos executivos extrajudiciais. Esta escolha se deve ao fato desta classe ser a apresentar esta seção como uma seção exploratória, visando
mais ampla e representativa do mercado de crédito, eliminado potenciais dificuldades na ilustrar algumas dificuldades no cálculo de um indicador diário e as
diferenças entre esse tipo de indicador e o indicador mensal.
amostragem diária. Por enquanto não temos outras classes, pois os sorteios diários aumentam
Commented [AC15R14]: Não sei se concordo, pois eh uma %
significativamente o volume de processamento dentro do sistema IPEAJUS. Neste momento expressiva do volume diário de processos distribuídos. Vamos
apresentamos apenas o valor mediano, pois a média diária apresenta oscilações discutir isso com calma

excessivamente acentuadas, devido às amostras menores que as mensais. Este indicador será
publicado após revisão do problema. Deve-se ressaltar que a análise da defasagem de

23
publicação dos indicadores apresentada no Apêndice não se aplica para o indicador diário, pois
sua base é diária.

A figura 10 abaixo apresenta a evolução diária do indicador do valor mediano dos títulos
executivos extrajudiciais, juntamente com uma média móvel de 365 dias, que permite uma
melhor observação da tendência do indicador, livre das oscilações acentuadas, observadas no
dado diário.

Figura 10: Valor mediano (Reais constantes, 2007=1) dos títulos executivos extrajudiciais,
diário e média móvel de 365 dias. São Paulo.

A figura 11 abaixo apresenta compara os indicadores diário e mensal do valor mediano de


títulos executivos. O indicador diário (deflacionado) é computado em termos da média mensal.
A figura contém gráfico de barras que mede a diferença percentual entre os dois indicadores.
Percebe-se uma diferença significativa e sistemática entre os dois indicadores: o indicador
diário é cerca de 12% menor do que o indicador mensal. Parte desta diferença deve-se ao fato
de que o indicador diário é apurado apenas com os dados disponíveis no dia seguinte.
Conforme a análise da seção XXX, podemos suspeitar que apenas uma parcela pequena dos
processos distribuídos em D são publicados em D+1, pois a defasagem média é de 7 dias.

24
Figura 11: Valor mediano dos títulos executivos extrajudiciais (Reais constantes, 2007=1).
Indicado mensal e média mensal do indicador diário. São Paulo.

25
4.3. Discussão

A figura 12 abaixo apresenta uma comparação dos indicadores agregados de valor e


quantidade de processos.

Figura 12: Indicadores judiciais de volume (unidades) e valor médio (Reais constantes,
2007=1), segundo classes processuais. São Paulo.

Nota: Linhas sólidas correspondem aos indicadores de volume (eixo primário). Linhas
tracejadas correspondem aos indicadores de valor médio (eixo secundário).

A partir dos indicadores de valor médio e da quantidade de processos judiciais, podemos obter
uma estimativa do valor total dos processos diretamente, a partir do produto dos dois

26
indicadores. Na figura 13 abaixo apresentamos estes indicadores do valor total. Os gráficos
estão no formato de índice com base fixa, para facilitar a visualização dos dados. Como os
indicadores de valor e de quantidade em geral oscilam na mesma direção, o resultado é que as
séries de valor total apresentam uma variância mais elevada.

Figura 13: Quantidade, valor médio e valor total dos títulos executivos extrajudiciais. Índice
base fixa. São Paulo.

Nota: Valores denominados em reais constantes, 2007=1.

27
5. Validade externa

Diante do ineditismo dos indicadores judiciais apresentados, é necessário avaliar a validade


externa do conjunto de indicadores para fins de aferição das condições do mercado de crédito.
Isto é, em que medida os indicadores aqui propostos são capazes de acompanhar de perto a
trajetória de indicadores tradicionais do mercado de crédito, em particular aqueles associados
à inadimplência? Visando ilustrar esta questão, a presente seção compara a evolução dos
indicadores judiciais com indicadores das condições de crédito divulgados pelo Banco Central
do Brasil (BCB). Cabe ressaltar que há diferenças conceituais importantes entre os dois
conjuntos de indicadores. Primeiro, estes indicadores do BCB são construídos a partir de
informações coletadas junto às instituições financeiras; não há, portanto, informações sobre
características de operações de crédito realizadas por instituições não-financeiras. Os
indicadores judiciais, por outro lado, contemplam também pedidos relativos a créditos não-
financeiros (com exceção de alguns segmentos ou recortes). Outra limitação dos dados do
Banco Central é que, em geral, se referem ao Brasil como um todo, não havendo dados
disponíveis para São Paulo - exceto pelos saldos das operações de crédito e pela taxa de
inadimplência. A despeito destas diferenças, sendo o Banco Central a única fonte de
informação, utilizamos estes dados para aferir a validade externa dos indicadores judiciais.

Conforme apontado na seção 3, o volume de demandas judiciais (judicial claims) varia não
somente por conta de oscilações na inadimplência, mas também por conta de oscilações no
“tamanho” do mercado de crédito. Assim sendo, nesta seção, “limpamos” os indicadores
judiciais do “efeito” do crescimento do mercado de crédito, gerando agregados “ajustados”,
conceitualmente mais consistentes com as diversas medidas da taxa de inadimplência. Este
procedimento consiste em rodar uma regressão do valor total do pedido contra o saldo das
operações de crédito. O indicador ajustado é o erro dessa regressão. Este erro será positivo
(negativo) quando o valor efetivo dos pedidos for superior ao valor previsto com base no saldo
das operações de crédito.

A figura 14 abaixo apresenta a trajetória do volume de títulos executivos e uma série de


indicadores de inadimplência. Como se trata de um indicador judicial agregado, os indicadores
de inadimplência utilizados também são agregados, isto é, incluem pessoa física e pessoa
jurídica18.

18
A taxa de inadimplência utilizada se refere a São Paulo. Os demais indicadores se referem ao Brasil,
pois não estão disponíveis para São Paulo.

28
Figura 14: Volume das ações de títulos executivos extrajudiciais, ajustado, e indicadores de
inadimplência. São Paulo.

Nota: Linhas sólidas correspondem aos indicadores judiciais ajustados de volume (eixo
primário). Linhas tracejadas correspondem aos indicadores de inadimplência do Banco Central
(eixo secundário), conforme indicado no título do gráfico.

A seguir, na figura 15, apresentamos gráficos semelhantes aos anteriores, referentes a


estimativa do valor total dos judicial claims (valor médio x quantidade), ajustado pela evolução
do saldo das operações. O resultado é que os indicadores judiciais se aproximam ainda mais Commented [MAFdHC16]: Acho melhor falar de “valor
ajustado pela evolução do saldo das operações”, ou simplesmente
dos indicadores de inadimplência. de “valor ajustado”, do que falar de “valor detrended, ou sem
tendência”. Isso porque esta terminologia geralmente se aplica à
remoção de movimentos de longo prazo, mas aqui estamos falando
também de remoção de efeitos cíclicos que afetem o saldo das
operações.

29
Figura 15: Valor total das ações de títulos executivos extrajudiciais, ajustado (em mil reais), e
indicadores de inadimplência. São Paulo.

Nota: Linhas sólidas correspondem aos indicadores judiciais ajustados de volume (eixo
primário). Linhas tracejadas correspondem aos indicadores de inadimplência do Banco Central
(eixo secundário), conforme indicado no título do gráfico.

Na figura 16 a seguir, confrontamos a trajetória do valor total das ações judiciais (ajustado pela
evolução do saldo das operações), segundo classe processual, com a trajetória da taxa de
inadimplência total em São Paulo.

30
Figura 16: Valor total das ações de títulos executivos extrajudiciais, ajustado (em mil reais),
segundo classe processual, e taxa de inadimplência total. São Paulo

Nota: Linhas sólidas correspondem aos indicadores judiciais ajustados de valor total das ações
(eixo primário), conforme definido no título do gráfico. Linhas tracejadas correspondem ao
indicador da taxa de inadimplência total, do Banco Central (eixo secundário).

Uma questão empírica relevante é se outros momentos da distribuição do valor dos processos,
como por exemplo a mediana, seriam capazes de capturar as flutuações de curto prazo na
inadimplência. Portanto, na figura 17 abaixo repetimos as figuras anteriores, porém
considerando o valor mediano de judicial claims, também ajustados pela evolução do saldo
das operações. Pelo exposto na figura, o valor mediano (ajustado ou não ajustado) dos judicial
claims não parece ser um indicador adequado para capturar flutuações na taxa de
inadimplência total. Na verdade, as figuras sugerem que quando a inadimplência aumenta, o
valor mediano (ajustado) também aumenta. Isto é, em momentos de queda da inadimplência,
o valor mediano de judicial claims é menor. A figura FIG_CICLO no final desta seção confirma a
ideia de que nos momentos de maior inadimplência, a massa de processos de valor mais
elevado aumenta, contribuindo para o aumento da mediana.

31
Figura 17 Valor mediano (ajustado) das ações judiciais, segundo classe processual, e taxa de
inadimplência total. São Paulo.

Nota: Linhas sólidas correspondem aos indicadores judiciais ajustados de valor mediano (eixo
primário), conforme definido no título do gráfico. Linhas tracejadas correspondem ao
indicador da taxa de inadimplência total, do Banco Central (eixo secundário).

Nas figuras a seguir, repetimos a análise anterior para alguns dos indicadores judiciais por
segmento, atentando para as comparações com indicadores de inadimplência por segmento,
como por exemplo, o de pessoas jurídicas e os instrumentos de alienação fiduciária.

A figura 18 abaixo apresenta a trajetória ajustada19 do valor médio dos títulos executivos
extrajudiciais, quando o executado é pessoa jurídica. Deve-se ressaltar que, no caso dos dados
por segmento, não é possível apresentar estimativa do valor total, pois não dispomos dos
dados de quantidade.

19
Isto é, o quanto o valor médio ou volume dos judicial claims excedem o previsto pelo tamanho do
mercado ou volume das operações.

32
Figura 18: Valor médio (ajustado) dos títulos executivos extrajudiciais quando o requerido é
pessoa jurídica e outros indicadores do mercado de crédito.

Nota: Linhas sólidas correspondem ao indicador do Valor médio (ajustado) dos títulos
executivos extrajudiciais (eixo primário). Linhas tracejadas correspondem aos indicadores de
inadimplência do Banco Central (eixo secundário), conforme definido no título do gráfico.

33
Figura 19: Valor médio (ajustado) dos despejos quando o requerido é pessoa física e outros
indicadores do mercado de crédito.

Nota: Linhas sólidas correspondem ao indicador do Valor médio (ajustado) das ações de
despejo (eixo primário). Linhas tracejadas correspondem aos indicadores de inadimplência do
Banco Central (eixo secundário), conforme definido no título do gráfico.

Na Figura 20 abaixo, apresentamos a trajetória dos indicadores judiciais (ajustados) com a


trajetória das provisões para empréstimos em atraso como porcentagem da carteira total. A
eventual necessidade de “limpar” o balanço dos passivos contingentes e com isso reduzir o
grau de alavancagem, tende a impulsionar os pedidos judiciais. De fato, as trajetórias são
bastante similares. Curiosamente, contudo, as figuras sugerem que a trajetórias das ações de
despejo é a que mais acompanha a trajetória das provisões bancárias.

34
Figura 20: Indicadores judiciais (ajustados) de valor médio e percentual do total de provisões
em relação à carteira de crédito do Sistema Financeiro Nacional

Nota: Linhas sólidas correspondem ao indicador do Valor médio (ajustado) dos títulos
executivos extrajudiciais (eixo primário), conforme definido no título do gráfico. Linhas
tracejadas correspondem ao indicador do total de provisões como porcentagem da carteira de
crédito do Sistema Financeiro Nacional (eixo secundário).

Até o momento, a análise dos indicadores do valor dos judicial claims se limitou a observar
alguns momentos da distribuição. Seria interessante, contudo, observar a totalidade desta
distribuição, que varia ao longo do tempo. Uma forma de visualizar o comportamento destas
distribuições seria representá-las em diferentes fases do ciclo de crédito. Estes ciclos alternam
entre períodos de expansão e de contração da oferta de crédito. Os seguintes períodos foram
identificados: I- entre Março de 2005 e Maio de 2008, observa-se expansão acelerada dos
saldos das operações; II- entre Junho de 2008 e Novembro de 2009, uma forte contração; III-
entre Dezembro de 2009 e Fevereiro de 2014, um período de relativa estabilidade, com a
estoque de crédito crescendo a taxa constante; IV- entre Março de 2014 e Dezembro de 2016,
nova contração, quando se observa forte desaceleração nas taxas de expansão; V- De Janeiro
de 2017 até os dias de hoje, uma certa estabilidade, com leve tendência de recuperação.
Portanto temos caracterizadas três fases do ciclo: expansão (período I), retração (períodos II e
IV) e estabilidade (períodos III e V). Assim, na figura FIG_CICLO a seguir, apresentamos

35
aproximações (kernel density estimates) para a distribuição do valor da ação, conforme as Formatted: Font: Italic
fases do ciclo definidas acima20.

Figura 21: Distribuição do valor real da ação judicial, segundo fases do ciclo de crédito:
expansão, retração e estabilidade. Classes processuais do indicador judicial. São Paulo.
Expansão: até 2008m5. Retração: 2008m6-2009m11 e 2014m3-2016m12. Estabilidade:
2009m12-2014m2 e 2017m1 em diante.

Dois fatos ficam evidentes a partir da figura acima. Primeiro, as distribuições de judicial claims
são semelhantes nos casos de estabilidade ou retração do mercado de crédito. Segundo, tais
distribuições mudam de formato, entre as fases de expansão e as fases de
estabilidade/retração, com.a proporção de casos de maior valor elevando-se no segundo caso.

6. Conclusões e próximos passos


Este artigo apresentou o conjunto inédito de indicadores baseados em registros judiciários,
que capturam o volume o valor de disputas judiciais associadas a contratos comerciais e de
crédito. Os indicadores compreendem um conjunto abrangente de instrumentos do mercado
de crédito. Além disso, eles são apurados não apenas de forma agregada, mas também

20
Às distribuições estão truncadas em dez, vinte ou trinta mil reais, dependendo da classe, pois as
distribuições completas possuem caudas muito longas (valores extremos), de modo que comprometeria
a visualização adequada do gráfico. Os valores são deflacionados pelo IPC FIPE para São Paulo.

36
segundo recortes que capturam diferentes segmentos do mercado de crédito. Na presente
versão, o painel conta com os recortes de pessoa física/pessoa jurídica; crédito
bancário/crédito não-bancário e o setor de serviços.

Algumas características fazem deste painel de indicadores uma fonte única de informação e
complementar aos indicadores tradicionais: a rapidez de apuração; a frequência diária, em
alguns casos; e a possibilidade de recortes regionais.

Conforme documentado ao longo do artigo, os recortes dos dados processuais dependem de


um sistema complexo que caracteriza e/ou identifica as partes do processo, a partir dos nomes
próprios. Portanto, o principal eixo de desenvolvimento deste projeto reside no
aprimoramento dos classificadores. Com isso, já se encontra em andamento o processo de
construção de novos recortes dos indicadores, incluindo: micro e pequenas empresas/grandes
empresas; setores de agropecuária e indústria; e indicadores relativos a instrumentos
específicos como cheques, promissórias, duplicatas, alienação fiduciária, contratos de cartão
de crédito, entre outros. A estrutura atual do sistema IPEAJUS permite a expansão do escopo
dos indicadores com custos marginais reduzidos, exigindo-se apenas algum volume de
processamento adicional, porém factível.

Futuramente, o sistema permitirá o desenvolvimento de indicadores mais sofisticados, que


possam capturar alguns aspectos institucionais do nosso sistema judicial, como por exemplo: a
taxa de recuperação de créditos; a duração dos procedimentos de recuperação; os índices de
acordo, etc. Tais indicadores constituem parâmetros relevantes para comparações
internacionais, por exemplo no tocante à capacidade do sistema judicial em assegurar direitos
dos credores. Diante do exposto, fica evidente que no estágio atual, os indicadores judiciais
podem contribuir para a aferição de aspectos importantes das condições econômicas
presentes. Em estágios futuros, indicadores mais sofisticados podem contribuir para análises
estruturais acerca do papel das instituições judiciais sobre o funcionamento dos mercados de
crédito e o desenvolvimento econômico.

37
Referências

Castro, Alexandre (2016). “Judicial Indicators and Business Cycles in Brazil”. Disponível
em: https://ssrn.com/abstract=2821897.

Castro, Alexandre, Marco Antonio Freitas de Holanda Cavalcanti and e Augusto


Consulmagnos Romeiro (2016). “Judicial indicators for credit markets in São Paulo”.
Paper presented at 34th CIRET Conference, September 2018. Rio de Janeiro.

Cooter, Robert and Ulen, Thomas, "Law and Economics, 6th edition" (2016). Berkeley
Law Books. Disponível em:https://scholarship.law.berkeley.edu/books/2

38
Apêndices

A1. Descrição do Sistema IPEAJUS

O IpeaJus é um sistema que vêm sendo desenvolvido na Assessoria técnica da Presidência do


IPEA, ASTEC. O sistema tem como objetivo de consolidar uma base de dados contendo
microdados obtidos a partir de consultas processuais públicas em diversos tribunais
brasileiros, por enquanto nas esferas estadual e federal; devendo alcançar, futuramente,
tribunais do trabalho e superiores. A construção de bancos de dados referentes a assuntos
específicos permite analisar a interface do sistema judicial com o desenho e a implementação
de políticas públicas em diversas áreas, como: tratamentos médicos e fornecimento de
medicamentos, concessão de benefícios assistenciais, improbidade administrativa, temas
relativos às agências reguladoras, falências e recuperações judiciais de empresas, relações
trabalhistas, entre outros assuntos processuais. O sistema pode contribuir também para
pesquisas na área de justiça/política criminal.

Desenvolvido majoritariamente em linguagem Python 3.6, sobre uma base de dados relacional
PostgreSQL, o sistema IpeaJus contém atualmente quase 40 mil linhas de código, que
possibilitaram a coleta e análise de mais de 140 milhões de registros relativos a processos da
esfera federal e esfera estadual (São Paulo). A Figura A.1 abaixo apresenta o diagrama
entidade-relacionamento simplificado da base de dados. O diagrama contém as principais
tabelas que suportam o sistema IpeaJus, como por exemplo a tabela Processo, que contém as
informações básicas de um processo judicial, como a sua numeração processual, a data de
distribuição, a unidade (vara ou juizado, etc.), a classe, o assunto, o juiz, etc. O diagrama
mostra de que forma as tabelas se relacionam entre si. Por exemplo: a tabela processo possui
um código para a classe processual, que será identificado na tabela classe processual. Para
tornar viável a exposição deste esquema analítico em uma única página, foram omitidas cerca
de 30 outras tabelas que suportam o armazenamento das diferentes informações específicas a
cada tribunal ou a um assunto processual específico. A arquitetura do banco de dados
apresenta um caráter bastante geral e abstrato, podendo assim suportar informações
provenientes não só dos tribunais já inclusos na pesquisa (TJSP e Tribunais Regionais Federais)
mas também informações processuais de qualquer outro tribunal do sistema de justiça
brasileiro.

39
Figura A.1: Diagrama entidade-relacionamento do banco de dados IPEAJUS.

A singularidade dos sistemas de consulta pública de acompanhamento processual implica que,


para cada tribunal é necessária a construção de extratores de informações específicos.
Atualmente, o sistema IpeaJus está prestes a concluir os extratores de processos relativos aos
tribunais regionais federais e expandindo o escopo de extratores na esfera estadual (TJRS,
TJSP, TJRJ, TJMG).

A construção de bancos de dados a partir do sistema está sujeita às restrições da consulta


processual pública: consulta por número do processo ou por nome/documento da parte. A
grande limitação da consulta processual nos tribunais brasileiros é a impossibilidade de
consulta por classe e/ou assunto processual. Portanto, a estratégia de construção de um banco
de dados orientado para pesquisa empírica passa necessariamente por definir um conjunto de
processos (números) associados ao assunto de interesse (por exemplo, falências, improbidade
administrativa, etc.). Em geral, é possível a obtenção de listas de processos associados a
determinada classe ou assunto, através de pedido baseado na Lei de Acesso à Informação, mas
esta é uma estratégia que nem sempre é bem-sucedida, pois, por vezes, os tribunais se
recusam a oferecer a informação e por vezes, fornecem com uma demora excessiva. Sem
contar as várias situações de recusa. Uma alternativa bastante utilizada no âmbito do IPEAJUS
é a identificação de classes/assuntos a partir da leitura automatizada dos diários de justiça.
Esta leitura visa identificar estas informações seja em listas de feitos distribuídos (quando
disponíveis), seja em publicações diversas relativas ao processo - nesse caso, com o auxílio de
expressões regulares podemos selecionar os processos com base no assunto, se aparecer de

40
forma explícita, ou a partir do conteúdo de publicação (despacho, sentença, intimação, edital,
etc.)21. Em todos os casos, o sistema sempre executa a validação da classe/assunto antes de
inserir as informações processuais no banco de dados. Uma vez que um processo é validado e
inserido no banco de dados, todos os processos associados a ele são também inseridos,
preservando a relação original, conforme o banco de dados do tribunal. A esta teia de relações
entre processos denominamos “árvore processual”. Esta árvore do processo pode conter tanto
incidentes processuais, como por exemplo uma habilitação de crédito, no caso de falências,
quanto recursos, como por exemplo um recurso inominado, no caso de um procedimento do
juizado especial. A “árvore processual” é um elemento crítico do banco de dados processual
pois é a partir dele que podemos caracterizar eventos relevantes como a recorribilidade e a
reforma de sentenças.

Conforme o exposto na Figura 2, o sistema IpeaJus é composto por 4 módulos principais,


sendo o mais básico o módulo de download e conversão de Diários Oficiais, que fornece os
dados que serão processados no módulo de extração de informações dos diários oficiais. Os
módulos se comunicam entre si sempre através da base de dados. As informações obtidas no
módulo de diários oficiais servem de input, ou parâmetro de busca para a consulta processual
pública. O resultado da consulta pública é validado (para verificação da classe ou assunto de
interesse) e então, inserido no banco de dados. Por fim, os dados no banco são analisados
através de filtros e classificadores diversos. Esse mesmo módulo é responsável ainda por dois
tipos de função: 1- operacionalizar uma série de construtos e variáveis secundárias, no
contexto do negócio em análise. Tais construtos incluem, por exemplo, taxas de reforma ou
taxas de recorribilidade externa22; 2- analisar o desempenho do classificador de sentenças e
decisões23. As variáveis primárias e secundárias resultantes desses classificadores possibilitam
a produção de estatísticas descritivas relevantes para a pesquisa empírica.

21
Por exemplo, considere um processo falimentar. Expressões como “habilitação de crédito”, “lista de
credores”, “decretada a falência”, etc., estão tipicamente associadas a processos da classe de falência
ou recuperação judicial de empresas.
22
Embora a operacionalização de tais conceitos seja relativamente direta, são necessárias algumas
classificações mais sutis como, por exemplo, se a sentença é passível ou não de recurso (sentenças sem
resolução de mérito em geral não são passíveis de recurso externo).
23
A análise de desempenho do classificador pressupõe duas tarefas: primeiro, determinar as sentenças
que foram classificadas, como porcentagem do total de sentenças; segundo, avaliar a taxa de erro do
classificador, quando for possível. Ambas as tarefas são específicas ao negócio, isto é, a matéria ou
assunto processual que é objeto da pesquisa. Por exemplo, a taxa de classificação não é a mesma para
sentenças de falência, de pedidos de benefício assistencial ou para sentenças de improbidade
administrativa. Vale ressaltar, contudo, que uma parte significativa dos filtros textuais para classificação
de sentenças são comuns a todos os assuntos e matérias processuais: a parte que classifica sentenças
sem resolução de mérito (abandono, litispendência, acordo, etc.).

41
Figura A.2: Estrutura do sistema IPEAJUS.

O módulo responsável pelo download de diários oficiais consiste em um conjunto de sub-


módulos, cada um responsável pela atualização diária do acervo de Diários Oficiais para um
determinado tribunal de justiça. Este módulo se encontra em avançado estágio de
desenvolvimento, tendo catalogado até o momento mais de 100.000 diários referentes aos 5
Tribunais Federais e mais de 1,8 milhões de diários dos tribunais estaduais.

No TJSP, a produção dos indicadores judiciais se baseou - no período até a data de 13/09/2018
- num total de 45,4 mil cadernos de diários oficiais, entre capital e interior. Deste acervo,
foram mapeados 60,4 milhões de processos, dentre os quais identificamos 8.8 milhões
relativos às classes processuais que definem os indicadores. A partir deste universo de
processos, definimos diversos recortes amostrais, como se segue:

Mensal- (restrito às classes do indicador)

 Valor agregado; 1,43 milhões processos amostrados


 PJ PF; 10,52 milhões requeridos classificados; 1,35 milhões processos amostrados
 Financeiro/não financeiro; 3,86 milhões requerentes classificados; 1,11 milhões
processos amostrados
 Setor serviços; 1,52 milhões requeridos classificados; 537,84 mil processos amostrados

Diário-

 Valor agregado (somente títulos executivos); 108,67 mil processos

Mensal- (restrito às classes do indicador)

42
- Valor agregado; xxxx processos amostrados
- PJ PF; yyyy requeridos classificados; xxxx processos amostrados
- Financeiro nao financeiro; yyyy requerentes classificados; xxxx processos amostrados
- Setor serviços;yyyy requeridos classificados; xxxx processos amostrados
Diário-

- Valor agregado (somente títulos executivos); xxxx processos

O módulo de extração de informações a partir do texto bruto dos diários é capaz de verificar
todo o texto da publicação em busca de informações diversas, incluindo: numeração de
processos (NPU ou outras); listas de distribuição de processos (numeração, data distribuição,
classe processual, comarca e vara, nomes de partes e advogados. Este módulo possui uma
característica bastante flexível, podendo prospectar informações a partir da aplicação de
expressões regulares, que buscam padrões textuais pré-estabelecidos. A partir da definição de
blocos de texto, o módulo permite a associação entre atributos, como classe ou assunto
processual, e um determinado número de processo. O módulo pode ser usado também para
prospectar identidades (CPF ou CNPJ) de indivíduos, para mapear processos associados a eles.
Este procedimento foi aplicado na busca de processos falimentares, por exemplo.

A partir dos NPUs obtidos pelos módulos mais básicos do sistema, o módulo de consulta
processual pública foi desenvolvido de forma a obter as informações completas a respeito de
um dado NPU. Nesta fase do processamento, são obtidas as seguintes informações: classe
processual, assunto processual, nomes das partes e seu envolvimento no processo (autor ou
réu), advogados, movimentos processuais, data de distribuição, juiz responsável pelo
julgamento, sentenças, etc. Todas as informações disponibilizadas podem ser obtidas pelo
sistema e armazenadas. Entretanto, para fins de desempenho de processamento, foram
definidas duas funcionalidades principais dentro deste módulo: (i) busca de classe e assunto
processual e (ii) busca do processo na íntegra (iii) outras tarefas. Desta forma, a partir do
processamento da etapa (i), menos custosa computacionalmente, pode-se definir o
subconjunto de NPUs que deverá ter suas informações obtidas na íntegra. Outras tarefas,
definidas no item (iii), consistem em explorar o banco de dados do tribunal para obter
informações potencialmente úteis ao nosso sistema. Por exemplo, para identificar empresas
em situação falimentar, podemos utilizar a consulta por documento da parte (no caso o CNPJ),
para obter uma listagem dos processos e respectivos nomes de parte associados aquele
documento. Esta tarefa foi amplamente utilizada para a identificação das empresas que
constam do banco de falências.

O módulo de classificação de sentenças, de parte e de elaboração de estatísticas descritivas é


um módulo crítico pois é o responsável por transformar a massa de informação bruta em
conteúdo tratável e passível de análise estatística. O módulo subdivide-se em três tarefas: (i)
classificação de sentenças e editais; (ii) identificação e classificação de partes do processo; (iii)
elaboração de estatísticas e indicadores judiciais diversos. O classificador de sentenças (i) não
é utilizado nos indicadores judiciais, mas é uma tarefa de alta importância na construção de
bancos de dados para pesquisa empírica pois possibilita a compreensão dos fluxos dos
processos judiciais. A identificação e classificação de partes é central para a produção dos

43
indicadores judiciais e por isso é apresentado com detalhes no Apêndice A.2 abaixo. A
elaboração de indicadores (iii) consiste na definição de construtos a partir da combinação de
atributos do processo, consolidados no banco de dados.

A2. Estrutura dos classificadores de partes e de decisões judiciais

Os microdados processuais produzidos pelo sistema IPEAJUS são, em grande parte, dados não-
estruturados, ou, na melhor das hipóteses, semi-estruturados. Isto é, são informações em
formato de linguagem natural (texto), ao invés de informações numéricas, categóricas ou
codificadas, como é o caso de bancos de dados tradicionais, como o Censo, a PNAD ou a RAIS.
Esta peculiaridade impõe um desafio para tornar o banco de dados de processos judiciais
tratável e utilizável em pesquisas empíricas de cunho quantitativo.

Para realizar o tratamento dos dados não-estruturados, o sistema IPEAJUS conta com um
amplo leque de classificadores, destinados a caracterizar e classificar sentenças (ou quaisquer
outras publicações judiciais, como despachos, decisões interlocutórias, intimações, editais,
etc.) e partes pertencentes aos processos judiciais.

No tocante a produção dos indicadores judiciais propostos neste estudo, utilizamos apenas os
classificadores referentes a partes dos processos, pois os resultados dos processos (duração e
teor da sentença) não têm serventia, pelo menos na atual versão dos indicadores judiciais.24
Desta forma, esta exposição fica circunscrita aos classificadores de partes.

Para produzir indicadores judiciais do mercado de crédito, segundo nichos específicos (por
exemplo, bancário ou não-bancário, pessoa física ou pessoa jurídica, setor de atividade
econômica, micro e pequena empresa, etc.), precisamos classificar as partes do processo. Nem
as listas de processos extraídas dos diários oficiais nem as informações do acompanhamento
processual contém este tipo de informação. Portanto é necessária uma estrutura de
processamento - detalhada nas subseções a seguir - para mapear este tipo de informação. Esta
estrutura compreende quatro estratégias: identificação a partir da consulta por documento
(CPF ou CNPJ) e inserção na tabela empresa; pareamento de registros com o banco de dados
da RAIS/MTE; expressões regulares; algoritmos de aprendizado de máquina (machine
learning). As duas primeiras classificam às partes indiretamente através da RAIS. As duas
últimas classificam uma parte sem conhecer o documento (CPF ou CNPJ).

24
É possível no futuro, propor indicadores que capturem outros aspectos dos processos judiciais, como
por exemplo a duração média dos processos ou mesmo o resultado, que, no caso de execuções, poderia
ser medido por exemplo, como a porcentagem recuperada do crédito requisitado (judicial claim), ou
como a porcentagem de processos que terminaram em acordo.

44
Consulta por documento da parte no Tribunal
Todos os CNPJ da RAIS de 2015 foram consultados na base do TJSP. Todos os nomes
correspondentes a cada CNPJ encontrado foram armazenados em uma tabela (“tabela
empresa”), juntamente com a quantidade de processos encontrados para cada nome. O fato
de uma dada empresa ter um processo no banco de dados do tribunal não quer dizer que a
busca por CNPJ trará algum resultado, pois é possível que tal empresa não tenha o CNPJ
cadastrado no banco de dados do Tribunal. Por isso, o pareamento de nomes diretamente na
RAIS, descrito a seguir, é um método complementar para identificar às empresas cujo CNPJ
não está cadastrado no Tribunal.

Pareamento de registros com a RAIS/MTE

Outra estratégia que utilizamos foi fazer um pareamento entre as partes identificadas no
diário de justiça e o banco de dados da RAIS/MTE, este banco de dados foi utilizado
principalmente para identificar os setores de atuação25. Além de podermos identificar
facilmente se a parte é pessoa jurídica, instituição financeira e órgão governamental.
Utilizando essa estratégia conseguimos parear mais de 1,6 milhões de partes processuais.

Embora a qualidade das informações que tivemos ao realizar o pareamento com a RAIS/MTE
seja muito relevante foram necessárias aplicar outras estratégias para podermos aumentar a
massa de dados que conseguimos classificar, pois 1,6 milhões de partes processuais é uma
quantidade muito pequena tendo em vista os recortes por classe processual. Por conta disso
escolhemos utilizar além da integração com base de dados da RAIS/MTE aplicar um algoritmo
de Machine Learning.

Expressões regulares
O método de expressões regulares consiste em identificar nos nomes das partes, algum tipo de
padrão ou assinatura que possa fornecer alguma pista inequívoca acerca de atributos
associados a parte. Por exemplo, a parte “Banco do Brasil S.A.” pode ser classificado com
precisão como sendo pessoa jurídica por conta do “S.A.”, e banco por conta do nome “Banco
do Brasil”. De forma mais geral, denominações de tipos de empresa - inclusive estrangeiras -
como SA, LTDA, EI, EIRELI, LLP, LLC, GBH, etc., possibilitam uma classificação inequívoca do
atributo pessoa jurídica. De forma mais específica, diante do reduzido número de bancos
operando no Brasil, buscamos, através de expressões regulares, os nomes de todas estas
instituições, inserindo algum grau de flexibilidade nas grafias, para capturar, erros tipográficos
e variações na nomeação da parte.

Para utilizar essa estratégia definimos um critério para testar e validá-la, onde criamos uma
base de teste com 10 mil empresas e aplicamos as expressões regulares para descobrir se é
uma empresa tivemos uma taxa de classificação correta de 90%. Também aplicamos as
expressões regulares para uma outra base de teste com 10 mil nomes de pessoa física e o

25
E certamente pode ser utilizado para “estimar” o tamanho da empresa, a partir do número de
vínculos trabalhistas ativos.

45
classificador para pessoa jurídica apurou menos de 1% de erro de classificação. Aplicamos o
mesmo teste para o classificador de banco na lista de bancos retirada do site do Banco Central
e tivemos 100% de classificação correta.

Algoritmos de aprendizado de máquina ou Machine Learning

A ideia de aplicar um algoritmo de aprendizado de máquina na RAIS é para responder a


seguinte pergunta: será que, dado o nome próprio da empresa, podemos dar um “chute” com
relação a que setor ela pertence? Em alguns casos, a resposta parece trivialmente positiva. Por
exemplo, um estabelecimento com o nome terminando em “bar e lanchonete”, muito
provavelmente pertencerá ao setor de serviços. Contudo, possivelmente em outros casos a
resposta parece ser negativa. Por exemplo, uma empresa com nome próprio, sem qualquer
referência a sua atividade ou razão social. Uma resposta mais elaborada requer uma análise
mais estruturada de todos os registros disponíveis na RAIS.

Para conseguirmos uma massa de dados relevante a ponto de conseguirmos criar os recortes
dos índices criamos um algoritmo supervisionado de machine learning, utilizamos como base
de aprendizado mais de 100 mil nomes de empresas e sua classificação de setor de atividade
econômica. Testamos diversos métodos diferentes (LinearSVC, SGDClassifier, NearestCentroid,
MultinomialNB e BernoulliNB) realizamos um benchmark entre eles e o que obteve um melhor
resultado foi o LinearSVC, por isso foi escolhido este método.

Fizemos um teste de validação onde foi criado uma base de teste com mais de 10 mil casos
com o nome de empresas e o setor correspondente criamos um critério de confiabilidade para
o algoritmo onde entre os 10 mil o algoritmo classificou o setor de atividade de apenas 1 mil
empresas. E verificamos que a taxa de acerto dos setores se comportava de forma distinta
para cada setor de atividade: enquanto que no setor de serviços conseguimos uma taxa de
acerto de 97%, nos setores de comércio, indústria e agricultura conseguimos uma taxa de
acerto de menos abaixo de 65%. Por conta da reduzida taxa de acerto dos outros setores,
incluímos apenas o setor de serviços no recorte de atividade econômica

Apenas para oferecer ao leitor uma visão mais clara do volume de informação processado para
a produção dos indicadores judiciais, foram inicialmente contabilizadas 121 milhões de partes
nos diários da justiça de São Paulo, desde 200426. Os métodos conseguiram classificar, no total,
mais de 43 milhões de partes. Dentro do subconjunto de partes classificadas há o recorte pela
classe processual de interesse, neste recorte conseguimos classificar 2,6 milhões. Podemos ver
na tabela 1 a comparação da quantidade de partes identificadas.

Tabela A.1: tabela comparativa das classificações de partes.

26
O efetivo de partes envolvidas pode ser significativamente maior pois a publicação da distribuição
relaciona apenas uma parte do processo.

46
Diário Partes classificadas Partes classificadas nas
Classes Processuais

121 milhões 43 milhões 2,6 milhões

Diagrama de venn para representar quantas partes são identificadas simultaneamente por
dois ou três métodos utilizados.

47
A3. Apuração do indicador: estrutura de defasagem de publicações

Na seção 4.1 do texto apresentamos uma breve descrição da estrutura de defasagem da


publicação de processos judiciais no diário oficial, buscando com isso, determinar o tempo
necessário de apuração dos indicadores.

Neste apêndice, complementamos a análise, buscando evidenciar a importância de atributos


processuais em geral, para explicar o tempo de publicação. Nossa maior preocupação reside
no valor do processo. Do ponto de vista dos indicadores de valor, caso o valor do processo
influencie a probabilidade de ele ser amostrado, então o indicador ficará sujeito a viés. Por
exemplo, se processos de menor valor demorarem mais tempo para serem publicados, então,
a depender da data de apuração, o indicador poderá superestimar o valor médio dos
processos.

O exercício apresentado consiste em fixar uma data de apuração e analisar a probabilidade de


o processo ser amostrado. Variamos as datas de apuração e comparamos o efeito do valor do
processo nas chances deste ser amostrado. No índice ideal (isto é, na data de apuração ideal),
o valor (ou faixa de valor) do processo não deve influenciar a probabilidade do mesmo ser
amostrado.

A tabela A.2 abaixo apresenta a duração até a publicação, segundo o mês da distribuição do
processo. Chama a atenção o fato de que a defasagem média para o mês de dezembro é o
dobro da observada para os demais meses: 14 versus 7 dias. Além disso, são necessários 31
dias (contra cerca de 10 dias, para os demais meses) para que 90% dos processos do mês de
dezembro sejam publicados. Este padrão não chega a ser surpreendente, visto que o recesso
forense neste mês faz com que se reduzam o número de edições do diário oficial. Ou seja,
muitos dos processos distribuídos no mês de dezembro serão publicados somente no mês de
Janeiro.

Tabela A.2: Diferença entre a data da publicação e a data da distribuição, segundo o mês de
distribuição do processo, em dias.

Mês distribuição média p90 N

1 6.9 13 29,192

2 6.2 10 22,170

3 6.1 11 25,134

4 6.6 12 23,769

5 6.4 12 25,231

6 6 11 23,522

7 5.3 8 24,525

8 5.4 8 20,929

48
9 5.3 9 16,899

10 5.8 9 15,831

11 6.3 10 14,322

12 15 31 13,178

Total 6.5 13 254,702

A seguir, na Tabela A.3, consta a defasagem de publicação, segundo o dia do mês da


distribuição. Entre os dias 16 e 19 do mês, a defasagem é mais elevada, principalmente
considerando o percentil 90. Este resultado, conforme explicado no apêndice, decorre
simplesmente de um padrão sazonal: o volume de processos distribuídos é maior entre os dias
16 e 21. O motivo para este padrão é desconhecido, mas curiosamente o movimento forense
(pelo menos para o conjunto de classes que compõem os indicadores judiciais) é
significativamente maior neste período do mês. Como consequência, presume-se a ocorrência
de algum tipo de “fila” para a publicação de processos, impactando assim a defasagem de
publicação.

Tabela A.3: Diferença entre a data da publicação e a data da distribuição, segundo o dia do
mês de distribuição do processo, em dias.

Dia do mês média p90 N

1 5.8 10 7,760

2 6.1 10 7,735

3 7.6 13 7,247

4 6.9 11 7,695

5 6.6 10 8,335

6 6 10 8,412

7 6 11 8,409

49
8 6.5 12 8,583

9 6.1 10 8,645

10 6.1 11 8,369

11 6.1 9 8,807

12 6.4 12 8,590

13 6.5 12 8,009

14 6.5 13 8,028

15 6.8 16 8,875

16 7.8 24 8,955

17 6.6 15 8,865

18 7.2 21 9,910

19 9.2 23 11,044

20 6.6 14 8,718

21 6.8 14 7,476

22 6.2 12 8,082

23 6.2 10 8,328

24 6.3 10 7,313

25 6.7 11 7,758

26 6 10 8,552

27 6.2 8 7,529

28 6.7 11 6,981

29 5.3 8 8,859

30 5.2 9 7,238

31 6.1 9 5,595

Total 6.5 13 254,702

Para complementar a análise, apresentamos na Figura A.3 abaixo uma aproximação (kernel
density estimate) para a distribuição do número de processos distribuídos a cada dia do mês.

50
Figura A.3: Distribuição do volume de casos novos, segundo o dia da distribuição. Inclui todas
as classes processuais dos indicadores.

Modelo estatístico

Visando determinar quais atributos observáveis do processo afetam as chances da sua inclusão
na amostra do índice, estimamos os parâmetros de um modelo probit. Este modelo explica a
probabilidade de um processo judicial pertencer à amostra sorteada n dias após a distribuição
do processo, com n=1, ...,10. Ou seja, se um processo distribuído em um dia, digamos D0, foi
publicado no diário oficial em até n dias. A probabilidade de o processo ser amostrado
depende, além da faixa de valor da ação (classificada segundo quintis da distribuição
amostral), de efeitos de calendário (dia do mês, dia da semana e mês), de efeitos de jurisdição
(capital versus interior).

51
A tabela A.4 abaixo apresenta os efeitos marginais na média, calculados para cada faixa de
valor da ação (quintil). A análise é realizada separadamente para cada classe processual, pois
os indicadores são definidos segundo classe processual, portanto não faria sentido um modelo
contemplando todas as classes conjuntamente. Nas linhas, apresentam-se diferentes datas de
publicação, com n=1,3,5,7,9. O resultado indica que as chances de o processo ser amostrado
variam muito pouco quando o processo muda de faixa de valor27. Concluímos, portanto, que
os indicadores judiciais de valor de disputas podem ser apurados com poucos dias de
defasagem, sem risco de ocorrência de viés de seleção de processos decorrente do valor da
ação. Conforme discutido anteriormente, esta seria uma preocupação caso ocorresse alguma
seleção em função de valor.

Tabela A.4: Efeitos marginais na média.

d=1 d=3 d=5 d=7 d=9

Título executivo extrajudicial

1.quintil_valor 0.011***, 0.448***, 0.755***, 0.847***, 0.869***

(0.00), (0.00), (0.00), (0.00), 0

0.010,0.012, 0.445,0.452, 0.751,0.760, 0.843,0.850, 0.865,0.872

2.quintil_valor 0.010***, 0.438***, 0.749***, 0.849***, 0.872***

(0.00), (0.00), (0.00), (0.00), 0

0.008,0.011, 0.433,0.443, 0.743,0.755, 0.844,0.854, 0.868,0.877

3.quintil_valor 0.008***, 0.440***, 0.747***, 0.847***, 0.874***

(0.00), (0.00), (0.00), (0.00), 0

0.007,0.010, 0.434,0.446, 0.740,0.754, 0.842,0.853, 0.868,0.879

27
De fato, percebe-se uma superposição - entre distintas categorias de valor - dos intervalos de
confiança para os efeitos marginais. Assim sendo, provavelmente um teste estatístico formal não seria
capaz de rejeitar a hipótese nula de que os efeitos marginais fossem diferentes. Mesmo no caso em que
os efeitos marginais fossem significativamente diferentes do ponto de vista estatístico, a diferença de
magnitude nas probabilidades de seleção da amostra do indicador seria desprezível do ponto de vista
substantivo.

52
4.quintil_valor 0.008***, 0.446***, 0.763***, 0.860***, 0.884***

(0.00), (0.00), (0.00), (0.00), 0

0.007,0.010, 0.441,0.451, 0.757,0.769, 0.855,0.865, 0.880,0.889

5.quintil_valor 0.009***, 0.454***, 0.769***, 0.869***, 0.893***

(0.00), (0.00), (0.00), (0.00), 0

0.007,0.010, 0.449,0.458, 0.764,0.774, 0.864,0.873, 0.889,0.896

N 81585 109769 109769 109769 109769

d=1 d=3 d=5 d=7 d=9

Monitória

1.quintil_valor 0.012***, 0.430***, 0.748***, 0.851***, 0.876***

(0.00), (0.00), (0.00), (0.00), 0

0.010,0.014, 0.424,0.436, 0.741,0.756, 0.845,0.856, 0.870,0.881

2.quintil_valor 0.010***, 0.435***, 0.757***, 0.857***, 0.882***

(0.00), (0.00), (0.00), (0.00), 0

0.008,0.012, 0.429,0.441, 0.750,0.765, 0.851,0.863, 0.877,0.888

3.quintil_valor 0.010***, 0.433***, 0.755***, 0.864***, 0.888***

(0.00), (0.00), (0.00), (0.00), 0

0.008,0.013, 0.426,0.441, 0.745,0.764, 0.856,0.871, 0.881,0.894

53
4.quintil_valor 0.010***, 0.432***, 0.760***, 0.861***, 0.886***

(0.00), (0.00), (0.00), (0.00), 0

0.008,0.013, 0.424,0.440, 0.751,0.770, 0.853,0.869, 0.879,0.893

5.quintil_valor 0.011***, 0.437***, 0.764***, 0.867***, 0.889***

(0.00), (0.00), (0.00), (0.00), 0

0.009,0.013, 0.431,0.443, 0.757,0.771, 0.862,0.873, 0.884,0.894

N 41131 52930 52930 52930 52930

d=1 d=3 d=5 d=7 d=9

Busca e apreensão em alienação fiduciária

1.quintil_valor 0.017***, 0.439***, 0.745***, 0.851***, 0.874***

(0.00), (0.01), (0.01), (0.01), -0.01

0.011,0.023, 0.423,0.454, 0.727,0.763, 0.836,0.865, 0.860,0.887

2.quintil_valor 0.011***, 0.427***, 0.744***, 0.848***, 0.873***

54
(0.00), (0.00), (0.00), (0.00), 0

0.008,0.014, 0.419,0.435, 0.735,0.754, 0.840,0.856, 0.866,0.880

3.quintil_valor 0.011***, 0.427***, 0.737***, 0.844***, 0.871***

(0.00), (0.00), (0.00), (0.00), 0

0.010,0.013, 0.421,0.432, 0.731,0.744, 0.839,0.850, 0.866,0.876

4.quintil_valor 0.010***, 0.420***, 0.732***, 0.838***, 0.867***

(0.00), (0.00), (0.00), (0.00), 0

0.008,0.012, 0.414,0.426, 0.725,0.739, 0.832,0.844, 0.861,0.872

5.quintil_valor 0.007***, 0.449***, 0.766***, 0.863***, 0.891***

(0.00), (0.01), (0.01), (0.01), -0.01

0.003,0.011, 0.435,0.462, 0.751,0.782, 0.850,0.876, 0.879,0.903

N 34055 43607 43607 43607 43607

d=1 d=3 d=5 d=7 d=9

Despejo

1.quintil_valor 0.008***, 0.442***, 0.753***, 0.855***, 0.879***

55
(0.00), (0.01), (0.01), (0.01), -0.01

0.004,0.013, 0.426,0.458, 0.734,0.772, 0.840,0.870, 0.865,0.892

2.quintil_valor 0.008***, 0.437***, 0.748***, 0.851***, 0.878***

(0.00), (0.00), (0.00), (0.00), 0

0.006,0.010, 0.430,0.443, 0.740,0.756, 0.844,0.857, 0.872,0.884

3.quintil_valor 0.007***, 0.438***, 0.749***, 0.856***, 0.882***

(0.00), (0.00), (0.00), (0.00), 0

0.006,0.009, 0.432,0.444, 0.742,0.757, 0.850,0.862, 0.877,0.887

4.quintil_valor 0.005***, 0.437***, 0.757***, 0.862***, 0.887***

(0.00), (0.00), (0.00), (0.00), 0

0.004,0.007, 0.429,0.445, 0.748,0.766, 0.854,0.869, 0.881,0.894

5.quintil_valor 0.006***, 0.429***, 0.751***, 0.862***, 0.889***

(0.00), (0.01), (0.01), (0.01), 0

0.003,0.009, 0.417,0.440, 0.738,0.764, 0.851,0.873, 0.879,0.899

N 30256 38220 38220 38220 38220

Nota: Todos os modelos incluem efeitos fixos de dia da semana, da do mês, ano e localização
(capital versus interior).

Por fim, nas figuras A.4, A.5, A.6 e A.7 a seguir, apresentamos a trajetória dos indicadores
judiciais, computado em diferentes datas de apuração. O objetivo destas figuras é mostrar que
o valor do indicador apurado 5 dias após o término do período de referência é muito próximo
do valor revisado após um longo período decorrido desde o término do período de referência.
As barras indicam a magnitude do erro percentual relativo ao indicador nas respectivas datas
de apuração (dia 5 e dia 15 do mês).

56
Figura A.4: Índice de valor médio dos processos judiciais, em diferentes datas de apuração (dia
5 e dia 10), e erro percentual em relação ao indicador revisado. Títulos executivos
extrajudiciais. São Paulo.

57
Figura A.5: Índice de valor médio dos processos judiciais, em diferentes datas de apuração (dia
5 e dia 10), e erro percentual em relação ao indicador revisado. Monitórias. São Paulo.

58
Figura A.6: Índice de valor médio dos processos judiciais, em diferentes datas de apuração (dia
5 e dia 10), e erro percentual em relação ao indicador revisado. Busca e apreensão em
alienação fiduciária. São Paulo.

59
Figura A.7: Índice de valor médio dos processos judiciais, em diferentes datas de apuração (dia
5 e dia 10), e erro percentual em relação ao indicador revisado. Despejo. São Paulo.

60
A.4. Relação completa dos indicadores

Indicadores agregados

Volume de pedidos/ título executivo extrajudicial/agregado

Volume de pedidos/ monitória/ agregado

Volume de pedidos/ busca e apreensão em alienação fiduciária/ agregado

Volume de pedidos/ despejo por falta de pagamento/ agregado

Valor/ título executivo extrajudicial/agregado

Valor/ monitória/ agregado

Valor/ busca e apreensão em alienação fiduciária/ agregado

Valor/ despejo por falta de pagamento/ agregado

Indicadores, segundo segmento (tipo de credor e tipo de devedor)

Valor / título executivo extrajudicial / requerido pessoa jurídica

Valor / título executivo extrajudicial / requerido pessoa física

Valor / título executivo extrajudicial / requerente pessoa jurídica do setor financeiro

Valor / título executivo extrajudicial / requerente pessoa jurídica do setor não-financeiro

Valor / título executivo extrajudicial / requerido setor de serviços

Valor / monitória / requerido pessoa jurídica

Valor / monitória / requerido pessoa física

Valor / monitória / requerente pessoa jurídica do setor financeiro

Valor / monitória / requerente pessoa jurídica do setor não-financeiro

Valor / monitória / requerido setor de serviços

Valor / busca e apreensão em alienação fiduciária / requerido pessoa jurídica

Valor / busca e apreensão em alienação fiduciária / requerido pessoa física

Valor / busca e apreensão em alienação fiduciária / requerente pessoa jurídica do setor


financeiro

Valor / busca e apreensão em alienação fiduciária / requerente pessoa jurídica do setor não-
financeiro

61
Valor / busca e apreensão em alienação fiduciária / requerido setor de serviços

Valor / despejo / requerido pessoa jurídica

Valor / despejo / requerido pessoa física

Valor / despejo / requerente pessoa jurídica do setor financeiro

Valor / despejo / requerente pessoa jurídica do setor não-financeiro

Valor / despejo / requerido setor de serviços

Indicador diário

Valor mediano / título executivo extrajudicial / agregado

62

Você também pode gostar