Você está na página 1de 185

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO

PUC-SP

Mamerto Granja Garcia

O PROCESSO ELEITORAL: Eleitores e Candidatos


Análise quantitativa nas Ciências Sociais: limites e possibilidades

DOUTORADO EM CIÊNCIAS SOCIAIS

São Paulo
2013
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO

PUC-SP

Mamerto Granja Garcia

O PROCESSO ELEITORAL: Eleitores e Candidatos


Análise quantitativa nas Ciências Sociais: limites e possibilidades

DOUTORADO EM CIÊNCIAS SOCIAIS

Tese apresentada à Banca Examinadora da


Pontifícia Universidade Católica de São Paulo,
como exigência parcial para obtenção do título de
Doutor em Ciências Sociais, Área de
Concentração Política, sob a orientação do
Professor Doutor Miguel W. Chaia.

São Paulo
2013
BANCA EXAMINADORA
Dedicatória

A meus pais, Mamerto (in memoriam) e


Manolvina, por acreditarem.

À minha companheira, Lucilene, pelo apoio


incondicional.

Aos meus queridos filhos, Gustavo e


Guilherme, pelo constante estímulo.
AGRADECIMENTOS

Na minha infância e parte da adolescência, estive inserido em um


círculo social repleto de figuras caricatas e inesquecíveis. Meu pai, um
imigrante espanhol, chegou ao Brasil em 1955, com a idade de 27 anos.
Deixou para trás (e nunca mais retornou) as Ilhas Canárias, região formada por
sete ilhas vulcânicas tendo o vulcão El Teide como o principal, com quase
4.000 metros acima do nível do mar. Região pertencente à Espanha, próxima
da costa africana do Oceano Atlântico, fica muito distante da Península Ibérica,
e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de
sobrevivência levou muitos “Canários”, assim chamados os seus habitantes, a
buscarem uma nova vida fora das ilhas. Meu pai abandonou sua terra natal na
esperança de encontrar uma vida melhor não no Brasil, mas na Venezuela,
considerada a terra das oportunidades, onde se poderia enriquecer com
facilidade. Infelizmente, para o meu pai, devido a uma política de cotas de
imigração, não foi possível imigrar para a Venezuela e decidiu vir ao Brasil com
a esperança de depois se mudar para a “vizinha” Venezuela. Não tinha noção
da imensidão das terras sul-americanas. Acabou ficando no Brasil até o fim da
vida.

Pobre e com pouca instrução, não teve outra opção a não ser trabalhar
duro na lavoura em terras arrendadas na periferia do Município de São Paulo,
próximo onde hoje fica o Parque Estadual do Pico do Jaraguá. Foi ai que
conheceu minha mãe, uma jovem brasileira que, como tantas outras da sua
época, enfrentava uma vida rude na lavoura. Sem nunca ter frequentado uma
sala de aula, trabalhava com uma enxada o dia todo, cumprindo as chamadas
“tarefas”, as quais correspondiam a uma área pré-determinada para capinar.
Minha mãe sempre possuiu uma energia e força impressionantes, nunca se
deixando abater pelos percalços que a vida produzia. Cheguei a participar
desse meio rural, acompanhando a luta dos meus pais na lavoura. Lembro-me
perfeitamente das plantações de cenoura, cebola, tomates, milho e mandioca.

Apesar da vida simples, havia uma riqueza cultural extensa, composta


de uma mistura de Brasil e Espanha. Meu pai era um exímio cozinheiro e no
final de semana o cardápio do almoço quase sempre era composto das
comidas típicas da região que meu pai vivia na Espanha. Nunca me esqueço
da cazuela, uma espécie de sopa de peixes, e do gofio, farinha de trigo
extremamente fina e torrada para ser adicionada à sopa.

Esse convívio social era partilhado intensamente com vizinhos,


principalmente nas datas festivas tais como natal, ano novo e festas juninas.

Com o tempo e após muito trabalho árduo, meus pais deixaram a


lavoura para trás e iniciaram um pequeno comércio, uma mistura de bar e
mercearia. Nessa fase a família aumentou com o nascimento da minha querida
irmã, carinhosamente chamada de “Niña” (pequenina), apelido que persiste até
hoje. Nesse ambiente de bar conheci pessoas que influenciaram e moldaram
parte da minha concepção de vida. Essa convivência com pessoas de lugares
distantes e culturas variadas, um clima que somente o ambiente de bar poderia
proporcionar, permitiu que eu construísse uma visão mais realista da natureza
humana do que muitos da minha idade. Nesse ambiente as pessoas expõem
seus problemas, seus traumas, suas angústias e também suas alegrias, tudo
potencializado pelo efeito inebriante das bebidas alcóolicas.

Desde cedo senti a necessidade de compreender o desconhecido,


sentindo uma forte atração pelas ciências exatas, principalmente a física.
Encontrava nas leis matemáticas, que buscavam delinear modelos funcionais
da realidade, uma sensação de que tudo poderia ser explicado, ser
determinado, desde que pudéssemos encontrar a equação certa. Puro delírio
de uma mente inexperiente.

Foi na minha adolescência, por volta dos 15 anos, que tive meu primeiro
contato com uma realidade invisível aos olhos na vida cotidiana. Influenciado
pelas discussões de bar, chegou a minhas mãos um livro que foi um verdadeiro
sucesso na época, “Eram os deuses astronautas?”, do escritor suíço Erich Von
Däniken. Nesse livro o autor faz varias considerações inusitadas (para não
dizer fantasiosas) a respeito de visitações de seres extraterrestres ao nosso
planeta no passado. Na verdade o que mais me chamou a atenção foram
alguns trechos do capítulo II, no qual se discutia a teoria da relatividade e
tentava explicar o que era a dilatação do tempo. Quando soube que a
relatividade era um fato e não mera fantasia do escritor, fiquei chocado.
Percebi, naquele momento, que a realidade apresentada à nossa frente não é
bem o que parece. Fiquei impressionado ao saber que o tempo, tal como o
concebemos no dia a dia é, na verdade, o produto da situação específica que
nos cerca, não tendo, necessariamente, o mesmo comportamento em outra
região do Universo. Vemos apenas uma casca, e que o conhecimento
completo da realidade provavelmente seja algo impossível.

Esse breve resumo autobibliográfico serve para evidenciar a minha


convicção de que somos moldados por pessoas singulares que, por pura sorte
ou destino, entram no momento exato da nossa vida.

Agradeço aos meus pais, sempre solícitos, amorosos e éticos. Sinto-me


compelido a agradecer àquelas pessoas especiais, as quais tive o privilégio de
conhecer nas várias fases da minha vida. Pessoas na grande maioria muito
simples, mas com uma riqueza de espírito imensurável.

Na vida acadêmica, como professor ou como aluno, conheci pessoas


extraordinárias, incentivadoras e amigas, que me apoiaram e trouxeram novas
oportunidades de desenvolvimento pessoal. A elas o meu sincero
agradecimento.

Agradeço à minha família, esposa e filhos pela busca permanente da


harmonia no lar. Pela paciência e compreensão nos momentos difíceis e pelo
apoio, abrindo mão de muitos momentos que poderíamos estar juntos para
permitir que eu chegasse aqui.
RESUMO

Compreender o processo eleitoral e identificar as variáveis


explicitamente ou implicitamente envolvidas continua sendo um campo repleto
de mistérios tão obscuros quanto a mente humana. Os fatores psicossociais
despertados no período eleitoral remetem o pesquisador a um ambiente repleto
de simbologias, as mais inusitadas emoções e interesses diversos que
compreendem uma busca empreendida pelo eleitor, aparentemente racional,
no sentido de encontrar convergência entre seus anseios pessoais e as
características do potencial representante.

Este trabalho tem como objetivo delinear considerações sobre o tema


com base em uma análise do comportamento do eleitor a partir de três fatores
que se destacam durante o processo eleitoral: a indecisão, a continuidade e o
candidato. A indecisão será analisada a partir do levantamento dos eleitores
indecisos apontados em diversas pesquisas eleitorais. Demonstra-se que pelo
simples fato de se situar no estrato dos indecisos, o eleitor apresenta
tendências de voto para determinado candidato. No tópico continuidade e
candidato, avalia-se a questão dos parlamentares que se mantem no cargo
eletivo por longos períodos, através de sucessivas reeleições e como
complemento, é feita uma análise do perfil do candidato e seus efeitos na
decisão do eleitor.

Para todas essas questões, são utilizados modelos quantitativos


apropriados, os quais buscam criar uma ponte entre a pesquisa nas Ciências
Sociais e a análise das observações por meio de ferramentas estatísticas.

Palavras-chave: Comportamento do eleitor, métodos quantitativos, modelos


estatísticos.
ABSTRACT

Understand the electoral process and to identify the variables explicitly or


implicitly involved remains a field full of mysteries as dark as the human mind.
Psychosocial factors awakened in the election period refer the researcher to an
environment full of symbols , the most unusual emotions and diverse interests
that include a search undertaken by the voter , apparently rational , in order to
find convergence between their personal aspirations and potential
characteristics representative .

This paper aims to outline considerations on the subject based on an


analysis of voter behavior from three factors that stand out during the election
process: indecision, the continuity and the candidate. Indecision will be
analyzed from a survey of undecided voters indicated in several polls. It is
demonstrated that the simple fact of being located in the stratum of the
undecided voter presents trends vote for a particular candidate. On the topic
continuity and candidate assesses the issue of parliamentarians that keeps on
elective position for long periods, through successive re-elections, and in
addition, an analysis of the candidate's profile and its effect on the voter's
decision.

To all these questions, appropriate quantitative models are used, which


seek to create a bridge between research in the social sciences and the
analysis of observations by means of statistical.

Key words: Voter behavior, quantitative methods, statistical models.


SUMÁRIO

LISTA DE FIGURAS ................................................................................................................ 12


LISTA DE TABELAS ................................................................................................................ 13
Introdução .................................................................................................................................... 1
Capítulo 1................................................................................................................................... 17
Métodos Empíricos nas Ciências Sociais. ............................................................................ 17
Capítulo 2................................................................................................................................... 43
Comportamento do Eleitor Paulistano na Eleição para Prefeito em 2008. Uma
abordagem usando os conceitos de Campo e Habitus de Pierre Bourdieu. .................. 43
2.1 As eleições de 2008 e o cenário político na Cidade de São Paulo. ...................... 43
2.2 O comportamento do eleitor paulistano, uma analogia aos conceitos de campo e
habitus de Pierre Bourdieu. ................................................................................................ 55
2.3 A dinâmica dos campos: uma proposta de modelagem.......................................... 61
2.4 Avaliação dos campos pela análise de correspondência ........................................ 69
2.4.1 Campo Escolaridade .............................................................................................. 69
2.4.2 Campo Renda ......................................................................................................... 76
2.4.3 Campo Faixa Etária................................................................................................ 78
2.4.4 Campo Religioso .................................................................................................... 80
Capítulo 3................................................................................................................................... 85
Eleições para Prefeito de São Paulo em 2008: A questão das declarações incompletas
dos eleitores nas pesquisas eleitorais e como estas podem ser “tratadas” a partir da
criação de modelos estatísticos adequados. ....................................................................... 85
3.1 Conceituação de Dados Incompletos ......................................................................... 85
3.2 Modelos Estatísticos para dados omissos ou incompletos ..................................... 87
3.3 Apresentação do Problema .......................................................................................... 91
3.4 Modelando o Problema ................................................................................................. 92
3.5 Estimação dos Parâmetros .......................................................................................... 96
3.6 Aplicação nos Problemas Propostos ........................................................................ 102
3.3.1 Variável Idade ....................................................................................................... 102
3.3.2 Variável Escolaridade .......................................................................................... 110
3.3.2 Variável Renda...................................................................................................... 113
Capítulo 4................................................................................................................................. 118
Reeleição e Perfil do Candidato: Eleições proporcionais e modelos que possam
apontar a probabilidade do candidato ser reeleito em função das diversas variáveis
explicativas previamente estabelecidas. ............................................................................ 118
4.1 Introdução .................................................................................................. 118
4.2 O fenômeno da reeleição dentro do sistema eleitoral ................................. 121
4.3 Proposta de modelagem estatística .................................................................... 129
Capítulo 5................................................................................................................................. 136
O perfil do candidato e o comportamento do eleitor: eleições para vereador no Estado
de São Paulo em 2012. ......................................................................................................... 136
5.1 Partidos políticos e a participação da mulher.......................................................... 137
5.2 As profissões e os candidatos .................................................................................. 141
5.3 Candidatos: escolaridade, estado civil e faixa etária. ............................................ 143
5.4 Modelagem Estatística do Perfil do Candidato e a Escolha do Eleitor ........ 147
Considerações Finais ............................................................................................................ 155
Apêndices ................................................................................................................................ 165
A.1 Código R referente ao capítulo 3 .................................................................................. 165
Bibliografia ............................................................................................................................... 167
LISTA DE FIGURAS

Figura 1: Exemplo de modelo funcional. Ajuste de uma reta. ........................................... 26


Figura 2: Exemplo de modelo funcional. Ajuste de uma função senoidal. ................................. 30
Figura 3: Proporção de avaliações negativas dos candidatos Gilberto Kassab e Marta
Suplicy. ....................................................................................................................................... 53
Figura 4: Proporção de avaliações positivas dos candidatos Gilberto Kassab e Marta
Suplicy. ....................................................................................................................................... 54
Figura 5: Número de citações positivas dos candidatos Gilberto Kassab e Marta
Suplicy. ....................................................................................................................................... 54
Figura 6: Número de citações negativas dos candidatos Gilberto Kassab e Marta
Suplicy. ....................................................................................................................................... 55
Figura 7: A dinâmica dos campos: renda, religião e escolaridade. .................................. 62
Figura 8: Diagrama simplificado para "estados" religiosos. ............................................... 65
Figura 9: Diagrama de uma situação hipotética para "estados" religiosos. .................... 67
Figura 10: Diagrama de uma situação hipotética para estados religiosos...................... 68
Figura 11: Mapa de percepção para o campo escolaridade. ............................................ 71
Figura 12: Mapa de percepção do debate na televisão quanto ao campo escolaridade.
..................................................................................................................................................... 75
Figura 13: Mapa de percepção para o campo renda.......................................................... 77
Figura 14: Mapa de percepção para o campo idade (faixa etária) ................................... 79
Figura 15: Mapa de percepção para o campo religião. ...................................................... 82
Figura 16: Esquema básico de mecanismos de censura. ................................................. 89
Figura 17: Comparativo dos percentuais de votos válidos o sob o modelo NMAR. .... 106
Figura 18: Comparativo do modelo NMAR e resultado do TSE (votos válidos). Eleição
para prefeitura de São Paulo, 2008..................................................................................... 112
Figura 19: Comparativo do modelo NMAR e resultado oficial do TSE. eleições para a
prefeitura de São Paulo, 2008 .............................................................................................. 115
Figura 20: Eleições para vereador no Município de São Paulo. Relação entre receita
para fins de campanha e número de votos obtidos. ......................................................... 133
Figura 21: Correlação entre o nível de lembrança ("Recall") e o número de votos. .... 135
Figura 22: Eficiência das candidaturas por partido e por gênero. .................................. 137
Figura 23: Mapa de percepção. Percentual de participação da mulher e eficiência. .. 138
Figura 24: Percentual de candidatos eleitor estratificado por profissão. ....................... 142
Figura 25: Percentual de candidatos eleitos estratificados por gênero e escolaridade.
................................................................................................................................................... 144
Figura 26: Desempenho dos candidatos estratificados por estado civil e gênero. ...... 145
Figura 27: Desempenho dos candidatos estratificados por faixa etária e gênero. ...... 147
Figura 28: Ciclo de estados da consciência ....................................................................... 157
Figura 29: Ação da flecha do tempo.................................................................................... 159
LISTA DE TABELAS

Tabela 1: Variação da arrecadação tributária no Município de São Paulo de 2004 a


2006. ........................................................................................................................................... 45
Tabela 2: Imagem de Kassab à época da saída de Serra para concorrer ao governo do
Estado de São Paulo. NS - não sabe, Outra - apontou outro nome. ............................... 47
Tabela 3: Modelagem da evolução das proporções de eleitores em cada estado do
campo religião........................................................................................................................... 67
Tabela 4: Pesquisa eleitoral de preferência de voto para prefeito de São Paulo
estratificada pelo nível de escolaridade. ............................................................................... 70
Tabela 5: Pesquisa eleitoral para prefeito de São Paulo, debate na TV, estratificada
pelo nível de escolaridade. ..................................................................................................... 72
Tabela 6: Pesquisa eleitoral de preferência de voto para prefeito de São Paulo
estratificada por renda. ............................................................................................................ 76
Tabela 7: Pesquisa eleitoral para prefeito de São Paulo estratificada por faixa etária. 78
Tabela 8: Pesquisa eleitoral de preferência de voto para prefeito de São Paulo
estratificada por religião. ......................................................................................................... 80
Tabela 9: Pesquisa Religiões do Brasil, confiança no Congresso Nacional................... 83
Tabela 10: Pesquisa Religiões do Brasil, confiança no Sistema Judiciário. ................... 83
Tabela 11: Pesquisa Religiões do Brasil, confiança no Sistema Educacional. .............. 84
Tabela 12: Notação das frequências observadas na tabela de contingência. ............... 93
Tabela 13: Frequências e "pseudo-frequências" observadas com a introdução da
variável indicadora R. .............................................................................................................. 94
Tabela 14: Distribuição da frequência de eleitores por período e faixa etária. SREP:
sem resposta........................................................................................................................... 103
Tabela 15: Percentuais de eleitores por período e faixa etária. ..................................... 104
Tabela 16: Intenção de votos, valores imputados nos modelos MAR e NMAR. .......... 104
Tabela 17: Intenção de votos imputados em percentuais. Modelo NMAR. .................. 105
Tabela 18: Número de eleitores por faixa etária. .............................................................. 107
Tabela 19: Posição do eleitor quanto à obrigatoriedade do voto. .................................. 108
Tabela 20: Apropriação estimada de abstenção por faixa etária. .................................. 109
Tabela 21: Percentuais na intenção de voto candidato Gilberto Kassab na eleição de
2008 no segundo turno do Município de São Paulo. ........................................................ 110
Tabela 22: Intenções de voto estratificadas por escolaridade ........................................ 110
Tabela 23: Intenção de voto segundo escolaridade. Valores imputados nos modelos
MAR e NMAR .......................................................................................................................... 111
Tabela 24: Intenção de voto segundo escolaridade. Valores imputados percentuais nos
modelos MAR e NMAR ......................................................................................................... 111
Tabela 25: Abstenção por grau de instrução. Eleições para a prefeitura de São Paulo,
2008 .......................................................................................................................................... 113
Tabela 26: Intenção de voto para a prefeitura de São Paulo, 2008, estratificação por
renda......................................................................................................................................... 114
Tabela 27: Intenção de voto, valores percentuais. Prefeitura de São Paulo, 2008,
estratificação por renda ......................................................................................................... 114
Tabela 28: Imputação dos dados segundo modelo NMAR para a variável renda ....... 116
Tabela 29: Imputação dos dados, valores percentuais, segundo modelo NMAR para a
variável renda .......................................................................................................................... 116
Tabela 30: Resultado do modelo de regressão logística usando o método "Stepwise"
do pacote estatístico R. ......................................................................................................... 132
Tabela 31: Número de vereadoras eleitas no Brasil no período 1996 a 2012. ............ 139
Tabela 32: Perfil dos candidatos a vereador no Estado de São Paulo. Gênero, idade e
escolaridade. ........................................................................................................................... 148
Tabela 33: Esquema notacional para o modelo logístico-linear, com interação até
primeira ordem, transcrito em uma tabela de contingência. ............................................ 149
Tabela 34: Coeficientes estimados sob o modelo logístico-linear com interação de
primeira ordem. ....................................................................................................................... 151
Tabela 35: Chances de ser eleito estratificadas por gênero, idade e escolaridade. ... 152
Tabela 36: Probabilidade de o candidato ser eleito estratificado por gênero, idade e
escolaridade. ........................................................................................................................... 154
Uma resposta aproximada da questão certa
é mais valiosa do que uma resposta certa de
um problema aproximado.

John Tukey (1915 - 2000)


1

Introdução

Compreender o processo eleitoral e identificar as variáveis


explicitamente ou implicitamente envolvidas continua sendo um campo repleto
de mistérios tão obscuros quanto a mente humana. Os fatores psicossociais
despertados no período eleitoral remetem o pesquisador a um ambiente repleto
de simbologias, as mais inusitadas emoções e interesses diversos que
compreendem uma busca empreendida pelo eleitor, aparentemente racional,
no sentido de encontrar convergência entre seus anseios pessoais e as
características do potencial representante.

Pode-se afirmar que os anseios serão sempre pessoais, pois não há


como se falar em anseios coletivos se considerarmos que estes apenas
representam as vontades individuais se materializando em uma coletividade. O
voto é individual, não coletivo. Tentar descrever o processamento dos anseios
e conflitos nas mentes individuais é uma tarefa difícil. Na melhor situação,
podem-se ter fatores psicossociais estratificados, ou seja, uma estimativa ou
uma estatística de como o eleitor se comporta dentro das categorias
analisadas.

Este trabalho tem como objetivo delinear considerações sobre o tema


com base em uma análise do comportamento do eleitor a partir de três fatores
que se destacam durante o processo eleitoral: a indecisão, a continuidade e o
candidato. A indecisão será analisada a partir do levantamento dos eleitores
indecisos apontados em diversas pesquisas eleitorais. Demonstra-se que
apesar de se situar no estrato dos indecisos, o eleitor apresenta, tendo em
vista as suas características, tendências de voto para determinado candidato.
No tópico continuidade e candidato, avalia-se a questão dos parlamentares que
se mantem no cargo eletivo por longos períodos, através de sucessivas
reeleições e como complemento, é feita uma análise do perfil do candidato e
seus efeitos na decisão do eleitor.
2

O trabalho comportará cinco capítulos e sexto para considerações. O


capítulo um busca esclarecer como métodos empírico-indutivos se tornaram as
ferramentas mais usadas na abordagem explicativa do comportamento eleitoral
empregando a visão de vários pesquisadores e seus trabalhos científicos.
Essas visões formam um conglomerado de conceitos, análises e conclusões de
diversos autores que permitem melhorar o foco desse tema delicado e
controvertido através de métodos estatísticos de análise do comportamento
eleitoral. A principal intenção do capítulo é criar uma ponte mais sólida entre a
pesquisa nas Ciências Sociais e a análise das observações por meio das
ferramentas estatísticas.

O fato social, na forma apresentada por Emile Durkheim (DURKHEIM,


2007), pode ser submetido a uma modelagem matemática dentro de limites
que são impostos pelo próprio fato social, ou seja, o modelo é válido para um
momento específico do fenômeno, tal qual uma fotografia, a qual representa
apenas um instante no tempo. Deve-se ser cuidadoso no uso de modelos
indutivos nas ciências sociais, pois nem sempre é possível prever o futuro a
partir do passado no comportamento social, existindo inúmeras situações que
endossam essa afirmação. Talvez o fenômeno social que mais evidencia a
fragilidade da indução seja a economia. Nada é mais instável do que um
cenário econômico projetado pelos economistas. Os períodos de prosperidade
e de crise se alternam de forma que nenhum modelo estatístico pode ser usado
para uma modelagem segura. É bem verdade, no contexto das ciências
econômicas, que os cenários se alternam dentro de um limite probabilístico,
mas tal condição torna-se extremamente fragilizada quando observamos crises
extremas, fora de qualquer intervalo probabilístico delineado pela estatística.
Os estatísticos, conscientes do problema das situações extremas, buscaram
teorias que modelassem as situações extremas, ou seja, a Teoria dos Valores
Extremos, ou no jargão dos estatísticos, a distribuição das caudas1, o que

11
Distribuição dos valores extremos de uma função de distribuição probabilística. Em uma
curva de distribuição normal, por exemplo, tem-se as caudas direita e esquerda, as quais abrigam os
3

implica uma distribuição de probabilidades dentro de outra distribuição de


probabilidades.

Valores extremos estão associados a baixas probabilidades.


A teoria dos valores extremos (TVE) trata das questões
probabilísticas e estatísticas relacionadas a valores muito
baixos ou muito altos em sequências da variáveis aleatórias
e em processos estocásticos. Assim, dados considerados
como eventos raros não podem ser tratados simplesmente
como “outliers", pois, podem ser inseridos em uma
modelagem de extremos.

Mais diretamente, o interesse pode ser modelar as caudas


de uma distribuição de alguma variável aleatória; esta pode
representar dados sobre climatologia ou hidrologia ou outra
área, como seguros ou finanças. Busca-se eventualmente
precaver-se contra algum evento extremo (evento raro)
cujas consequências podem ser indesejáveis ou
desastrosas. Modelando essa cauda, pode-se ter ciência
sobre as probabilidades de ocorrências de valores altos ou
baixos.

Entretanto, extremos não são usualmente bem modelados


via distribuições clássicas, como, por exemplo, a distribuição
normal (BERGER e BRASIL, 2012).

Parece que os valores extremos estão mais ligados com eventos


caóticos do que com probabilísticos, ou seja, a modelagem não seria
probabilística abrindo caminho para que a teoria do caos forneça melhor
explicação. Pela teoria do caos, uma pequena variação dentro de um sistema
dinâmico como a economia pode gerar situação extremas e catastróficas. É o
popularmente chamado “efeito borboleta”, situação na qual o bater das asas de

valores extremos da distribuição, ou seja, os menores valores (cauda esquerda) e os maiores valores
(cauda direita).
4

uma borboleta numa ilha remota do pacífico pode gerar uma amplificação de
efeitos que culminariam com um furacão no Caribe.

Assim, acreditar que os fenômenos sociais possam ser domados a ponto


de serem previsto dentro de um intervalo de confiança2 é, no mínimo, agir com
ingenuidade. Isso não significa que devemos descartar completamente a
modelagem probabilística, longe disso. Deve-se, entretanto, considerar suas
limitações quanto ao fenômeno estudado, pois a concepção exata do
comportamento do fenômeno no instante imediatamente posterior à
observação é impossível. Torna-se claro que o fluxo do tempo é a principal
variável que afeta as modelagens que dependem da indução. A seta do tempo
permite que sistemas aparentemente em equilíbrio entrem em colapso a partir
de interferências mínimas.

Independentemente da polemica envolvendo a explicação dos


fenômenos sociais através da análise quantitativa, não há como abrir mão
desse recurso para parte dos estudos acadêmicos na área das ciências
sociais. É importante, entretanto, tentar separar como a explicação ocorre no
campo das ciências sociais. Brage e Cañellas (2005) consideram que a
explicação apresenta comportamentos diferentes dentro dos variados campos
da ciência.

Definir o que é uma explicação não acarreta maior


dificuldade, pode-se dizer que significa falar de algo para dar
conhecimento a outros a fim de que o compreendam. Mas,
quando levamos a explicação ao campo da ciência o
problema se faz mais complexo, por exemplo, uma
explicação na física inclui, pelo menos, dois elementos
fundamentais; em primeiro lugar, algumas leis que formam
parte de una teoria mais ampla e, em segundo lugar, uma
linguagem matemática na qual as leis se expressam. As

2
Na estatística o intervalo de confiança é definido por um limite inferior e um superior onde a
probabilidade de tais limites serem superados é muito pequena (normalmente adota-se 2,5% para cada
lado).
5

ciências da vida (biologia) e as ciências sociais apresentam


outra maneira de considerar a explicação. Na história da
ciência pode-se observar como as diversas tradições
evoluíram em formas de explicação diferenciadas (BRAGE e
CAÑELLAS, 2005).

Explicar o comportamento da matéria, campo vinculado à física, exige o


reconhecimento incontestável do fenômeno, uma teoria e um conjunto de leis.

Na explicação física pode-se encontrar, portanto, três


aspectos fundamentais, a saber: o fenômeno que se trata de
explicar a lei em função da qual se explica e a teoria em que
se inserem essas leis. Entre outras considerações, o que se
pode aproveitar do modelo das explicações físicas é que os
fenômenos aparecem inseridos em marcos mais amplos que
lhes permitem entrar em relação com outros fenômenos, ou
seja, estão compreendidos entre si (BRAGE e CAÑELLAS,
2005).

Não é difícil compreender a referência aos limites ampliados da


explicação do comportamento da matéria quando se constata que as leis
explicativas são regidas por uma linguagem universal, a matemática.

Albert Einstein possuía intuição aguçada para a física, mas, segundo


suas próprias palavras, não dispunha de conhecimento matemático suficiente
para definir as leis que regem as suas teorias. Conseguia reconhecer o
fenômeno e até criar uma teoria para explica-lo, entretanto, as leis que regem o
fenômeno, quase sempre uma expressão matemática, não eram facilmente
obtidas por seu esforço próprio, sendo obrigado, em muitas ocasiões, recorrer
a amigos matemáticos.

A explicação das ciências da vida, geralmente representada pela


biologia, vincula-se mais intensamente a um processo de interação entre um
organismo vivo, delimitado pelo seu corpo ou estrutura, com o meio que o
cerca. Essa interação se dá por meio de ferramentas sensoriais físico-químicas
6

desenvolvidas pelo organismo. A constante dinâmica do meio induz


adaptações constantes do organismo às mudanças. Essas adaptações
estariam fortemente ligadas a processos aleatórios de mudança na natureza do
organismo que, por vezes, podem coincidir com as novas exigências do
ambiente. Tais processos aleatórios de mudança orgânica são denominados
de mutações genéticas. Nesse contexto, a explicação para a variabilidade da
vida é a dinâmica do meio ambiente favorecendo mutações melhores
adaptadas a essa dinâmica. Assim, a teoria da evolução, usada para designar
as mudanças do organismo em função da melhor adaptação, não significa
necessariamente evoluir em complexidade. Assim, a explicação nas ciências
da vida assume um contorno muito semelhante ao da física, quando nos
damos conta que o processo biológico é nada mais do um processo físico-
químico. Um exemplo ilustrativo muito interessante sobre a pesquisa na ciência
biológica está relacionado com as formigas da espécie Catagyphis fortis. Essas
formigas, adaptadas ao clima extremo do deserto do Saara, são capazes de
saírem de seu ninho e caminhar por até mais de 100 metros em busca de
alimento e depois retornar rapidamente, em linha reta, até o ninho
(SRINIVASAN, 2001). Qual o segredo dessa perfeita orientação num ambiente
onde o sol escaldante não permite que se deixem rastros químicos para serem
seguidos até o ninho? Uma teoria aponta para um mapeamento de odores
químicos ao longo do caminho, ou seja, a formiga seria capaz de criar
mentalmente um mapa de odores até o ninho. Os odores seriam oriundos de
objetos ao longo do caminho e a posição desses objetos num contexto
específico indicaria à formiga a direção da entrada do formigueiro. Esse
exemplo é citado pelo fato de que as pesquisas científicas desenvolvidas para
explicar o comportamento da formiga não são, todavia, conclusivas. Apesar de
todos os controles efetuados nos procedimentos, pairam dúvidas quanto à
validade da explicação. Mais recentemente outros pesquisadores, por exemplo,
alegam que suas pesquisas apontam outra explicação, igualmente válida,
afirmando que na verdade as formigas possuem uma espécie de odômetro nas
patas, e que conseguiriam, de alguma forma, contar os passos até o ninho
7

(WITTLINGER, WEHNER e WOLF, 2007). Embora seja uma explicação válida


e convincente, não é possível determinar, ainda, se é a única e definitiva
explicação ou uma combinação de várias explicações.

Se nas ciências da vida a explicação pode apresentar várias facetas, o


que dizer então das Ciências Sociais, onde a complexidade das inter-relações
assume um papel preponderante, tornando a explicação mais enigmática e
imprevisível em função do comportamento humano.

O contexto apresentado pelas ciências sociais mostra uma dinâmica


desconhecida pelas ciências da matéria e parcialmente reconhecida nas
ciências da vida. Tal dinâmica está atrelada ao consciente coletivo e como este
reage às ações individuais. A busca de explicações no campo das ciências
sociais revela que o fato social, objeto de estudo, apresenta características que
vão muito além da explicação funcionalista, ou seja, uma relação de causa e
efeito. O segmento específico deste trabalho, o qual está voltado para o
comportamento eleitoral, não apresenta melhor sorte quanto ao fato social
estudado, ou seja, o processo eleitoral. Encontrar relações de causa e efeito no
processo eleitoral sempre é possível quando delimitado dentro de um lapso de
tempo. Pode-se explicar, por exemplo, porque um candidato cresceu nas
pesquisas de intenção de voto, mas é impossível inferir com exatidão, a partir
do seu ritmo de crescimento até o presente, se essa intenção crescerá,
estabilizará ou decrescerá nas próximas pesquisas. Enquanto as leis da física
e boa parte das leis da vida apresentam boa possibilidade de previsão, as leis
sociais fogem com maior frequência do controle probabilístico, ficando a mercê
da regência do caos.

É inegável a dominação dos fenômenos sociais pelo caos quando


notamos que um caso particular e isolado pode assumir proporções
imprevisíveis, afetando toda uma sociedade ou até várias sociedades,
mudando para sempre o seu perfil.
8

Nas ciências da vida o caos também tem o seu papel. Esse papel pode
ser de modo relevante, sendo capaz de alterar toda a estrutura da
biodiversidade em um único momento. A sessenta e cinco milhões de anos
atrás houve uma extinção em massa na Terra, eliminando por completo os
dinossauros, os quais imperavam no ambiente terreno por milhões de anos
consecutivos. A teoria mais aceita é que a extinção se deu em um único
momento, quando o nosso planeta foi atingido por um grande meteoro,
causando mudanças radicais no meio ambiente por um longo período, matando
boa parte dos seres vivos e extinguindo outros. Após a recuperação das
condições normais do ambiente sobreveio o domínio de novos biótipos,
sobreviventes da catástrofe, entre eles os mamíferos, árvore genealógica que
deu origem ao homo sapiens. Tal evento radical é fruto de movimentos
caóticos no universo, estrelas nascendo e morrendo, buracos negros,
supernovas, quasares, pulsares, cometas e asteroides circulando
aleatoriamente no espaço, etc. Um evento dessa magnitude certamente não
pertence ao campo das probabilidades, tão raro são as suas condições de
ocorrência, entretanto, são possíveis, como é possível um candidato azarão
ganhar uma eleição. Muitos poderiam contestar essa analogia afirmando que a
trajetória de um corpo celeste, tal como um asteroide, é determinista, sofrendo
apenas de pequenos erros de medição que poderiam se encaixar
perfeitamente na teoria das probabilidades. Mas aí está o problema: não há
qualquer garantia que esses erros ficariam sob o controle estatístico. Qualquer
intervenção não prevista na sua trajetória (impacto com outro corpo celeste, por
exemplo, mesmo que diminuto) poderia gerar um desvio mínimo, mas que
culminará com um grande desvio após longo tempo. Do mesmo modo agem os
fenômenos sociais, tais como as eleições. Um pequeno evento, aparentemente
inofensivo, pode mudar completamente os rumos de uma eleição.

O capítulo dois faz uma análise do comportamento do eleitor paulistano


na eleição para prefeito em 2008. Essa análise toma como base os conceitos
de campo e habitus de Pierre Bourdieu e uma proposta de modelagem da
dinâmica desses campos.
9

O comportamento do eleitor paulistano é marcado pelas condições


sociais e culturais da população. Explicar o voto é uma tarefa árdua quando
imaginamos a variabilidade cultural do paulistano. Acrescenta-se ainda uma
variável de peso nessa explicação do voto: a escolaridade. O comportamento
do eleitor é avaliado a partir de diversas pesquisas efetuadas pelo instituto de
pesquisas Datafolha. Esses dados secundários possuem informações que
permitem uma avaliação dos diversos aspectos comportamentais do eleitor
paulistano no processo eleitoral.

É realizado um acompanhamento pormenorizado da eleição para


prefeito da Cidade de São Paulo em 2008 e como a mídia focou as ações dos
principais candidatos e sua correlação com as intenções de votos divulgados
pelas pesquisas.

Tomou-se esse caso especificamente em função da situação


desfavorável do candidato Gilberto Kassab no início do processo eleitoral e
como este conseguiu alcançar o segundo turno e obter a cadeira de Prefeito da
maior cidade do país.

Busca-se demonstrar que os fatos políticos e midiáticos que permearam


o processo eleitoral foram de extrema relevância para que o candidato
obtivesse uma projeção positiva perante o eleitorado suficiente para coloca-lo
entre os dois mais votados no primeiro turno. Fenômenos relacionados à
identidade partidária e à rejeição se abateram sobre a candidata Marta Suplicy,
permitindo que o candidato considerado “azarão” se impusesse de modo
surpreendente no segundo turno. Delimitar e quantificar os fatos políticos e
midiáticos que permitiram tamanha proeza é o objetivo desse capítulo, através
do levantamento bibliográfico do tema e a análise de dados obtidos nos
principais jornais que circulam na Cidade de São Paulo, das pesquisas
eleitorais e do comportamento do eleitor.

O papel da mídia tem como principal foco a veiculação dos fatos


ocorridos no período eleitoral, seja de forma imparcial ou não. O interesse é
10

demonstrar que essa veiculação pode ter um papel decisivo na eleição do


candidato.

Outras questões levantadas nesse capítulo estão vinculadas ao perfil do


eleitor e como se encaixa na sua decisão de voto. A intenção é avaliar até que
ponto as teorias expostas sobre o comportamento do eleitor se aderem aos
dados colhidos nas diversas pesquisas de opinião colhidas pelos institutos.

Questões relacionadas à emoção, à utilidade, à racionalidade ou à


irracionalidade são abordadas nesse capítulo.

O fluxo de emoções que acompanham o processo eleitoral é um fator de


peso no momento da decisão do voto. Desde os primórdios da humanidade, na
formação dos primeiros conglomerados humanos, o poder da persuasão
através do carisma pessoal viabilizou o destaque daqueles que melhor
dominavam as emoções humanas. O carisma, ou seja, o poder de poder
influenciar pessoas é um atributo que a maioria dos políticos de sucesso
costuma apresentar. Além do carisma do candidato, as emoções dos eleitores
podem ser despertadas por propagandas partidárias realizadas com o objetivo
de influenciar emocionalmente o eleitor. Quem não se lembra das eleições para
presidente da república em 2002, na disputa entre José Serra e Lula. Nessa
ocasião a atriz Regina Duarte protagonizou uma das mensagens de maior
apelo emotivo no horário político, quando afirmava que “tinha medo” de como
ficaria a situação do país caso Lula fosse eleito.

Distintamente da emoção, o voto utilitário apresenta uma maior


racionalidade do voto, ou seja, o eleitor busca atender suas necessidades
pessoais no momento da votação. Assim uma função utilidade direcionaria a
escolha do candidato conforme a relação entre voto e potencial de retorno
aumentasse.

Já a racionalidade está mais ligada a um ideal do eleitor, geralmente


vinculado a um partido e nem tanto a um candidato. Talvez seja o cenário mais
raro no processo eleitoral, dada às circunstâncias que marcam as identidades
11

partidárias na atualidade. A identidade partidária está muito enfraquecida no


contexto político atual.

O fator indecisão será abordado no capítulo três, o qual se resume na


análise do comportamento do eleitor indeciso traduzido no campo da estatística
como uma variável que apresenta informações incompletas ou omitidas. A
problemática envolvida nesse tema está diretamente relacionada com
tendências do eleitor ao longo de várias pesquisas eleitorais, ou seja, será
aventada a hipótese de que o eleitor, pelo simples fato de estar na condição de
indeciso, revela sua preferência por determinado candidato. Essa preferência
será traduzida via modelos estatísticos de estimação paramétrica. Tais
parâmetros viabilizam a distribuição dos eleitores indecisos, entre os
candidatos, quanto a sua preferência revelada pelo modelo estatístico a partir
de informações latentes extraídas de outras características observadas nesses
indecisos. Parte desse capítulo toma como base trabalho anterior sobre o tema
desenvolvido na dissertação de mestrado buscando-se as adaptações
necessárias do texto, proporcionando uma visão dentro dos moldes exigidos
pelas Ciências Sociais. Essas adaptações permitem vislumbrar a problemática
no contexto tanto da Sociologia quanto da estatística, ou seja, permite que o
leitor não habituado com o rigor formal da matemática relacionada aos modelos
estatísticos consiga compreender os resultados obtidos e, caso tenha
interesse, aprofundar os conhecimentos a respeito dos modelos utilizados
através da literatura recomendada.

A delimitação empírica se restringe aos resultados de pesquisas


eleitorais realizadas pelo Instituto Datafolha referente à eleição para Prefeito de
São Paulo, segundo turno, em 2008. Os dados secundários obtidos serão
ajustados em modelos estatísticos voltados para a análise de dados
categorizados incompletos3.

3
Normalmente os dados categorizados são dispostos em tabelas apropriadas conhecidas como
tabelas de contingência. Nessas tabelas o encontro de uma linha com uma coluna identifica os atributos
12

A questão da falta de informações em variáveis que compõe os dados


nas mais diversas áreas do conhecimento é lugar comum e constitui um
verdadeiro desafio para os pesquisadores. O grande problema envolvendo
dados incompletos está relacionado com a maneira pela qual serão tratados. A
abordagem mais comum é simplesmente ignorá-los, ou seja, são descartados
do banco de dados sem um critério prévio de análise com o intuito de identificar
os motivos de serem incompletos. Descartar dados sem um critério implica que
a estimação, de alguma forma, está prejudicada por algum tipo de viés. A área
das Ciências Sociais não foge a regra, pois a exclusão das observações com
informações incompletas resulta numa simplificação que permite a análise por
métodos convencionais mais parcimoniosos. Essa estratégia é conhecida nas
Ciências Sociais como exclusão listwise ou casewise (ALLISON, 2002).

O desenvolvimento de modelos estatísticos que abordassem as


observações incompletas ocorreu a partir de meados da década de 80,
entretanto, já havia alguns trabalhos pioneiros da década de 70. (GRAHAM,
2009) faz uma breve descrição desses primeiros trabalhos:

“Problemas gerados por falta de dados começaram a ser


tratados de uma forma importante a partir de 1987, embora
já houvesse alguns artigos influentes até então (por
exemplo, Dempster et al. 1977, Heckman 1979, Rubin
1976). O que aconteceu em 1987 foi nada menos que uma
revolução no pensamento sobre a análise de dados
incompletos. A revolução começou com dois grandes livros
que foram publicados naquele ano. Little e Rubin (1987)
publicaram o livro clássico Statistical Analysis with Missing
Data ( segunda edição publicada em 2002). Além disso,
Rubin (1987) publicou seu livro, Multiple Imputation for
Nonresponse in Surveys. Esses dois livros, juntamente com
o aumento da capacidade computacional e o uso dos

observados para um grupo de elementos. Quando para um determinado grupo de elementos há


ausência ou omissão de algum atributo, dizemos que os dados são incompletos.
13

computadores pessoais, lançaram as bases para os pacotes


computacionais voltados para a estatística e, mais
especificamente, nos vinte anos seguintes e além, para o
tratamento de dados incompletos. Também foram
publicados em 1987 dois artigos descrevendo o primeiro
método verdadeiramente acessível para lidar com dados
incompletos usando programas computacionais existentes
de modelagem de equações estruturais (Allison 1987,
Muthen et al. 1987). Por fim, Tanner e Wong (1987)
publicaram artigo sobre o aumento de dados, o qual se
tornaria a pedra angular do programa computacional de
imputação múltipla (MI) desenvolvido uma década depois.”

Assim, podemos ver que tais fenômenos, envolvendo dados


incompletos, se repetem nas pesquisas eleitorais quando uma fração dos
eleitores não declara o seu voto, seja por indecisão ou por convicção (em
branco ou nulo). Mesmo aqueles eleitores que declaram voto em branco ou
nulo, podem se decidir no momento do voto por algum candidato. O fluxo
dessa mudança pode ser quantificado através de modelos estatísticos para
dados incompletos.

A adaptação da realidade do processo eleitoral a partir dos modelos de


dados incompletos pode trazer novas interpretações para o comportamento do
eleitor, principalmente daquele que se mostra indeciso no momento que
responde uma pesquisa eleitoral. Na modelagem sugerida por este trabalho
são tomadas conjuntamente com seu estado de indecisão variáveis conhecidas
do eleitor indeciso tais como escolaridade, faixa etária, renda e outras que
podem auxiliar na imputação do seu voto a algum candidato.

A principal contribuição desse capítulo pode ser entendida quando


constatamos que há uma grande lacuna no Brasil quanto ao tratamento dos
dados incompletos nos estudos referentes a fenômenos sociais. A leitura desse
capítulo pode despertar um maior interesse no assunto por parte dos
pesquisadores da área das Ciências Sociais levando a uma maior produção
14

acadêmica e resultados práticos para a realidade brasileira. Tais análises são


amplamente consideradas em trabalhos realizados fora do Brasil e podem-se
citar, como destaque, os trabalhos realizados por Paul D. Allison, professor de
Sociologia da Universidade de Pensilvânia.

A continuidade e o candidato será objeto do capítulo quatro. Considera-


se, neste trabalho, continuidade como o fenômeno das reeleições sucessivas
de um político, tornando-o praticamente o dono da sua cadeira de
representante seja no Senado, na Câmara dos Deputados Federais, na
Assembleia Legislativa como Deputado Estadual ou ainda como vereador na
Câmara Municipal. Quais condições externas e características do candidato
que lhe permitem permanecer num cargo eletivo por um tempo extremamente
longo?

Buscando compreender o fenômeno, são trabalhadas variáveis


consideradas relevantes para explicar a reeleição. Tais variáveis estarão
vinculadas às atividades do parlamentar no que se refere a sua produção
legislativa, sua capacidade administrativa, sua identidade com o governo
(situação ou oposição) e seu grau de exposição na mídia.

A sua exposição na mídia, seja de forma positiva ou negativa, será


obtida a partir do volume de informação que circula nos principais sites de
busca na internet ou nos principais jornais que circulam na sua cidade ou
estado. Eventualmente, são coletadas informações pontuais, mas de grande
impacto referente ao candidato, tais como escândalos políticos ou ações que,
perante o eleitorado, o rotulam como um verdadeiro paladino da justiça. Essas
informações adicionais são quantificadas e adicionadas ao modelo como mais
uma variável a ser considerada.

A produção legislativa, ou seja, os projetos de lei relevantes que se


converteram em lei, são levantados a partir das informações obtidas nas
páginas de Organizações Não Governamentais voltadas para o controle dos
políticos brasileiros, as quais apresentam informações abundantes sobre os
15

parlamentares respeitando a imparcialidade. Sempre que houver desconfiança


quanto à imparcialidade da ONG, são buscadas alternativas que possam
confirmar as informações tais como páginas das Câmaras Municipais ou
assembleias estaduais. Em último caso, não havendo confiança nas
informações, estas serão descartadas.

A identidade do parlamentar com o governo é quantificado em termos do


seu grau de aproximação com a situação. A importância dessa variável está no
fato da sua proximidade com a máquina administrativa. Apesar da ilegalidade
do uso da máquina administrativa para fins eleitorais, é impossível separar as
eleições da máquina administrativa. Qualquer cidadão, com o mínimo de
percepção do seu meio, vislumbra atividades do poder público distintas no
período eleitoral como, por exemplo, maior investimento em obras públicas.
Tais atividades aparentemente estariam revestidas de legalidade, afinal o
investimento público não pode parar no período eleitoral. A suspeita recai na
distribuição desses investimentos, com uma concentração maior de gastos no
período eleitoral. Assim, não há dúvidas que a proximidade do candidato com a
situação pode gerar um viés nas intenções de votos a seu favor.

Já a capacidade administrativa do candidato ou “currículo” é avaliada a


partir do seu histórico de atividades políticas tais como luta sindical ou
trabalhos sociais de relevância. A busca desses atributos vinculados à
experiência do candidato é realizada a partir de informações contidas na sua
página pessoal, nas páginas da Justiça Eleitoral, mídia e ONGs.

A variável explicada será sua probabilidade de reeleição, definida


através de um modelo probabilístico adequado e dentro dos intervalos de
confiança estatísticos. Procura-se dessa maneira quantificar o fenômeno da
reeleição dentro de um contexto mais geral definido pelo processo eleitoral.

O perfil do candidato é tema do capítulo cinco. O candidato é avaliado


quanto ao potencial de sucesso no processo eleitoral. Quais condições
relacionadas ao candidato, tais como escolaridade, gênero, idade ou profissão
16

permitem maior probabilidade de vitória nas urnas. Para avaliar o perfil do


candidato, é utilizado um banco de dados disponibilizado pelo Tribunal Superior
Eleitoral (TSE) que disponibiliza informações pessoais do candidato. Essas
informações são buscadas entre os candidatos a vereador nos Municípios do
Estado de São Paulo nas eleições de 2012. A relação dos atributos dos
candidatos e o seu potencial de voto é modelada de forma permitir encontrar
uma medida para a intensidade dessa relação, destacando e comparando
candidatos.

Assim, nota-se claramente que este trabalho busca destacar o quanto é


imprescindível em toda campanha eleitoral uma avaliação do desempenho do
candidato. Sem essa avaliação os riscos se elevam consideravelmente, pois o
candidato caminha praticamente às cegas.

A avaliação da campanha normalmente é realizada por meio das


pesquisas eleitorais, as quais trazem informações que auxiliarão o candidato
nas formulações de estratégias.

As pesquisas qualitativas, por exemplo, fornecem subsídios para as


decisões com base na análise de caso. A análise de caso pode ser útil para
definir parâmetros que deverão estimados numa pesquisa quantitativa.

Uma campanha bem sucedida certamente depende do grau de


conhecimento que o candidato tem do seu eleitorado e como este reage às
suas atitudes.

O trabalho desenvolvido nesta tese busca, por meio da


interdisciplinaridade, formular conceitos e modelos matemáticos que podem
auxiliar na compreensão do processo eleitoral, identificando os caminhos que a
sociedade brasileira trilha na escolha dos seus representantes, fundamental
para o regime democrático.
17

Capítulo 1

Métodos Empíricos nas Ciências Sociais.

Em razão do uso intensivo de ferramentas estatísticas, procura-se, neste


primeiro capítulo, traçar um paralelo entre os métodos quantitativos utilizados
na tese e sua aplicabilidade no campo das Ciências Sociais. Não se trata de
resumos ou noções desses métodos, pois a bibliografia recomendada atende
plenamente a esse quesito. Busca-se discorrer sobre sua importância como
ferramenta para as ciências sociais e quais as limitações impostas à sua
aplicação nos fenômenos sociais.

A ciência estatística, principal ferramenta do positivismo, apresentou um


grande avanço, tanto na geração de novas teorias como na ampliação do seu
repertório de modelos probabilísticos para as mais diversas aplicações. Hoje é
possível encontrar no mercado uma variedade de pacotes computacionais
voltados exclusivamente para o tratamento estatístico de dados oriundos de
pesquisas efetuadas em áreas do conhecimento que vão desde o direito até a
medicina, sem deixar de passar pela área da sociologia. Não resta dúvida que,
com o advento da informática, viabilizando o tratamento em tempo curto de
uma grande massa de dados, foi uma das principais razões desse crescimento
acentuado da estatística.

O uso das pesquisas empíricas nas Ciências Sociais é, atualmente,


lugar comum nas publicações acadêmicas, fornecendo uma grande quantidade
de análises estatísticas apoiadas em pacotes estatísticos que são “pilotados”
de forma que, no mínimo, gera dúvidas se as conclusões obedecem a um
método científico isento de interferências que desqualificariam tais conclusões.
Deve-se, portanto, evitar o foco estritamente “quantitativista” em detrimento da
verdadeira realidade social.

O argumento central é que o quantitativismo tem seu lugar


na ciência por se tratar de um conjunto de técnicas de pesquisa
social e análise que, ao ser bem aplicado, permite relacionar
18

descobertas sobre padrões de comportamento social com


implicações nas teorias sociais já existentes. Para isso, é
preciso evitar duas armadilhas principais. A primeira é o
excesso de quantitativismo, que não raras vezes transforma a
ferramenta estatística, que deveria servir como forma de
acesso à realidade social, em finalidade última da pesquisa
empírica (CERVI, 2008).

O pesquisador deve tomar o cuidado de abordar seu trabalho de


maneira que não gere desconfiança quanto aos procedimentos adotados,
principalmente no que se refere ao rigor no levantamento das observações que
servirão como base para o processo empírico indutivo. Não se trata de uma
crítica à automação disponibilizada pelos pacotes computacionais, mas a falta
de uso criterioso desses pacotes.

A base de um trabalho empírico está atrelada às observações, sejam


elas do todo (universo) ou de uma parcela (amostra). Florestan Fernandes
busca delinear o processo de observação em três espécies:

Portanto, nas ciências sociais o processo de observação


abrange três espécies distintas de operações intelectuais: a) as
operações através das quais são acumulados dados brutos, de
cuja análise dependerá o conhecimento objetivo dos
fenômenos estudados; b) as operações que permitem
identificar e selecionar, nessa massa de dados, os fatos que
possuem alguma significação determinável na produção
daqueles fenômenos; c) as operações mediante as quais são
determinadas, isoladas e coligidas – nesse grupo restrito de
fatos – as instâncias empíricas relevantes para a reconstrução
e a explanação dos fenômenos, nas condições em que foram
considerados (FERNANDES, 1959).

Traduzindo a compreensão das três espécies de Florestan Fernandes


na linguagem da estatística, temos: a) a amostragem (ou censo, caso se trate
de toda a população), onde se acumulam os dados brutos através do
19

levantamento de dados primários ou secundários, ou seja, dados oriundos de


uma pesquisa de campo (primários) ou de um banco de dados existente
(secundários); b) a análise exploratória de dados implica organizar e resumir as
informações através dos recursos da estatística descritiva, identificando e
selecionando aquilo determinante para o estudo; c) a inferência, a qual só faz
sentido quando se devem estimar parâmetros a partir de uma parcela do
universo (população) tomando-se uma amostra. Temos ai, na amostra, o ponto
sensível da pesquisa voltada para as ciências sociais ou qualquer outra área
do conhecimento.

Podem-se compreender melhor as espécies descritas por Florestan


Fernandes quando se busca uma analogia nos conceitos da estatística
moderna. A acumulação dos dados brutos é realizada a partir da coleta de
dados primários ou secundários. Essa coleta pode abranger toda a população
(censo) ou uma parte dela (amostra). É importante separar as implicações do
censo na estatística. A própria palavra estatística se refere a uma denominação
matemática ligada à estimação de parâmetros populacionais. Assim, quando se
faz um censo, toda a população está presente nos dados e, portanto, somente
trabalhamos com a exploração, descrição e resumo dos dados, ou seja, a
Estatística Descritiva propriamente dita. Os dados são interpretados, no censo,
de forma aflorar características da população visualizadas através de recursos
gráficos, tabelas, diagramas, etc. Conjuntamente com esses recursos, são
obtidas medidas resumos daquela população, também conhecidos como
parâmetros populacionais. Um dos parâmetros populacionais mais conhecidos
é a média. Outros parâmetros populacionais também despertam interesse do
pesquisador, tais como a mediana e o desvio padrão. A mediana corresponde
ao valor que divide a população finita em duas partes com o mesmo número de
elementos, ou seja, cinquenta por cento de cada lado. Quanto ao desvio
padrão, trata-se de uma medida resumo que aponta o grau de dispersão dos
valores da população. Essa dispersão é avaliada a partir do distanciamento dos
valores da média populacional.
20

A estatística, quando considerada como ferramenta essencial ao


processo de indução, somente faz sentido quando é analisada uma parte da
população, uma amostra. Não existe indução no censo, pois todo o universo
está presente.

A importância da indução deve ser reconhecida, entretanto o seu uso


obedece a critérios precisos com a finalidade de se evitar conclusões errôneas.
Essa preocupação foi externada por J. S. Mill em sua obra Sistema de Lógica
Dedutiva e Indutiva. A citação a seguir, apesar de longa, mostra claramente as
armadilhas presentes no uso da indução.

Este uso tem engendrado uma grave confusão na teoria


da indução, exemplificada nos mais recentes e bem elaborados
tratados sobre a filosofia indutiva que existem em nossa língua.
O erro em questão é o de confundir uma mera descrição, por
meio de termos gerais, de um grupo de fenômenos observados
como uma indução tirada desses fenômenos.

Suponhamos que um fenômeno se compõe de partes, e


que essas partes só podem ser observadas separadamente, e,
obviamente, uma a uma. Quando as observações tiverem sido
feitas, haverá a conveniência (atingindo, conforme os objetivos,
a uma necessidade) de obter uma representação do fenômeno
como um todo, combinando, ou, de algum modo, juntando
esses fragmentos separados. Um navegante percorrendo o
oceano descobre terra; não pode a princípio, ou por uma
simples observação, determinar se é um continente ou uma
ilha, mas a costeia e, depois de alguns dias, descobre ter feito
a volta completa ao seu redor; então, declara-se uma ilha. Ora,
não houve um momento ou lugar específico de observação em
que se pudesse perceber essa terra completamente cercada
de água; apurou o fato por meio de uma sucessão de
observações parciais e, então, escolheu uma expressão geral
que resume em duas ou três palavras o conjunto do que
observara. Mas há algo da natureza de uma indução nesse
21

procedimento? Ele inferiu alguma coisa que não tinha sido


observada de uma outra que o tinha sido? Certamente não:
tinha observado tudo que a proposição afirma. Que a terra em
questão é uma ilha não é uma inferência dos fatos parciais que
o navegante viu no curso de sua circunavegação; ela é os
próprios fatos; é um resumo desses fatos, a descrição de um
fato completo em relação ao qual fatos mais simples são como
as partes de um todo (MILL, 1979).

Se um pesquisador pudesse perguntar a todos os eleitores de uma


cidade em quem irão votar para prefeito e encontrar a proporção de 60% então
pode-se afirmar que tal proporção não é fruto da indução e sim uma
constatação da verdadeira proporção de eleitores do candidato naquele
momento. Se a variável tempo for introduzida, então a indução ressurge, pois
se estima que no dia seguinte à pesquisa a proporção se manterá nos 60%.
Para contradizer ou confirmar essa estimativa, o pesquisador deverá realizar
uma nova pesquisa e introduzir o componente tempo. Uma sucessão de
valores no tempo proporcionará um novo modelo de previsão por meio da
indução, estimando, por exemplo, as tendências das proporções de voto no
tempo.

Quando se tem uma amostra, chama-se de estatística um arranjo


matemático dos valores observados da amostra. Esse arranjo composto de
variáveis aleatórias é chamado de Estimador. O Estimador produz, a partir da
amostra, uma estimativa de um parâmetro populacional de interesse. Para
exemplificar, se um pesquisador desejasse estimar o peso médio de uma
população a partir de uma amostra, a Estatística ou Estimador dessa média
populacional, no caso o parâmetro de interesse, seria a média da amostra. É
possível demonstrar através de recursos matemáticos que o melhor estimador
da média populacional (Parâmetro) é a média amostral (Estatística ou
Estimador). De qualquer modo, não é difícil usar a intuição para perceber que
tal afirmação é verdadeira.
22

O grande problema a ser enfrentado nesse procedimento é que a média


amostral também é um valor aleatório e que está estreitamente ligada à forma
adotada para a coleta da amostra, ou seja, ao planejamento amostral.

Nas Ciências Sociais, na maioria das vezes impossibilitada de fazer uso


da observação experimental, a amostra é muito sensível a interferências,
exigindo um planejamento amostral robusto.

A construção do caso típico, que se obtém mediante a


observação experimental, e a formulação de sua explicação,
que constitui um processo lógico de abstração e de
generalização das instâncias empíricas, interpretativamente
relevantes, encontram uma expressão comum nas mesmas
operações intelectuais, que culminam na descrição sintética do
fenômeno.

Isso não ocorre, de forma regular, com as ciências sociais,


em que ainda são muito limitadas as possibilidades de praticar
a observação em condições experimentais. Os dois momentos
ou fases do processo de investigação se separam com nitidez:
primeiro se procede à eliminação do que é acidental,
circunstancial e fortuito, mediante a construção analítica de
casos típicos; só então é que se pode passar ao tratamento
interpretativo das instâncias empíricas selecionadas, com o
propósito de explicar os fenômenos observados. Em outras
palavras, as operações intelectuais de caráter “técnico”
precedem e condicionam as operações intelectuais de caráter
“logico” (FERNANDES, 1959).

A primeira das duas fases do processo de investigação descritas por


Fernandes expõe claramente a problemática envolvendo a coleta de dados. As
chamadas “operações intelectuais de caráter técnico” nada mais é que planejar
a amostragem de forma reduzir a um mínimo os erros que afetam a
representatividade da população. Não faz o menor sentido passar para a
23

segunda fase sem ter o controle da primeira. Seria uma estrutura de aço sendo
construída numa base de areia.

Uma estimativa somente tem importância se a amostra que lhe deu


origem provém da população de interesse e a representa em todos os aspectos
que estão sendo estudados. Toma-se, por exemplo, uma pesquisa eleitoral em
que a amostra de eleitores foi coletada dentro de um reduto eleitoral de certo
candidato. Provavelmente essa pesquisa apresentará falta de
representatividade da população de eleitores, gerando um viés em favor desse
candidato.

As operações intelectuais de caráter “lógico” definem as ferramentas


necessárias para a reconstrução proposta por Fernandes, o que implica
interpretar o todo a partir da parte, ou seja, pela lógica da indução, do
conhecido para o desconhecido. Essa reconstrução faz uso de modelos
probabilísticos funcionais, mas sempre admitindo uma parcela aleatória
desconhecida, chamada de parcela residual. Essa parcela residual, ou ruído,
não pode ser explicada pelo modelo mas, teoricamente, está sob controle
probabilístico.

Normalmente esse resíduo é tratado como um erro intrínseco ao modelo


e adota-se, para esse erro, um tamanho apropriado. Nas pesquisas de
intenção de voto, por exemplo, é comum anunciar que um candidato possui
tantos por cento das intenções de voto com uma margem de erro de tantos por
cento, para mais ou para menos.

É importante compreender que essa margem de erro 4 depende de duas


grandezas: do tamanho da amostra e da confiança probabilística 5 desejada.

4
Trata-se do erro amostral, ou seja, a diferença esperada entre o valor estimado pela amostra
(estimativa) e o verdadeiro valor populacional (parâmetro).
5
A confiança probabilística, ou nível de confiança, é eleita pelo pesquisador e representa
quanto se deseja confiar no erro adotado confrontado com a amostra, ou seja, a probabilidade de que
o erro amostral seja menor ou igual ao erro adotado. Se, por exemplo, o pesquisador desejar um erro de
3% com nível de confiança de 95%, deve um tamanho de amostra que permita afirmar que para 100
24

Assim é possível ter-se um erro pequeno, mas com baixa confiança


probabilística.

Adota-se na maioria das pesquisas um nível de confiança de 95% para o


erro amostral. Uma vez fixada a confiança, o erro somente poderá ser reduzido
a partir do aumento do tamanho da amostra.

Assim, a explicação dos fatos sociais com base na observação amostral


não foge à regra, depende de um termo aleatório mas com uma diferença,
sofre perturbações cruciais ao longo do tempo. O mesmo não ocorre com as
ciências experimentais. Se um pesquisador da área da física estuda a
resistência que um determinado corpo geométrico oferece à passagem de um
fluido, pode, empiricamente, determinar um modelo explicativo funcional para
aquela forma geométrica. Os erros envolvidos estão sob tal controle
probabilístico, que é possível repetir a experiência e colher dados que levarão a
resultados similares em qualquer instante. Assim, a variável tempo,
aparentemente, não possui relevância nesse caso.

De qualquer forma, as ciências sociais não dispõem de


meios regulares para a constatação e a retificação dos erros,
através das próprias condições de observação e da
experiência. Essa é uma possibilidade característica das
ciências que podem praticar a observação em condições
experimentais. Como já sugeria Comte, elas também carecem
dos meios de controle das explicações, fornecidos pela
experimentação propriamente dita. Mesmo a psicologia social,
que dispõe de maiores recursos para a observação controlada
e a exploração dos modelos experimentais de pesquisa, não
conta com as facilidades das “ciências de laboratório”, nas
quais basta repetir artificialmente as condições de produção do
fenômeno para saber-se se a explicação é verdadeira ou falsa
(FERNANDES, 1959).

amostras com esse tamanho, espera-se que no máximo cinco apresentem um erro amostral superior a
3%.
25

É importante esclarecer o significado do erro na análise de dados (erro


amostral), buscando não confundi-lo com os erros de amostragem. Os erros de
amostragem podem ocorrer de várias maneiras como, por exemplo, erros de
medidas, de objeto, de representatividade, omissões de respostas, informações
incompletas, entre outros. Assim o erro de amostragem é uma falha na coleta
dos dados, enquanto o erro amostral é probabilístico, intrínseco a análise de
dados e vinculado ao processo de modelagem, ou seja, em função do grau de
aderência do modelo aos dados. Um modelo com maior aderência apresenta
erro amostral menor.

Pode-se melhor esclarecer o uso da modelagem na pesquisa social


usando um exemplo simples. O pesquisador está interessado em verificar o
número de votos de um vereador em função dos gastos com a campanha.
Assim o pesquisador parte do princípio que existe uma correlação entre gasto
de campanha e número de votos. Pode-se perceber que essa hipótese é
intuitiva, advinda da experiência do pesquisador, mas que carece de
comprovação empírica. O estudo busca obter os gastos de todos os candidatos
a vereador e quantos votos cada um obteve. Apesar do levantamento dos
gastos e número de votos de todos os vereadores até aquela data, ainda se
trata de uma amostra, pois não sabemos como os futuros candidatos a
vereador irão se portar frente às variáveis gasto e número de votos. A
estimativa para os futuros vereadores é o interesse principal e será obtida
através do modelo proposto.

A grande vantagem neste exemplo é que o pesquisador não necessita


se preocupar com o planejamento amostral, pois está usando todas as
informações disponíveis. O maior problema está na veracidade dos gastos
declarados, ou seja, incorrerá num viés que muito provavelmente subestimará
os gastos. Um pesquisador meticuloso poderia buscar informações
complementares sobre os gastos dos candidatos e realizar um cruzamento,
entretanto exigiria um grande esforço de logística, de tempo e de recursos
financeiros, nem sempre disponíveis. A seguir o pesquisador passa a explorar
26

os dados usando ferramentas que permitam vislumbrar a correlação entre as


variáveis gasto e número de votos. Uma ferramenta que permite a visualização
de uma possível correlação entre as variáveis é o chamado gráfico de
dispersão. A figura 1 mostra um conjunto de dados obtidos no site do Tribunal
Superior Eleitoral (TSE) envolvendo uma amostra de 11 vereadores
posicionados em um gráfico de dispersão. A simples observação desse gráfico
permite afirmar que a correlação existe, pois a medida que os gastos
aumentam o número de votos também aumenta. Uma possível modelagem
para o comportamento das duas variáveis seria uma reta, a qual está
desenhada na figura. Trata-se de um modelo funcional, no qual entramos com
o valor gasto na campanha e obtemos uma estimativa do número de votos que
esse candidato terá.

Figura 1: Exemplo de modelo funcional. Ajuste de uma reta.

Fonte: TSE. Elaborada pelo autor.

O princípio utilizado aqui se baseia nas variações concomitantes de


Stuart Mill, a qual é discutida mais adiante. Nesse caso pode-se observar uma
dependência aparente entre o número de votos e os gastos de campanha.
27

Dizemos que aparenta existir uma dependência pelo simples fato de que
existem outros fatores que afetam o número de votos e que mesmo os gastos
devem ser considerados como causa com algumas reservas, pois por trás dos
gastos existem fatores que podem possuir maior correlação com o número de
votos do que o próprio gasto. O que se quer dizer é que os fatores
determinantes conspiram de tal forma que trazem como resultado o volume de
gastos, que na verdade apenas simboliza a conjunção desses fatores. Uma
analogia para a situação pode ser feita quando temos um quadro valioso. O
quadro é valioso não pelo material que é feito, mas pelas qualidades atribuídas
ao seu autor, as quais permitem que o quadro seja valioso. De mesma forma o
pesquisador deve ter em mente que muitas vezes o objeto não se revela por
completo. A visão dos verdadeiros fatores está ofuscada por um fenômeno que
na realidade apenas é o portador de tais fatores.

Pode-se notar uma observação (apontada por uma seta na figura 1) que
foge do comportamento do restante. Tal observação discrepante aponta um
vereador que obteve muitos votos com baixo gasto em campanha. O
pesquisador deve realizar uma melhor análise dessa observação, pois afeta o
modelo no sentido de reduzir a aderência das observações, ou seja, aumenta o
erro amostral. Independentemente se o gasto divulgado é verdadeiro ou não,
obriga o pesquisador tomar uma decisão: se retira ou não essa observação da
análise. Uma justificativa para essa atitude está vinculada ao fato de que tal
observação é muito rara e mantê-la para fins de modelagem poderia gerar um
viés desnecessário na previsão. Por outro lado, caso se tenha certeza de que o
gasto foi realmente baixo, justificaria manter essa observação, pois se trata de
uma observação verdadeira. Nota-se, portanto, que mesmo na racionalidade
envolvendo o processo de indução, há espaço para alguma subjetividade
inerente à experiência do pesquisador. Mas essa subjetividade é relativa, pois
o pesquisador deve tomar sua decisão com algum respaldo técnico.

Em resumo, cabe à análise converter os dados imediatos da


experiência (ou, o que seria mais preciso, os “dados primários”
28

da investigação), em dados manipuláveis pelo raciocínio


científico. Em contraste com o conhecimento de senso comum,
o conhecimento científico exige matéria prima própria, que
permita representar objetivamente as ocorrências observadas.
De fato, seria impossível explicar positivamente a realidade, se
só a pudéssemos perceber e representar através de
aparências e de atributos superficiais. Por isso, a primeira
etapa da pesquisa científica [coleta de dados], nas disciplinas
indutivas, se funde com uma indagação sistemática sobre os
caracteres e as condições das ocorrências (FERNANDES,
1959).

A questão da modelagem probabilística para explicar a realidade


apresenta limitações não somente com o erro amostral, mas também com sua
estrutura. Teoricamente, sempre é possível ajustar um modelo de explanação
que torna o erro amostral menor que outro modelo, ou seja, existem modelos
probabilísticos concorrentes que apresentam melhor aderência aos dados do
que outros modelos. O principal problema enfrentado com esses modelos está
relacionado com a complexidade. Normalmente maior aderência implica
modelos com maior complexidade matemática e nem sempre o ganho obtido
com essa melhor aderência justifica a adoção desses modelos. Convém,
portanto, buscar modelos probabilísticos mais parcimoniosos, mesmo que
esses impliquem menor aderência aos dados. A busca descontrolada por uma
aderência perfeita torna-se inútil, pois além da complexidade maior do modelo,
sua explicação para o fenômeno seria artificial em demasia.

Voltando ao exemplo dos gastos de campanha e número de votos,


“parece razoável” modelar o comportamento relacional entre os dois
fenômenos por uma reta. O que leva a crer que seja “razoável” modelar o
comportamento por uma reta? Temos novamente subjetividade nessa crença
do pesquisador ou trata-se de um critério estritamente técnico? Na verdade o
pesquisador pode adotar modelos que se encaixam perfeitamente aos dados.
Se, por exemplo, ao invés de utilizar uma reta, utilizar uma função senoidal do
29

tipo , provavelmente teria um ajuste muito melhor aos dados


do que uma equação de reta do tipo .

A figura 2 mostra o ajuste de um modelo senoidal aos dados. Pode-se


observar que a curva do modelo está mais aderente aos dados. Quando o
pesquisador encontra modelos que apresentam essa característica, deve
eleger aquele que melhor se adequa à realidade do fenômeno. Fica claro que o
uso de um modelo mais complexo como o senoidal no exemplo é inútil do
ponto de vista prático. É inútil porque a realidade não se comporta dessa
maneira, e tudo leva a crer que caso se adicione mais observações para fins de
modelagem, nada garante que esse modelo continue sendo tão aderente,
demonstrando a sua artificialidade. Também é inútil a adoção do novo modelo
quando se constata o aumento de complexidade, flagrantemente
desnecessária para o modelo, tendo em vista que um modelo mais
parcimonioso atende satisfatoriamente as previsões necessárias tanto quanto o
modelo simplificado. Alias, é possível que um modelo mais simples apresente
previsões melhores do que um modelo mais complexo.

Pode causar surpresa tal situação no uso de ferramentas estatísticas,


pois se tem a ideia que tais ferramentas são inteiramente originárias de regras
objetivas. Nota-se, portanto, que o cientista deve encarar situações que exigem
algum grau de subjetividade, entretanto, essa subjetividade é relativa quando
se tem em mente que a experiência do pesquisador permite considerar que a
subjetividade envolvida é desprezível.

A escolha entre um modelo simples e outro complexo deve ser avaliada


em função do ganho que um modelo mais complexo traria. Esse ganho deve
ser avaliado de duas formas: quantitativamente e qualitativamente. Um ganho
quantitativo nem sempre implica num ganho qualitativo. O ganho quantitativo
se apoia na frieza dos números, ou seja, o modelo mais complexo trouxe uma
quantidade maior de aderência aos dados. O ganho de qualidade está ligado à
resistência do modelo a novas informações. Se novas informações são
30

introduzidas no modelo e este continua mantendo seu grau de aderência,


pode-se afirmar que apresenta uma boa qualidade.

Figura 2: Exemplo de modelo funcional. Ajuste de uma função senoidal.

Fonte: TSE. Elaborado pelo autor.

O comportamento social implica uma complexidade que transcende as


leis naturais, exigindo uma compreensão adicional do pesquisador, ou seja,
segundo Durkheim, “o sentimento da especificidade da realidade social”:

A sociologia, portanto, não é o anexo de nenhuma outra


ciência; ela própria é uma ciência distinta e autônoma, e o
sentimento da especificidade da realidade social é inclusive tão
necessário ao sociólogo, que somente uma cultura
especificamente sociológica é capaz de prepará-lo para a
compreensão dos fatos sociais (DURKHEIM, 2007).

A partir dessas aplicações, reforça-se a ideia de que a Sociologia, tal


como foi tão apropriadamente formulada por Durkheim, possui vida própria
como ramo das ciências, trazendo no seu bojo a aplicação do método
31

empírico-indutivo exigindo, entretanto, que se deva levar em conta que o


dinamismo dos fatos sociais carece de atualização constante. Um
comportamento social pode mudar completamente num curto intervalo de
tempo.

Durkheim, na sua obra As Regras do Método Sociológico, afirma:

A sociologia não tem de tomar partido por uma das grandes


hipóteses que dividem os metafísicos. Ela não precisa afirmar a
liberdade nem o determinismo. Tudo o que ela pede que lhe
concedam é que o princípio de causalidade se aplique aos
fenômenos sociais. E, ainda assim, esse princípio é por ela
estabelecido não como uma necessidade racional, mas
somente como um postulado empírico, produto de uma indução
legítima. Visto que a lei da causalidade foi verificada nos outros
reinos da natureza e que progressivamente ela estendeu seu
domínio do mundo físico-químico ao mundo biológico, e deste
ao mundo psicológico, é lícito admitir que ela igualmente seja
verdadeira para o mundo social; e é possível afirmar hoje que
as pesquisas empreendidas sobre a base desse postulado
tendem a confirmá-lo. Mas a questão de saber se a natureza
do vínculo causal exclui toda contingência nem por isso está
resolvida (DURKHEIM, 2007).

Segundo Durkheim, a sociologia apenas pede o benefício do princípio da


causalidade estabelecido a partir de um postulado empírico, o qual emerge por
meio da indução, e não permite conclusão diversa. Causalidade transmite a
ideia de que um fenômeno, quando surge ou é alterado, causa, a princípio,
algum efeito em outro fenômeno de características distintas do primeiro. Essa
ideia de causa e efeito deve ser vista com muita reserva, pois as aparências
enganam. John Stuart Mill na sua obra “A System of Logic” de 1843,
resumidamente, apresenta cinco métodos de indução: Concordância,
Diferença, Junção entre Concordância e Diferença, Resíduos e Variações
Concomitantes, sempre destacando a relação de causa e efeito.
32

A indução permite obter conclusões a respeito de um determinado


fenômeno, ou fato social, a partir da observação de uma parte desse fato, ou
seja, do particular para o geral, da parte para o todo. Como a indução, nesse
método, parte da observação empírica, o objeto de pesquisa deve ser definido
com clareza de modo delinear como a parte deve ser tomada.

Fica claro, portanto, que se deve isolar a população a ser pesquisada, a


qual deve apresentar características exteriores que lhes são comuns, as quais
escapam da vontade do observador, ou seja, completamente definidas pela
natureza do objeto. Assim, não é possível tomar como objeto aquele que não
representa a população (categoria) de interesse, ou seja, desejando-se verificar
a incidência de um fato social dentro de uma categoria, seria absurdo utilizar
categorias diversas6.

Ao proceder dessa maneira, o sociólogo, desde seu primeiro


passo, toma imediatamente contato com a realidade. Com
efeito, o modo como os fatos são assim classificados não
depende dele, da propensão particular de seu espírito, mas da
natureza das coisas. O sinal que possibilita serem colocados
nesta ou naquela categoria pode ser mostrado a todo o mundo,
reconhecido por todo o mundo, e as afirmações de um
observador podem ser controladas pelos outros (DURKHEIM,
2007).

Percebe-se a necessidade de se afirmar que o procedimento se


enquadra na realidade do objeto de tal forma que pode ser reconhecido,
compreendido e reproduzido por outros interessados, tal qual um
desencadeamento lógico de uma equação matemática, ou seja, despojado de
qualquer subjetividade. Essa necessidade não foge à regra adotada pelas
ciências naturais.

6
Se, por exemplo, deseja-se verificar a frequência de pessoas favoráveis ao aborto no estrato
(categoria) correspondente aos indivíduos que se declaram católicos (propriedade exterior), não faria
sentido tomar indivíduos que se declaram não católicos, a menos que o pesquisador deseja comparar os
dois estratos mas , de qualquer forma, é definida uma nova população, não fugindo, portanto, da
orientação de Durkheim.
33

Em outros casos, toma-se o cuidado de definir o objeto


sobre o qual incidirá a pesquisa; mas, em vez de abranger na
definição e de agrupar sob a mesma rubrica todos os
fenômenos que têm as mesmas propriedades exteriores, faz-se
uma triagem entre eles. Escolhem-se alguns, espécie de elite,
que são vistos como os únicos com o direito a ter esses
caracteres. Quanto aos demais, são considerados como tendo
usurpado esses sinais distintivos e não são em conta. Mas é
fácil prever que dessa maneira só se pode obter uma noção
subjetiva e truncada. Essa eliminação, com efeito, só pode ser
feita com base numa ideia preconcebida, uma vez que, no
começo da ciência, nenhuma pesquisa pôde ainda estabelecer
a realidade dessa usurpação, supondo-se que ela seja possível
(DURKHEIM, 2007).

Logo, para decidir se uma determinada observação merece ou não estar


na pesquisa, não se permite simplesmente tomar o caminho da subjetividade.
Pode-se afirmar que somente a realidade do objeto permitiria fazê-lo, nunca o
critério subjetivo do observador. Qualquer atitude fora do contexto da realidade
atentaria contra o princípio da imparcialidade, podendo desmoralizar a
pesquisa por falta de objetividade ou, em caso extremo, gerar desconfiança
quanto à ética do pesquisador.

Durkheim mostra sua convicção no poder da explicação, ou seja, uma


postura funcionalista:

Mostramos que um fato social só pode ser explicado por


outro fato social, e, ao mesmo tempo, indicamos de que
maneira esse tipo de explicação é possível ao assinalarmos
*no meio social interno o motor principal da evolução coletiva*.
(...)

*Uma ordem de causas dotadas de suficiente eficiência para


tornar inteligível a produção dos efeitos que lhes atribuímos, e
bastante próximas desses efeitos para poder explicá-los sem
34

que seja necessário desnaturá-los por uma simplificação


artificial: trata-se das propriedades do meio social (DURKHEIM,
2007).

Como já mencionado anteriormente, Durkheim sofre influência de Mill,


entretanto, seu trabalho apresenta forte influência de Descartes. A explicação
científica seria fornecida, fundamentalmente, por um processo empírico-
indutivo, mas igualmente aberta às influências do empiricismo e do
racionalismo (FERNANDES, 1959).

Nas Regras, no início do capítulo referente à administração da prova,


Durkheim afirma:

Temos apenas um meio de demonstrar que um fenômeno é


causa de outro: comparar os casos em que eles estão
simultaneamente presentes ou ausentes e examinar se as
variações que apresentam nessas diferentes combinações de
circunstâncias testemunham que um depende do outro.
Quando eles podem ser artificialmente produzidos pelo
observador, o método é a experimentação propriamente dita.
Quando, ao contrário, a produção dos fatos não está à nossa
disposição e só podemos aproximá-los tais como se
produziram espontaneamente, o método empregado é o da
experimentação indireta ou método comparativo.

(...)

Vimos que a explicarão sociológica consiste exclusivamente


em estabelecer relações de causalidade, quer se trate de ligar
um fenômeno à sua causa, quer, ao contrário, uma causa a
seus efeitos úteis. Uma vez que, por outro lado, os fenômenos
sociais escapam evidentemente à ação do operador, o método
comparativo é o único que convém à sociologia (DURKHEIM,
2007).
35

Na administração da prova vemos a sedução que o método das


variações concomitantes7 de Mill exercia sobre Durkheim e, segundo suas
próprias palavras:

Muito diferente é o que acontece com o método das


variações concomitantes. Com efeito, para que ele seja
demonstrativo, não é necessário que todas as variações
diferentes daquelas que se comparam tenham sido
rigorosamente excluídas. O simples paralelismo dos valores
pelos quais passam os dois fenômenos, contanto que tenha
sido estabelecido num número suficiente de casos
suficientemente variados, é a prova de que existe entre eles
uma relação. Esse método deve esse privilégio ao fato de
atingir a relação causal, não a partir de fora como os
precedentes, mas a partir de dentro (DURKHEIM, 2007).

Após discorrer sobre os métodos de Mill, descartando um a um como de


alguma utilidade à interpretação dos fenômenos sociais, detém-se no método
das variações concomitantes. Segundo Durkheim, a vantagem desse método
sobre os outros8 está no fato de não haver necessidade da exclusão de todas
as variações distintas das que se comparam exceto uma. Segundo ele, os
fenômenos sociais seriam por demais complexos, não permitindo isolar os
efeitos de todas as causas exceto uma.

O método das variações concomitantes descrita por Mill vai ao encontro


do funcionalismo, na medida em que determinada variável de um fenômeno

7
No método da variações concomitantes, Mill afirma que quando um fenômeno varia de uma
maneira específica sempre que um outro fenômeno varia, também de sua maneira específica, as
variações são causa ou efeito uma da outra.
8
Durkheim se refere ao método da concordância, da diferença e dos resíduos (Mill, 1843). No
método da concordância “se duas ou mais instâncias de um fenômeno sob investigação tem somente
uma circunstância em comum, a circunstância, a qual todas as instâncias concordam, é a causa (ou
efeito) do dado fenômeno”. O método da diferença diz que “se um fenômeno ocorre em uma instância e
não em outra, e as duas instâncias têm todas as circunstâncias em comum exceto uma, e a circunstância
onde as duas instâncias diferem está presente na primeira e não na segunda, a tal circunstância é o
efeito, a causa, ou, necessariamente, parte da causa do fenômeno.”. Já o método dos resíduos afirma
que “reduzindo-se de um fenômeno as partes previamente conhecidas como sendo efeitos de certos
antecedentes, os resíduos do fenômeno são efeitos dos antecedentes remanescentes.”
36

varia quantitativamente quando uma outra variável relacionada ao fenômeno


também sofre uma variação quantitativa:

A concomitância constante é, portanto, por si mesma, uma


lei, seja qual for o estado dos fenômenos que permaneceram
fora da comparação (DURKHEIM, 2007).

Durkheim adotou o método das variações concomitantes consciente das


suas limitações pois, segundo ele, as leis que potencialmente estariam
estabelecidas pelo método não significam, necessariamente, relação de causa
e efeito, havendo necessidade de interpretação dos resultados.

É verdade que as leis estabelecidas por esse procedimento


nem sempre se apresentam de imediato sob a forma de
relações de causalidade. A concomitância pode ser devida, não
a um fenômeno ser a causa do outro, mas a serem ambos os
efeitos de uma mesma causa, ou então por existir entre eles
um terceiro fenômeno, intercalado, mas despercebido, que é o
efeito do primeiro e a causa do segundo. Os resultados a que
esse método conduz têm, portanto, necessidade de ser
interpretados (DURKHEIM, 2007).

Esse comentário de Durkheim mostra seu cuidado na interpretação dos


fenômenos sociais pois, sem dúvida, o uso incorreto do método das variações
concomitantes pode levar a conclusões totalmente erradas a partir de
resultados aparentemente coerentes. Não seria surpresa descobrir que o
próprio Durkheim teria sido vítima desse método no momento de inferir as
relações de causa e efeito.

Imaginemos que um pesquisador consegue verificar empiricamente que


toda vez que uma variável A de um fenômeno sofre uma variação quantitativa
outra variável B também varia. A princípio ele desconhece uma terceira variável
C, também vinculada ao fenômeno, porém passou despercebida. De imediato o
pesquisador seria levado, a partir dos resultados, a afirmar que A é causa do
efeito em B. O pesquisador, desconfiado do resultado, resolve criar dois
37

estratos, um que contém somente objetos que apresentam a variável A e outro


que apresenta a variável C, anteriormente ignorada. No estrato que contém a
variável A, quanto esta sofre uma variação, nada ocorre com a variável B,
entretanto, no estrato que contém a variável C, quanto maior a quantidade de C
maior a quantidade de B, ou seja, existe uma razão direta entre as variáveis. O
erro inicial do pesquisador está no fato de não ter percebido que A está
relacionado com C e não com B. Na verdade uma quantidade maior de A
implica uma maior quantidade de C e consequentemente uma maior
quantidade de B. Caso C esteja ausente, A não causa qualquer efeito em B.
Caso C esteja presente, B sofre efeito de sua presença. Esse fenômeno é
muito conhecido pelos epidemiologistas nos seus estudos relacionados às
substância que causam malefícios ao organismo. Uma variável com as
característica da variável C descrita no exemplo anterior é conhecida como
“Variável de Confusão”. Consideremos uma pesquisa feita sobre o consumo de
café, que indique uma relação causal entre consumo de café (A) e incidência
de câncer de pulmão (B), ou seja, aparentemente quanto maior o consumo de
café, maior o risco de adquirir câncer de pulmão. Na verdade, ocorre um
grande equivoco, pois quando se cria dois estratos, um de fumantes e outro de
não fumantes, constata-se que no estrato de não fumantes o consumo de café
não mostrava relação causal com o câncer de pulmão, ou seja, a incidência
estava dentro dos índices normais da população em geral. Entretanto, quando
se observa o estrato de fumantes, notava-se uma relação causal entre o
consumo de café e o câncer de pulmão. Quando separam-se entre os
fumantes os que tomam café e os que não tomam, observa-se o mesmo nível
de incidência de câncer. Não é o café que causa o câncer e sim o hábito de
fumar (C). O que ocorre é que, em geral, pessoas que fumam muito também
gostam de tomar muito café, o conhecido “cafezinho” após um cigarro. Nesse
caso a variável consumo de café é um exemplo de “variável de confusão”.

O racionalismo de Durkheim se manifesta no cuidado empregado na


interpretação dos resultados. A interpretação exige, obrigatoriamente, o uso da
razão e de processos dedutivos. Na verdade, a dedução pode preceder a
38

experiência estabelecendo hipóteses que devem ser confirmadas


empiricamente através da indução, ou seja, a indução deve coincidir com a
dedução. Talvez o exemplo mais conhecido do que se diz aqui é a teoria da
relatividade geral. Einstein afirmava que uma das consequências da teoria era
que a gravidade pode curvar a luz. Entretanto, tratava-se de um processo
dedutivo, fruto das equações matemáticas, ou seja, não havia uma
demonstração experimental. Por mais que a razão indicasse a validade da
teoria, sem uma comprovação experimental, não passaria de um exercício
mental. Einstein buscava desesperadamente uma comprovação experimental
dos efeitos da teoria da relatividade. Chegou a fazer um apelo aos astrônomos
para que buscassem uma comprovação empírica da sua teoria, descrevendo
como esse experimento deveria ser feito durante um eclipse solar e até
buscando financiar quem se dispusesse a realizar tal empreitada. Somente
quando os astrônomos, aproveitando um eclipse solar, constataram
empiricamente os efeitos da gravidade na luz, corroborando com a teoria da
relatividade, que se reconheceu a validade da teoria9.

Durkheim reconhece a importância da dedução:

Mas qual o método experimental que permite obter


mecanicamente uma relação de causalidade sem que os fatos
que ele estabelece precisem ser elaborados pelo espírito?
Tudo o que importa é que essa elaboração seja metodicamente
conduzida, e eis aqui de que maneira se poderá procedera
isso. Em primeiro lugar procuraremos saber, com o auxílio da
dedução, como um dos dois termos foi capaz de produzir o
outro; a seguir, nos esforçaremos por verificar o resultado
dessa dedução com o auxílio de experiências, isto é, de novas
comparações. Se a dedução é possível e a verificação bem-
sucedida, poderemos considerar a prova como feita. Se, ao
contrário, não percebemos entre esses fatos nenhum vínculo

9
O reconhecimento é provisório, tendo em vista que sempre existirá a possibilidade de uma
nova teoria que refutaria a anterior.
39

direto, sobretudo se a hipótese de semelhante vínculo


contradiz leis já demonstradas, sairemos em busca de um
terceiro fenômeno dos quais os dois outros dependam
igualmente ou que tenha podido servir de intermediário entre
eles (DURKHEIM, 2007).

Propõe a dedução como ferramenta auxiliar no processo de indução, ou


seja, constatada a relação de causa e efeito através do experimento, deve-se,
segundo Durkheim, deduzir através do uso da razão uma lei que modele o
fenômeno. O modelo obtido, que corresponderia à hipótese adotada, seria
testado com o auxílio de novos experimentos e se a hipótese resistir à
verificação considera-se a prova feita10. Esse método é usual no teste de
hipóteses na estatística quando imaginamos a situação na qual se afirma que
determinado candidato teria mais de 60% das intenções de voto. Temos então
duas hipóteses em jogo, uma que afirma que o candidato possui 60% ou
menos das intenções de voto, considerada como a hipótese básica e outra que
afirma que o candidato possui mais do que 60% dos votos, a qual corresponde
à afirmação a ser testada, ou seja, determinar sua validade. Dessa forma,
busca-se empiricamente por meio da experimentação11 verificar se a afirmação
é verdadeira ou falsa. Constatar, empiricamente, a validade da afirmação
significa que a validade é relativa, ou seja, a afirmação seria verdadeira (se
assim os resultados indicassem) com certa probabilidade.

Parte significativa da metodologia de Durkheim está relacionada a um


alto grau de positivismo e objetividade. Durkheim acreditava que o método
empírico-indutivo, acrescido com tempero dedutivo em alguns estágios da
pesquisa, era suficiente para o estudo dos fenômenos sociais. O caminho

10
Karl Popper na sua obra A Lógica da Investigação Científica (POPPER, 2007), adota o método
hipotético-dedutivo, no qual afirma que se deve buscar evidências empíricas que falseiam uma hipótese
adotada. Nesse aspecto, Durkheim mostra alguma semelhança com Popper exceto pelo fato deste
último rejeitar o método indutivo.
11
Nesse caso seria obtida uma amostra representativa de eleitores e seria observada a
característica de interesse, ou seja, a proporção de eleitores da amostra que votariam no candidato.
Para facilitar o entendimento, considera-se uma população de eleitores muito grande e que a amostra
sempre será uma pequena fração dessa população.
40

adotado de obter a partir do particular uma explicação para o todo faz


transparecer o seu pensamento indutivista ingênuo.

De acordo com o indutivista ingênuo, o corpo do


conhecimento científico é construído pela indução a partir da
base segura fornecida pela observação.

Conforme cresce o número de dados estabelecidos pela


observação e pelo experimento, e conforme os fatos se tornam
mais refinados e esotéricos devido a aperfeiçoamentos em
nossas capacidades de observação e experimentação, cada
vez mais leis e teorias de maior generalidade e escopo são
construídas por raciocínio indutivo cuidadoso. O crescimento
da ciência é contínuo, para a frente e para o alto, conforme o
fundo de dados de observação aumenta (CHALMERS, 1993).

Karl Popper, na sua obra A Lógica da Pesquisa Científica, critica


severamente o método da indução:

Ora, está longe de ser óbvio, de um ponto de vista lógico,


haver justificativa no inferir enunciados universais de
enunciados singulares, independentemente de quão
numerosos sejam estes; com efeito, qualquer conclusão
colhida desse modo sempre pode revelar-se falsa:
independentemente de quantos casos de cisnes brancos
possamos observar, isso não justifica a conclusão de que todos
os cisnes são brancos (POPPER, 2007).

Desperta curiosidade o exemplo dos cisnes brancos de Popper e


descobre-se que no passado sempre se acreditou somente na existência de
cisnes brancos até a descoberta da Austrália, pois lá foi encontrada uma
espécie de cisne de coloração negra, ou seja, apesar de todas as evidências
41

até aquele momento indicar que todos os cisnes eram brancos, foram
encontrados cisnes negros12.

A proposta de Popper é radical, considera o princípio da indução


supérfluo e podendo levar a incoerências lógicas, ou seja, trata a indução como
um equívoco da razão.

Alguns dos que acreditam na Lógica Indutiva apressam-se a


assinalar, acompanhando Reichenbach, que “o princípio de
indução é aceito sem reservas pela totalidade da Ciência e
homem algum pode colocar seriamente em dúvida a aplicação
desse princípio também na vida cotidiana”13. Contudo, ainda
admitindo que assim fosse – pois, afinal, “a totalidade da
ciência” poderia estar errada–, eu continuaria a sustentar que
um princípio de indução é supérfluo e deve conduzir a
incoerências lógicas (POPPER, 2007).

Popper propõe uma metodologia que primeiramente parte de conceitos


quase metafísicos, afastando o uso de métodos empíricos. A partir da criação
da hipótese ou conjectura esta passará às fases seguintes que tentarão validar
ou falsear a hipótese com a presença de novas hipóteses, melhores adaptadas
à explicação do fenômeno. Obviamente que seria quase impossível testar
essas hipóteses sem algum recurso empírico, entretanto, não é o único fator
determinante da validade de uma hipótese. Qualquer explicação estaria
sempre sujeita a ser substituída por outra, num processo infinito.

Popper não deixa de ter razão nos seus argumentos, entretanto, não
seria viável na prática das ciências sociais, a qual não pode abrir mão da
indução para estabelecer previsões dentro da realidade do cotidiano social.
Uma pesquisa de intenção de voto serve para estimar as proporções de voto
que cada candidato possui utilizando-se de um processo indutivo. Não seria

12
Uma obra interessante sobre o improvável é A Lógica do Cisne Negro de Nassim Nicholas
Taleb.
13
Hans Reichenbach, filósofo alemão, no seu artigo de 1930, revista Erkenntnis, vol1, pag. 186.
42

possível a partir de um processo dedutivo encontrar essas proporções. A


complexidade imposta pelo fenômeno social é extrema.

Enfim, a problemática envolvendo os fatos sociais vai muito além dos


métodos propostos por Durkheim ou Popper. Toda essa metodologia se baseia
nos valores estabelecidos pelo próprio investigado, ou seja, está vinculada
numa realidade criada pela sua mente a qual se encontra em constante
mutação.

Os atributos das mentes, assim como os dos corpos, são


fundados em sentimentos ou estados da consciência. Mas, no
caso de uma mente, temos que considerar seus próprios
estados tanto quanto aqueles que ela produz em outras
mentes. Todo atributo de uma mente consiste ou em ser ela
mesma afetada de uma certa maneira, ou em afetar outras
mentes de uma certa maneira. Considerada em si, só podemos
predicar dela a série de seus próprios sentimentos. Quando
dizemos que uma mente é devota, supersticiosa, meditativa ou
alegre, afirmamos que as ideias, volições ou emoções contidas
nessas palavras entram, frequentemente, na série de
sentimentos ou estados de consciência que preenchem a
existência sensível da mente (Mill, 1989, p.124)

Tanto a dedução como a indução são resultados da interpretação de um


estado consciente vivido pela mente humana no espaço e no tempo. Esse
estado de consciência, nas ciências sociais, é objeto de estudo.
Diferentemente das ciências naturais, identificar padrões e estabelecer
previsões tendo como objeto uma coleção de mentes não é tarefa fácil ou pior,
tais padrões e previsões podem estar fadados a um redundante fracasso
devido a uma mudança repentina dos valores e interpretações dessas mentes.
43

Capítulo 2

Comportamento do Eleitor Paulistano na Eleição para Prefeito


em 2008. Uma abordagem usando os conceitos de Campo e
Habitus de Pierre Bourdieu.

2.1 As eleições de 2008 e o cenário político na Cidade de São Paulo.

Em novembro de 2004 José Serra vence as eleições para prefeito de


São Paulo na disputa no segundo turno com Marta Suplicy. Muitos creditaram
sua vitória às atitudes de Marta Suplicy após sua separação conjugal do
senador Eduardo Suplicy. A sua aparente indiferença quanto ao processo de
separação transpareceu na mídia, e o eleitor considerou que tal falta de
sensibilidade pudesse refletir no trato com a população da Cidade de São
Paulo. Tal suspeita pode ser transcrita a partir da leitura feita pelos próprios
colaboradores da campanha de marta Suplicy, tal como Valdemir Garreta,
influente na sua gestão, secretário de Abastecimento e Projetos Especiais.

Foi determinante a atitude do senador Eduardo Suplicy logo


após a separação. Ele se colocou o tempo todo na mídia
como vítima, transformando a Marta numa pessoa
insensível, arrogante, indiferente ao que ele sentia (Folha de
São Paulo, 03/11/2004).

O modo como a separação foi exposta na mídia, de um lado a insensível


e do outro a vítima, foi um dos fatores que provavelmente pesou na preferência
do eleitor.

Outro fator considerado determinante para a sua derrota, foi a criação de


diversas taxas durante sua gestão como prefeita de São Paulo. As mais
polêmicas foram as taxas de lixo, conhecidas como TRSD (Taxa sobre
Resíduos Sólidos Domiciliares) e TRSS (Taxa sobre Resíduos Sólidos de
Saúde), a primeira tinha como fato gerador do tributo a utilização potencial dos
serviços divisíveis de coleta, transporte, tratamento e destinação final de
44

resíduos sólidos domiciliares, de fruição obrigatória, prestados em regime


público. Quanto a TRSS, seu fato gerador era utilização potencial do serviço
público de coleta, transporte, tratamento e destinação final de resíduos sólidos
de serviços de saúde, de fruição obrigatória, prestados em regime público e
devida, principalmente, por farmácias, clínicas, laboratórios, consultório
médicos e hospitais.

O desgaste político foi tanto, que lhe proporcionou um


apelido criado pelo PSDB em tom jocoso, “Martaxa” (Folha
de São Paulo, 06/02/2005).

Surge ainda o aspecto conservador do eleitorado paulistano.


Questionado se Kassab reuniria esses votos, atraindo
eleitores dos candidatos derrotados Geraldo Alckmin e
Paulo Maluf (PP), Tadeu César tem outra versão. "É um
eleitorado anti-Marta, mais que anti-PT", avaliou, lembrando
aspectos que a população considerou negativos como o
apelido "Martaxa" e a separação do senador Eduardo
Suplicy (O Estado de São Paulo, 13/10/2008).

José Serra e seu vice, Gilberto Kassab, assumiram a Prefeitura de São


Paulo em janeiro de 2005 com pesadas críticas à situação financeira da maior
cidade do país.

Quase que imediatamente, José Serra impôs um forte ritmo à gestão


financeira da Cidade de São Paulo cancelando e renovando empenhos,
revendo e criando contratos e focando a arrecadação de tributos sem aumento
da carga tributária. Essa política fiscal permitiu um crescimento nominal de
31% na arrecadação comparando-se o exercício 2006 com 2004. Em termos
reais, ou seja, descontado o efeito da inflação, a expansão foi de 17%,
conforme Site do Tesouro Nacional (STN, 2013).

A tabela 1 mostra a evolução da arrecadação tributária do Município de


São Paulo no período 2004 a 2006. Essa arrecadação engloba os repasses
referentes à cota parte do Imposto sobre a Circulação de Mercadorias e
45

prestação de Serviços (ICMS) e do Imposto sobre a Propriedade de Veículos


Automotores (IPVA), ambos de competência arrecadatória do Estado de São
Paulo.

Tabela 1: Variação da arrecadação tributária no Município de São Paulo de 2004 a


2006.

Variação Nominal Real


2006 x 2005 14% 9%
2006 x 2004 31% 17%
Fonte: Site do Tesouro Nacional.

Em 2006, José Serra revoga parte da lei que criou as taxas do lixo,
numa tentativa de demonstrar coerência com uma política fiscal voltada para a
arrecadação sem aumento da carga tributária.

Um dia antes de apresentar o Orçamento 2006 à Câmara


Municipal de São Paulo, o prefeito José Serra entregou
ontem um pacote composto por três projetos, de autoria do
executivo, à Casa com o intuito de organizar o sistema
tributário da cidade.

Um dos projetos extingue a taxa do lixo - instituída na


administração passada - a partir de 2006. O mesmo projeto
concede isenção da Contribuição para Custeio do Serviço
de Iluminação Pública (Cosip), a taxa de luz, para
moradores de ruas que não têm iluminação pública. Essa
proposta inclui ainda a redução das alíquotas e o perdão
das dívidas do Imposto Sobre Serviço (ISS) para
prestadores de serviço de diversões públicas. O segundo
projeto cria o Conselho Municipal dos Tributos. (Diário do
Comércio e Indústria /DCI – 30/09/2005).

Já em 2006, José Serra deixa o cargo de prefeito de São Paulo para


concorrer às eleições para o governo do Estado de São Paulo, deixando seu
vice, Gilberto Kassab assumir a Prefeitura de São Paulo.
46

A administração Kassab deu continuidade aos projetos criados pelo seu


antecessor, ou seja, na prática, parecia que José Serra continuava no cargo,
pois até o secretariado foi mantido, provavelmente no compasso de espera
quanto ao resultado das eleições para o governo do Estado de São Paulo.

O engenheiro civil e economista Gilberto Kassab (PFL), 45,


assumiu ontem a Prefeitura de São Paulo após 15 meses de
gestão José Serra (PSDB), que renunciou para disputar o
governo do Estado. Na primeira entrevista como mandatário
da maior cidade do país, Kassab afirmou que sua gestão
será marcada pela continuidade de todos os projetos do
tucano (Folha de São Paulo – 01/04/2006)

Gilberto Kassab era praticamente um desconhecido até o momento da


sua posse como prefeito, conforme constatado em pesquisa de opinião
realizada pelo Datafolha.

Há 11 dias no comando da maior cidade do Brasil, o prefeito


Gilberto Kassab (PFL-SP), 45, ainda é desconhecido da
maioria dos moradores de São Paulo. Pesquisa realizada
pelo Datafolha nos dias 6 e 7 de abril com 1.073 pessoas
acima de 16 anos mostra que 77% não sabem quem é o
prefeito. A margem de erro é de três pontos, para mais ou
menos (Folha de São Paulo – 10/04/2006).

A pesquisa fazia a seguinte pergunta: “O prefeito José Serra deixou a


prefeitura da cidade de São Paulo para concorrer ao governo do estado de São
Paulo. Quem é o prefeito da cidade de São Paulo?” Foram consultadas 1073
pessoas, cujas respostas estratificadas por sexo, idade, escolaridade, renda e
ocupação estão tabuladas na Tabela 2.

A partir da observação da tabela, encontramos uma maior incidência de


desconhecimento de Kassab entre as mulheres (83%). Para o estrato idade, o
grau de desconhecimento prevalece entre os mais jovens (entre 16 e 25 anos),
chegando a 83%. No que se refere ao quesito escolaridade, encontramos mais
47

desconhecimento para estrato referente ao nível fundamental, 85%. Quando


observamos o estrato renda, o maior grau de desconhecimento ocorre com a
faixa até 5 salários mínimos, 84%.

Tabela 2: Imagem de Kassab à época da saída de Serra para concorrer ao


governo do Estado de São Paulo. NS - não sabe, Outra - apontou outro nome.
SEXO IDADE ESCOLARIDADE RENDA

MASC FEM 16 a 15 26 a 40 41 ou mais FUND MED SUP Até 5 Até 10 Mais de


SM SM 10 SM
Kassab 31% 17% 16% 23% 29% 15% 22% 45% 17% 33% 45%
Serra 3% 3% 2% 5% 2% 4% 3% 2% 4% 0% 3%
Outra 9% 8% 7% 8% 10% 8% 7% 12% 8% 7% 16%
NS 57% 72% 74% 65% 59% 73% 68% 41% 72% 60% 36%

Fonte: Datafolha (2008).

A importância dessa análise do momento em que Kassab assume a


prefeitura torna-se de extrema importância para avaliar o seu grau de
crescimento e de relacionamento junto ao eleitor paulistano, pois são
justamente essas faixas que viabilizarão a sua reeleição para o cargo de
prefeito de São Paulo.

A primeira administração Kassab, iniciada em abril de 2006 e terminada


em 2008, foi salpicada por diversos eventos que culminaram com uma
aprovação substancial do seu governo em 2008. A partir de janeiro de 2007, a
lei cidade limpa, proposta pelo próprio Kassab, gerou diversas polêmicas, haja
vista a grande quantidade de mandados de segurança por ela gerados, todos,
efetivamente, cassados. A sociedade aprovou a lei, e nem mesmo a perda de
compostura do prefeito contra um manifestante contra a lei da cidade limpa14
abalou esse apoio da população e dos mais diversos setores representantes da
sociedade civil. Pode-se até arriscar que tal fato tenha consolidado, junto à
população, um perfil de bom administrador, não se intimidando, inclusive, com
ameaças de alguns setores prejudicados pelo dispositivo legal.

14
Esse episódio, amplamente divulgado pela mídia, mostra um Gilberto Kassab colérico,
expulsando aos berros um manifestante contra a lei cidade limpa durante uma visita a um posto de
saúde.
48

Outras polêmicas que renderam um amplo espaço na mídia foram os


casos dos empresários Oscar Maroni15 e Law Kin Chong16. A firmeza
demonstrada pelo prefeito nos dois casos impressionou o paulistano.

Pode-se ter uma visão da evolução da aceitação dos candidatos pelo


eleitorado a partir de uma análise da cobertura jornalística desses candidatos.

Segundo página do Laboratório de Pesquisa em Comunicação Política e


Opinião Pública (DOXA, 2008), para cada jornal são apresentados os dados
parciais em gráficos relativos à quantidade de vezes em que o nome de cada
candidato aparece no noticiário (aparições) e à valência atribuída a cada um
nas matérias (positiva, negativa ou neutra).

Periodicidade: O objetivo de divulgação dos primeiros


dados relativos à cobertura das eleições presidenciais de
2008 é disponibilizar quinzenalmente os registros de
visibilidade (quantas vezes cada candidato foi citado em
cada jornal, valores totais) e valência (proporção de
matérias positivas, negativas e neutras na cobertura dada
por cada jornal aos quatro principais candidatos).

Definição das valências: Optamos por classificar as


valências de acordo com seu efeito potencial para a
candidatura em questão, notando-se ou não intenção de
viés ou parcialidade jornalística. Desta forma, os principais
critérios para identificar a valência da matéria, em relação a
cada candidato, procuram esclarecer se ela beneficia ou
prejudica sua candidatura.

15
O empresário do setor de entretenimento para adultos, iniciou a construção de um hotel
próximo à cabeceira da pista do aeroporto de Congonhas. A partir dai, teve inicio uma disputa judicial
entre a prefeitura e o empresário. Essa disputa reverberou nas outras atividades do empresário, sendo
acusado de apologia à prostituição.
16
Law Kin Chong, empresário chinês residente no Brasil, recebeu destaque na mídia após
investigação da polícia federal, com participação ativa da Prefeitura de São Paulo, que o acusou de ser o
chefe do contrabando em São Paulo.
49

Positiva: matéria sobre ou com o candidato reproduzindo


programa de governo; promessas; declarações do candidato
ou do autor da matéria ou de terceiros (pessoas ou
entidades) favoráveis (contendo avaliação de ordem moral,
política ou pessoal) ao candidato; reprodução de ataques do
candidato a concorrentes, resultados de pesquisas ou
comentários favoráveis.

Negativa: matéria reproduzindo ressalvas, críticas ou


ataques (contendo avaliação de ordem moral, política ou
pessoal) do autor da matéria, de candidatos concorrentes ou
de terceiros a algum candidato, resultados de pesquisas ou
comentários desfavoráveis.

Neutra: agenda do candidato, matéria sobre ou citação de


candidato sem avaliação moral, política ou pessoal do
candidato. Do autor da matéria ou de terceiros, inclusive de
concorrentes.

Equilibrada: matérias sobre o candidato que apresentem


conteúdos positivos e negativos com pesos relativamente
iguais; matérias cujo conteúdo apresente “contra-
ponto” entre aspectos positivos e negativos; matérias que
apresentam aspectos positivos e negativos do mesmo
evento (DOXA, 2008).

Para os candidatos Marta Suplicy e Gilberto Kassab foram adaptados os


dados da página do DOXA utilizando apenas as citações dos dois principais
jornais que circulam no Município de São Paulo: Folha de São Paulo e o
Estado de São Paulo.

O gráfico da Figura 3 mostra a evolução do percentual de citações


negativas dos candidatos no período de 01/03/2008 a 26/10/2008. As medições
foram realizadas quinzenalmente nos jornais Folha de São Paulo e O Estado
de São Paulo. O ápice da avaliação negativa de Kassab ocorreu na segunda
quinzena de julho, a qual se deve, em parte, a uma suposta “ação” nos pontos
50

de coleta da pesquisa Datafolha. Tal “ação” seria arquitetada conjuntamente


com as subprefeituras. Tal caso está bem explicitado em editorial da Folha de
São Paulo sob o titulo “A Mensagem de Kassab”, a qual vale a pena ser
reproduzida:

Em dificuldade para deslanchar sua campanha à reeleição,


o prefeito de São Paulo, Gilberto Kassab, patrocinou na
semana passada uma atitude infeliz, que sugere desespero.
Enviou mensagem eletrônica a 26 subprefeitos, chamando-os a
"identificar o ponto" onde entrevistadores do Datafolha
abordariam eleitores e realizar uma "ação", sem especificar
qual.

Kassab afirma que jamais tentou inflar seu desempenho na


pesquisa eleitoral. É difícil, entretanto, acreditar que tenha sido
outro o propósito da iniciativa. O e-mail foi repassado na
quarta-feira à noite, fim do primeiro dia do campo do Datafolha,
e o resultado, que mostrava o prefeito estagnado na terceira
colocação com 11% das preferências, foi divulgado na noite de
quinta-feira.

O candidato do DEM diz que o objetivo da "ação" era


impedir que "pessoas ligadas ao PT" promovessem distúrbios
em lugares próximos aos pontos onde seriam feitas as
entrevistas, a fim de prejudicar a percepção que o eleitorado
tem da gestão. De acordo com Kassab, a ideia era que os
funcionários da prefeitura ficassem atentos e, se fosse o caso,
chamassem a polícia para prender os baderneiros. Conspira
contra essa explicação o fato de ela ter sido fornecida apenas
após reportagem de Renata Lo Prete, desta Folha, ter revelado
o teor da mensagem enviada aos assessores. Se o prefeito
estava desconfiado de armação petista, deveria ter feito
denúncia antecipada. Além disso, o correto seria acionar seu
51

comitê de campanha, nunca a máquina da administração, para


tanto.

É difícil influir em conclusões do Datafolha. O instituto


cumpre um protocolo rígido para evitar ações indevidas.
Mantém sigilo sobre os locais das entrevistas e descarta
pessoas que se apresentem como voluntárias para responder
ao questionário. Na hipótese de movimentações atípicas
próximas ao campo, todo o material recolhido é desprezado e
procede-se a nova coleta.

Quem tentar distorcer o resultado da pesquisa, portanto,


estará fadado ao fracasso e correrá o risco de ter descoberta a
maquinação pueril (Folha de São Paulo, 29/07/2008).

A partir desse episódio, a proporção de citações negativas de


Kassab começou a subir até, igualando-se a Marta Suplicy a partir do mês de
agosto de 2008 e caindo abaixo das avaliações de Marta Suplicy no mês de
outubro. No mês de outubro, as avaliações negativas de Marta Suplicy
aumentaram drasticamente, a qual está relacionada, principalmente, a uma
inserção no horário de propaganda política que atacava a vida pessoal do
candidato Gilberto Kassab.

O juiz Marco Antônio Martin Vargas, da 1ª Zona Eleitoral de


São Paulo, proibiu a candidata à Prefeitura Marta Suplicy (PT)
de transmitir, novamente, na publicidade eleitoral gratuita na
televisão e rádio, "expressões com questionamentos vagos,
fugindo do direito de crítica político-administrativa", e deu ao
prefeito Gilberto Kassab(DEM) um minuto de direito de
resposta no rádio.

A decisão refere-se à publicidade eleitoral petista que teve


início no domingo, em que o locutor perguntava, entre outras
coisas, se o democrata era casado e se tinha filhos.
52

A proibição foi em resposta a uma representação da


Coligação São Paulo no Rumo Certo (DEM-PR-PMDB-PRP-
PV-PSC), de Kassab, contra a Coligação Uma Nova Atitude
para São Paulo (PT-PC do B-PDT-PTN-PRB-PSB), de Marta.

A resposta no rádio deve ser dada pelo prefeito de São


Paulo em até 36 horas. De acordo com a sentença, "os
questionamentos feitos na propaganda, de modo subliminar,
trazem no seu âmago a indagação proposital e depreciativa
que, indiscutivelmente, ofende a honra subjetiva do candidato
por levantar a suspeita quanto ao seu caráter e sua conduta,
seja na vida pública ou pessoal".

O juiz eleitoral entendeu que a publicidade pode causar


dúvidas no eleitor, dando a entender que Kassab possa ter
algo "escuso" no passado que o "descredenciaria" como
candidato.

Segundo Vargas, "na verdade, as abordagens negativas


subliminares aos candidatos em nada acrescentam para o
convencimento de o eleitor definir seu voto". O prefeito pode
recorrer ao Tribunal Superior Eleitoral (O Estado de São Paulo,
14/10/2008).

Tal atitude por parte do comitê de campanha da candidata Marta Suplicy


certamente causou grandes estragos no seu desempenho junto ao eleitorado
paulistano. No momento em que a campanha de ataque à vida pessoal de
Kassab, a candidata Marta chegou a 40% de avaliações negativas, situação
somente superada na segunda quinzena de junho de 2008, quando atingiu a
marca de 56% de avaliações negativas. Esse momento coincide com a sua
decisão de concorrer à prefeitura de São Paulo, deixando o cargo de ministra
do turismo e polêmica referente à propaganda política eleitoral antecipada,
sendo inclusive multada após decisão judicial do Tribunal Regional Eleitoral de
São Paulo.
53

Figura 3: Proporção de avaliações negativas dos candidatos Gilberto Kassab e Marta


Suplicy.

Fonte: Doxa, Laboratório de Pesquisa em Comunicação Política e Opinião Pública


(2010). Adaptado pelo autor.

Quando são levantadas as proporções de avaliações positivas dos


candidatos, mostradas na figura 4, nota-se que havia um equilíbrio entre eles
até o final de setembro/2008. A partir desse momento, o candidato Kassab
ultrapassou a proporção da candidata Marta e se manteve assim até o final do
processo eleitoral.

As citações em números absolutos podem ser visualizadas nos gráficos


das Figuras 5 e 6. Em números absolutos, o comportamento das citações
converge para o resultado obtido com os números relativos (proporções de
citações positivas e negativas) e as conclusões obtidas mantêm-se inalteradas.

No mês de outubro, já na reta final do processo eleitoral, o candidato


alcançou praticamente o dobro de citações positivas em comparação a sua
oponente Marta Suplicy.
54

Figura 4: Proporção de avaliações positivas dos candidatos Gilberto Kassab e Marta


Suplicy.

Fonte: Doxa, Laboratório de Pesquisa em Comunicação Política e Opinião Pública


(2010).

Figura 5: Número de citações positivas dos candidatos Gilberto Kassab e Marta


Suplicy.

Fonte: Doxa, Laboratório de Pesquisa em Comunicação Política e Opinião Pública


(2010).
55

Figura 6: Número de citações negativas dos candidatos Gilberto Kassab e Marta


Suplicy.

Fonte: Doxa, Laboratório de Pesquisa em Comunicação Política e Opinião Pública


(2010).

2.2 O comportamento do eleitor paulistano, uma analogia aos conceitos


de campo e habitus de Pierre Bourdieu.

Apresentado o cenário político na Cidade de São Paulo, resta saber o


que o eleitor paulistano pensa a respeito dos candidatos e como funciona a
dinâmica desse pensamento ao longo do processo eleitoral. Desvendar o que
se passa na mente do eleitor não é tarefa simples, entretanto, pode-se buscar
uma aproximação através de uma pesquisa de opinião. O período eleitoral traz
a tona uma série de circunstâncias incomuns no dia a dia do brasileiro.
Segundo Moacyr Palmeira, é o chamado “tempo da política”.

Nas áreas que estudamos, ao contrário de outras atividades,


a política não é pensada como uma atividade permanente. Ela
se circunscreve a um período determinado, o período eleitoral,
que é designado sintomaticamente como o tempo da
56

política. O tempo da política representa o momento em que as


facções (os partidos reais) são identificadas, e em que, por
assim dizer, existem plenamente, em conflito aberto, as
municipalidades divididas de uma maneira pouco habitual nas
grandes cidades. Como a facção, fora do tempo da política,
resume-se aos chefes políticos e a uns poucos seguidores, a
disputa eleitoral é exatamente uma disputa para incorporar o
maior número possível de pessoas, o maior numero de apoios
a cada facção. É o seu lado da sociedade que tem que ser
aumentado. Está, pois, em jogo uma disputa que é mais ampla
do que a disputa eleitoral stricto sensu. Está em questão tanto
a tentativa de acesso a certos cargos de mando quanto o peso
relativo de diferentes partes da sociedade, o que é decisivo
para a ordenação das relações sociais durante um certo
período de tempo (PALMEIRA, 1992).

Nesse contexto nascem as mais diversas teorias explicativas de como o


eleitor decide seu voto.

Vigoram na ciência política, inclusive na brasileira, várias


teorias que procuram explicar o comportamento eleitoral.
Dentre as principais, pode-se destacar a perspectiva
sociológica, a psicológica e a teoria da escolha racional
(RADMANN, 2001).

Pode-se afirmar que nenhuma delas explica isoladamente a decisão do


eleitor no momento do voto. O máximo que se pode afirmar é que as teorias
agem conjuntamente sendo apropriadas em maior ou menor grau conforme
são ditadas as regras impostas pelas circunstâncias do momento dentro do
processo eleitoral.

A teoria sociológica do comportamento eleitoral presume que indivíduos


que se encontram em situações sociais semelhantes tendem apresentar o
mesmo comportamento político e, consequentemente, eleitoral.
57

Quanto à teoria psicológica, está vinculada às emoções que margeiam o


processo eleitoral, tal como ondas que atingem um barco, jogando-o para
frente, para trás ou para os lados. Dependendo do impacto emocional, os
rumos da eleição podem ser desastrosos para o candidato, ou seja, uma onda
pode acabar virando o barco.

A escolha racional é possivelmente aquela que apresenta maior


preponderância na escolha do voto, pois está diretamente ligada a um
processo de troca, de identidade, de comprometimento do candidato com os
anseios e razões do eleitor.

Pode-se imaginar que a escolha do voto segundo o critério sociológico,


tal como definido anteriormente, é o resultado da composição das escolhas
racional e psicológica, pois os estratos sociais apresentam reações emocionais
e racionais distintas, ou seja, a sua condição dentro do espaço social define a
sua reação perante os fatos políticos que o cercam. Pode-se afirmar que o
eleitor apresenta padrões de comportamento quando identificamos os estratos
sociais a qual pertence. Tais estratos correspondem, por exemplo, a sua
condição religiosa, financeira, de faixa etária, de educação, etc.

Considerando que cada grupo de pacientes reage de forma diferente a


um medicamento, o principal objetivo deste capítulo é buscar e isolar esse
comportamento no interior de cada estrato, os quais podem evidenciar parte
das reações emocionais e racionais do eleitor.

A situação social pode ser compreendida como o campo e habitus


definidos por Pierre Bourdieu.

O conceito de habitus está diretamente relacionado com a percepção


que o indivíduo possui do seu ambiente e como interage com esse meio,
deixando-o impregnado de marcas que o inserem como participante
incontestável de um determinado estrato ou estratos da sociedade. Nota-se,
prontamente, que o habitus está ligado a características peculiares que
conduzem o indivíduo socialmente numa linha do tempo em constante
58

mudança, normalmente causada pelas pressões impostas pela composição


dos campos em que se insere. Assim, podemos concluir que o habitus é um
subproduto do campo e, nesse contexto, com raras exceções, ambos são
inseparáveis. Acresce, ainda, observar que o habitus tem sua origem a partir
de ações externas impostas, principalmente, pelo campo.

Segundo Bourdieu, existe um estreito relacionamento entre habitus e


campo, considerando que o primeiro se manifesta ou é estimulado dentro do
segundo.

Pensar a relação entre indivíduo e sociedade com base na


categoria habitus implica afirmar que o individual, o pessoal e o
subjetivo são simultaneamente sociais e coletivamente
orquestrados. O habitus é uma subjetividade socializada
(BOURDIEU, 1992).

Dessa forma, deve ser visto como um conjunto de


esquemas de percepção, apropriação e ação que é
experimentado e posto em prática, tendo em vista que as
conjunturas de um campo o estimulam (SETTON, 2002)

O campo, compreendido como uma categoria autônoma molda os


agentes que nele estão inseridos dotando-os de características peculiares que
permitem identificá-los como a ele pertencentes. Essa modelagem imposta
pelo campo cria um perfil construído paulatinamente dentro de um processo
histórico, gerando e extinguindo ações, e com intensidades distintas de
indivíduo para indivíduo, de modo a criar substratos condicionados pelas
interfaces com outros campos.

[...] a existência de um campo especializado e relativamente


autônomo é correlativa à existência de alvos que estão em jogo
e de interesses específicos: através dos investimentos
indissoluvelmente econômicos e psicológicos que eles
suscitam entre os agentes dotados de um determinado habitus,
59

o campo e aquilo que está em jogo nele produzem


investimentos de tempo, de dinheiro, de trabalho etc. [...]

Todo campo, enquanto produto histórico, gera o interesse,


que é condição de seu funcionamento (BOURDIEU, 1990).

Os habitus individuais, produtos da socialização, são


constituídos em condições sociais específicas, por diferentes
sistemas de disposições produzidos em condicionamentos e
trajetórias diferentes, em espaços distintos como a família, a
escola, o trabalho, os grupos de amigos e/ou a cultura de
massa (SETTON, 2002).

Adaptando os conceitos de campo e habitus dentro do processo


eleitoral, votar transforma-se em sinônimo de habitus, o qual se encontra
enraizado nos campos respectivos.

No campo econômico, por exemplo, podemos delinear o capital renda e


de que forma influi na decisão do voto. Para cada nível de renda, o habitus
difere, ou seja, em termos de preponderância, a escolha do eleitor acompanha
o seu nível de renda.

Dessa maneira, é possível endossar o pensamento de Bourdieu, quando


se pretende descrever o campo social observado por meio de escalas
multidimensionais em um sistema de coordenadas:

[...] o campo social como um espaço multidimensional de


posições tal que qualquer posição atual pode ser definida em
um sistema multidimensional de coordenadas cujos valores
correspondem aos valores das diferentes variáveis pertinentes:
os Agentes distribuem-se assim nele, na primeira dimensão,
segundo o volume global do capital que possuem e na segunda
dimensão segundo a composição do seu capital – quer dizer,
segundo o peso relativo das diferentes espécies no conjunto
das suas posses. [...]
60

O inquérito estatístico só pode apreender esta relação de


forças em forma de propriedades, por vezes juridicamente
garantidas por meio dos títulos de propriedade econômica,
cultural – títulos escolares – ou social – títulos de nobreza -; é
isto que explica o liame entre a pesquisa empírica entre as
classes e as teorias da estrutura social como estratificação
descrita em termos de distância em relação aos instrumentos
de apropriação (‘distância em relação ao núcleo dos valores
culturais’ de Halbwachs), como faz o próprio Marx quando fala
da ‘massa privada de propriedade’ (BOURDIEU, 1989).

Para atender os objetivos do capítulo é abordado o comportamento do


eleitor paulistano na eleição para prefeito da Cidade de São Paulo em 2008. As
principais variáveis estudadas estão vinculadas aos campos renda,
escolaridade, faixa etária e religião. Cada um desses campos é avaliado com
base em mapeamento estatístico utilizando a ferramenta Análise de
Correspondência (ANACOR) a qual busca encontrar associações entre os
campos estudados com os respectivos candidatos.

A análise de correspondência (ANACOR) e a análise de


homogeneidade (HOMALS) são técnicas de interdependência
que buscam estudar a relação entre variáveis qualitativas,
permitindo ao pesquisador a visualização de associações, por
meio de mapas perceptuais que oferecem uma noção de
proximidade, ou associação de frequências, das categorias das
variáveis não métricas (FAVERO, BELFIORI, et al., 2009).

Os dados foram obtidos da pesquisa Datafolha realizada entre 07 e 08


de outubro de 2008, a qual mostra as preferências dos eleitores considerando
sexo, faixa etária, escolaridade, renda e religião. Esses dados secundários são
tratados e organizados de forma apropriada permitindo adaptá-los ao pacote de
análise estatística R (R PROJECT, 2013).
61

2.3 A dinâmica dos campos: uma proposta de modelagem.

Antes de se iniciar a análise de correspondência, faremos uma breve


explanação referente à dinâmica dos campos procurando explicitar algumas
limitações impostas pelas variações intrínsecas a esses campos no que se
refere às análises de comportamento social e, mais especificamente, do
comportamento eleitoral.

A teoria exposta neste item se justifica pelo fato de proporcionar


potenciais análises e modelagens dos campos no que se refere à sua
dinâmica. A teoria que envolve o assunto é complexa para ser detalhada neste
trabalho, entretanto, busca-se traçar as linhas básicas dessa teoria de forma
subsidiar os interessados que desejarem um maior aprofundamento no
assunto.

A medida que o parâmetro tempo flui, a dinâmica desses campos pode


ser avaliada a partir de uma modelagem que considere as posições dos
agentes no interior desses campos e como esses agentes interagem com
essas posições. Essa modelagem permitiria realizar previsões sobre as
posições dos agentes dentro do seu campo considerando o comportamento
histórico desses mesmos agentes.

O que se pretende é apresentar ferramentas probabilísticas básicas


voltadas para potenciais estudos da dinâmica dos campos. Provavelmente não
é a única forma de se lidar com o fenômeno da dinâmica dos campos,
entretanto, pode lançar luz em um assunto pouco trabalhado quantitativamente
e que poderá abrir novos procedimentos de visualização dos campos tais como
conceituados por Pierre Bourdieu.

Para ilustrar a dinâmica imposta aos campos, consideremos o diagrama


da Figura 7. Nele é possível distinguir três campos (renda, religião e
escolaridade) interagindo ao longo de uma variável tempo. Se considerarmos a
62

ação simultânea dos três campos (ou seja, a intersecção dos três campos),
vemos que essa ação depende da sua localização no tempo.

Figura 7: A dinâmica dos campos: renda, religião e escolaridade.

Fonte: Elaborada pelo autor.

Assim, num instante t particular, a configuração dos campos pode


oferecer um comportamento eleitoral diferente do instante anterior, t-1, ou em
instante posterior, t+1, ou seja, ocorre uma variação do comportamento do
eleitor quando há um incremento no tempo.

Esse incremento no tempo pode ser, por exemplo, o intervalo entre


períodos eleitorais, ou seja, considerando o processo eleitoral brasileiro, a cada
dois anos ou até dentro de um processo eleitoral caso o incremento de tempo
seja o intervalo entre as pesquisas eleitorais.

Tal fenômeno, dependente do tempo e de ocorrências aleatórias, é


conhecido como processos estocásticos, ou seja, processos probabilísticos
dependentes da variável tempo.

O processo estocástico é uma coleção de variáveis aleatórias indexadas


por um parâmetro t entendido como tempo.
63

A variável aleatória é definida em um espaço denominado de espaço de


estados. Um exemplo singelo de processo estocástico é a condição
meteorológica em um determinado dia. Nesse exemplo o espaço de estados
pode ser definido como “chuvoso”, “nublado” ou “ensolarado” e o parâmetro
tempo corresponde ao dia em que a condição meteorológica é observada.
Tanto o estado quanto o tempo podem assumir várias formas relacionadas à
continuidade e à extensão.

Os processos estocásticos podem ser classificados em relação ao


estado e em relação ao tempo.

Em relação ao estado, quanto ao quesito continuidade, o espaço pode


ser discreto, quando é possível iniciar uma enumeração ou contagem17 do
número de estados, ou contínuo, quando não é possível realizar uma
enumeração ou contagem. Quanto à extensão, o espaço de estados pode ser
finito ou infinito.

O número de usuários em uma fila no caixa do banco em um


determinado instante corresponde a um espaço de estados discretos (número
de usuários) e finito, pois existe um número limite de usuários.

A temperatura média da Terra em determinado instante apresenta um


espaço de estados (temperatura) contínuo, pois o valor observado da
temperatura depende do grau de precisão do instrumento de medição, ou seja,
sempre se observa uma aproximação do valor da temperatura. O espaço de
estados é finito, considerando-se a hipótese de que o Universo está em
constante expansão e tende a se resfriar até o chamado zero absoluto 18 em um
futuro extremamente distante.

17
Um conjunto é dito discreto quando for enumerável ou contável. O conjunto do número de
filhos de um casal é enumerável e contável. Caso o conjunto seja discreto, mas infinito, ele é apenas
enumerável, mas não contável. Um conjunto contínuo não permite enumeração e contagem.
18
A temperatura zero absoluto corresponde a -273,15°C e é a temperatura mais baixa
alcançável no Universo. Segundo algumas teorias sobre o futuro remoto do Universo, haveria uma
expansão sem fim com consequente resfriamento até o zero absoluto (teoria do Big Freeze). Mesmo o
64

Em relação ao tempo, o processo estocástico pode ser contínuo ou


discreto (quesito continuidade) e finito ou infinito (quesito extensão).

No exemplo da temperatura média da Terra em determinado instante, o


tempo é contínuo e infinito, admitindo-se a hipótese de que o tempo fluirá para
sempre.

Todas as classes de processos estocásticos tem aplicação nas


modelagens dos fenômenos socioeconômicos, dependendo apenas do
comportamento do fenômeno analisado.

Neste capítulo, o interesse está voltado para um caso específico de


processo estocástico, aquele no qual o espaço de estados é discreto e finito e
o parâmetro tempo é discreto, seja finito ou não. Tais processos estocásticos
são conhecidos como Cadeias de Markov19 em tempo discreto. Um exemplo de
Cadeias de Markov é o fluxo dos agentes dentro dos estados no campo
religioso. Nesse caso o espaço de estados corresponde às religiões e o
parâmetro tempo é discreto quando as observações são realizadas em
intervalos discretos e constantes.

É inevitável, portanto, a ação do tempo nas condições do campo por


meio das atitudes individuais dos agentes, as quais, somadas, definem um
novo estado ou uma permanência no estado.

Se considerarmos que o processo de transição entre as posições


(estados) dentro de um campo ocorre de forma homogênea, então se pode
afirmar que, em algum momento futuro, haverá um equilíbrio perfeito entre as
transições e as posições convergem para uma situação estável. Entende-se
como transição de forma homogênea aquela na qual as probabilidades de
transição são constantes no tempo, ou seja, uma simplificação da realidade
que pode ser útil em condições controladas. Para melhor esclarecimento dos

limite zero absoluto pode vir a ser contestado, pois corresponde a uma condição teórica confirmada por
algumas experiências instrumentais, mas sem garantias de que não possa ser ultrapassado.
19
A cadeia de Markov apresenta a propriedade Markoviana, denominada em homenagem ao
matemático Andrei Andreyevich Markov.
65

conceitos apresentados até aqui, recorreremos ao diagrama da Figura 8. Essa


figura mostra três estados (posições) dentro do campo religião. A simplificação
do diagrama exige que somente esses três estados sejam possíveis no campo
religião. Os agentes estão inseridos nesse campo dentro das respectivas
posições em um instante inicial qualquer. Esses agentes podem no instante
seguinte (uma próxima eleição, por exemplo) mudar a sua condição de estado,
ou seja, migrar de um estado para outro ou permanecer no mesmo estado.

Figura 8: Diagrama simplificado para "estados" religiosos.

Fonte: Elaborada pelo autor.

Essas mudanças de estado ocorreriam segundo uma probabilidade


encontrada a partir de uma análise histórica de comportamento.
Acompanhando o diagrama da Figura 8, quando se toma o estado, por
exemplo, sem religião, a probabilidade de que no período seguinte o agente se
mantenha nessa condição é , a probabilidade de que ele passe ao estado
católico é e de passar ao estado evangélico é . Como se admite que
somente existem esses três estados, a soma dessas probabilidades deve
resultar em 100%.
66

Levando-se em conta a definição de processo estocástico do tipo tempo


discreto20 e cadeias homogêneas e regulares21 nos modelos estatísticos
(ROSS, 1996), em algum momento no futuro haverá uma estabilidade e será
possível estimar, por exemplo, o número daqueles sem religião dentro de uma
população de eleitores.

Como exemplo de modelagem de um campo usando as Cadeias de


Markov toma-se o diagrama da Figura 9, o qual corresponde a uma situação
hipotética para o problema das posições (estados) do campo religião. Pode-se
observar, por exemplo, que para o estado 3 (sem religião) a probabilidade do
agente continuar nesse estado é de 99%. A probabilidade de realizar uma
transição para o estado 2 (evangélico) é de 0,3% e para o estado 1 (católico) a
probabilidade é de 0,7%. O mesmo entendimento é aplicado para os outros
estados considerando-se as respectivas probabilidades de transição.

Admite-se que essas probabilidades de transição são fruto de


levantamentos históricos efetuados a cada dois anos, ou seja, coincidindo com
o período eleitoral. Assim, a cada dois anos, o percentual de católicos que
fariam transição para o estado 2 (evangélico) é de 1,5%.

Ainda considerando-se uma situação hipotética, admite-se que


atualmente as condições de estado do eleitorado nesse campo é 70% de
católicos, 25% de evangélicos e 5% sem religião.

Caso as probabilidades de transição se mantenham constantes


(homogêneas) para os próximos seis anos (três períodos) como estará essa
distribuição dentro do campo em cada período?

20
Discreto no tempo e no espaço de estados. No tempo porque a observação do processo
ocorre em um instante definido (a cada dois anos, por exemplo) e no espaço de estados porque existe
um numero finito de estados mutuamente exclusivos e exaustivos.
21
A cadeia é regular quando atende condições definidas de estado. Para um maior
aprofundamento no tema, recomenda-se a leitura de Ross, 1996.
67

Figura 9: Diagrama de uma situação hipotética para "estados" religiosos.

Fonte: Elaborada pelo autor.

A modelagem feita através da definição das Cadeias de Markov permite


estimar, para cada período subsequente, a proporção de eleitores em cada
posição (estado) do campo religião. Os valores obtidos a partir dessa
modelagem são fornecidos na Tabela 3.

Tabela 3: Modelagem da evolução das proporções de eleitores em cada estado


do campo religião.

Condição Católico Evangélico Sem religião


Inicial 70% 25% 5%
Após 2 anos 68,8% 25,8% 5,4%
Após 4 anos 67,7% 26,6% 5,7%
Após 6 anos 66,6% 27,4% 6%
Fonte: Elaborada pelo autor.

Assim, após três períodos eleitorais (6 anos) haveria 66,6% de católicos,


27,4% de evangélicos e 6% sem religião.

Caso as probabilidades de transição se mantivessem constantes, após


muitos períodos as proporções se estabilizariam (haveria um equilíbrio) em
68

27,7% de católicos, 48,7% de evangélicos e 23,6% sem religião. O gráfico da


Figura 10 mostra a velocidade de convergência das proporções de cada estado
até a estabilidade. Essa estabilidade, nas condições adotadas, levaria
aproximadamente 600 anos (300 períodos) para ser alcançada. Entretanto,
para que isso pudesse ocorrer, as probabilidades de transição entre os estados
teriam que ser imutáveis ao longo desses 600 anos. Obviamente que essa
condição é impossível de ser respeitada.

Figura 10: Diagrama de uma situação hipotética para estados religiosos.

Fonte: Elaborada pelo autor.

O problema principal nessa modelagem está vinculado ao fato de que as


probabilidades de mudança de estado não são constantes no tempo, ou seja, a
cadeia não é regular, jogando por terra qualquer tentativa eficiente de previsão.
Mesmo o campo da religião, o qual pode admitir certa regularidade no tempo,
está sujeita a mudanças drásticas, mudando completamente as probabilidades
de transição de estados.
69

Não podemos esquecer que os campos não são herméticos, e podem


interagir, ou seja, mudanças em um campo pode afetar outro campo ou outros
campos, levando a uma reação em cadeia que beira o caos, não existindo
qualquer modelo estatístico que possa prever os resultados.

Apesar dos problemas evidenciados, a aproximação fornecida pelos


modelos estocásticos é importante para uma visualização do comportamento
social presente e em curto prazo. Com base nessas informações o cientista
político pode definir estratégias eleitorais considerando a dinâmica dos campos
e das posições que o compõe.

Passamos a seguir para a análise de correspondência para cada um dos


campos escolhidos para estudo de comportamento eleitoral. Cada campo será
analisado de forma independente, entretanto, sempre que ocorrer, é feita uma
análise das correlações entre os campos.

2.4 Avaliação dos campos pela análise de correspondência

2.4.1 Campo Escolaridade

A Tabela 4 mostra a preferência dos eleitores considerando o campo


escolaridade.

A escolaridade é, sem a menor margem para dúvidas, um fator


determinante nas análises de intensão de voto. Eleitores com mais
escolaridade tende a formar uma visão mais ampla do processo eleitoral e
consequentemente um maior senso crítico. Além da formação de opinião, o
eleitor recebe forte influência em função da sua posição no campo
escolaridade.

.
70

Tabela 4: Pesquisa eleitoral de preferência de voto para prefeito de São Paulo


estratificada pelo nível de escolaridade.

Pesquisa: 7 e 8 de Escolaridade
outubro 2008 Fundamental Médio Superior
Gilberto Kassab 48 54 67
Marta Suplicy 45 36 25
Branco/nulo/nenhum 3 7 7
Não sabe 4 3 2
Total (%) 4 3 2
Total n° absolutos 734 774 398
Fonte: Datafolha (2008).

A análise de correspondência foi realizada utilizando-se o pacote


estatístico R (R PROJECT, 2013), de código aberto e de uso gratuito. Para
testar a significância estatística dos dados da Tabela 4, usou-se o teste de qui-
quadrado com 6 graus de liberdade, o qual forneceu um valor de 11,55 e um p-
valor correspondente de 0,073 (7,3%). Considerando um nível de confiança de
90%, pode-se afirmar que os dados fornecem informações de significância
estatística quanto ao comportamento dos eleitores em correspondência com o
campo escolaridade. O passo seguinte foi elaborar através do pacote
estatístico R, o mapa perceptual dos eleitores. Esse mapa perceptual é
apresentado na Figura 11.

O mapeamento perceptual do campo escolaridade realizado por meio da


análise de correspondência mostra claramente maior proximidade do nível
fundamental com a candidata Marta Suplicy. Pode-se explicar essa
proximidade considerando-se que eleitores do nível fundamental apresentam
maior probabilidade de pertencer às camadas mais pobres da sociedade. A
candidata pertencente ao partido do governo federal (PT) tem sua imagem
vinculada às ações e programas sociais de auxílio aos mais necessitados, tal
como o programa Bolsa Família. Nota-se, portanto, a provável eficiência
dessas ações no quesito referente à atração de votos dessa camada social.
71

Figura 11: Mapa de percepção para o campo escolaridade.

ESCOLARIDADE
0.1

Sup Fund
Kassab
nsabe
0.0

Marta

Medio
-0.1

branconulo
-0.2
-0.3

-0.3 -0.2 -0.1 0.0 0.1 0.2

Fonte: Elaborada pelo autor.

Os eleitores do nível médio se posicionaram em um ponto ligeiramente


mais próximo do candidato Gilberto Kassab, mostrando uma pequena
vantagem do candidato nesse estrato.

Já os eleitores que afirmaram votar em branco ou anular o voto


apresentam maior correspondência com os eleitores de nível superior e médio,
os quais demonstram ceticismo quanto ao processo eleitoral, não acreditando
72

na possibilidade de viabilizar uma real mudança nos rumos da administração


da cidade.

Outra constatação interessante diz respeito aos eleitores indecisos, os


quais apresentam correspondência com os eleitores do nível fundamental. Uma
possível explicação para esse fenômeno se deve ao fato de que eleitores com
menor grau de instrução têm menos acesso aos meios de comunicação e,
consequentemente, maior dificuldade na formação de opinião. Tal explicação
pode ser confirmada pela pesquisa Datafolha que indaga a respeito do debate
realizado em 24/10/2008 a qual está resumida na Tabela 5. A pesquisa
perguntou se o eleitor assistiu o debate (por inteiro ou parte do debate) ou se
não assistiu.

Tabela 5: Pesquisa eleitoral para prefeito de São Paulo, debate na TV,


estratificada pelo nível de escolaridade.

Pesquisa: 25 de Escolaridade
outubro 2008 Fundamental Médio Superior
Assistiu 41 45 54
Assistiu Inteiro 12 15 19
Assistiu parte 30 30 35
Não Assistiu 59 55 46
Fonte: Datafolha (2008).

A partir da Tabela 5 realizou-se a análise de correspondência entre


escolaridade dos eleitores e se assistiu o debate realizado pela TV Globo em
25/10/2008. O resultado vai ao encontro da explicação proposta para os
eleitores indecisos do nível fundamental, pois o mapa perceptual mostra a
ligação desses eleitores com aqueles que não assistiram o debate e são do
nível fundamental.

Deve-se reconhecer, entretanto, que a questão dos eleitores indecisos


vai muito além da explicação proposta aqui, ou seja, o fato do eleitor do nível
fundamental apresentar correspondência com os indecisos é parte da
73

explicação. Existem, certamente, outros motivos que levam o eleitor à


indecisão. O capítulo 3 tratará com maior aprofundamento o fenômeno da
indecisão no voto, inclusive propondo modelos estatísticos que possam
explicar esse comportamento e prever o comportamento do eleitor indeciso no
momento de inserir o seu voto na urna.

O mapa perceptual da Figura 12 mostra a proximidade dos eleitores do


nível superior com aqueles que assistiram inteiramente o debate. Um candidato
que faz uma boa apresentação em um debate tende apresentar uma boa
aceitação no estrato do nível superior, pois é justamente essa categoria que
mais assiste o debate. Assim, um candidato que apresentar melhor
desempenho num debate televisionado, provavelmente gerará impacto nos
eleitores que assistiram tal debate. Já os eleitores do nível fundamental
apresentam maior proximidade com aqueles que não assistiram o debate e,
portanto, os efeitos de um debate nesse estrato de eleitores seriam mínimos.

É possível afirmar, entretanto, que os efeitos dos debates são


relativamente pequenos no que se refere à mudança de opinião do eleitor. Para
aqueles que assistem o debate e apresentam maior senso crítico, a opinião é
formada por outros meios de informação, sendo o debate apenas uma
informação adicional para confirmar suas convicções, ou seja, está mais
interessado no desempenho do seu candidato do que no debate. O mesmo não
ocorreria com aqueles menos preparados em termos de formação de opinião.
Nesse caso, estariam mais sujeitos às estratégias de persuasão dos
candidatos.

Em suma, os estudos da literatura internacional sustentam


que os efeitos mínimos dos debates sobre a preferência do
voto ao nível individual são esperados porque os eleitores que
assistem esses eventos já são suficientemente informados
sobre os candidatos e suas posições. Essa atitude teria
correlação com as características sociais como escolaridade,
renda, preferência partidária e idade. Para esses eleitores,
74

possíveis inconsistências entre a atitude com relação ao


desempenho dos candidatos e a preferência do voto seriam
reduzidas a partir de uma estratégia de percepção seletiva.
Como são mais preparados do ponto de vista cognitivo para
lidar com temas da política, podem recorrer a outros meios de
informação política, especialmente aqueles que reforcem suas
predisposições. Essa estratégia ajudaria a reduzir o efeito de
enfraquecimento ou mudança de atitude. Para outro grupo de
eleitores, especialmente os menos informados, as atitudes
seriam menos consistentes porque eles apresentam menos
disposição para o consumo de outras fontes de informação
política. Essa afirmação implica em dizer que esses eleitores,
embora tenham menos incentivos para assistir aos debates,
estão mais sujeitos às estratégias persuasivas dos candidatos
(VASCONCELLOS, 2011).

Vasconcellos (2011) chega a uma conclusão similar ao encontrado no


mapa perceptual da Figura 12 quanto ao perfil do eleitor que assiste o debate
pela televisão.

[...] a escolaridade alta, seguida da renda, preferência por


algum candidato e preferência partidária aumentam e muito a
probabilidade de o eleitor assistir ao debate. A escolaridade é a
variável preditora mais forte para toda a série.
Pelos resultados desse estudo, os debates, embora sejam
eventos de campanha voltados para o grande público da
televisão, têm mais probabilidade de atrair um determinado tipo
de eleitor. Portanto, não é o meio que atrai a audiência, mas
sim uma associação entre posição social e o conteúdo
específico desses eventos, qual seja, as informações político-
eleitorais.

[...] embora a escolaridade, renda e preferência partidária


sejam preditores importantes para prever quem deverá assistir
aos debates, eleitores com alta renda, alta escolaridade e
75

preferência partidária, ou seja, aqueles mais propensos a


acompanhar esses eventos, são menos representativos no
eleitorado brasileiro. Portanto, uma avaliação geral dos efeitos
dos debates deve levar em conta também a repercussão dos
debates nas outras fontes de informação que chegam aos
outros eleitores que não acompanham esses eventos de
campanha (VASCONCELLOS, 2011).

Figura 12: Mapa de percepção do debate na televisão quanto ao campo


escolaridade.

DEBATE
0.10
0.05

asspart
Fund
Sup
0.00

assistiu
naoass

Medio
assint
-0.05
-0.10

-0.15 -0.10 -0.05 0.00 0.05 0.10

Fonte: Elaborada pelo autor.


76

2.4.2 Campo Renda

A análise de correspondência para o campo renda apresentou forte


significância estatística para as correspondências entre as posições do campo
(níveis de renda) e a intensão de voto. O teste de correspondência de Pearson
forneceu um qui-quadrado com valor 21,5, para 9 graus de liberdade o que
fornece um p-valor de 1,06%, ou seja, alta significância estatística. A tabela 6
mostra os dados referentes à preferência de voto considerando a renda dos
eleitores com base no salário mínimo (SM).

Tabela 6: Pesquisa eleitoral de preferência de voto para prefeito de São Paulo


estratificada por renda.

Pesquisa: 7 e 8 de Renda (em salário mínimo)


outubro 2008 até 2 SM 2 a 5 SM 5 a 10 SM mais 10 SM
Gilberto Kassab 40 55 60 73
Marta Suplicy 49 37 31 22
Branco/nulo/nenhum 5 6 5 5
Não sabe 5 3 3 0
Total (%) 100 100 100 100
Total n° absolutos 485 830 312 223
Fonte: Datafolha(2008)

O mapa perceptual para o campo renda é apresentado na Figura 13. O


mapa mostra que eleitores de renda mais baixa estão próximos da candidata
Marta Suplicy e os de renda mais alta estão próximos do candidato Gilberto
Kassab. O campo renda apresenta comportamento similar ao campo
escolaridade, ou seja, a discussão se repete se considerarmos a analogia entre
os estratos de instrução e os estratos de renda. Eleitores com renda inferior a
dois salários mínimos e entre dois salários mínimos e cinco salários mínimos
estão próximos da candidata Marta Suplicy, juntamente com os indecisos.
Eleitores com renda superior a cinco salários mínimos estão próximos ao
candidato Gilberto Kassab. Votos em branco e nulos apresentam maior
correspondência com eleitores de renda superior a cinco salários mínimos.
77

Figura 13: Mapa de percepção para o campo renda.

0.3
0.2 RENDA

branconulo
0.1

5a10sm

2a5sm
0.0

Marta
Kassab nsabe
<2sm
>10sm
-0.1
-0.2

-0.3 -0.2 -0.1 0.0 0.1 0.2 0.3

Fonte: Elaborada pelo autor.

Analisando os campos escolaridade e renda é possível constatar uma


associação entre os níveis extremos de cada campo, ou seja, superior com
mais de dez salários mínimos e fundamental com menos de dois salários
mínimos. É possível delinear perfeitamente a oposição entre esses níveis no
exercício do voto.

A situação de insatisfação com o processo eleitoral e a descrença em


reais mudanças na administração pública pode ser avaliada com base nos
eleitores que declaram voto nulo ou em branco. Nota-se, através do mapa
78

perceptual, que eleitores com renda acima de cinco salários mínimos


apresentam elevada correspondência com os que declaram voto nulo ou em
branco. Uma possível explicação para essa correspondência seria a formação
de um senso crítico dentro da sua posição no campo renda e escolaridade.
Uma melhor análise seria possível se dados referentes às suas atividades
sociais fossem mais detalhados a ponto de determinar o habitus do grupo ao
qual pertence e, consequentemente, como votam. Tal análise exigiria um
levantamento de campo extremamente complexo, entretanto, seria interessante
para um trabalho futuro voltado exclusivamente para essa questão.

2.4.3 Campo Faixa Etária

A análise de correspondência para o campo faixa etária (idade) não


apresentou significância estatística para as correspondências entre as posições
do campo (faixas etárias) e a intensão de voto. O teste de correspondência de
Pearson forneceu um qui-quadrado com valor 14,03, para 12 graus de
liberdade o que fornece um p-valor de 29,86%, ou seja, sem significância
estatística. A estratificação das intenções de voto por faixa etária é
apresentada na tabela 7.

Tabela 7: Pesquisa eleitoral para prefeito de São Paulo estratificada por faixa
etária.

Pesquisa: 7 e 8 de Idade (anos)


outubro 2008 16 a 24 25 a 34 35 a 44 45 a 59 Mais de 60
Gilberto Kassab 53 53 53 54 62
Marta Suplicy 34 41 37 39 30
Branco/nulo/nenhum 10 5 5 4 4
Não sabe 2 2 4 3 4
Fonte: Datafolha (2008).

O mapa perceptual para o campo renda é apresentado na Figura 14.


Apesar de não apresentar significância estatística, é possível visualizar
proximidades no mapa perceptual. Temos uma proximidade dos muitos jovens
(16 a 24 anos) com a candidata Marta Suplicy. Também estão muito próximos
79

da candidata os eleitores da faixa etária 35 a 44 anos. Surpreendentemente a


faixa 25 a 34 anos está mais distante da candidata que a faixa imediatamente
acima (35 a 44 anos), ou seja, isso justifica o resultado encontrado da não
significância estatística, mostrando que a preferência dos mais jovens pela
candidata não se confirma inteiramente. Já os eleitores com mais de 60 anos
apresentaram grande proximidade com o candidato Gilberto Kassab. Talvez
um estudo envolvendo uma amostra maior traga significância estatística para a
correspondência entre faixa etária e intenção de voto

Figura 14: Mapa de percepção para o campo idade (faixa etária)

IDADE
0.2
0.1

16a24 35a44 >60


Marta
Kassab
0.0

branconulo 25a34
45a59
-0.1

nsabe
-0.2
-0.3

-0.3 -0.2 -0.1 0.0 0.1 0.2 0.3

Fonte: Elaborada pelo autor.

.
80

2.4.4 Campo Religioso

O campo religião apresentou significância estatística moderada com


valor de qui-quadrado 19,18 para 12 graus de liberdade e consequente p-valor
de 8,42%, ou seja, abaixo de um nível descritivo de 10%.

Isso indica que é considerável a influência do campo religião na decisão


do voto. Evangélicos e Católicos se posicionam de forma praticamente
equidistantes dos candidatos Gilberto Kassab e Marta Suplicy, mostrando a
inexistência de uma tendência. O destaque foi para os Espíritas e aqueles que
se declararam sem religião. A tabela 8 mostra os dados da preferência de voto
estratificados por religião adotada (católica, evangélica pentecostal - Evan,
evangélica não pentecostal – Evan Npet, espírita e sem religião).

Tabela 8: Pesquisa eleitoral de preferência de voto para prefeito de São Paulo


estratificada por religião.

Pesquisa: 7 e 8 de Religião
outubro 2008 Católica Evan. Evan. Npet. Espírita Sem Religião
Gilberto Kassab 55 Pet.
52 57 68 44
Marta Suplicy 38 38 38 26 43
Branco/nulo/nenhum 4 6 4 4 11
Não sabe 3 4 1 3 1
Fonte: Datafolha (2008).

No mapa perceptual do campo religioso da Figura 15 os Espíritas


mostraram maior proximidade com o candidato Gilberto Kassab e os sem
religião, mostraram proximidade com os que declararam voto nulo ou em
branco. Desperta curiosidade o fato dos sem religião optarem por anular o voto
ou votarem em branco. Tal disposição de voto, mostra que transferem sua
condição religiosa para o campo político, ou seja, não crê nas instituições
religiosas e, consequentemente, não crê nas instituições políticas. Lembrando
que os eleitores declarantes de voto nulo ou em branco estão próximos do
nível superior no campo escolaridade, temos a possibilidade de levantar como
provável hipótese para esse comportamento a racionalidade. A razão leva o
81

eleitor questionar as instituições e seu papel na sociedade e, na sua


interpretação, não vê a possibilidade de mudança na sua condição de vida
caso aderir a uma instituição religiosa ou votar em um político. Possivelmente
não se trata exclusivamente na espécie de razão que leva ao ateísmo, apesar
de fazer parte desse grupo. O agente na condição de sem religião pode estar
em busca de formas alternativas de manifestar sua crença ou sua convicção
política, pois não consegue se identificar com os modelos preponderantes na
sociedade.

Reforçando o entendimento adotado no parágrafo anterior, foi possível


constatar que esse comportamento já ocorreu em outros estudos relacionados
à religião envolvendo questões socioeconômicas. Estudo realizado pelo Projeto
Religiões no Brasil (GREELEY e SCALON, 2002) proporciona uma visão geral
sobre a religião através das opiniões dos entrevistados.

Segundo sumário do Consórcio de Informações Sociais, CIS, o estudo


entrevistou homens e mulheres, maiores de 18 anos, em 24 Estados e 195
municípios brasileiros.

Este banco de dados traz informações sobre os valores e a


religião no Brasil de homens e mulheres de 18 anos e mais
para 24 Estados e 195 municípios no ano de 2002. Inclui a
opinião dos entrevistados sobre questões polêmicas no campo
religioso (como aborto e sexo antes do casamento, por
exemplo) e sobre a Igreja, bem como crenças (acredita ou não
em alguns dogmas, videntes, curandeiros; acredita na
existência de um céu e um inferno, entre outras) e religiosidade
dos mesmos (frequência com que vai ao culto/missa, filiação
religiosa, religião dos pais), além de opiniões sobre questões
sociais, políticas e econômicas (GREELEY e SCALON, 2002).

A análise do banco de dados permite observar como o campo religioso


influencia na opinião do entrevistado quanto a confiança nas instituições.
82

Para permitir essa visão singela, os dados foram adaptados e inseridos


em três tabelas que mostram opiniões quanto a confiança no congresso, na
justiça e no sistema educacional. Essas opiniões são estratificadas pela religião
do entrevistado seguindo, aproximadamente, a nomenclatura adotada neste
capítulo (outras: outras religiões, semrel: sem religião, evnpen: evangélico
não pentecostal, evpen: evangélico pentecostal e catol: católico romano)

Figura 15: Mapa de percepção para o campo religião.

RELIGIÃO
0.1

evnpen

branconulo semrel espir


Kassab
0.0

Marta
Catol
-0.1

evpen
-0.2
-0.3
-0.4

nsabe

-0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2

Fonte: Elaborada pelo autor.


83

A Tabela 9 mostra a confiança no congresso estratificada por religião.


Indivíduos de outras religiões e sem religião apresentam o maior percentual de
falta de confiança, com 84% e 82,5%, respectivamente. Os católicos romanos
apresentam o menor percentual de falta de confiança, 66%.

Tabela 9: Pesquisa Religiões do Brasil, confiança no Congresso Nacional.

Religião atual
Confiança no congresso outras semrel evnpen evpen catol
Confia 8,0% 0,0% 3,5% 4,6% 5,4%

Não sabe 0,0% 3,8% 7,0% 6,2% 5,8%

Confia completamente 4,0% 3,1% 5,3% 2,9% 3,8%

Alguma confiança 4,0% 10,6% 14,0% 14,0% 18,9%

Pouca confiança ou não confia 84,0% 82,5% 70,2% 72,3% 66,0%

Fonte: Consórcio de Informações Sociais, CIS (2002).

Quando o assunto se refere à confiança nas Instituições do judiciário, o


percentual se reduz um pouco, mas em alguns casos é maior que 50%,
conforme Tabela 10. O maior percentual de falta de confiança fica com os sem
religião (58,8%).

Tabela 10: Pesquisa Religiões do Brasil, confiança no Sistema Judiciário.

Religião atual
Confiança no congresso outras semrel evnpen evpen catol
Confia 12% 81% 7,0% 10,7% 11,8%

Não sabe 4,0% 2,5% 5,3% 5,5% 5,2%

Confia completamente 8,0% 10,0% 7,0% 6,2% 8,5%

Alguma confiança 20,0% 20,6% 31,6% 23,1% 27,0%

Pouca confiança ou não confia 56,0% 58,8% 49,1% 54,4% 47,4%

Fonte: Consórcio de Informações Sociais, CIS (2002).


84

Um menor nível de falta de confiança ocorre para o sistema educacional,


sendo que os sem religião também apresentam o maior percentual (24,4%)
conforme a Tabela 11. Adotando uma postura inversa à adotada para o
congresso e para a justiça, o maior nível de confiança é apresentado por outras
religiões, com 80% dos entrevistados depositando pelo menos alguma
confiança no sistema educacional.

Tabela 11: Pesquisa Religiões do Brasil, confiança no Sistema Educacional.

Religião atual
Confiança no sistema educacional outras semrel evnpen evpen catol
Confia 40,0% 27,5% 29,8% 28,3% 30,2%
Não sabe 4,0% 1,3% 3,5% 1,6% 2,0%

Confia completamente 16,0% 21,3% 26,3% 22,8% 25,3%


Alguma confiança 24,0% 25,6% 17,5% 25,4% 25,1%
Pouca confiança ou não confia 16,0% 24,4% 22,8% 21,8% 17,4%

Fonte: Consórcio de Informações Sociais, CIS (2002).

Essas análises mostram indícios de que o campo religioso,


definitivamente, tem papel fundamental na formação da opinião do agente e na
estruturação do habitus e, consequentemente, na escolha do seu voto.
85

Capítulo 3

Eleições para Prefeito de São Paulo em 2008: A questão das


declarações incompletas dos eleitores nas pesquisas eleitorais
e como estas podem ser “tratadas” a partir da criação de
modelos estatísticos adequados.

3.1 Conceituação de Dados Incompletos

Durante o processo eleitoral as pesquisas de opinião mostram que a


quantidade de eleitores indecisos apresenta peso suficiente para alterar o
resultado do pleito no momento das urnas, considerando que as proporções
das intenções de voto para cada candidato estão muito próximas. Além dos
eleitores indecisos, têm-se ainda aqueles que manifestam a intenção de anular
o voto ou votar em branco.

A questão central deste capítulo está vinculada ao fato de que parte dos
eleitores que alegam votar nulo ou em branco na verdade não o fazem, e
acabam decidindo-se por algum candidato. Para atender o objetivo de se
analisar os eleitores que se enquadram nessas categorias, buscaram-se
recursos estatísticos que possibilitassem a modelagem desse comportamento,
permitindo alocar essa classe de eleitores para os respectivos candidatos em
uma proporção que não obedece, necessariamente, à mesma proporção
encontrada para aqueles que declaram o seu voto.

Nas eleições passadas, quando não havia urna eletrônica, o voto nulo se
manifestava nas formas mais inusitadas, sendo o espaço da cédula de votação
o limite da imaginação do eleitor. Com a cédula de papel, o voto era
manifestado quando o eleitor assinalava o campo correspondente ao seu
candidato, caso marcasse mais de uma opção de candidato, estava
86

caracterizado o voto nulo. As eleições pelo sistema proporcional22, envolvendo


deputados e vereadores, acomodavam alguns exemplos pitorescos de voto
nulo, pois o eleitor deveria escrever de próprio punho o nome ou o número do
seu candidato. Nas eleições para prefeito e vereadores da cidade de São Paulo
em 1959 o eleitor elegeu, com quase cem mil votos, o rinoceronte cacareco,
personagem conhecido do Zoológico de São Paulo (The Rhino Vote, 1959).
Com a utilização da urna eletrônica, o voto nulo é caracterizado quando o
eleitor digita um número que não corresponde a qualquer candidato que esteja
oficialmente concorrendo ao cargo eletivo.

Uma polêmica envolvendo o voto nulo é a questão relacionada aos


princípios de cidadania quando o eleitor, intencionalmente, anula o seu voto
como forma de protesto. O voto em branco, também, se caracteriza como uma
forma de protesto permitindo, de um modo sutil, manifestar indignação com o
processo eleitoral e s candidatos. Para anular o voto é necessário digitar um
número que não corresponda a qualquer candidato do pleito, ou seja, o eleitor
que deseja protestar pode correr o risco de votar em algum candidato contra a
sua vontade. Tal situação não ocorre com o voto em branco, pois existe uma
tecla específica na urna eletrônica para esse fim. É possível que a maioria dos
votos nulos seja um erro do eleitor no momento de digitar ou não conheça a
função do voto em branco como forma de não manifestar o seu voto.
Provavelmente essa confusão advém da possibilidade de os votos em branco

22
Esse sistema se aplica na eleição dos cargos de Deputado Federal, Deputado Estadual e
Vereador. No sistema proporcional o número de votos válidos é dividido pelo número de vagas
concorridas obtendo-se o quociente eleitoral. Na sequência, é obtido o quociente partidário através da
divisão do número de votos obtido pelo partido pelo quociente eleitoral. A partir de critérios
matemáticos pré-estabelecidos (Código Eleitoral, artigos 105 a 113), o quociente partidário define o
número de candidatos eleitos do partido.O sistema é polêmico e seu extremo ocorreu nas eleições de
1945, quando o candidato Hermelindo Castelo Branco foi eleito deputado federal pelo Acre com zero
votos (não chegou a votar sequer em si mesmo). Em 2002, quando o presidente do antigo PRONA,
Enéas Carneiro, candidatou-se a deputado federal por São Paulo, obteve a maior votação da história
brasileira para aquele cargo, impressionantes 1.573.112 votos, suficientes para, através do sistema
proporcional, eleger mais cinco deputados federais, alguns com votações inexpressivas. Este episódio
ficou marcado pela polêmica de que alguns destes candidatos teriam mudado de colégio eleitoral de
forma ilegal apenas para serem eleitos pelo princípio da proporcionalidade, com a certeza de que o
candidato Enéas obteria uma votação expressiva.
87

serem computados de alguma forma em benefício de algum candidato ou


legenda. Realmente, até 1997, o Código Eleitoral (lei nº 4.737, de 15 de julho
de 1965), no seu art. 106, parágrafo único, considerava os votos em branco
para efeito do cálculo do quociente eleitoral. Hoje os votos em branco não são
computados, ou seja, não mais é considerado no cálculo do quociente eleitoral
e, consequentemente, o receio do eleitor de ter sua vontade de anular seu voto
desrespeitada é improcedente, pelo menos nos dispositivos legais.

Este capítulo não tem a intenção de simplesmente quantificar votos


nulos e em branco após o processo eleitoral, não é o objetivo principal do
capítulo, mas sim prever, por meio de modelos estatísticos apropriados, seu
comportamento ao longo do processo eleitoral. São utilizadas pesquisas de
intenção de voto realizadas pelos principais institutos de pesquisa, ou seja, são
utilizados dados secundários que atendem plenamente os objetivos. Irar-se-á
mais além, buscando interpretar o comportamento do eleitor desse estrato
quanto suas reais intenções de anular seu voto ou votar em branco, ou seja, se
o pelo fato de se encontrar nesse estrato não revelaria, na verdade, que estaria
propenso a votar em determinado candidato.

Às declarações de voto nulo e em branco serão somadas àquelas nas


quais os eleitores se dizem indecisos, ou seja, todos esses eleitores serão
considerados num mesmo estrato e, portanto, com comportamento similar.

3.2 Modelos Estatísticos para dados omissos ou incompletos

Independentemente da área de interesse, dados incompletos ou


censurados são, com frequência, um problema no momento de se efetuar uma
análise de dados. Dados incompletos elevam consideravelmente o nível de
complexidade da análise e, como resultado, muitos analistas acabam dando
pouca importância ao problema, subavaliando seu impacto. Além disso, a
dificuldade para identificar corretamente sua influência pode causar viés
significativo, prejudicando ou invalidando completamente, os resultados.
88

Dados incompletos podem ocorrer por uma série de razões. Nas


pesquisas sociais, por exemplo, indivíduos podem interpretar certas perguntas
como irrelevantes, deixando de respondê-las. Além disso, alguns indivíduos
podem simplesmente se recusar a responder certos tipos de perguntas.
Existem ainda armadilhas estritamente técnicas, associadas a bancos de
dados corrompidos, à fusão de dados de várias fontes e a erros de registro,
que podem levar à eliminação de alguns dados.

Uma situação de grande importância para o estudo está relacionada


com dados categorizados23 (AGRESTI, 2007). O objetivo é estimar os
parâmetros de interesse levando em conta os mecanismos de censura de
informações.

Estes mecanismos de censura podem ser classificados em três


categorias (LITTLE e RUBIN, 1987): perdas completamente ao acaso (missing
completely at random–MCAR); perdas ao acaso (missing at random–MAR) e
perdas não aleatórias (not missing at random–NMAR). Estes mecanismos
podem ser “Ignoráveis”, compreendidos pelos mecanismos MCAR e MAR e
“Não-Ignoráveis”, representados pelo mecanismo NMAR.

Um mecanismo de censura é considerado MCAR quando as perdas de


informação não estão relacionadas às variáveis especificadas. Esta é a mais
restritiva das três condições no sentido de impor que a probabilidade de não-
resposta seja a mesma para diversas situações.

O mecanismo de censura é considerado MAR, quando o padrão de


perda de informação é previsível a partir das variáveis no banco de dados
excluindo-se a(s) variável(is) específica(s) na(s) qual(is) os dados são perdidos.

O mecanismo de censura é considerado NMAR quando as perdas de


informação não ocorrem de forma aleatória. Em contraste com o mecanismo
MAR, situação esboçada anteriormente, onde a perda de dados é explicável

23
As observações são definidas em função dos seus atributos (categorias)..
89

através de outras variáveis medidas em um estudo, os dados perdidos via


mecanismo NMAR surgem devido ao padrão de perda que é explicável, além
de outras variáveis do estudo, pela(s) mesma(s) variável(is) para a(s) qual(is)
existe (m) informação (ões) omissas. Pode-se tomar como exemplo um estudo
sobre a renda de indivíduos de diversos níveis sociais. Podemos argumentar
que a perda de informação sobre a variável renda depende da própria variável
renda, ou seja, seria esperado, por exemplo, que indivíduos com maior renda
tendessem a omitir mais informações.

Buscando uma melhor compreensão dos três mecanismos


apresentados, foi montado o esquema da figura 16. Nesse esquema podemos
observar três variáveis: Classe Social, Idade e Renda. A variável Classe Social
está estratificada em dois níveis (A e B), a variável Idade está estratificada
também em dois níveis (Até 25 anos e mais de 25 anos) e a variável renda
apresentando dois níveis (Até 4 salários mínimos e mais de 4 salários
mínimos).

Figura 16: Esquema básico de mecanismos de censura.

Fonte: Elaborado pelo autor


90

Foram entrevistas 880 pessoas quanto às variáveis acima, das quais


760 responderam por completo em quais níveis se encontram de cada variável,
entretanto, 120 delas omitiram informações sobre uma ou mais variáveis.

Caso o mecanismo de censura for MCAR, então não existe qualquer


informação a respeito dos 120 entrevistados e a modelagem simplesmente
apropria os entrevistados proporcionalmente ao total observado (760), ou seja,
para definir, por exemplo, quantos se encontram no nível A da classe social,
idade até 25 anos e renda Mais 4 SM, toma-se 120x(30/760)+30=35. Dessa
maneira, são calculadas todas as quantidades sob o modelo MCAR
apresentadas no esquema da Figura 16.

No momento que outras variáveis são conhecidas exceto a que se quer


medir, ou seja, são conhecidas para os 120 entrevistados as variáveis classe
social e idade, mas se desconhece a renda, caracterizando o mecanismo de
censura MAR, então a modelagem apropria as quantidades considerando as
variáveis conhecidas. Considerando, por exemplo, que dos 120 entrevistados
que não se conhece a renda, 20 são da classe social B e com idade até 25
anos então se obtém a quantidade com renda até 4 salários mínimos fazendo-
se 20x(200/210)+200=219. Dessa maneira são calculadas todas as
quantidades restantes apresentadas no esquema.

O Mecanismo de censura NMAR considera, além das variáveis Classe


Social e Idade, a própria variável sem informação, ou seja, Renda. A
modelagem é bem mais complexa e é abordada em detalhes neste capítulo.
Considerando que dos 120 entrevistados sem renda declarada, 15 são da
classe A e idade até 25 anos, 50 da classe A e idade acima de 25 anos, 20 da
classe B e idade até 25 anos, 35 da classe B e idade acima de 25 anos,
encontra-se o resultado apresentado no esquema e pode-se notar, por
exemplo, que há indícios de omissão de renda em todas as categorias, ou seja,
a quantidade de indivíduos que se declararam com renda superior a 4 salários
mínimos seria maior do que o observado.
91

Dempster, Laird e Rubin (1977) introduziram o algoritmo EM


(Expectation-Maximization) o qual fornece um método iterativo para a obtenção
da estimativa de máxima verossimilhança de parâmetros envolvendo
informações incompletas (MCLACHLAN e KRISHNAM, 1997), abrindo caminho
para uma série de publicações voltadas para a imputação de dados com
informações faltantes e, entre essas publicações, algumas direcionadas para a
imputação de dados categorizados. Tanner e Wong (1987) apresentaram um
algoritmo para dados aumentados (latentes) enquanto Baker e Laird (1988)
usaram modelos envolvendo análise de regressão24 para dados categorizados
com informação incompleta.

Como o interesse nesse capítulo é a modelagem dos eleitores indecisos,


a abordagem se resume ao mecanismo de censura não-ignorável, ou seja,
inferir a intenção de voto dos eleitores indecisos considerando o próprio fato de
estarem indecisos.

Este capítulo é desenvolvido da seguinte forma: na seção 3.3, é


apresentado um problema vinculado a dados incompletos, ilustrado por um
exemplo prático. A seção 3.4 aborda a modelagem do problema. A seção 3.5
apresenta métodos para estimação de parâmetros. A seção 3.6 mostra a
aplicação para o problema proposto.

3.3 Apresentação do Problema

Uma pesquisa de intenção de voto espontânea para prefeito do


Município de São Paulo no segundo turno das eleições 2008 foi realizada pelo
Datafolha, em dois períodos no mês de outubro posteriores ao primeiro turno.
Foram realizadas 1.979 entrevistas para o primeiro período e 5.086 para o
segundo período. Segundo informações do Instituto Datafolha a pesquisa é um

24
Pode-se citar como exemplo a regressão logística ou logit onde variável resposta é dada por
uma probabilidade variando de 0 a 100% obtida a partir de variáveis explicativas categóricas ou
contínuas.
92

levantamento por amostragem estratificada por sexo, idade, escolaridade e


renda com sorteio aleatório dos entrevistados. O universo da pesquisa é
composto pelos eleitores com 16 anos ou mais da cidade de São Paulo.

3.4 Modelando o Problema

Antes de adotarmos um modelo probabilístico, seria importante destacar


algumas suposições adotadas: a) O esquema amostral não foi levado em
consideração25; b) Todos os eleitores indecisos irão votar em algum candidato,
ou seja, não existem votos nulos ou em branco; c) Aqueles indivíduos que não
opinaram foram considerados como indecisos; d) Não há qualquer
dependência entre os indivíduos amostrados, evitando-se viés de opinião; e) A
proporção oficial de votos válidos apurados e divulgados pelo Tribunal Superior
Eleitoral corresponderá, para todos os efeitos, aos verdadeiros parâmetros
populacionais.
Nessa seção, optou-se por um nível de detalhamento mais aprofundado
da modelagem estatística com o objetivo de permitir que o leitor, caso deseje
aplicar o modelo em algum estudo, possa utilizar os recursos matemáticos aqui
utilizados, pois se acredita que tal abordagem seja inédita na pesquisa eleitoral
dentro do Município de São Paulo ou até no território brasileiro. Considerando
essa possibilidade, todos os códigos de linhas de programação viabilizados
através do pacote estatístico utilizado são fornecidos na forma de apêndice.
Uma classe de modelos log-lineares26, proposta por Fay (1986) e Baker
e Laird (1988), pode assumir o mecanismo de censura aqui apresentados para
os dados categorizados. Nesta seção usaremos este tipo de modelo, que é

25
Por se tratar de dados secundários, não se tem informações a respeito do esquema amostral
adotado.
26
Os modelos log-lineares para dados categorizados foram desenvolvidos durante a década de
1960 objetivando criar uma metodologia que abordasse situações nas quais as variáveis são observadas
simultaneamente tal como ocorrem nas tabelas de contingência. São modelos com estrutura linear no
logaritmo das relações cruzadas de probabilidades ou médias das celas de uma tabela de contingência
(Paulino e Singer, 2006).
93

ajustado a tabelas de dados aumentados nas quais uma variável dicotômica é


incluída, indicando se a observação de determinada variável ocorreu ou não.

Devido à complexidade na aplicação do modelo log-linear para uma


tabela de contingência de três entradas, quando mais do que uma variável
apresenta dados ausentes, optou-se, neste trabalho, pela ilustração baseada
em uma situação específica na qual apenas uma variável apresenta ausência
de informação, entretanto, a modelagem proposta pode ser estendida para
qualquer número de variáveis sendo a complexidade computacional envolvida
o fator limitante. Vamos considerar aqui uma tabela tridimensional (Tabela 12)
composta por uma variável resposta Y (k=1: Candidato A e k=2: Candidato B)
indexada por k, que poderá conter informações omissas e pelas variáveis
explicativas (i=1: Período 1 e i=2: Período 2), representando dois momentos
da pesquisa eleitoral, e (j = 1: Estrato 1 e j = 2: Estrato 2), definindo duas
categorias relacionadas uma variável de interesse na explicação dos votos. As
variáveis e sempre são observadas e indexadas por i e j,
respectivamente. Seja K o número de categorias de Y e I e J o número de
categorias de e , respectivamente. Uma variável indicadora dicotômica R,
indexada por l, será introduzida objetivando apontar se a variável Y está sendo
informada ou não. Quando R = 1, Y foi observado e quando R = 2, a
informação sobre Y foi omitida.

Tabela 12: Notação das frequências observadas na tabela de contingência.

Y
1 2 Sem Resp
1
1
2
1
2
2
Fonte: Elaborada pelo autor.

Os índices na notação utilizada na Tabela 12 indicam o seguinte: os


números subscritos indicam os níveis de , , Y e R, respectivamente. Por
94

exemplo, é o número de observações no nível 1 de , nível 2 de , nível


2 de Y e nível 1 de R. Quando a informação sobre Y é desconhecida, o índice
correspondente a essa variável é substituído por “+” e temos o nível 2 de R.

Montando-se a tabela de contingência de maneira que todas as celas


apresentem informações de X, Y e R então, um modelo de não-resposta será
não-ignorável quando possuir um termo de interação27 entre as variáveis Y e R.
A Tabela 13 mostra essa situação, destacando-se o fato de serem adotadas as
“pseudo-frequências observadas” , desdobradas a partir das frequências
observadas .

Para uma tabela genérica o modelo log-linear pode assumir a forma


em que é o vetor de frequências médias em cada uma das celas
é uma matriz de especificação de dimensão onde é o
número de celas e o número de parâmetros do modelo de tal forma que
( ) é o vetor de parâmetros com . A notação indica o
vetor de dimensão em que cada componente é o logaritmo natural do
correspondente componente em .

Tabela 13: Frequências e "pseudo-frequências" observadas com a introdução


da variável indicadora R.

R
Sim Não
1 1 1
2
2 1
2
2 1 1
2
2 1
2
Fonte: Elaborada pelo autor

27
Dizemos que existe interação entre variáveis quando o efeito isolado de qualquer uma delas
difere quando outras variáveis estão presentes.
95

Com a introdução da variável indicadora , o modelo log-linear apresentando


todos os parâmetros possíveis (modelo saturado) pode ser escrito com as
restrições usuais de identificabilidade28.

(1)

Esse modelo servirá como base para a imposição dos dois mecanismos
de censura aqui tratados.

Dentro do contexto de modelos hierárquicos29 e sob o mecanismo de


censura ignorável (representado pelos modelos MAR), o modelo log-linear
apropriado pode ser expresso como uma redução da equação (1):

(2)

Esse modelo pode ser escrito na notação log-linear como


com as restrições usuais de identificabilidade. Nessa situação tem-se Y e R
condicionalmente independentes, dados e . Há ausência da interação de
primeira ordem YR, das interações de segunda ordem e e da
interação de terceira ordem .

Um mecanismo de censura não-ignorável, também a partir de uma


redução da equação (1), é representado por:

(3)

28
Essas restrições obrigam que a somatória dos parâmetros em determinados níveis seja zero
(Agresti, 1990).
29
A hierarquia tratada aqui se refere a ordenação de um modelo a partir da sua forma
complexa até a mais parcimoniosa, ou seja, a hierarquia define o número de parâmetros a serem
estimados.
96

escrito como , também com as restrições usuais. Aqui, e R


são condicionalmente independentes dado e Y. Nessa situação, ocorreria a
ausência da interação de primeira ordem , das interações de segunda
ordem e e da interação de terceira ordem . A
proposta desse modelo está voltada para a interação entre as variáveis
respostas Y e R, significando agora que a probabilidade de censura depende
dos dados ausentes.

3.5 Estimação dos Parâmetros

Os estimadores de máxima verossimilhança para as frequências nas


celas podem ser obtidos pela maximização da função de verossimilhança
correspondente ao modelo log-linear restrito, usando-se o algoritmo EM.

O núcleo da função de log-verossimilhança de uma densidade conjunta


de , e Y condicionada em R pode ser escrito como

∑ ∑ ∑ ( ) ∑ ∑ ( ) (4)

em que [ ] e ∑ [
]. As frequências são as observadas para os dados
completamente informados e são as frequências para os dados com
ausência de informação sobre Y.

Os elementos do vetor de probabilidades são parametrizados como

A função de verossimilhança é maximizada sob frequências pseudo-


observadas nas celas, representadas por , fazendo-se uso do algoritmo
EM. O passo E do algoritmo determina as frequências pseudo-observadas nas
celas e o passo M obtém os estimadores de máxima verossimilhança dessas
frequências. Dentro do enfoque do modelo de censura não-ignorável, a
97

estimação de máxima verossimilhança pode levar a soluções que se


encontram nas bordas do espaço paramétrico, quando algumas estimativas de
são zeros. Quando essas soluções limites ocorrem, as estimativas dos
parâmetros não podem ser determinadas de forma única. Esta instabilidade é
causada pelo ajuste do modelo incluindo termos de interação YR. Com o
objetivo de contornar esses problemas, foi proposta uma abordagem bayesiana
por Park e Brown (1994).

Em uma abordagem bayesiana, simplificada para estimar os parâmetros


em um modelo de regressão logística, Clogg, Rubin, et al. (1991) propuseram
usar uma constante de ajuste, de maneira que o valor de maximização seja
único. A partir dessa abordagem, Park e Brown (1994) usaram uma priori com
uma distribuição de Dirichlet para na forma conjugada,

∏∏∏

em que são constantes de ajuste positivas a serem especificadas e temos


para a equação (4) a nova forma

∑∑∑ [ ( ) ]

∑∑{ [ ( ) ]

∑ [ ( )

]}

Embora a condição ∑ ∑ ∑ seja usada para obter a equação


(7), seria conveniente aplicar um fator de correção, em de maneira a
satisfazer . Esse procedimento leva em conta que é um
98

valor imputado para a pseudo-frequência observada na cela cujo total,


, para um dado i, j, é uma frequência verdadeiramente observada.

Tomando-se , pode-se garantir que , o que

implica que, para cada i, j, a soma das frequências pseudo-observadas é igual


àquelas das frequências observadas nas celas, e a condição
está satisfeita. Para atender a essas imposições, as frequências pseudo-
observadas nas celas são redefinidas como:

[ ]

Sob esse enfoque bayesiano, as estimativas de máxima posteriori (EMP)


das frequências esperadas nas celas são obtidas a partir das frequências
pseudo-observadas que maximizam o logaritmo da posteriori sob as
condições e .

Podemos definir o passo E como:

( )

( ) [ ]

Como o EMV não tem forma fechada, para obtê-lo no passo M é


necessário o uso de algum algoritmo de maximização como por exemplo
Newton-Raphson ou o método do ajustamento proporcional iterativo (DEMING
e STEPHAN, 1940).

O método do ajustamento proporcional iterativo (do termo em inglês,


Iterative Proportional Fitting - IPF), originalmente apresentado por Deming e
Stephan na década de 1940, é um procedimento que permite obter a estimativa
de máxima verossimilhança de com base nas frequências marginais
observadas, as quais constituem estatísticas suficientes mínimas dentro do
99

modelo log-linear reduzido enfocado. Para o modelo saturado, as estatísticas


suficientes mínimas são as frequências observadas em cada cela.

Em determinadas condições, comparado com o método de Newton-


Raphson, o algoritmo IPF tende a convergir mais lentamente; entretanto é
computacionalmente mais simples. Ao longo do processo iterativo, o método de
Newton-Raphson provê automaticamente a estimativa da matriz de covariância
assintótica referente às estimativas dos parâmetros e o algoritmo IPF não
fornece esta matriz. Como o objetivo do presente trabalho foca a estimação
dos parâmetros para imputação de dados, não se terá a preocupação de se
obter erros-padrões e, consequentemente, não será necessária a matriz de
covariância assintótica.

O algoritmo IPF consiste das seguintes etapas:

a) uso de um valor inicial ̂ que satisfaça o modelo log-linear a ajustar;

b) ajuste sucessivo dos elementos de ̂ a cada um dos subconjuntos


distintos de componentes da estatística suficiente mínima (frequências
marginais observadas), através de sua multiplicação por fatores de escala
apropriados, de modo que satisfaça a correspondente equação de
verossimilhança;

c) o processo continua até que a variação entre as estimativas seja


desprezível dentro de um critério de convergência estabelecido a priori, o que
acontece quando todas as equações de verossimilhança são satisfeitas dentro
da aproximação tolerada.

Numa tabela I × J × K × L, para o modelo log-linear de ausência de


interação de segunda ordem, o algoritmo IPF (adaptado às frequências
pseudo-observadas) é composto por três passos para cada iteração, pois
nessa tabela temos três componentes da estatística suficiente mínima:

As Expressões
100

̂ ̂
̂

̂ ̂
̂

̂ ̂
̂

̂ ̂
̂

definem o algoritmo IPF para o passo M, que maximiza o modelo posterior de


não-resposta impondo as frequências pseudo-observadas, , como
sendo as frequências observadas nas celas. Dependendo do modelo a ser
ajustado, o passo M do algoritmo EM difere, ou seja, por exemplo, se o modelo
a ser ajustado é , são usadas as Expressões (11) e (13). O
algoritmo EM, usando-se o algoritmo IPF no passo M, sempre converge para
uma solução, mesmo quando a solução está próxima de um limite do espaço
paramétrico, quando se toma o valor 0 para na expressão (9) (Dempster,
Laird e Rubin, 1977).

Quando , a abordagem se reduz àquela proposta por Fay


(1986) e Baker e Laird (1988), ou seja, corresponde ao método de máxima
verossimilhança. Nessa abordagem, as frequências pseudo-observadas nas
celas são exclusivamente determinadas por . Uma vez que seja
estimada como zero, continuará como zero ao longo das iterações, o que
poderá acarretar estimativas instáveis para os parâmetros . A introdução de
uma constante de ajuste, , pode evitar esse resultado indesejado;
sempre permanecerá positivo, desde que seja positivo.

Ao contrário da abordagem de máxima verossimilhança, essa


abordagem pelo método bayesiano acarretará estimativas estáveis e únicas
dos parâmetros do modelo.
101

Para especificar a distribuição a priori, é necessário determinar Δ e


reparti-lo dentro dos valores de , ou seja, distribuir a quantidade Δ de
forma a gerar as quantidades . Seguindo aabordagem de Clogget al.
(1991), Δ foi escolhido como sendo p, o número de parâmetros do modelo a
serem estimados, pois este valor já corresponderia a uma situação de
estabilidade nas estimativas das frequências esperadas.

Sob o mecanismo de censura ignorável, o EMV de pode ser obtido


como

̂ ( )

e neste contexto, escolhe-se o que melhor aproxima o EMP de


dessas estimativas, ou seja, é escolhido de forma a ser proporcional aos
. Tomando-se Δ = p, temos

Dessa maneira, deve ser expresso como

[ ]

Assim a distribuição a priori (5) é dependente dos dados, uma vez que
é estimado a partir das frequências observadas .

As estimações dos parâmetros dependem das variáveis

Quando está entre e , a estimação de máxima verossimilhanças


decompõe os totais marginais dos dados censurados nas duas categorias de
Y. No caso contrário, a tabela é completada pela alocação de todos os dados
102

ausentes em somente uma das categorias. Nessa situação, as frequências


esperadas para as celas de uma das categorias de Y são estimadas como
zero, e os estimadores dos parâmetros não podem ser unicamente
determinados. Quando o procedimento bayesiano é aplicado e uma constante
de ajuste é introduzida, evita-se esse problema, ou seja, uma solução de
borda só ocorre quando está próximo de 0 ou 1.

3.6 Aplicação nos Problemas Propostos

3.3.1 Variável Idade

O primeiro problema a ser apresentado está relacionado com a variável


idade e como esta interfere na decisão dos eleitores que não manifestaram seu
voto. Para essa análise, foi utilizada pesquisa Datafolha em dois períodos do
mês de outubro, após o primeiro turno, ou seja, já estavam definidos os
candidatos que participariam do segundo turno e, no caso da Cidade de São
Paulo, foram Gilberto Kassab e Marta Suplicy.

O primeiro período corresponde às pesquisas realizadas nos dias16 e 17


de outubro de 2008 e o segundo nos dias 24 e 25 de outubro de 2008. A
Tabela 14 apresenta a distribuição dos eleitores nas respectivas categorias
representadas por dois períodos e cinco níveis de idade: 16 a 24 anos, 25 a 34
anos, 35 a 44 anos, 45 a 59 anos e mais de 60 anos. A variável intenção de
voto, Y, pode assumir três situações, voto no Kassab, voto na Marta ou não
definido (SResp). Por exemplo, no período 16 e 17/10/08, faixa etária 25 a 34
anos, têm-se 229 entrevistados que declararam voto em Kassab, 192 na Marta
e 47 não responderam.

A Tabela 15 mostra a distribuição dos eleitores da Tabela 14 na forma


de frequências relativas (proporções). As proporções apresentadas na Tabela
15 normalmente diferem do divulgado pela mídia, pois, via de regra, os votos
sem definição são abandonados, permanecendo apenas os votos válidos.
103

Tabela 14: Distribuição da frequência de eleitores por período e faixa etária.


SREP: sem resposta.

Intenção Voto (Y)


Período Idade
(X1) (X2) Kassab Marta SResp
16a24 153 156 31
25a34 229 192 47
35a44 206 153 44
16e17/10/08
45a59 270 161 43
60 mais 197 71 26
TOTAL 1055 733 191
16a24 400 366 85
25a34 630 448 133
35a44 507 424 103
24e25/10/08
45a59 682 414 122
60 mais 533 201 39
TOTAL 2752 1853 482
Fonte: Datafolha (2008)

Assim, as estimativas publicadas das proporções de votos válidos totais


para os candidatos Kassab e Marta foram respectivamente de
1055/(1055+733) = 59,00% e 733/(1055+733) = 41,00% para o período 1 e de
2752/(2752+1853) = 59,76% e 1853/(2752+1853) = 40,24% para o período 2.

A Tabela 15 mostra que a vantagem do candidato Kassab aumenta a


medida que a idade do eleitor aumenta. Resta saber, entretanto, se esse
comportamento se repete nos eleitores indecisos a partir da imputação dos
votos utilizando o modelo probabilístico proposto (NMAR).

As frequências esperadas obtidas a partir da estimação dos parâmetros,


sob os mecanismos de censura não-ignorável (NMAR) e ignorável (MAR),
estão apresentadas na Tabela 16. O Programa utilizado foi desenvolvido para o
aplicativo R. O algoritmo empregado no programa foi o IPF.
104

Tabela 15: Percentuais de eleitores por período e faixa etária.


Intenção Voto (Y)
Período (X1) Idade (X2) Kassab Marta SResp
16a24 45% 46% 9%
25a34 49% 41% 10%
35a44 51% 38% 11%
16e17/10/08
45a59 57% 34% 9%
60 mais 67% 24% 9%
TOTAL 53% 37% 10%
16a24 47% 43% 10%
25a34 52% 37% 11%
35a44 49% 41% 10%
24e25/10/08
45a59 56% 34% 10%
60 mais 69% 26% 5%
TOTAL 54% 36% 10%
Fonte: Elaborada pelo autor.

Tabela 16: Intenção de votos, valores imputados nos modelos MAR e NMAR.
Intenção Voto (Y)
Sem Resposta
Com resposta (MAR) (NMAR) Total (NMAR)
Período (X1) Idade (X2) Kassab Marta Kassab Marta Kassab Marta
16a24 153 156 18 14 170 170
25a34 229 193 28 18 258 210
35a44 206 153 25 18 232 171
16e17/10/08
45a59 270 161 24 20 294 180
60 mais 196 71 18 9 215 79
TOTAL 1055 733 113 78 1168 811
16a24 399 366 55 31 454 397
25a34 633 450 105 23 737 474
35a44 509 425 41 59 550 484
24e25/10/08
45a59 682 411 57 68 739 479
60 mais 531 199 27 16 558 215
TOTAL 2753 1852 285 197 3038 2049
Fonte: Elaborada pelo autor.
105

A Tabela 16 mostra os valores estimados para os candidatos nas celas


onde houve respostas (com resposta), nas celas onde não houve respostas
(sem respostas) e a imputação das quantidades estimadas dos sem resposta
para os respectivos candidatos.

A Tabela 17 mostra as quantidades obtidas sob o modelos NMAR


(colunas 5 e 6) na forma de proporção. Nessa tabela é possível ver como o
modelo NMAR apropria percentualmente para cada candidato as observações
sem resposta. Para o período24 e 25/10/08, essa apropriação favorece o
candidato Gilberto Kassab nas duas primeiras faixas etárias (coluna 3) e nas
faixas restantes favoreceu a candidata Marta Suplicy (coluna 4).

Tabela 17: Intenção de votos imputados em percentuais. Modelo NMAR.

Intenção Voto (Y) - Modelo NMAR


Com resposta
(votos válidos) Sem Resposta Total
Kassab Marta Kassab Marta Kassab Marta
Período(X1) Idade(X2) (1) (2) (3) (4) (5) (6)
16a24 49,51% 50,49% 56,25% 43,75% 50,00% 50,00%
25a34 54,27% 45,73% 60,87% 39,13% 55,13% 44,87%
35a44 57,38% 42,62% 58,14% 41,86% 57,57% 42,43%
16e17/10/08
45a59 62,65% 37,35% 54,55% 45,45% 62,03% 37,97%
60 mais 73,41% 26,59% 66,67% 33,33% 73,13% 26,87%
TOTAL 59,00% 41,00% 59,16% 40,84% 59,02% 40,98%
16a24 52,16% 47,84% 63,95% 36,05% 53,35% 46,65%
25a34 58,45% 41,55% 82,03% 17,97% 60,86% 39,14%
35a44 54,50% 45,50% 41,00% 59,00% 53,19% 46,81%
24e25/10/08
45a59 62,40% 37,60% 45,60% 54,40% 60,67% 39,33%
60 mais 72,74% 27,26% 62,79% 37,21% 72,19% 27,81%
TOTAL 59,78% 40,22% 59,13% 40,87% 59,72% 40,28%
Fonte: Elaborada pelo autor.
106

O gráfico da Figura 17 mostra como o modelo NMAR apropriou para a


pesquisa do período 24 e 25/10/08, em termos percentuais, a intenção de voto
dos indecisos (coluna 3 da Tabela 17) para o candidato Gilberto Kassab
comparando com os votos válidos observados na pesquisa (coluna 1 da Tabela
17). A partir do gráfico é possível constatar que o modelo identificou uma maior
propensão dos indecisos das faixas de idade 16 a 24 anos e 25 a 34 anos em
votar no candidato Gilberto Kassab. Quanto se toma a faixa 25 a 34 anos, por
exemplo, o modelo aponta que 82% dos eleitores indecisos estariam dispostos
a votar no candidato Kassab enquanto os votos validos da pesquisa mostram
apenas 58%. Já os eleitores indecisos com 35 a 59 anos seriam, conforme o
modelo, mais propensos a votar na candidata Marta Suplicy.

Figura 17: Comparativo dos percentuais de votos válidos o sob o modelo NMAR.

Apropriação dos sem resposta (NMAR) x Votos Válidos -


Gilberto Kassab
90%
80%
70%
60%
Percentual

50%
40%
30%
20%
10%
0%
16a24 25a34 35a44 45a59 60 mais
Votos Válidos 52% 58% 54% 62% 73%
NMAR 64% 82% 41% 46% 63%

Fonte: Elaborada pelo autor.

Observa-se que se considerarmos a distribuição dos votos dos indecisos


pelo modelo NMAR (colunas 3 e 4 da Tabela 17), o candidato Kassab levaria
ligeira vantagem, pois as faixas etárias (16 a 24), (25 a 34) e (60 mais)
suplantam em número de eleitores as faixas (35 a 44) e (45 a 59),
desfavorecendo, numericamente, a candidata Marta Suplicy, entretanto, nos
107

votos válidos, Kassab leva vantagem em todas as faixas (coluna 1 da Tabela


17).

Tabela 18: Número de eleitores por faixa etária.

Idade Nr. Eleitores Percentual


16a24 1.295.012 15,8%
25a34 1.961.146 24,0%
35a44 1.687.790 20,6%
45a59 1.981.665 24,2%
60 mais 1.255.143 15,3%
Fonte: Tribunal Superior Eleitoral (2008)

Considerando a importância dessa constatação, buscou-se junto ao TSE


informações sobre o número de eleitores no Município de São Paulo por faixa
etária e no mês de outubro de 2008. A Tabela 18 mostra como ocorre a
distribuição do número de eleitores por faixa etária no Município de São Paulo
à época das eleições de 2008.

A ponderação do resultado obtido pelo modelo NMAR quanto à


apropriação dos indecisos e levando em conta as proporções de eleitores nas
faixas etárias da Tabela 18, eleva a estimativa da proporção de votos do
candidato Kassab para 59,80%. É um ganho pequeno, entretanto, existe outro
fator que pode elevar ainda mais essa proporção, o fenômeno da abstenção
eleitoral.

Existem alguns estudos avaliando os efeitos da alienação eleitoral, ou


seja, a soma da participação via votos nulos e em branco com a abstenção.
Esses estudos procuram mostrar como ocorre a alienação eleitoral dentro das
variáveis idade, escolaridade e renda, dentre outras. Podemos citar como
exemplo os trabalhos de Silva (2013) e de Borba (2008). Esses dois trabalhos
se baseiam em dados do Estudo Eleitoral Brasileiro - ESEB 2002. Ambos
abordam os dados apresentados pela ESEB avaliando o grau de correlação
entre abstenção e algumas variáveis tais como escolaridade, idade e renda,
entretanto, tais dados foram levantados após a eleição para presidente em
2002 e com abrangência nacional. A abstenção obtida pelo estudo é inferior ao
108

apresentado pelo TSE, demonstrando que o eleitor não revela efetivamente o


fato de não ter votado.

Outra questão importante diz respeito à abstenção no Município de São


Paulo, a qual é bem maior que a Nacional. Nas eleições para prefeito em 2008,
a abstenção no Município de São Paulo, divulgada pelo TSE, foi de 17,54%, a
qual tem forte impacto na avaliação obtida pelo modelo NMAR.

Buscando uma forma de quantificar o impacto da abstenção no modelo


NMAR, obteve-se a Tabela 19, a qual mostra o resultado de pesquisa realizada
pelo Datafolha entre 20 e 21/05/2010. Essa tabela resume as respostas à
seguinte pergunta: No Brasil o voto é obrigatório por lei. Você é a favor ou
contra o voto obrigatório?

Tabela 19: Posição do eleitor quanto à obrigatoriedade do voto.

IDADE ESCOLARIDADE RENDA


16 a 24 25 a 34 35 a 44 45 a 59 mais 60 mais 10
Fund Medio Sup até 2 SM 2 a 5 SM 5 a 10 SM
anos anos anos anos anos SM
A favor 56 49 44 43 47 52 45 38 52 43 45 40
Contra 41 48 54 52 44 42 52 59 43 54 54 59
Indiferente 3 3 1 4 5 3 3 2 4 3 0 1
Não sabe 0 1 1 2 4 2 0 1 2 0 1 1
Total em % 100 100 100 100 100 100 100 100 100 100 100 100
Base pondeada 488 645 523 601 403 1266 1068 326 1348 856 241 109
Total nº absolutos 489 646 523 599 403 1260 1070 330 1346 858 242 108

Fonte: Datafolha (2010)

Para estimar a distribuição da abstenção eleitoral no Município de São


Paulo, toma-se como base a pesquisa Datafolha. Pode-se considerar que a
distribuição dos eleitores que são contra o voto obrigatório reflete a distribuição
da abstenção, ou seja, do total divulgado da abstenção pelo TSE apropria-se
essa abstenção dentro das variáveis idade, escolaridade e renda seguindo a
proporção apresentada na pesquisa Datafolha da Tabela 19.

Para a variável idade, a distribuição percentual dos que são contra o


voto obrigatório permite criar a Tabela 20 na qual são apropriadas as
abstenções por faixa etária dos 17,54% de abstenção, ou seja, 1.434.905
109

eleitores que não votaram no segundo turno na eleição de 2008 no Município


de São Paulo.

Tabela 20: Apropriação estimada de abstenção por faixa etária.

Faixa (anos) (%) Nº eleitores Abstenção Votos Válidos


16 a 24 17,2 1.295.013 246.155 1.048.858
25 a 34 20,1 1.961.146 288.182 1.672.964
35 a 44 22,6 1.687.790 324.204 1.363.586
45 a 59 21,8 1.981.665 312.197 1.669.468
60 ou mais 18,4 1.255.143 264.167 990.976
Total 100 8.180.757 1.434.905 6.745.852
Fonte: Adaptado pelo autor

Essa nova ponderação atribui ao candidato Gilberto Kassab 59,78% dos


votos, ou seja, praticamente não altera os valores inferidos pelo modelo NMAR,
confirmando a pouca influência da abstenção quando estratificada pela variável
idade.

O resultado final das eleições de 2008 para prefeito do Município de São


Paulo, oficialmente divulgado pela Justiça Eleitoral (TSE), dá ao candidato
Gilberto Kassab 60,72% dos votos válidos e 39,28% à candidata Marta Suplicy.
O resultado da pesquisa de boca de urna divulgado pelo Datafolha dá ao
candidato Gilberto Kassab 59,76% dos votos válidos e 40,24% à candidata
Marta Suplicy. Os resultados obtidos pelo modelo MAR são os mesmos
divulgados pelo Datafolha, que consideram somente os dados totalmente
observados. O modelo NMAR não difere substancialmente do resultado boca
de urna dano ao candidato Gilberto Kassab 59,72% dos votos, demonstrando
que a variável idade pouco contribui, no seu total, para explicar o
comportamento do eleitor indeciso, apesar da indicação de tendências mais
favoráveis ao candidato Gilberto Kassab nos estratos do eleitorado indeciso
mais jovem. A vantagem de Kassab nos estratos dos eleitores mais jovem é
110

ligeiramente superior a sua desvantagem nos estratos do eleitorado mais velho


e, possivelmente, explique o resultado final das urnas, dando ao candidato
Kassab 60,72% dos votos válidos. A Tabela 21 resume o parágrafo anterior.

Tabela 21: Percentuais na intenção de voto candidato Gilberto Kassab na


eleição de 2008 no segundo turno do Município de São Paulo.

Modelo (%)
MAR (votos válidos no per. 24 e 25/10/08) 59,76
NMAR 59,72
NMAR ponderado pela idade 59,80
NMAR ponderado pela idade + abstenção 59,78
Resultado TSE (votos válidos) 60,72

Fonte: TSE (2008)

3.3.2 Variável Escolaridade

O segundo problema a ser apresentado está relacionado com a variável


escolaridade. A Tabela 22 mostra o resultado da pesquisa Datafolha adaptado
para apenas dois níveis de escolaridade: Fundamental e Médio/Superior
(Med+Sup).

Tabela 22: Intenções de voto estratificadas por escolaridade

Intenção Voto (Y)


Período(X1) Escolaridade(X2) Kassab marta S Resp
Fundamental 324 309 86
16e17/10/08
Med+Sup 713 433 113
Fundamental 921 806 192
24e25/10/08
Med+Sup 1823 1027 317
Fonte: Datafolha (2008)

A Tabela 23 mostra o resultado sob o modelo NMAR para a variável


escolaridade quanto às intenções de voto para os dois períodos já
apresentados conjuntamente com dois níveis de escolaridade adotados:
Fundamental e acima (médio mais superior).
111

Tabela 23: Intenção de voto segundo escolaridade. Valores imputados nos


modelos MAR e NMAR

Intenção Voto (Y) - Modelo NMAR


Imp Sem
Imp com resposta Imp Total
Resposta
Período(X1) Escol(X2) Kassab marta Kassab Marta Kassab Marta
Fundamental 340 311 30 38 370 349
16e17/10/08 Med+Sup 711 431 63 53 775 484
TOTAL 1051 742 93 91 1145 833
Fundamental 921 806 102 90 1023 896
24e25/10/08 Med+Sup 1823 1027 203 114 2026 1141
TOTAL 2744 1833 305 204 3049 2037
Fonte: Elaborada pelo autor

A Tabela 24 apresenta o resultado da Tabela 23 em percentuais. Nessa


tabela é possível notar que a variável escolaridade não afeta de forma
significativa o eleitor indeciso.

Tabela 24: Intenção de voto segundo escolaridade. Valores imputados


percentuais nos modelos MAR e NMAR

Intenção Voto (Y) - Modelo NMAR


Imp Sem
Imp com resposta Imp Total
Resposta
Período(X1) Escol(X2) Kassab marta Kassab Marta Kassab Marta
Fundamental 52,23% 47,77% 44,12% 55,88% 51,46% 48,54%
16e17/10/08 Med+Sup 62,26% 37,74% 54,31% 45,69% 61,56% 38,44%
TOTAL 58,62% 41,38% 50,54% 49,46% 61,56% 38,44%
Fundamental 53,33% 46,67% 53,13% 46,88% 53,31% 46,69%
24e25/10/08 Med+Sup 63,96% 36,04% 64,04% 35,96% 63,97% 36,03%
TOTAL 59,95% 40,05% 59,92% 40,08% 59,95% 40,05%
Fonte: Elaborado pelo autor
112

O gráfico da Figura 18 mostra uma comparação entre o resultado


estimado do percentual de votos destinados ao candidato Kassab pelo modelo
NMAR e o resultado final das eleições para a prefeitura de São Paulo, 2008,
votos válidos. Esse resultado segue a estratificação de escolaridade adotada.
Os valores estimados pelo modelo NMAR praticamente coincidem com o valor
do resultado final divulgado pelo TSE.

Figura 18: Comparativo do modelo NMAR e resultado do TSE (votos válidos).


Eleição para prefeitura de São Paulo, 2008

Fonte: Elaborado pelo autor

Com o objetivo de analisar o efeito da escolaridade na abstenção, foram


obtidos dados de abstenção segundo o grau de instrução nas eleições para a
prefeitura de São Paulo, 2008.

O TSE fornece informações do eleitorado categorizado por nível de


escolaridade conforme Tabela 25.

Uma ponderação do modelo NMAR a partir do número de eleitores


estratificados por grau de instrução não afeta significativamente os resultados.
113

Quando se busca adicionar o efeito da abstenção a partir dos dados da


Tabela 19 (pesquisa Datafolha do voto obrigatório), novamente não se
encontra mudança significativa.

Assim, a abstenção não fornece informações adicionais que possam


explicar a intenção de voto do eleitor indeciso.

Tabela 25: Abstenção por grau de instrução. Eleições para a prefeitura de São
Paulo, 2008

Grau de Instrução Total(T) %T/TT


ANALFABETO 203.313 2,48
LE E ESCREVE 664.891 8,11

PRIMEIRO GRAU COMPLETO 824.824 10,061

PRIMEIRO GRAU INCOMPLETO 2.251.749 27,466

SEGUNDO GRAU COMPLETO 1.440.068 17,565

SEGUNDO GRAU INCOMPLETO 1.824.398 22,253

SUPERIOR COMPLETO 575.940 7,025

SUPERIOR INCOMPLETO 413.099 5,039

TOTAL(TT) 8.198.282 100


Fonte: TSE (2008)

3.3.2 Variável Renda

A terceira variável explicativa do voto do indeciso é a renda. A Tabela 26


mostra, em termos de frequência absoluta, o comportamento do eleitor
considerando duas faixas de renda: até dois salários mínimos (ate 2SM) e
acima de dois salários mínimos (mais 2SM). A mesma informação, em termos
de frequências relativas, é apresentada na Tabela 27.
114

Tabela 26: Intenção de voto para a prefeitura de São Paulo, 2008,


estratificação por renda

Intenção Voto (Y)


Período(X1) Renda(X2) Kassab marta S Resp
ate 2SM 205 240 55
16e17/10/08 mais 2SM 815 488 131
TOTAL 1020 728 186
ate 2SM 545 557 109
24e25/10/08 mais 2SM 2092 1229 374
TOTAL 2637 1786 483
Fonte: Datafolha (2008)

Tabela 27: Intenção de voto, valores percentuais. Prefeitura de São Paulo,


2008, estratificação por renda

Intenção Voto (Y)


Período(X1) Renda(X2) Kassab marta S Resp
ate 2SM 41,0% 48,0% 11,0%
16e17/10/08 mais 2SM 56,8% 34,0% 9,1%
TOTAL 52,7% 37,6% 9,6%
ate 2SM 45,0% 46,0% 9,0%
24e25/10/08 mais 2SM 56,6% 33,3% 10,1%
TOTAL 53,8% 36,4% 9,8%
Fonte: Datafolha (2008)

Introduzindo os dados a partir da variável renda no modelo NMAR,


obtém-se a distribuição dos eleitores conforme a Tabela 28 (frequências
absolutas) e Tabela 29 (frequências relativas).

A variável renda foi a que causou maior impacto na votação dos


eleitores indecisos quando utilizado o modelo NMAR. A variável renda elevou o
percentual de intenção de voto para o candidato Kassab de 59,6%, quando
considerado somente os votos válidos (MAR),para 60,4%, quando são
imputados os resultados obtidos pelo modelo NMAR. Esse percentual
apontado pelo modelo NMAR se aproxima muito do número final divulgado
pelo TSE para o candidato, ou seja, 60,72% dos votos válidos.
115

O gráfico da Figura 19 mostra o percentual de votos válidos por faixa de


renda para o candidato Kassab na pesquisa Datafolha do período 24 e
25/10/08. Para a faixa até dois salários mínimos (ate 2SM), o candidato obteve
49% dos votos válidos e para a faixa acima de dois salários mínimos (mais
2SM), obteve 63% dos votos válidos. O modelo NMAR apropriou os eleitores
indecisos em proporções maiores para o candidato. Pelo modelo, 58% dos
indecisos com faixa de renda até dois salários mínimos votaram no candidato
Kassab e 70% dos indecisos com renda superior a dois salários mínimos
votaram no candidato.

Assim, sob o modelo NMAR, o candidato apresentou melhor


desempenho para as duas faixas de renda, sendo que na faixa de menor renda
esse desempenho foi mais destacado, crescendo de 49% para 58%, ou seja,
um crescimento aproximado de 18,4%.

Figura 19: Comparativo do modelo NMAR e resultado oficial do TSE. eleições


para a prefeitura de São Paulo, 2008

Fonte: Elaborado pelo autor

Não foi buscada para a variável renda uma ponderação pelo número de
eleitores em cada uma das faixas de renda, pois tal informação não foi
116

divulgada pelo TSE. Consequentemente, pela falta da informação do número


de eleitores por faixa de renda, não foi possível ponderação considerando-se
também a abstenção por faixa de renda.

Tabela 28: Imputação dos dados segundo modelo NMAR para a variável renda

Intenção Voto (Y)


Com Sem Resposta
resposta (NMAR) TOTAL (NMAR)
Período(X1) Renda(X2) Kassab marta Kassab marta Kassab marta
ate 2SM 206 242 17 35 223 277
16e17/10/08 mais 2SM 814 486 66 69 879 555
TOTAL 1020 728 83 104 1102 832
ate 2SM 541 554 67 49 608 603
24e25/10/08 mais 2SM 2096 1232 259 109 2355 1340
TOTAL 2637 1786 326 158 2963 1943
Fonte: Elaborado pelo autor

Tabela 29: Imputação dos dados, valores percentuais, segundo modelo NMAR
para a variável renda

Intenção Voto (Y)


Com Sem Resposta
TOTAL (NMAR)
resposta (NMAR)
Período(X1) Renda(X2) Kassab marta Kassab marta Kassab marta
ate 2SM 46,0% 54,0% 32,7% 67,3% 44,6% 55,4%
16e17/10/08 mais 2SM 62,6% 37,4% 48,9% 51,1% 61,3% 38,7%
TOTAL 58,4% 41,6% 44,4% 55,6% 57,0% 43,0%
ate 2SM 49,4% 50,6% 57,8% 42,2% 50,2% 49,8%
24e25/10/08 mais 2SM 63,0% 37,0% 70,4% 29,6% 63,7% 36,3%
TOTAL 59,6% 40,4% 67,4% 32,6% 60,4% 39,6%
Fonte: Elaborado pelo autor
117

Embora as estimativas das proporções de votos tenham sido aqui


apresentadas, intervalos de confiança não foram construídos, pois o objetivo
principal deste trabalho é a apresentação do método de imputação. A
comparação desse tipo de método geralmente é feita de maneira empírica,
mas aqui não fizemos comparação com outros métodos.
118

Capítulo 4

Reeleição e Perfil do Candidato: Eleições proporcionais e


modelos que possam apontar a probabilidade do candidato ser
reeleito em função das diversas variáveis explicativas
previamente estabelecidas.

4.1 Introdução

Dentre as diversas variáveis a serem analisadas dentro do perfil do


candidato uma que merece destaque é aquela relacionada ao político de
carteirinha. Aquele cuja profissão é ser vereador tal como declarado no
Tribunal Superior Eleitoral. Nesses casos, temos o vereador se candidatando a
vereador, ou seja, a busca da reeleição. O perfil desse candidato destoa de
maneira relevante dos demais candidatos que não possuem esse atributo.

A partir das conclusões desse tipo de estudo, pode ser possível traçar,
ainda que de forma grosseira, o perfil do eleitor e do candidato e, de certa
forma, diagnosticar a situação da democracia em nosso país.

Análises referentes a reeleições são escassas na produção acadêmica


e, quando são feitas, normalmente se vinculam aos cargos com eleição
majoritária. Essas análises se resumem, em sua maioria, nas especificidades
inerentes ao cargo e no desempenho do candidato e de sua equipe frente à
propaganda eleitoral. Alguns desses trabalhos focam, por exemplo, a análise
dos discursos dos candidatos no Horário Gratuito de Propaganda Eleitoral
(HGPE), destacando como esses discursos influenciam na reeleição do
candidato.

As imagens de estadista de FHC e Lula nos respectivos programas


eleitorais reforçam a idealização de que quem está no poder deve ficar.
Assim, a estratégia da ameaça é acionada para apontar que quem
vislumbra o melhor mundo futuro é o candidato da situação. A ênfase
119

nos temas de cunho administrativo e o foco para questões econômicas


também se revelam como estratégias que favorecem os candidatos da
situação, na medida em que alimentam no eleitorado a impressão de
que suas políticas públicas serão mais eficientes do que as dos
oponentes, que muitas vezes não têm elementos para sustentar uma
sensação retrospectiva no eleitorado (MACHADO, 2009).

Trabalhos que analisam o fenômeno da reeleição nas eleições


proporcionais são muito raros. Grande maioria desses trabalhos se apoia na
Teoria da Conexão Eleitoral, descrita pelo cientista político estadunidense
David Mayhew no seu livro Congress: The electoral connection (1974),
baseado, principalmente, na teoria da escolha racional do eleitor. Segundo
essa teoria, o objetivo principal de todo político é de se manter no poder
através da reeleição. Para alcançar esse objetivo, o político toma como base o
comportamento racional do eleitor e busca criar condições no seu reduto
eleitoral para que essa racionalidade aflore favoravelmente a sua candidatura,
cuja importância se sobrepõe às posturas ideológicas do parlamentar no
Congresso nacional.

Uma vez que os eleitores estão se tornando cada vez mais


pragmáticos em relação às suas demandas específicas, as políticas
locais (pork barrel) têm se tornado mais relevantes para o controle do
desempenho dos parlamentares por parte dos eleitores do que a
postura ideológica que eles assumem dentro do Congresso (PEREIRA
e RENNÓ, 2001).

Como reforço a essa estratégia do candidato há ainda o apoio dos


partidos a essa prática, inclusive controlando, através dos seus líderes, a
distribuição dos benefícios ao eleitorado.

Nosso argumento é que o sistema político brasileiro cria incentivos para


que os eleitores se preocupem mais com os benefícios locais do que
com a performance nacional dos seus representantes, o que faz com
que a participação dos parlamentares no âmbito nacional,
120

principalmente na Câmara dos Deputados, seja orientada pela busca de


benefícios que possam ser utilizados no plano local, como forma de
alcançar maiores retornos eleitorais. O comportamento partidário
também segue essa lógica, pois são os líderes dos partidos e o
Executivo que controlam a distribuição desses benefícios (PEREIRA e
RENNÓ, 2001).

Esses trabalhos buscam estabelecer marcadores (variáveis


explicativas) que possam quantificar e correlacionar as ações do parlamentar
com o comportamento racional do eleitor no momento do voto. A conexão
eleitoral envolve relações com as arenas políticas, legislativas e eleitorais
(CERVI, 2009).

O objetivo é analisar as interações entre essas duas arenas [política e


eleitoral] em um sistema de representação política subnacional: o
legislativo estadual do Paraná. A partir da relação entre a produção
legislativa individual dos deputados estaduais na 14ª Legislatura da
Assembleia Legislativa do Estado do Paraná (ALEP) e o desempenho
eleitoral dos que concorreram à reeleição, busca-se identificar possíveis
interdependências entre atividade parlamentar individual e reeleição.
Para isso, além dos resultados eleitorais dos candidatos à reeleição,
que deram origem a uma tipologia de votação (se concentrada ou
desconcentrada regionalmente) como variável dependente, são
incluídos no modelo três conjuntos de variáveis explicativas. O primeiro
é formado por variáveis sobre a posição política institucionalizada
(bancada a que pertence; ideologia; partido político; ocupação de cargo
na mesa; número de mandatos na ALEP; e posição sobre tema
polêmico). O segundo aborda a visibilidade do mandato (número de
aparições dos parlamentares no principal jornal diário do Estado e tipo
de aparições). O terceiro grupo de variáveis explicativas diz respeito à
produção legislativa individual propriamente dita (tipo de projeto de lei
apresentado; abrangência geográfica do projeto de lei; abrangência
social do projeto de lei; número de projetos apresentados; e número de
projetos aprovados durante o mandato). A partir do cruzamento das
121

variáveis que compõem o modelo em testes de independência de


médias ou de regressões, o modelo analítico demonstra a existência de
forte correlação entre votações concentradas regionalmente e maior
possibilidade de reeleição. As variáveis explicativas sobre posição
política e visibilidade do mandato mostraram-se fracas na explicação
para tipo de votação, enquanto algumas variáveis sobre produção
legislativa individual apresentaram alto índice de correlação com
votação regionalizada e, por consequência, com a maior possibilidade
de reeleição do parlamentar (CERVI, 2009).

O trabalho de Cervi (2009), aplicado aos deputados estaduais do


Paraná, utiliza variáveis que também serão abordadas neste capítulo, tais
como a visibilidade do candidato (nível de Recall) e sua produção legislativa.

4.2 O fenômeno da reeleição dentro do sistema eleitoral

A política sempre foi e continua sendo uma área de pouco interesse e,


por isso, de pouca familiaridade para o cidadão brasileiro médio. Somos um
povo pouco politizado, até mesmo quando comparados com nossos vizinhos
sul-americanos, como os argentinos, que demonstram ser politicamente mais
ativos (FAUSTO e DEVOTO, 2004).

A cada dois anos, no entanto, durante os curtos períodos das eleições,


essa apatia do brasileiro frente à política é amenizada. Talvez por um despertar
voluntário para o cumprimento do dever cívico, talvez pela pressão sofrida
graças ao bombardeio de informações das propagandas políticas, ou
simplesmente por uma euforia contagiante similar à experimentada durante as
Copas do Mundo de futebol. O que se verifica é que cada brasileiro parece
tornar-se um expert em política nos três meses de campanha eleitoral e acaba
122

traçando (ou repetindo) algumas teorias para prever ou explicar o sucesso ou o


fracasso dos candidatos nas urnas.

Muitas dessas teorias são internalizadas também pelos coordenadores


de campanha dos candidatos, balizando-os na condução da estratégia eleitoral
e, invariavelmente, produzem bons resultados, colaborando para reafirmar a
validade de tais teses. Os resultados (cada vez mais frequentes) que
contrariam o senso comum são relegados à esfera do imponderável, aquela
reserva de possibilidades a que todos estamos sujeitos, pois tal qual o futebol,
as eleições também seriam “uma caixinha de surpresas”, mas na realidade,
isso não ocorre.

Se pararmos para analisar mais profundamente, veremos que o eleitor


tem uma lógica muito bem definida de escolha de candidatos. De acordo com
ALMEIDA (2008), são seis os fatores que formam a lógica do eleitor: a
avaliação do governo – quanto mais positiva, maiores as chances de uma
continuidade, seja pela reeleição, seja pela eleição de um sucessor; quanto
mais negativa, maiores as chances de sucesso de um candidato de oposição; a
identidade dos candidatos como do governo ou de oposição – os candidatos
com forte identificação de oposição ou de apoio ao governo têm maiores
chances de sucesso do que aqueles candidatos que ficam, no jargão popular,
“em cima do muro”; o nível de lembrança (recall) dos candidatos – quanto mais
conhecidos, maiores as chances de conquistarem votos; o currículo dos
candidatos e se eles utilizam-no para mostrar ao eleitor que podem resolver o
principal problema que aflige o eleitorado – o candidato deve concentrar sua
campanha nos problemas que mais afligem os eleitores e, principalmente, deve
ser identificado com alguém com experiência (ou potencial) para enfrentar
efetivamente esses problemas; o potencial de crescimento dos candidatos, que
combina a rejeição de cada um deles com seu respectivo recall – é frequente
um candidato desconhecido tornar-se conhecido e conquistar mais votos do
que um candidato bem conhecido, mas que apresenta altos níveis de rejeição;
e o fato de não ser possível contar com os apoios políticos – a influência de
123

apoios políticos é muito pequena quando comparada à dos fatores acima


descritos.

Segundo ALMEIDA (2008), fatores tidos pelo senso comum como


fundamentais, tais como o número de minutos de que dispõe o candidato na
propaganda eleitoral gratuita no rádio e TV, a verba gasta na campanha
eleitoral, a transferência de votos pelo apoio político e a influência das próprias
pesquisas no resultado da eleição (segundo o efeito da profecia
autorrealizável30), não passam de grandes mitos (ou paradigmas) sem
comprovação.

Para chegar a essas conclusões, Almeida analisou mais de 150 eleições


– federais estaduais e municipais – todas elas para cargos de eleição
majoritária: presidente da República, governadores, prefeitos e senadores. Em
suas análises, entretanto, não foram contempladas disputas para cargos de
eleição proporcional: deputados federais e estaduais e vereadores.

Dessa forma, dadas as peculiaridades de cada um dos dois sistemas


eleitorais, é possível que haja fatores particulares às eleições proporcionais,
que, mesmo fazendo parte do processo de escolha dos candidatos, tenham
sido desconsiderados.

Dentre os fatores que podem ter sido negligenciados, o primeiro que


vem à mente é a produção legislativa realizada pelo deputado ou vereador
candidato à reeleição. É possível que o desempenho de um parlamentar
durante a legislatura seja acompanhado pelos eleitores e componha um

30
A profecia autorrealizável é um efeito conhecido desde tempos remotos pela humanidade, mas
que acabou por ser conceituado pela primeira vez no livro “Teoria e Estrutura Sociais”, de 1949, Robert
King Merton. Em termos simples, uma afirmação declarada como verdadeira, quando na verdade é falsa,
pode influenciar de tal maneira as pessoas que acaba por se realizar.
Na literatura, temos o exemplo de “Macbeth”, de William Shakespeare, no qual três bruxas
profetizam que o general Macbeth poderá se tornar rei um dia. Macbeth, inspirado pela profecia, acaba
por assassinar o rei Duncan e tornar-se rei. Em seguida, as três bruxas profetizam que Macbeth deve
tomar cuidado com o nobre Macduff. Desconfiado, Macbeth acaba assassinando a família de Macduff.
Por esse motivo, Macduff passa a liderar uma revoluçãocontra Macbeth, e acaba matando-o. Se
nenhuma das profecias fosse anunciada, possivelmente não teriam se realizado.
124

cenário de aprovação ou rejeição do candidato, refletindo-se no resultado das


urnas.

Outro fator que pode ter sido negligenciado é a verba gasta na


campanha pois, diferentemente das eleições majoritárias, existe um grande
número de candidatos concorrendo a uma vaga de vereador, pulverizados
pelas diversas regiões do município. Nesse caso, gastos com divulgação do
seu nome e da sua plataforma política são imprescindíveis para melhorar a
competitividade do candidato.

Destarte, o que se pretende é verificar, mediante testes estatísticos, a


aplicabilidade dos fatores definidos por ALMEIDA (2008) às eleições realizadas
mediante o sistema proporcional, realizando-se, quando necessário, as devidas
adaptações, com o intuito de adequá-los às peculiaridades do referido sistema.

Para tanto, serão analisados os dados referentes às eleições para as


Câmaras Municipais de São Paulo, Rio de Janeiro, Belo Horizonte, Porto
Alegre e Recife, realizadas em 2008.

São duas as razões para essa escolha.

A primeira, de ordem mais pragmática, é a facilidade de obtenção de


informações referentes à produção legislativa dos vereadores candidatos à
reeleição, bem como referentes aos candidatos aos cargos de vereador por
esses grandes centros. A opção por cidades de menor porte traria dificuldades
adicionais e uma possível imprecisão nos dados, o que poderia comprometer o
resultado da pesquisa.

A segunda, também de ordem prática, é a dimensão do colégio eleitoral


dos referidos municípios, o que torna a disputa eleitoral mais impessoal do que
em municípios de pequeno porte. É uma tentativa de isolar efeitos não
previstos no modelo, mas que poderiam comprometer o caráter democrático
das eleições, em especial o livre arbítrio do eleitor, como, por exemplo, o
domínio que certos grupos ou famílias exercem, mediante força política e/ou
125

econômica, sobre a população de determinados municípios. Tal situação, se


ocorre em grandes centros, é numa escala que não chega a prejudicar o
panorama geral do pleito.

Ao final, esperamos, além de confirmar (ou rejeitar) nossas hipóteses


iniciais, elucidar a importância do trabalho de vereador e, com isso, contribuído,
por pouco que seja, para que o Brasil torne-se cada vez mais uma verdadeira
democracia.

Como exposto anteriormente, o propósito é determinar, com base em


métodos estatísticos, os fatores que influenciam o processo de escolha do
eleitor nas eleições legislativas municipais, numa adaptação do modelo de
ALMEIDA (2008), o qual é elaborado, fundamentalmente, com base em
eleições majoritárias, para eleições proporcionais.

Como um objetivo adicional, espera-se elaborar uma metodologia que


seja, embora precisa, suficientemente flexível para ser empregada aos
legislativos estadual e federal, possibilitando a geração de resultados que
confirmem (ou desmintam) as conclusões a que chegou o presente trabalho,
permitindo (ou impedindo) sua generalização.

Para alcançar tais objetivos, analisaremos as produções dos


parlamentares das câmaras municipais de São Paulo, Rio de Janeiro, Belo
Horizonte, Porto Alegre e Recife, num período correspondente a legislaturas
2005-2008. O último ano da legislatura coincide com o ano das eleições
municipais. Assim, podemos considerar que o resultado do pleito reflete a
percepção dos eleitores a respeito do desempenho do parlamentar (ou do
partido).

A hipótese subjacente a esse capítulo é a de que há uma ou mais


variáveis relativas à produção legislativa de um parlamentar que são
percebidas pela população e se refletem no resultado das eleições: se a
percepção é positiva, há uma chance maior de o parlamentar ser reeleito do
que se a percepção for negativa. Seria o equivalente do fator “avaliação do
126

governo”, no modelo proposto por ALMEIDA (2008). Para analisar tal aspecto,
estudaremos tanto a relevância dos projetos de lei apresentados pelo
parlamentar, quanto sua eficiência, isto é, a relação entre a quantidade de
projetos apresentados e o número dos que foram efetivamente aprovados pela
Câmara.

Outro fator que analisaremos é o que ALMEIDA (2008) chama de recall,


isto é, o grau de lembrança que o candidato consegue suscitar no eleitor. Na
falta de indicadores específicos para medir tal efeito, o nível de recall de cada
parlamentar será analisado pelo número de resultados gerados pelo seu nome
numa busca efetuada na Internet por meio da ferramenta Google. Infelizmente,
por limitações da metodologia empregada, não há a possibilidade de se
levantar dados históricos de recall. Por esse motivo, o grau de recall será
confrontado somente com os resultados das últimas eleições municipais
(2008).

Por fim, o fator “currículo” será avaliado de forma simplificada, pois, dada
a grande heterogeneidade que se observa entre os ocupantes das Câmaras
Municipais, é difícil graduar a experiência (ou potencial) de cada candidato
eleito. Assim, preferiu-se atribuir aos candidatos eleitos apenas um marcador
do tipo binário, para separar os que possuem alguma experiência prévia na
política, no trabalho social ou na luta sindical dos que não a possuem.

O fator “potencial de crescimento” não será analisado. Ao contrário das


eleições majoritárias, nas quais a disputa acaba sendo de um candidato contra
o outro, e o nível de rejeição torna-se uma variável decisiva, em especial no
segundo turno, em eleições proporcionais, essa variável perde sua importância,
pois os candidatos que se tem à disposição para escolher são muitos, de forma
que ninguém precisa optar pelo voto em um candidato porque rejeita outro ou
outros.

Dessa forma, serão avaliadas as seguintes variáveis relativas aos


parlamentares: EFICIÊNCIA – cada projeto de lei apresentado pelo
127

parlamentar durante o mandato é classificado em categorias em termos de


relevância. Tais informações são obtidas na página da Organização Não
Governamental TRANSPARÊNCIA BRASIL (http://www.transparencia.org.br/ ).
Em seguida é levantada a relação entre o número de projetos de lei relevantes
apresentados pelo parlamentar durante a legislatura e a quantidade total de
projetos apresentados por esse parlamentar; RECEITA – a receita que o
candidato obteve para fins de gastos com sua campanha. Essa é a receita
oficialmente divulgada pelo TSE; RECALL – como dito anteriormente, será
levantado o número de resultados gerados pelo nome do parlamentar numa
busca efetuada na Internet por meio da ferramenta Google e citações na mídia.
Para atingir esse objetivo, foram efetuas as buscas utilizando o nome divulgado
pelo TSE como aquele utilizado para divulgação na campanha os quais nem
sempre correspondem ao nome de batismo do candidato. A busca foi sempre
utilizando a palavra “vereador” antes do nome e a frase exata, ou seja, o nome
entre aspas duplas. Por exemplo, se o parlamentar procurado é o Zé das
Cabras então é buscado “vereador Zé das Cabras”. Dessa maneira foi buscada
uma uniformidade na condição de busca do número de citações. Uma limitação
que deve ser reconhecida no nível de recall está vinculada ao fato de que não
é possível filtrar as citações quanto a serem favorável ou não ao candidato. Um
candidato pode apresentar um alto nível de recall mas podem ser lembranças
ou citações negativas, ou seja, estão na mídia por motivos que irão prejudicar a
sua imagem e, consequentemente, sua eleição, tais como envolvimento em
escândalos pessoais ou políticos. Assim, seria necessário um aprimoramento
da ferramenta de busca de citações através de um trabalho de coleta
permanente de dados sendo classificados segundo categorias de interesse
para o pesquisador, tais como ser ou não favorável ao candidato ou, conforme
o caso, neutra. Tais dados teriam importância relevante se considerarmos os
subsídios que forneceriam fortes subsídios para o eleitor no momento de
escolher o seu voto; CURRÍCULO – serão identificados os candidatos que
possuem alguma experiência prévia na política, no trabalho social ou na luta
128

sindical, de forma a separá-los dos que não a possuem. Essas informações


também foram obtidas na ONG TRANSPARÊNCIA BRASIL.

Todas as variáveis acima serão confrontadas com o resultado das


eleições municipais realizadas ao fim da legislatura, procurando-se verificar,
com base em testes estatísticos, se há alguma correlação entre cada uma
delas e o resultado do pleito, bem como identificar quais delas apresentam
maior efeito.

É de se esperar, num regime democrático representativo, que os


cidadãos fiscalizem o trabalho dos eleitos para representá-los. Uma forma de
medir em que nível essa fiscalização ocorre (se é que ocorre), é verificar o
efeito do desempenho de cada parlamentar durante o mandato no sucesso ou
fracasso de sua tentativa de reeleição, ou seus reflexos nas candidaturas de
seus colegas de partido.

Por outro lado, o Brasil vive num regime democrático apenas há pouco
mais de 20 anos, após um período de ditadura militar. Assim, pode-se dizer
que o país ainda não tem uma sólida tradição democrática.

O motivo acima, aliado à dificuldade de acesso pelos cidadãos a


informações sobre o andamento do processo legislativo na maioria das
câmaras municipais, afasta o espanto frente à possibilidade de os resultados
analisados apontarem na direção de que a qualidade do trabalho parlamentar
tenha pouco ou nenhum efeito sobre o resultado das eleições municipais.

Portanto, excetuando-se o fator “avaliação de governo” (em nosso caso,


“produção legislativa”), que pode trazer, como dito, resultados surpreendentes,
esperamos validar a influência dos demais fatores apontados por ALMEIDA
(2008) também no processo de escolha de candidatos em eleições
proporcionais.
129

4.3 Proposta de modelagem estatística

O interesse é encontrar um modelo estatístico que possa estimar a


probabilidade do candidato ser reeleito em função das variáveis adotadas para
explicarem o voto. Nessa situação em particular o melhor modelo que se ajusta
é o modelo de regressão binária conhecido como Regressão Logística.

A regressão logística se originou em meados de 1960 para atender


demandas da área de medicina como método de previsão de fatores de risco
para a saúde cardíaca. Esse modelo tornou-se tão popular que se alastrou
para outras áreas do conhecimento e, principalmente, nas áreas
socioeconômicas.

No modelo de Regressão Logística a variável resposta ou variável


independente é uma probabilidade, ou seja, varia de 0 a 100%. Essa
probabilidade como resposta é estimada a partir de um conjunto amostral de
variáveis explicativas que podem ser métricas (quantitativas) ou não métricas
(qualitativas) e uma variável resposta binária ou dicotômica indicando do
parlamentar foi eleito ou não. Esse conjunto amostral compõe o histórico do
comportamento do eleitor frente às características do vereador.

. Assim, se o objetivo é estimar a probabilidade de um candidato a


vereador ser reeleito (variável resposta) a partir das suas características
específicas (variáveis explicativas) devemos estimar os parâmetros do modelo
a partir das informações obtidas do perfil dos candidatos reeleitos confrontados
com os que não foram reeleitos.

Pode-se equacionar o Modelo de Regressão Logística através da


expressão:

( )

Nessa expressão, indica a probabilidade de ocorrência do evento de


interesse (reeleição), ( ) representa o conjunto de variáveis
130

explicativas (perfil do candidato) e ( )o conjunto de parâmetros

(ou coeficientes) do modelo a serem estimados. O termo ( ) corresponde

ao logaritmo natural da razão entre a probabilidade de ser eleito e de não ser


eleito. Quando essa razão é menor do que 1, indica que a probabilidade de ser
eleito é menor do que não ser eleito. Caso o valor for superior a 1, a
probabilidade de ser eleito é maior do que não ser. Na estatística essa razão é
chamada de chance, ou seja, se a probabilidade de ser eleito, , é 80%, temos
que , o que indicaria que a chance de ser eleito é 4 vezes maior

do que não ser.

Uma das vantagens desse modelo está na possibilidade de se obter


essa razão a partir de uma transformação na expressão anterior assumindo a
forma a seguir:

( )

Além da vantagem de se obter a chance diretamente a partir do modelo,


existe a possibilidade de se comparar as chances obtidas para cada situação
através da razão entre elas. Essa razão é chamada de razão de chances, a
qual é de extrema importância para a análise dos resultados a partir dos
diversos estratos gerados pelas variáveis estudadas.

A estimativa dos parâmetros permite verificar quais atribuições do perfil


do candidato são estatisticamente significativas quanto a sua probabilidade de
reeleição.

Para uma melhor clareza, o modelo é reescrito a seguir considerando-se


as variáveis do estudo:

( )
131

Onde:

probabilidade do candidato ser reeleito;

parâmetro do termo constante;

parâmetros das variáveis explicativas;

RECEITA: variável explicativa relacionada com receita, em R$, obtida pelo


candidato e gasta na sua campanha;

CURRÍCULO: variável explicativa que aponta se o candidato possui


experiência prévia na política, no trabalho social ou sindical. Essa é do tipo
dicotômica, ou seja, somente pode assumir dois valores. No modelo essa
variável assume o valor 0 (zero), caso o parlamentar não possua experiência
prévia ou o valor 1 (um) caso possua alguma experiência.

EFICIÊNCIA: variável explicativa que quantifica a produção legislativa relevante


do candidato. Trata-se de uma variável contínua no intervalo entre zero e um.
Esse valor corresponde à razão entre o número de projetos relevantes e o
número total de projetos apresentados pelo candidato. Caso, por exemplo, o
candidato apresente o valor 0,3 então 30% dos seus projetos foram
considerados relevantes.

RECALL: Esta variável explicativa corresponde ao número de vezes em que o


nome do candidato foi citado na ferramenta de busca Google.

O próximo passo é determinar quais dessas variáveis explicativas eleitas


apresentam significância estatística, ou seja, apesar da intuição de que existe
uma correlação entre o volume de votos e a variável explicativa sob análise,
entretanto, não apresentam indícios estatísticos que corroboram a intuição.

Para seleção das variáveis explicativas com significância estatística, foi


utilizado, dentro do modelo de Regressão Logística, o método “Stepwise”, o
qual permite a avaliação de cada uma das variáveis quanto a sua significância
estatística, ou seja, a eliminação passo a passo daquelas variáveis não
132

representativas no modelo. O resultado da modelagem foi obtido através do


pacote estatístico de uso livre R-Software, sendo apresentado na tabela xxx a
seguir.

A tabela mostra que o método apresenta como resultado final três


variáveis significativas no nível de 5% de significância: a variável RECEITA,
com um p-valor de 0,2%, a variável EFICIÊNCIA, com p-valor de 4,5%, e a
variável RECALL, com um p-valor de 0,8%.

Tabela 30: Resultado do modelo de regressão logística usando o método


"Stepwise" do pacote estatístico R.

Passo Variável β e.p. Sig. Exp(β)


1 Receita 0,000 0,000 0,003 1,000
Currículo -0,029 0,414 0,945 0,972
Eficiência 1,952 0,975 0,045 7,040
Recall 0,000 0,000 0,008 1,000
Constante -1,982 0,813 0,015 0,138
2 Receita 0,000 0,000 0,002 1,000
Eficiência 1,945 0,969 0,045 6,992
Recall 0,000 0,000 0,008 1,000
Constante -2,002 0,760 0,008 0,135
Fonte: Elaborada pelo autor

Esse resultado mostra que a variável CURRÍCULO não apresentou


significância estatística para efeito da reeleição do candidato, entretanto, as
variáveis RECEITA, EFICIÊNCIA e RECALL apresentaram significância
estatística (medida pelo p-valor) considerando nível descritivo de 5%, ou seja,
são importantes para que o candidato seja reeleito.

Um resultado importante da análise está relacionado com o fato de que


a produção legislativa relevante do parlamentar é levada em consideração por
uma parcela do eleitorado. Isso mostra que parte do eleitorado dos grandes
centros urbanos não está totalmente alheia ao trabalho do parlamentar na
Câmara Municipal, considerando esse fator no momento do seu voto.

Quanto à variável RECEITA, já era de se esperar sua significância


estatística, pois está diretamente relacionada aos gastos do candidato com a
133

propaganda da sua candidatura. Tal estudo comparativo entre número de votos


obtidos e gasto com propaganda eleitoral já foi realizado em outras ocasiões,
demonstrando cabalmente a correlação entre voto e gasto. Um estudo sobre as
eleições para deputado federal em 2002 enfatizando os gastos dos candidatos
declarados no Tribunal Superior Eleitoral foi realizado por FIGUEIREDO
(2005). Nesse estudo pode constatar a correlação positiva entre o gasto e o
número de votos.

É importante enfatizar que foi demonstrado que a


quantidade de recursos (variável receita) possui correlação
positiva e significante com o número de votos obtidos. Ou seja,
quanto mais recursos são investidos nas campanhas, maior é o
número de votos recebidos por um determinado candidato
(FIGUEIREDO, 2005).

O gráfico da

Figura 20 mostra a relação entre os gastos de campanha e o número de votos


obtido pelo parlamentar nas eleições para vereador no Município de São Paulo
em 2008.

Figura 20: Eleições para vereador no Município de São Paulo. Relação entre receita
para fins de campanha e número de votos obtidos.
134

Fonte: TSE (2008).

Nesse gráfico foram destacados os candidatos eleitos, suplentes e não


eleitos dentro do universo de todos os candidatos. Nota-se claramente o
posicionamento dos eleitos na parte superior direita do gráfico, indicando que
quanto maior o gasto, maior o número de votos obtidos.

Outro resultado interessante é a acentuada significância estatística da


variável referente ao nível de lembrança “RECALL”, apresentando um p-valor
de 0,8%. Isso mostra que a exposição na mídia tem algum benefício para o
candidato, desde que não seja negativa.

A Figura 21 mostra a relação entre o nível de lembrança e o número de


votos com destaque para os candidatos reeleitos e não reeleitos. Observando o
gráfico pode-se constatar, visualmente, uma maior concentração de não
reeleitos entre aqueles com baixo nível de lembrança (abaixo de 50 mil). Para
um nível de lembrança acima de 100 mil, 90% dos candidatos foram reeleitos e
para um nível de lembrança abaixo de 50 mil a proporção cai para 53% de
reeleitos.

Na amostra encontra-se um candidato com alto nível de lembrança


(acima de 150 mil), entretanto, não foi reeleito. Provavelmente a lembrança não
135

seja positiva, causando perda de votos pelo candidato. Isso mostra que seria
necessário um maior aprofundamento na pesquisa, pois se adotando outras
metodologias de busca de citações, estratificando citações positivas (favoráveis
ao candidato) daquelas negativas (desfavoráveis ao candidato), é possível
melhorar a qualidade do modelo e encontrar resultados mais significativos.

Figura 21: Correlação entre o nível de lembrança ("Recall") e o número de


votos.

Fonte: Elaborado pelo autor.


136

Capítulo 5

O perfil do candidato e o comportamento do eleitor: eleições para


vereador no Estado de São Paulo em 2012.

Os capítulos 2 e 3 analisam o comportamento do eleitor considerando


características específicas do seu perfil. No capítulo 4 é feita uma inversão,
considerando-se o perfil do candidato que concorre à reeleição. Esse perfil
considera variáveis mais complexas e construídas pelo candidato ao longo da
sua atividade parlamentar.

Neste capítulo também será feita uma análise do perfil do candidato,


entretanto, são características mais comuns, tais como condição social ou
natural. São características que colocam o candidato como um cidadão
comum, tornando mais fácil o julgamento da população de eleitores. Assim,
diferentemente dos capítulos anteriores, a análise proposta busca mostrar
como o eleitor identifica os candidatos com base em características que podem
ser encontradas nesse mesmo eleitor.

Faremos agora uma análise exploratória do perfil dos candidatos a


vereador dos municípios do Estado de São Paulo e como esse perfil impacta
na decisão do eleitor. Foram analisados 72.263 candidatos a vereador, quanto
suas chances de serem eleitos, a partir dos atributos Gênero, Idade, Profissão,
Partido, Estado Civil e Escolaridade. Essas informações foram obtidas a partir
dos arquivos disponibilizados do Tribunal Superior Eleitoral (TSE) referentes a
todos os candidatos a vereador nos municípios do Estado de São Paulo nas
eleições de 2012.

Sempre que possível, a análise exploratória dos dados quanto à


eficiência dos candidatos é feita a partir da estratificação do atributo focado por
Gênero.
137

5.1 Partidos políticos e a participação da mulher

Inicialmente é analisada a eficiência dos Partidos, ou seja, de todos os


candidatos que concorrem à eleição, quantos efetivamente foram eleitos. O
gráfico da figura 19 mostra a eficiência dos Partidos estratificados por Gênero.
Partidos que não elegeram vereador não aparecem no gráfico.

Figura 22: Eficiência das candidaturas por partido e por gênero.

Fonte: TSE (2012)

A primeira a ser notada no gráfico é a baixa eficiência das mulheres no


processo eleitoral. Dentro dos Partidos de alta eficiência, tais como PSDB,
138

PSD, DEM e PMDB, todos com taxa de eficiência acima de 16% para os
candidatos masculinos, as taxas de eficiência das mulheres se mantêm na
faixa de 5%, ou seja, menos que a terça parte da eficiência dos homens. Pode-
se imaginar que isso se deve a uma desproporção entre candidatos do sexo
masculino e feminino, entretanto isso não ocorre. Em média 47,8% dos
candidatos são do sexo feminino, tendo como extremos o PPS, com 44,3% de
mulheres candidatas e o PSOL, com 52,9% de candidatas. Uma análise
detalhada desses resultados permite concluir que boa parte do contingente de
candidatas apenas preenche o quociente exigido por lei, não lhe sendo
oferecidas condições reais para disputa do cargo.

Uma forma de apresentar a posição de cada partido quanto à


oportunidade de competição dada às mulheres pode ser visualizada na figura
20. A figura mostra os partidos posicionados em quatro quadrantes onde cada
quadrante representa a intensidade da participação das mulheres no partido
através da proporção de candidatas e a intensidade da eficiência.

Figura 23: Mapa de percepção. Percentual de participação da mulher e eficiência.

Eficiência

Participação
139

Fonte: TSE (2008). Elaborado pelo autor.

Assim, partidos localizados no quadrante “Alta Participação/Alta


Eficiência” mostra que estes apresentam proporção de candidatas a vereador
acima da média e também eficiência acima da média. A pior situação é “Baixa
Participação/Baixa eficiência” e nesse caso os partidos oferecem participação
de candidatas abaixo da média e também apresentam baixo desempenho
dessas candidatas.

Apresentam melhor eficiência o PT do B e PRTB e, além disso, apenas


perdem para o PSOL em termos de proporção de candidatas.

A tabela 20 mostra a evolução do número de vereadoras eleitas no


Brasil no período 1992 a 2012. De 1992 para 1996 houve um crescimento
expressivo de 65% no número de mulheres eleitas. Grande parte desse
crescimento pode ser explicado pela mudança na legislação eleitoral, a qual
estabeleceu cotas de mulheres nas listas partidárias para as eleições.

Tabela 31: Número de vereadoras eleitas no Brasil no período 1996 a 2012.

Ano Número de Eleitas Variação

1992 3.952 -
1996 6.536 65,4%
2000 7.001 7,1%
2004 6.555 -6,4%
2008 6.504 -0,8%
2012 7.648 17,6%
Fonte: TSE (2012).

A primeira lei (9.100/95) estabelecia 20% de mulheres nas listas


partidárias para as eleições do ano de 1996. Em 1997 foi votada a lei
eleitoral no 9.504, que aumentou o percentual para 30% a partir do ano
2000, estabelecendo o percentual intermediário de 25% para as
eleições de 1998. A existência da lei não mudou substancialmente a
participação das mulheres, mas provocou movimentos no sentido de
140

trazer as mulheres para dentro dos partidos e instrumentalizá-las para a


vida política: são muitos os diretórios partidários em todo o Brasil que
promovem cursos para mulheres candidatas a cargos eletivos (ALVES,
2012).

Nos anos eleitorais seguintes praticamente não ocorreu alteração,


com um percentual de mulheres eleitas oscilando entre 11% e 13%,
segundo dados do TSE. Um salto maior ocorreu de 2008 para 2012 e,
novamente, parte desse crescimento se deve a mudança na legislação

Um dos fatores que explicam o aumento do número de vereadoras


eleitas foi a mudança da política de cotas. A Lei 12.034, de 29/09/2009,
substituiu a palavra reservar por preencher [...] A alteração pode
parecer pequena, mas a mudança do verbo "reservar" para "preencher"
significou uma mudança no sentido de forçar os partidos a darem
maiores oportunidades para as mulheres. O ideal é que fosse garantida
a paridade de gênero (50% para cada sexo) nas listas de candidaturas.
Mas diante do baixo número de mulheres candidatas, a mudança da Lei
em vigor já representou um avanço, mesmo que limitado.

O novo cenário construído pela legislação eleitoral permite uma maior


participação da mulher no mundo político, mas isso não significa que a
participação efetiva por meio de cargos políticos ou mandatos foi
automaticamente garantida.

Uma relação interessante se inverte: se antes as mulheres eram


barradas nas listas partidárias, agora os partidos buscam mulheres para
compô-las. Isso, entretanto, não garantiu qualquer condição de disputa
real por cargos eletivos.

Se, por um lado, a presença de mulheres pode ter apenas o intuito de


tentar cumprir a lei eleitoral, por outro, a resistência das mulheres em
entrar na arena política também é responsável pelo seu pequeno
número (PINTO, 2001).
141

A situação do Estado de São Paulo, quanto à proporção de mulheres,


pode ser considerada favorável às mulheres quando comparada ao resto do
País. Muitos partidos acabam por não cumprir a proporção mínima de 30% de
mulheres candidatas em várias regiões do Brasil. Mas é importante notar que o
fato da proporção ser respeitada não permite avaliar que se está fazendo
justiça quanto a participação política da mulher, pois o baixo nível de eficiência
obtido mostra que apenas fazem número, não sendo encaradas com seriedade
pelos partidos. A politização da mulher de forma independente é caso raro, pois
muitas que estão envolvidas na política entraram através da indicação dos pais
ou maridos que já são políticos. Para que essa situação de baixa eficiência se
reverta, será necessário que os partidos encarem com seriedade o papel da
mulher na política, respeitando o seu espaço sem preconceitos e a tratando
politicamente, como igual.

A baixa participação feminina na política não corresponde ao papel que


as mulheres desempenham em outros campos de atividade. Elas são
maioria da população, maioria do eleitorado, já ultrapassaram os
homens em todos os níveis de educação e possuem uma esperança de
vida mais elevada. As mulheres compõem a maior parte da População
Economicamente Ativa (PEA) com mais de 11 anos de estudo e são
maioria dos beneficiários da Previdência Social. Nas duas últimas
Olimpíadas (Pequim e Londres) as mulheres brasileiras conquistaram
duas das tres medalhas de Ouro. Portanto, a exclusão feminina da
política é a última fronteira a ser revertida, sendo que o déficit político de
gênero em nível municipal não faz justiça à contribuição que as
mulheres dão à sociedade brasileira (ALVES, 2012).

5.2 As profissões e os candidatos

A figura 22 mostra o percentual de candidatos eleitos, considerando


suas profissões, na eleição de 2012 para vereador no Estado de São Paulo. A
profissão declarada pelos candidatos nos dados do TSE e com melhor
desempenho é a de vereador. O motivo óbvio para esse desempenho, quase
142

56% de eficiência, é a vasta experiência e poder político do candidato para


angariar votos. Esse cenário já foi analisado anteriormente e não retomaremos
o assunto. Algo que impressiona é a profissão de farmacêutico, que ocupa a
segunda posição com 28,2% de eficiência. Nas eleições para vereador de 2012
nos Municípios Paulistas, concorreram 156 farmacêuticos, sendo eleitos 44
candidatos. Parte desse sucesso pode ser atribuída ao apoio explícito dos
Conselhos Regionais de Farmácia (CRF) aos candidatos da categoria em
2012. Outra provável grande vantagem dessa profissão é a sua atividade nas
farmácias, atendendo os consumidores de medicamentos, orientando e
aconselhando o bom uso dos medicamentos receitados pelos médicos. Tal
relacionamento estreito com o consumidor permite criar um laço afetivo na
região em que atua, estabelecendo relações sociais estreitas com aqueles
carentes de atenção, principalmente os idosos. Não seria surpresa se uma
pesquisa de intenção de voto indicasse como principais eleitores desse tipo de
profissional as pessoas com idade mais avançada. A mesma explicação pode
ser estendida para o quarto colocado, praticamente empatado com o terceiro, a
profissão de médico, com 24,2% de eficiência. Quanto ao terceiro colocado, o
pecuarista, dos 188 candidatos, 44 foram eleitos, uma eficiência de 24,5%,
uma possível explicação para esse desempenho está no fato que a maioria dos
candidatos está nas cidades do interior, onde a atividade pecuarista apresenta
peso relevante na economia.

No quesito quantidade de candidaturas, a profissão vencedora é a de


Servidor Público Municipal, com 6.869 candidatos e 879 eleitos, uma eficiência
de 12,8%. A seguir têm-se os comerciantes, com 6.165 candidatos e 590
eleitos, eficiência de 9,6%.

Figura 24: Percentual de candidatos eleitor estratificado por profissão.


143

Fonte: TSE (2012)

5.3 Candidatos: escolaridade, estado civil e faixa etária.

Escolaridade

No quesito escolaridade, a figura 22 mostra que entre os candidatos do


sexo feminino a escolaridade influência no seu desempenho de forma
crescente mais discreta até o nível de escolaridade superior incompleto,
apresentando um salto significativo quando a candidata possui nível superior,
saltando de 2,8% para 6,54%.
144

Figura 25: Percentual de candidatos eleitos estratificados por gênero e


escolaridade.

Fonte: TSE (2012)

Quanto ao candidato do sexo masculino, o desempenho também


aumenta de forma gradual e discreta até o nível de escolaridade ensino médio
completo. No nível superior incompleto dá um salto de 11,8% para 18,5% de
eficiência, entretanto, no nível superior volta a cair para os mesmos níveis do
ensino médio. É possível afirmar que a influência do nível superior no
desempenho é mais proeminente na candidata do que no candidato. Chama a
atenção o fato do candidato do sexo masculino apresentar melhor desempenho
no nível de escolaridade superior incompleto. Uma possível explicação para
esse fato seria resultado de candidatos reeleitos, os quais adotam a política
como profissão, optando por não concluir o nível superior enquanto investido
no cargo.
145

Estado Civil

Candidatos casados do sexo masculino apresentam a maior eficiência


nas categorias de estado civil (casado, divorciado, separado judicialmente,
solteiro e viúvo), como pode ser observado na figura 23, com destaque de
13,5% de eficiência na categoria casado, apresentando o triplo das mulheres
casadas, as quais apresentam 4,4% de eficiência. O restante das categorias
apresentam eficiências similares na estratificação por sexo.

Figura 26: Desempenho dos candidatos estratificados por estado civil e gênero.

Fonte: TSE (2012)

O eleitor, aparentemente, vê com bons olhos o político casado,


imaginando-o como um indivíduo equilibrado, respeitoso dos valores morais e
da família.

Faixa Etária

A faixa etária compreendida entre 30 e 60 anos corresponde à aquela


que apresenta maior eficiência, próximo de 13% para os candidatos
masculinos e 3,7% para as candidatas. As gerações mais jovens
146

apresentam menor eficiência, a qual pode estar vinculada a uma quantidade


menor de recursos políticos (capital político).

O capital político é, em grande medida, uma espécie de


capital simbólico: o reconhecimento da legitimidade daquele
indivíduo para agir na política. Ele baseia-se em porções de
capital cultural (treinamento cognitivo para a ação política),
capital social (redes de relações estabelecidas) e capital
econômico (que dispõe do ócio necessário à prática política).
Como toda forma de capital, o capital político está
desigualmente distribuído na sociedade (MIGUEL, 2003).

Situações como esta foram constatadas em pesquisas anteriores, como


a realizada no Estado do Paraná para o cargo de deputado estadual.

Em todos os modelos, a variável “Idade” tem uma


importância reduzida para a formação dos eixos (com exceção
de 1998). Entretanto, a distribuição das modalidades dessa
variável dá, ainda assim, uma informação interessante sobre as
diferenças etárias correspondentes a cada perfil. Em todos os
modelos, há uma oposição entre a modalidade de candidatos
com até 30 anos e outras faixas etárias (31-40, 41-50, 51-60 e
mais de 60).

Nos quatro modelos, a modalidade “até 30 anos” se localiza,


considerando o primeiro eixo, do lado que representa o perfil
de performance eleitoral sem sucesso. Assim, é possível notar
como o insucesso eleitoral nas candidaturas a deputado
estadual no sul estão associadas a essa faixa etária mais
jovem. [...] A eleição para deputado estadual já exigiria uma
quantidade mediana de recursos políticos que as geração mais
jovens ainda não tiveram tempo de conquistar. (RESENDE e
CANTU, 2009)
147

Para a faixa etária acima dos 60 anos, a eficiência diminui, o que pode
indicar, como parte da explicação, uma ruptura do eleitorado com a velha
guarda de políticos objetivando uma renovação dos seus representantes.

Figura 27: Desempenho dos candidatos estratificados por faixa etária e gênero.

Fonte: TSE (2012)

5.4 Modelagem Estatística do Perfil do Candidato e a Escolha do Eleitor

As diversas características dos candidatos, estudadas uma a uma, trás


poucas informações, exigindo uma maneira de se observar conjuntamente
essas características e como interagem.
148

Para atender essa necessidade, foram buscadas as informações dos


candidatos junto ao Tribunal Superior Eleitoral (TSE) relacionadas ao gênero,
faixa etária e escolaridade.

A partir dessas informações, foi construída a tabela 21, tratando-se de uma


tabela de contingência apresentando o número de candidatos em cada
conjunto de atribuições, ou seja, para o conjunto Gênero, Idade, Escolaridade e
se Eleito ou não.

Tabela 32: Perfil dos candidatos a vereador no Estado de São Paulo. Gênero,
idade e escolaridade.

Escolaridade
Fundamental (1) Médio (2) Superior (3)
Gênero Idade Eleito Total Eleito Total Eleito Total
(anos)
Feminino <30 (1) 3 341 22 1420 26 670
30-44 (2) 28 2061 105 3984 188 2635
45-59 (3) 60 3104 125 3747 177 3046
>60 (4) 18 1007 13 626 29 706
masculino <30 (1) 33 534 174 2098 203 1166
30-44 (2) 501 5106 1087 8660 1001 5021
45-59 (3) 853 8153 933 7788 817 5033
>60 (4) 212 2629 121 1361 175 1367
Fonte: TSE (2012). Elaborado pelo autor.

Os dados referentes à distribuição dos candidatos a vereador nos


Municípios do Estado de São Paulo, eleições 2012, apresentados na tabela 21,
estão na seguinte ordem: número de candidatos eleitos, número total de
candidatos (eleitos e não eleitos), Escolaridade (1: Fundamental, 2: Médio, 3:
Superior), Idade em anos (1: menor do que 30, 2: 30 a 44, 3: 45 a 59, 4: mais
de 60) e o Gênero (1: Feminino, 2: masculino). Supõe-se que a distribuição do
número de candidatos eleitos tenha distribuição binomial. Essa suposição é
imprescindível para a validade do modelo estatístico adotado. O modelo
estatístico proposto para explicar a proporção de eleitos é o Logístico-Linear, o
149

qual se passa a descrever. A descrição utilizada busca utilizar uma notação


que ajuda compreender o código de programação utilizado, o qual é
apresentado nos anexos.

Seja o número total de candidatos que concorrem ao cargo de


vereador no nível de A (Gênero), de B (Idade) e de C (Escolaridade).

Considere o número de candidatos eleitos no nível de A, de B e


de C então, conforme suposto, onde é a probabilidade
dos candidatos no nível de A, de B e de C serem eleitos onde: Gênero
(A), 1: Feminino, 2: masculino; Idade (B), 1: <30, 2: 30 a 44, 3: 45 a 59; 4:
>60; Escolaridade (C), 1: Fundamental, 2: Médio, 3: Superior.

Assim o modelo Logístico-Linear com interação até 1ª ordem é dado por:

{ } onde temos: efeito

comum, efeito da variável Gênero, efeito da variável Idade e efeito da


variável Escolaridade.

As estimativas dos parâmetros serão obtidas utilizando-se o modelo de


caselas de referência onde , e .

Dessa forma pode-se construir o esquema da tabela 22 para os efeitos


assumidos no modelo.

Tabela 33: Esquema notacional para o modelo logístico-linear, com interação


até primeira ordem, transcrito em uma tabela de contingência.
Escolaridade
Gênero Idade Fundamental (1) Médio (2) Superior (3)
<30 (1) + +
30-44 (2) + + +
FEM(1)
45-59 (3) + + +
>60 (4) + + +
<30 (1) + +
30-44 (2) + +
MAS(2)
45-59 (3) + +
>60 (4) + +
Fonte: Elaborada pelo autor
150

A casela de referência é a célula com o efeito comum representada


pelo nível 1 de Gênero (Feminino), nível 1 de Idade (<30 anos), nível 1 de
Escolaridade (Fundamental). A partir dessa casela os efeitos são somados à
medida que se caminha pelas células. É importante comentar que o valor dos
parâmetros pode ser positivo ou negativo, ou seja, o efeito tanto pode contribuir
para aumentar a probabilidade de o candidato ser eleito como para diminuir
essa probabilidade.

O processo de obtenção das estimativas de máxima verossimilhança


dos parâmetros exige iteração (algoritmo de convergência), já que não é
possível chegar-se numa forma fechada para as estimativas, tal como ocorre
no modelo normal linear tradicional.

Dessa forma, utiliza-se o pacote R-Software para o ajuste do modelo.


Todos os códigos utilizados para a obtenção dos resultados estão nos anexos.

O resultado do ajuste é mostrado na tabela 23 onde é possível visualizar


os parâmetros estimados e as respectivas significâncias estatísticas.

Os ajustes dos efeitos principais (sem interação) foram significativos.


Quanto às interações de primeira ordem, alguns efeitos foram significativos,
demonstrando a necessidade do ajuste do modelo considerando essas
interações. A interação entre Escolaridade e Idade apresentou significância
para os efeitos conjugados do nível 3 de Escolaridade (Superior) e Idade 3 (45
a 59 anos), para o nível 3 de Escolaridade (Superior) e Idade 4 (> 60 anos). A
interação entre Idade e Gênero apresentou significância estatística para os
efeitos conjugados de Idade 3 (45 a 59 anos) e Gênero 2 (Masculino), para
Idade 4 (> 60 anos) e Gênero 2 (Masculino). Os efeitos conjugados de
Escolaridade e Gênero apresentaram significância para Escolaridade 2 (Médio)
e Gênero 2 (Masculino), para Escolaridade 3 (Superior) e Gênero 2
(Masculino).

A existência de interação indica que a ação simultânea de dois efeitos


não é simplesmente a soma deles. Na interação ocorre uma potencializarão
151

dos efeitos, quando o resultado é maior que a soma dos efeitos, ou uma
redução, quando o resultado é menor que a soma desses efeitos.

Tabela 34: Coeficientes estimados sob o modelo logístico-linear com interação


de primeira ordem.

Fonte: Elaborado pelo autor

Em todos os casos de interação o resultado foi inferior à soma dos


efeitos. Tem-se como exemplo a interação do nível Superior com a Idade 45 a
59 anos e nível Superior com a Idade > 60 anos. Nesses dois casos de
interação o efeito do candidato possuir nível superior não se soma ao efeito da
Idade, resultando num valor inferior. Assim, caso não houvesse a interação, a
probabilidade estimada de eleição seria ainda maior. A mesma explicação pode
ser estendida às outras interações significativas encontradas.

Por outro lado, algumas mostraram não ser significativas, tais como a
interação entre o nível 2 de escolaridade (Médio) e o nível 2 de Idade ( 30 a 44
anos).
152

Para uma melhor interpretação dos dados, é construída a tabela 24 com


os valores calculados para em cada casela, ou seja, a chance de ser

eleito.

Tabela 35: Chances de ser eleito estratificadas por gênero, idade e


escolaridade.

Escolaridade
Gênero Idade FUND (1) MÉDIO (2) SUP (3)
<30 (1) 0,00734 0,01417 0,04471
30-44 (2) 0,01562 0,02908 0,07189
FEM (1)
45-59 (3) 0,01978 0,03274 0,06393
>60 (4) 0,01473 0,02255 0,04683
<30 (1) 0,06696 0,09166 0,20745
30-44 (2) 0,10790 0,14239 0,25252
MAS (2)
45-59 (3) 0,11682 0,13713 0,19208
>60 (4) 0,08924 0,09687 0,14433

Fonte: Elaborado pelo autor

[ ]
para ; ; e

A grande vantagem dessa tabela está relacionada ao fato de ser


possível comparar os diversos estratos quanto às chances de eleições através
do cálculo das razões de chances.

Inicialmente é analisada a situação das candidatas na faixa etária abaixo


dos 30 anos. A chance de uma candidata (i=1) com menos de 30 anos (j=1) e
do nível fundamental (k=1) é de 0,00734, ou seja, o resultado da razão entre a
probabilidade de ser eleita e a probabilidade de não ser eleita. Em termos de
chances, uma candidata com idade abaixo de 30 anos e com nível superior
apresenta uma chance de ser eleita de 0,04471. Fazendo-se uma comparação
com a candidata de nível fundamental, com chance de 0,00734, mostra que a
de nível superior tem 6,09 mais chances de ser eleita do que a de nível
153

fundamental. Para obter esse resultado, basta encontrar a razão de chances


entre as candidatas, ou seja, calcular 0,04471/0,00734 = 6,09. O grande
abismo, entretanto, pode ser encontrado quando se compara as chances de
um candidato masculino, idade entre 30 e 44 anos e do nível superior com uma
candidata de idade inferior a 30 anos e do nível fundamental. A razão de
chances para esse caso é de 0,25252/0,00734 = 34,4, ou seja, as chances do
candidato ser eleito é aproximadamente 34 vezes maior do que a candidata.

Para ilustrar o distanciamento existente entre os gêneros, o perfil mais


favorável para uma candidata é aquele na qual sua idade está entre 30 e 44
anos com nível superior, apresentando uma chance de 0,07189. Esse
resultado é muito próximo do pior perfil do candidato masculino, com idade
abaixo dos 30 anos e nível fundamental, apresentando uma chance de
0,06696. Assim, a melhor situação de uma candidata corresponde ao pior
desempenho de um candidato.

Tomando-se uma candidata e um candidato com idade inferior a 30 anos


e nível fundamental, o candidato tem 9,12 vezes mais chance de ser eleito do
que a candidata.

As candidatas nas faixas etárias acima dos 30 anos apresentam um


melhor desempenho. De modo geral, candidatas com nível médio têm 50%
mais chance de ser eleita do que as de nível fundamental e as de nível
superior, 3 vezes mais chance do que a de nível fundamental. A vantagem da
candidata de nível superior quando comparada com a de nível médio é de
aproximadamente 2 vezes mais chance.

Pode-se converter a chance numa probabilidade isolando-se, no caso de


uma candidata (i=1) abaixo dos 30 anos (j=1) e nível fundamental (k=1),
(probabilidade de ser eleita) na expressão fornecendo

. Assim, uma candidata com idade inferior a 30 anos e do


nível fundamental tem uma probabilidade de 0,7% de ser eleita. Fazendo-se o
mesmo procedimento para uma candidata com as mesmas características
154

exceto por ter nível superior, a sua probabilidade de ser eleita sobe para 4,3%.
Repetindo-se o procedimento para todas as células, obtém-se a tabela 25, a
qual apresenta as probabilidades de ser eleito para as combinações de
características.

Essa tabela apresenta um forte apelo ilustrativo, pois destaca


visualmente as probabilidades de um candidato ser eleito a partir da
combinação de suas características. Quanto menor a probabilidade de ser
eleito, mais clara é a célula e quanto maior a probabilidade, mais escura a
célula. Nota-se, portanto, que candidatos do sexo masculino, idade entre 30 e
44 anos e nível superior são os que mais se destacam nas eleições, com
20,2% de probabilidade de ser eleito.

Tabela 36: Probabilidade de o candidato ser eleito estratificado por gênero,


idade e escolaridade.

Escolaridade
Gênero Idade FUND (1) MÉDIO (2) SUP (3)
<30 (1) 0,7% 1,4% 4,3%
30-44 (2) 1,5% 2,8% 6,7%
FEM (1)
45-59 (3) 1,9% 3,2% 6,0%
>60 (4) 1,5% 2,2% 4,5%
<30 (1) 6,3% 8,4% 17,2%
30-44 (2) 9,7% 12,5% 20,2%
MAS (2)
45-59 (3) 10,5% 12,1% 16,1%
>60 (4) 8,2% 8,8% 12,6%
Fonte: Elaborado pelo autor
155

Considerações Finais

O uso dos métodos quantitativos nas ciências sociais esbarra em um


ponto de difícil controle, a ação da flecha do tempo. Segundo a teoria mais
aceita atualmente, o universo teve início a partir de uma diminuta região
conhecida como singularidade. Por motivos ainda desconhecidos, ou seja,
fogem da explicação científica, essa singularidade, surgida a partir do nada
onde não existiam tempo e espaço, sofreu uma grande explosão, conhecida
como “big-bang”, e a partir dessa explosão a singularidade passou a se
expandir de modo inflacionário, criando o universo. Segundo essa mesma
teoria, o universo continua em expansão e de forma acelerada, ou seja, cada
vez mais rápido.

Essa expansão ocorre segundo um princípio que parte da organização


para a desorganização ou, a rigor, aumento constante da desorganização
conhecida como entropia nas leis de termodinâmica.

O crescimento da entropia designa, pois, a direção do


futuro, quer no nível de um sistema local, quer no nível do
universo como um todo (PRIGOGINE, 1996).

Assim, a flecha do tempo está associada à irreversibilidade.

A entropia é o elemento essencial introduzido na


termodinâmica, a ciência dos processos irreversíveis, ou seja,
orientados no tempo (PRIGOGINE, 1996).

O tempo, nessa interpretação de Prigogine, não é nada mais do que a


ação constante de um processo irreversível dado pela constante expansão do
universo, criando a sensação de há uma ordem cronológica na natureza,
quando na verdade tudo não passa de uma mera ilusão.

O pensamento é sequencial, sucessivo e unidimensional, ao


mesmo tempo em que o mundo real se apresenta como um
padrão multidimensional, não sucessivo e simultâneo, de
riqueza e variedade infinitas; e tentar que um compreenda o
156

outro é o mesmo que tentar apreciar uma bonita paisagem


olhando através de uma estreita fenda numa cerca ou tentar
contemplar um quadro de Renoir por um microscópio (WILBER,
2007).

Existem tantas variáveis determinantes do tempo que este se torna


único e exclusivo para cada consciência que o interpreta.

Em verdade, toda a noção da sucessão, de uma “coisa” que


sucede a outra “coisa” no tempo, depende diretamente dos
nossos processos de memória, pois é óbvio que, sem memória,
não teríamos nenhuma ideia do tempo, quer do passado quer
do futuro. Trata-se, portanto, de saber se a memória nos
informa a respeito de um fenômeno real, a que damos o nome
de “tempo”, ou se a memória cria uma ilusão de tempo
(WILBER, 2007).

É este o divisor das águas. A consciência de alguma forma se destaca


do processo de irreversibilidade, a qual a natureza está submetida, devido ao
seu poder de criação dos momentos virtuais por meio da memória. Esse
mesmo tempo coaduna-se com a memória, agindo no sentido de causar
mudanças, mas com uma grande diferença, pelo menos em termos de
comportamento e expressão do pensamento, é possível a reversibilidade.

A sondagem dessas consciências por meio de análises quantitativas


implica em sérias restrições nas informações e respectivas interpretações. Uma
taça de cristal cai sobre o piso e se estilhaça em inúmeros pedaços. É um
processo irreversível, pois jamais será possível recompor a taça original, átomo
por átomo; o máximo que se poderia obter é uma taça muito parecida com a
original. Isso não ocorre na manifestação da consciência.

Nesse contexto pode surgir uma pergunta: se a entropia somente


aumenta no universo então por que a natureza permitiu o surgimento de
organismos tão organizados como os seres vivos? A resposta está na segunda
lei da termodinâmica, a qual afirma que a entropia aumenta o fica constante em
157

um sistema isolado, ou seja, não ocorre troca de energia com o meio. Esse não
é o caso dos organismos vivos, os quais interagem com o meio, buscando
energia para se organizar e manterem essa organização até os limites
permitidos pela sua natureza, afinal a morte é considerada, por enquanto, a
realidade final de qualquer organismo vivo, a menos que possibilidades
metafísicas sejam consideradas. Entretanto, possibilidades metafísicas não são
passíveis de medições, coleta controlada de dados e comprovação por meios
empíricos, afastando-a da pesquisa científica clássica.

A consciência pode escapar da irreversibilidade quando se leva em


conta que os processos mentais estão à margem da segunda lei da
termodinâmica, ou seja, pode mudar de estado e depois retornar a esse
mesmo estado (processo reversível), perfazendo um caminho cíclico (Figura
28). Isso torna ainda mais difícil fazer previsões do estado dessa consciência
no tempo.

Figura 28: Ciclo de estados da consciência

Estado
1

Estado Estado
n 2
CONSCIÊNCIA

Estado Estado
4 3

Fonte: Elaborado pelo autor.

A principal utilidade dos métodos quantitativos nas ciências sociais está


relacionada à identificação de estados sociais tais como cultural, econômico,
religioso, etc. e como esses estados se relacionam entre si. Estados
158

comportamentais, reflexos de uma consciência coletiva, apresentam uma maior


dificuldade de modelagem.

A exploração e a análise de informações de estados sociais estão


vinculados, principalmente, a dados demográficos e a indicadores sociais.
Estatísticas nessa área tendem a ser mais comportadas no tempo, sendo
possível realizar previsões e projeções mais confiáveis. De qualquer maneira
também não estão imunes a fraturas bruscas, que alteram repentinamente
esses estados. Tais fraturas ocorrem a partir de eventos sociais drásticos e
imprevisíveis, tais como crises econômicas, políticas e conflitos armados. É
patente a relação dessas fraturas com o estado de consciência coletiva.

Quando o objeto de análise é o comportamento social, ou seja,


quantificar o estado da consciência coletiva, as dificuldades aumentam,
tornando a modelagem instável devido a sua sensibilidade à ação da flecha do
tempo. A manifestação da consciência coletiva é guiada por acontecimentos
temporais que modificam, por exemplo, opiniões, as quais, diferentemente dos
processos irreversíveis, podem até retornar a um estado anterior.

Se a sondagem diz respeito às opiniões ao longo de um processo


eleitoral, os modelos quantitativos precisam ser continuamente revistos, pois o
impacto de novos acontecimentos muda drasticamente a consciência coletiva.

Importante destacar que os impactos dos acontecimentos não ocorrem


de maneira homogênea nos estratos sociais aos quais os eleitores pertencem.
Esses estratos, quando corretamente delineados dentro dos campos
respectivos, podem, utilizando-se modelagem adequada, mostrar de que forma
o impacto dos acontecimentos é absorvido por cada um deles.

A ação da flecha do tempo pode ser incorporada em modelo estatístico


e, como a portadora da constante evolução da entropia do universo, pode
apontar tendências ou servir como contraste na identificação de variáveis
latentes, as quais passariam despercebidas em uma sondagem estática. Uma
única foto de um objeto não permite dizer se está parado ou em movimento.
159

Quando são obtidas várias fotos (o tempo agindo) e desde que haja
informações nas fotos que permitam criar um modelo posicional para o objeto,
pode-se inferir se está em movimento e até dizer com que velocidade. Nesse
exemplo a velocidade é uma variável latente que não pode ser observada
diretamente, mas é possível determina-la a partir de outras informações
conhecidas e informadas pelos efeitos carregados pela flecha do tempo.

Figura 29: Ação da flecha do tempo

Candidato A • 80% Religião A


45% • 20% Religião B

Candidato B • 60% Religião A


DATA 1
45% • 40% Religião B

FLECHA DO TEMPO
Não Sabe • 60% Religião A
10% • 40% Religião B

Candidato A • 85% Religião A


48% • 15% Religião B

Candidato B • 55% Religião A


DATA 2
42% • 45% Religião B

Não Sabe • 70% Religião A


10% • 30% Religião B

Fonte: Elaborado pelo autor.

A Figura 29 mostra um exemplo da ação do tempo no processo eleitoral.


Nela é possível observar que a proporção de eleitores para os candidatos
mudou entre duas datas pesquisadas, indicando uma ligeira vantagem para o
160

candidato A. Provavelmente há uma tendência e o candidato A poderá, numa


próxima sondagem, ter maior proporção de votos. Entretanto, a proporção de
indecisos não mudou, mas a proporção dos estratos religiosos sofreu alteração
entre os indecisos e candidatos. A modelagem estatística se faz
particularmente importante nessas situações, pois muitos desses indecisos
terminarão decidindo seu voto e é possível modelar como esses votos migrarão
para cada candidato.

Esse tipo de abordagem específica foi utilizado no capítulo 3, entretanto,


ele se repete, usando-se outras formas de modelagem adaptadas aos
interesses apresentados nos capítulos 2, 4 e 5.

No capítulo 2 buscou-se delinear o comportamento do eleitor


paulistano na eleição para prefeito da cidade em 2008. Para atingir esse
delineamento, foram utilizadas técnicas de análise estatística nos principais
campos da sociedade, proporcionando uma visualização de como esses
campos se relacionam, através dos eleitores neles inseridos, com o processo
eleitoral na figura dos candidatos e as preferências dos eleitores.

A análise estatística mostrou que os campos apresentam relação com o


processo eleitoral, permitindo avaliar sua influência no resultado do processo
eleitoral.

A análise e modelagem dos campos, tais como conceituados por Pierre


Bourdieu, é possível quando se leva em consideração a dinâmica desses
campos. Tais modelagens, entretanto, são limitadas pelo fluxo temporal, o qual
permite a ação de fatores imprevisíveis, não probabilísticos, os quais podem
alterar totalmente as previsões traçadas pelo modelo adotado.

A maior contribuição que se pode atribuir a esse capítulo é a


possibilidade de se vislumbrar o estudo dos campos de forma qualitativa
através da modelagem dos estados e de forma quantitativa no momento em
que se avalia o montante do fluxo dos agentes entre os estados na seta do
161

tempo. Esses modelos trariam previsões que podem funcionar razoavelmente


para avaliar a dinâmica dos campos em períodos curtos.

A abordagem feita no capítulo 3 permite modelar o comportamento do


eleitor indeciso nas eleições para prefeito da Cidade de São Paulo em 2008. A
modelagem mostra que é possível identificar padrões de comportamento de
eleitores que não revelaram o seu voto, entretanto foi possível colher algumas
informações do perfil desses eleitores indecisos. A partir desse perfil, foram
criados modelos estatísticos que incorporam as informações conhecidas e a
partir dessas informações inferir qual seria o candidato mais provável do eleitor
indeciso. Assim, o perfil do eleitor poderia revelar em qual candidato estaria
mais propenso a votar.

Esses modelos estatísticos consideram diversos níveis de conhecimento


de informação dos eleitores e, para atender os objetivos propostos no capítulo,
optou-se pela utilização do modelo de censura, ou seja, de falta de
informações, que considera um padrão de perda de informações que pode ser
explicado não só pelas variáveis conhecidas, mas também pela variável
desconhecida. Tal modelo considera um mecanismo de censura não-ignorável
(NMAR).

A abordagem para o mecanismo de censura não-ignorável


mostrou claramente a importância da escolha do mecanismo de censura que
inclua as observações incompletas. A adoção de um modelo NMAR para as
eleições apresentou resultados mais próximos do valor final (votos válidos
divulgados pela Justiça Eleitoral) se comparado com o resultado das pesquisas
descartando-se os votos indefinidos ou adotando-se o modelo de censura
ignorável.

Uma pergunta importante seria como eleger o modelo de censura


adequado. Os modelos ignorável e não-ignorável não são encaixados; cada um
deles se apresenta de forma independente para explicar os dados, ou seja,
representam, individualmente, o modelo saturado não implicando, portanto, da
162

simplificação de um o qual gera outro. Provavelmente existem outros fatores


que podem levar a uma escolha adequada do modelo de censura. Alguns
desses fatores podem ser oferecidos pelo pesquisador, maior conhecedor do
provável comportamento do fenômeno, outros por algum método de análise de
sensibilidade. O desenvolvimento dessa análise de sensibilidade será tema de
um trabalho futuro.

O perfil do candidato à reeleição é o tema do capítulo 4. A partir do


resultado das eleições para vereador nas cidades de São Paulo, Rio de
Janeiro, Belo Horizonte, Porto Alegre e Recife em 2008 e o levantamento de
informações dos vereadores candidatos à reeleição, foi possível modelar quais
dessas informações, adotadas como perfil do candidato, são relevantes para a
sua reeleição. Foram consideradas como variáveis explicadas da reeleição a
receita declarada pelo candidato para fins de campanha, o seu currículo
relacionado a sua experiência prévia na política, no trabalho social ou sindical,
a sua eficiência como parlamentar, medida a partir da sua produção de projetos
relevantes apresentados e o nível de lembrança que o eleitor possui do
candidato.

A modelagem estatística proposta, modelo de regressão logística,


aponta com principal fator de reeleição o capital disponível para campanha,
medido a partir da receita declarada ao Tribunal Superior Eleitoral. Tal
relevância era esperada e modelo apenas confirmou tal expectativa. Outro fator
que revelou grande importância é o nível de lembrança que o eleitor possui do
candidato, indicando que a exposição na mídia trás benefícios à candidatura e
é relevante para o sucesso da sua reeleição.

Outro fator que apresentou relevância estatística foi a produção


parlamentar do candidato. Tal constatação foi surpreendente, considerando
que o eleitor brasileiro pouco acompanha as atividades dos parlamentares na
produção legislativa. Isso mostra que, nas cidades analisadas, o trabalho do
parlamentar é levado em consideração por uma parcela do eleitorado,
163

ressaltando sua participação, como munícipe, no processo legislativo da


Câmara Municipal, característica fundamental da democracia.

O capítulo 5 complementa o capítulo 4, ou seja, também analisa o perfil


do candidato e determina as probabilidades de ser eleito, entretanto, apresenta
uma diferença básica, não se limita à análise de um grupo específico de
candidatos (vereadores) e as características ligadas à sua atividade como
parlamentar. O capítulo 5 leva em conta a generalização dos candidatos. Os
candidatos são analisados segundo uma série de características e como estas
influem na sua probabilidade de ser eleito. Informações referentes ao gênero,
profissão, escolaridade, estado civil e faixa etária, são analisadas focando o
sucesso do candidato no processo eleitoral.

A partir de uma modelagem estatística adequada (modelo logístico-


linear) foi possível mapear as chances de o candidato ser eleito a partir do seu
perfil considerando as suas características e como estas se inter-relacionam,
reduzindo ou aumentando as chances de ser eleito. O estudo realizado nesse
capítulo permite posicionar um candidato entre os demais no que diz respeito
às chances de ser eleito. Um resultado importante dessa análise é um
mapeamento da visão do voto dos eleitores vinculado às características dos
candidatos. Esse mapeamento pode indicar tabus e preconceitos que afloram
na sociedade brasileira e revelados por meio da expressão do voto.

A partir do que foi apresentado nos capítulos, nota-se que a abordagem


quantitativa das ciências sociais é plenamente válida e justificável desde que
alguns limites sejam respeitados. Esses limites se referem aos cuidados no
momento de se fazer o planejamento amostral, tratamento dos dados e
modelagem adequada para cada caso.

Informações importantes podem ser extraídas e aplicadas no


entendimento do comportamento social, ou seja, lançar uma luz sobre a
consciência coletiva.
164

Este trabalho contribui com a divulgação do potencial do uso dos


métodos quantitativos nas ciências sociais, trazendo no seu bojo algumas
aplicações de modelagens que são úteis na compreensão do processo
eleitoral.
165

Apêndices

A.1 Código R referente ao capítulo 3

O programa em R referente ao modelo NMAR, representado pela


equação 3, é apresentado a seguir:

m0<-matrix(1:16, nrow=1)-0:15;
m<-matrix(ncol=16,nrow=1);
m1<-matrix(ncol=16,nrow=1);
N<-matrix(ncol=16,nrow=1);
K<-16;
NAm<-19006;
FO<-matrix(c(2961,1436,3386,1890,2815,1406,3198,1914),nrow=1);
M<-matrix(c(236,488,394,650),nrow=1);
d<-(K/NAm)*FO;
for(I in seq(1,8,1)){
N[2*I-1]<-FO[I];}
N
for(J in 1:10000){
r<-0;
for(I in seq(1,(K-9),2)){
r<-r+1;
N[I*2]<-(M[r]/(M[r]+d[I]+d[I+1]))*(M[r]*m0[I*2]/(m0[I*2]+m0[(I+1)*2])+d[I]);
N[(I+1)*2]<-
(M[r]/(M[r]+d[I]+d[I+1]))*(M[r]*m0[(I+1)*2]/(m0[I*2]+m0[(I+1)*2])+d[I+1]);}
for(R in 1:3){
for(I in seq(1,(K-1),2)){
m[I]<-m0[I]*((N[I]+N[I+1])/(m0[I]+m0[I+1]));
m[I+1]<-m0[I+1]*((N[I]+N[I+1])/(m0[I]+m0[I+1]));}
m1<-m;
for(I in seq(1,(K-7),8)){
m[I]<-m1[I]*((N[I]+N[I+4])/(m1[I]+m1[I+4]));
166

m[I+1]<-m1[I+1]*((N[I+1]+N[I+5])/(m1[I+1]+m1[I+5]));
m[I+2]<-m1[I+2]*((N[I+2]+N[I+6])/(m1[I+2]+m1[I+6]));
m[I+3]<-m1[I+3]*((N[I+3]+N[I+7])/(m1[I+3]+m1[I+7]));
m[I+4]<-m1[I+4]*((N[I]+N[I+4])/(m1[I]+m1[I+4]));
m[I+5]<-m1[I+5]*((N[I+1]+N[I+5])/(m1[I+1]+m1[I+5]));
m[I+6]<-m1[I+6]*((N[I+2]+N[I+6])/(m1[I+2]+m1[I+6]));
m[I+7]<-m1[I+7]*((N[I+3]+N[I+7])/(m1[I+3]+m1[I+7]));}
m0<-m;}}
m0
N
167

Bibliografia

AGRESTI, A. An Introduction to Categorical Data Analysis. 2 ed. ed. New Jersey: John Wiley &
Sons, 2007.

ALLISON, P. D. Missing Data. Series: Quantitative Applications in the Social Sciences, vol. 136.
New York: SAGE Publications, Inc., 2002.

ALVES, E. D. O avanço das mulheres nas eleições de 2012 e o déficit democrático de gênero.
EcoDebate, 2012. Disponivel em: <http://www.ecodebate.com.br/2012/10/17/o-avanco-das-
mulheres-nas-eleicoes-de-2012-e-o-deficit-democratico-de-genero-artigo-de-jose-eustaquio-
diniz-alves/>. Acesso em: 2013.

BAKER, S. G.; LAIRD, N. M. Regression Analysis for Categorical Variables With Outcom Subject
to Nonignorable Nonresponse. Journal of the American Statistical Association, v. 83, p. 62-69,
1988.

BERGER, P. P.; BRASIL, H. Valores Extremos: Conceitos, Abordagem Clássica e Métodos de


Modelagem. Rio de Janeiro: [s.n.], 2012.

BORBA, J. As bases sociais e atitudinais da alienação eleitoral no Brasil. Revista Debates, Porto
Alegre, v. II, p. 134-157, 2008.

BOURDIEU, P. O Poder Simbólico. Lisboa: Bertrand, 1989. 135 p.

BOURDIEU, P. Coisas Ditas. São Paulo: Brasiliense, 1990.

BOURDIEU, P. Pierre Bourdieu avec Löic Wacquant; réponses. Paris: Seuil, 1992.

BRAGE, L. B.; CAÑELLAS, A. J. C. El concepto de explicación en las ciencias sociales. Revistes


Catalanes amb Accés Obert, Barcelona, v. 77, p. 181-204, 2005.

CERVI, E. U. Métodos quantitativos nas ciências sociais: uma abordagem alternativa ao


fetichismo dos números e ao debate com qualitativistas. blog em Público, 2008. Disponivel
em: <http://www.blogempublico.com/wp-
content/uploads/2011/04/2008_PesquisaSocialMetQuant_CapEmerson.pdf>. Acesso em:
julho 2013.

CERVI, E. U. Produção legislativa e conexão eleitoral na Assembléia Legislativa do Paraná.


Revista de Sociologia Política, fevereiro 2009. 159-177.

CHALMERS, A. O queé ciência afinal? 2a. ed. São Paulo: Brasiliense, 1993.
168

CLOGG, C. C. et al. Multiple imputation of industry and occupation codes in census public-use
samples using bayesian logistic regression. Journal of American Statistical Association, v. 86,
p. 68-78, 1991.

DEMING, W. E.; STEPHAN, F. F. On a least squares adjustment of a sample frequency table


when the expected marginals totals are know. Annals of Mathematical Statistics, v. 11, p. 427-
444, 1940.

DEMPSTER, A. P.; LAIRD, N. M.; RUBIN, D. B. Maximum Likelihood from Incomplete Data via
the EM Algorithm. Journal of the Royal Statistical Society, v. B, p. 1-38, 1977.

DOXA. Laboratório de Pesquisa em Comunicação Política e Opinião Pública, 2008. Disponivel


em: <http://doxa.iesp.uerj.br/eleicoes2008.html>. Acesso em: 2013.

DURKHEIM, È. As Regras do Método Sociológico. 3a. ed. São Paulo: Livraria Martins Fontes,
2007.

DURKHEIM, È. As Regras do Método Sociológico. São Paulo: Livraria Martins Fontes, 2007.

FAUSTO, B.; DEVOTO, F. J. Brasil e Argentina: um ensaio de história comparada (1850 - 2002).
1a. ed. São Paulo: 34, 2004.

FAVERO, L. P. et al. Análise de dados - modelagem multivariada para tomada de decisões.


São Paulo: Elsevier, 2009.

FAY, R. E. Causal Models for Patterns of Nonresponse. Journal of the American Statistical
Association, v. 77, p. 270-278, 1986.

FERNANDES, F. Fundamentos Empíricos da Explicação Sociológica. São paulo: Companhia


Editora Nacional, 1959.

FERNANDES, F. Fundamentos empíricos da explicação sociológica. São Paulo: Companhia


Editora Nacional, 1959.

FIGUEIREDO, D. B. Gastos eleitorais: os determinantes das eleições? Estimando a influência


dos gastos de campanha nas eleioções de 2002. Urutágua, Maringá, v. 8, p. 1-10, 2005.

GRAHAM. Missing Data Analysis: Making It Work in the Real World. Annual Review of
Psychology, Pennsylvania, v. 60, p. 549–576, 2009.

GREELEY, A.; SCALON, C. Consórcio de Informações Sociais. Projeto Religião (Banco de Dados).
Rio de Janeiro: Instituto Universitário de Pesquisa do Rio de Janeiro - IUPERJ., 2002. Disponivel
em: <http://www.cis.org.br>. Acesso em: 15 janeiro 2013.

LITTLE, R. J. A.; RUBIN, D. B. Statistical Analysis with Missing Data. 2 ed. ed. New York: John
Wiley & Sons, 1987.
169

MACHADO, M. A retórica da reeleição: mapeando os discursos dos Programas Eleitorais


(HGPE) em 1998 e 2006. Opinião Pública, Junho 2009. 159-189.

MAYHEW, D. R. Congress: the electoral connection. 1a. ed. [S.l.]: Yale University Press, 1974.

MCLACHLAN, G. J.; KRISHNAM, T. The EM Algorithm and Extensions. 1a. ed. New York: John
Wiley & Sons, 1997.

MIGUEL, L. F. Capital Político e Carreira Eleitoral: algumas variáveis na eleição para o congresso
brasileiro. Revista de Sociologia e Política, Curitiba, n. 20, p. 119-134, junho 2003. ISSN ISSN
0104-4478.

MILL, J. S. Sistema de Lógica Dedutiva e Indutiva. Tradução de J. M. Coelho. 2a. ed. São Paulo:
Abril Cultural, 1979. 169 p. Série Os Pensadores.

PALMEIRA, M. Voto: racionalidade ou significado? Revista Brasileira de Ciências Sociais,


volume 20, 1992. 26-30.

PARK, T.; BROWN, M. B. Models for categorical data with nonignorable nonresponse. Journal
of the Americal Statatiscal Association, v. 89, p. 44-52, 1994.

PEREIRA, C.; RENNÓ, L. O que É que o Reeleito Tem? Dinâmicas Político-Institucionais Locais e
Nacionais nas Eleições de 1998 para a Câmara dos Deputados. Dados, Vol. 44, nr. 2, 2001.

PINTO, C. R. J. Paradoxos da participação política da mulher no Brasil. REVISTA USP, São Paulo,
v. 49, p. 98-112, maio 2001.

POPPER, K. R. A Lógica da Pesquisa Científica. 13a. ed. São paulo: Cultrix, 2007.

R PROJECT. The R Project for Statistical Computing. R Project, 2013. Disponivel em:
<http://www.r-project.org/>. Acesso em: 2013.

RADMANN, E. R. H. O Eleitor Brasileiro: Uma Análise do Comportamento Eleitoral. Porto


Alegre: Dissertação de Mestrado, 2001.

RESENDE, R. C.; CANTU, R. Performance eleitoral e perfis: análise da Assembléia Legislativa


do Paraná (1998-2006). Observatório de Elites Políticas e Sociais do Brasil. Caxambú. 2009.

ROSS, S. Stochastic Processes, Second Edition. New York: John Wiley & Sons, Inc, 1996.

SETTON, M. D. G. J. A teoria do habitus em Pierre Bourdieu: uma leitura contemporânea.


Revista Brasileira de Educação, nr. 20, 2002. 60-70.

SETTON, M. D. G. J. Família escola e mídia: um campo com novas configurações. Educação e


Pesquisa, v. 28, nr. 1, 2002. 107-116.
170

SILVA, R. Alienação eleitoral: um estudo comparado das bases sociais e atitudinais. Revista
Andina de Estudios Políticos, Lima - Peru, v. III, p. 109-133, 2013.

SRINIVASAN, M. V. Animal behaviour: Homing in on ant navigation. Nature, Londres, v. 411, p.


752-753, junho 2001. ISSN doi:10.1038/35081224.

STN. Sistema de Coleta de Dados Contábeis. Sistema de Coleta de Dados Contábeis dos Entes
da Federação - SISTN, 2013. Disponivel em:
<https://www.tesouro.fazenda.gov.br/pt/prefeituras-governos-estaduais/sistema-coleta-
dados-contabeis>. Acesso em: 2013.

TANNER, M. A.; WONG, W. H. The Calculation of Posterior Distributions by Data Augmentation.


Journal of the American Statistical Association, v. 82, n. 398, p. 528-540, 1987.

THE Rhino Vote. Time Magazine, outubro 1959. Disponivel em:


<http://content.time.com/time/magazine/article/0,9171,869297,00.html>. Acesso em: 10
fevereiro 2013.

VASCONCELLOS, F. Quem se importa com os debates eleitorais na TV?, Rio de Janeiro, 2011.

WITTLINGER, M.; WEHNER, R.; WOLF, H. W. The desert ant odometer: a stride integrator that
accounts for stride length and walking speed. The Journal of Experimental Biology, Zürich, v.
210, p. 198-207, 2007. ISSN doi:10.1242/jeb.02657.

Você também pode gostar