Você está na página 1de 28

CONSELHO FEDERAL DE ESTATÍSTICA

Rio de Janeiro, 19 de setembro de 2009

Orientações para Entender os Resultados da Pesquisa Eleitoral.

LUIZ CARLOS DA ROCHA


Presidente do CONFE
Conselho Federal de Estatística

O objetivo do documento é esclarecer questões técnicas relevantes divulgadas


nas pesquisas eleitorais, principalmente para leitores não familiarizados com a teoria
estatística, o que impõe cuidado redobrado com uma linguagem menos especializada.
Porém, existem aspectos técnicos subjacentes nos resultados das pesquisas eleitorais,
que induzem conclusões falsas que não podem deixar de ser esclarecidos a todos que
se interesse em compreendê-las para analisá-las, interpretá-las e divulgá-las.

PARTE I - INTRODUÇÃO.

Quando se trabalha com Amostragem a primeira preocupação do estatístico é


definir com precisão os elementos da população alvo (PA) do seu interesse, isto é, ter
o critério que permita identificar quais elementos compõe ou não a PA. Exemplos
simples de PA: os domicílios de certa cidade; o rebanho de gado de uma determinada
fazenda; os eleitores de um dado município. Em seguida declaram-se as informações
que se quer obter dos elementos da PA, tais informações formam um questionário
preenchido para cada elemento pesquisado. Nos domicílios pode-se ter interesse nas
informações: Quantos moradores? Quantos quartos? Quantos banheiros? Na PA dos
gados pode-se ter interesse só em avaliar o peso total do rebanho. Quanto ao exemplo
dos eleitores pode interessar; Em quem vai votar? Qual o grau de instrução? Qual a
idade?
Vamos supor que estamos falando de PA com grande número (N) de elementos,
por exemplo; a cidade pode ter N = 500 mil domicílios; a fazenda pode ter espalhado
pelos pastos N = 100 mil cabeças de gado e o município N = 1 milhão de eleitores.
______________________________________________________________________ 1
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

Fazer levantamento censitário (pesquisar todos os elementos) para se obter as


informações nem pensar, devido ao custo envolvido e do prazo demandado, e para
surpresa do leitor por causa da imprecisão do resultado final, por conta de múltiplas
fontes de erros associadas às informações quando são levantadas exaustivamente.
Para resolver o problema, a idéia intuitiva que surge de imediato é selecionar um
pequeno (n) subconjunto dos elementos e fazer a pesquisa neste recorte da PA.
Obviamente a dificuldade que surge em decorrência desta proposta simplificadora é
transformar as informações obtidas do subconjunto para a PA como um todo. Mais
uma vez se pode propor uma solução simples e conhecida de todos; a famosa regra de
três; tão estudada no 2º grau do ensino fundamental. Por exemplo, se no caso das
cabeças de gado o recorte de n animais pesou P(n), então qual seria o peso do
rebanho com N animais? Pela regra de três obter-se-ia o seguinte resultado P(N)=N x
P(n)/n.
Parece simples, mas não é. A fórmula proposta supõe a existência de uma
homogeneidade dos elementos da PA, como no caso do sangue onde se pode realizar
com uma simples gota, o exame laboratorial para diagnosticar uma doença. Já no caso
do rebanho não se pode contar com a homogeneidade do peso, as idades dos animais
diferem, a genética é diferenciada e o tipo do pasto é variado, estas diversidades
contribuem para gerar diferenças de peso entre os animais e em alguns casos nem
mesmo o tamanho do rebanho é conhecido com precisão. Então, nossa regra de três
neste caso pode dar resultados bem distantes da realidade, e o que é pior, não temos
a mínima idéia do grau de erro que podemos cometer e nem a confiabilidade deste
erro.
Os estatísticos resolvem estas questões através da Tecnologia da Amostragem
(TA), que são técnicas que lidam com as variabilidades dos dados levantados e
fornecem resultados mais precisos, além de informar a confiabilidade do erro que se
pode estar cometendo. Portanto significa um estupendo avanço em relação à proposta
inicial da regra de três. Na TA os estatísticos costumam designar a PA por universo da
pesquisa, trata-se da mesma coisa.
______________________________________________________________________ 2
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

A diferença fundamental que constitui a essência do método estatístico se


concentra na escolha do subconjunto que denominamos recorte da PA. No caso será
denominada de “amostra estatística” e significará somente um subconjunto selecionado
de forma aleatória com lei conhecida. Aqui existe uma redundância estatística com o
termo ”aleatória com lei conhecida”, pois no jargão estatístico o termo aleatório sempre
é reservado para situações que a lei do acaso é conhecida. Em poucas palavras, lei do
acaso conhecida significa que a probabilidade de selecionar a amostra é determinável
e o recorte é dito “amostra aleatória” ou simplesmente amostra. Assim, ao selecionar
uma bola vermelha retirada ao acaso de um saco que contém 3 bolas vermelhas e 7
pretas, sabemos que a probabilidade é igual ao número de casos favoráveis sobre o
número de casos possíveis ou seja igual a 3/10=0,3. Raciocínio similar resulta que a
seleção de uma bola preta é igual a 0,7 portanto estamos falando de uma situação de
seleção aleatória. Logo, é a seleção aleatória dos elementos que caracteriza a amostra
estatística e ao mesmo tempo permite fazer previsões com confiabilidade do erro.
A seleção ao acaso sem lei conhecida não é tratada como sendo aleatória, por
exemplo: “foi fruto do acaso ao sair de casa hoje encontrar uma pessoa que me fez
recordar um ente querido já falecido”.
Os procedimentos de extrapolação dos resultados obtidos na amostra estatística
têm caráter análogo à primitiva regra de três, mas são mais refinados e dependem do
processo aleatório da seleção da amostra. O processo de seleção determina diferentes
métodos na TA tais como Simples, Estratificado, Conglomerado, etc, cada um deles
com seus específicos processos de extrapolação chamados de expansão da amostra.
Dos três exemplos de PA mencionadas acima, a seleção de uma amostra pelo
método da TA Simples de domicílios numa cidade é relativamente fácil e pode ser
realizada fazendo uso das informações dos setores censitários do IBGE; já no caso do
rebanho de 100 mil gados espalhados no pasto, o procedimento da seleção aleatória
esta longe de ser tarefa fácil; no exemplo dos eleitores de um dado município a seleção
da amostra seria simplificada através do cadastro do TRE.
Mas, a seleção da amostra não é o único condicionante na determinação da
______________________________________________________________________ 3
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

técnica de amostragem usada pelo estatístico para levantamento da informação. Há


outros aspectos a considerar como: o prazo demandado para o levantamento, o custo,
a veracidade da informação, etc.
Outro aspecto que merece destaque e independe se estamos fazendo censo ou
amostragem, diz respeito à natureza do dado levantado. Pode-se observar que entre
os três exemplos citados, o do eleitor que é nosso foco principal, tem um aspecto muito
particular que o distingue dos outros dois. Enquanto nos dois primeiros se levantam
dados objetivos, quantidade de cômodos (basta contar) e peso do animal (basta
pesar), no terceiro exemplo se levanta dados subjetivos. Nos casos de pesquisa de
opinião, a subjetividade da informação gera dificuldade na fidedignidade dos dados
levantados, seja por censo ou por amostragem, o que compromete a precisão da
expansão.
A pesquisa eleitoral reflete a intenção de Voto num determinado momento e de
acordo com certo cenário político. É uma fotografia mal focada da subjetividade dos
entrevistados num certo instante. A grande questão que envolve a pesquisa eleitoral é:
“Opinião” não se mede; não se pesa; não se toca; não tem cheiro e não se vê. É
intangível: Pergunta-se e acredita-se!

Antes de passar aos conceitos estatísticos da Amostragem é importante ter


clareza das fontes de erros comuns no levantamento da informação em pesquisa
eleitoral ou na pesquisa de opinião em geral, seja por levantamento censitário ou por
amostragem na avaliação de atributos subjetivos.

I - Erros quanto à veracidade da informação do entrevistado:


a) o informante pode mentir em relação a seus dados demos - sócio - econômicos.
b) o informante pode mentir em relação a sua Intenção de Voto.
c) o informante pode mudar de opinião com ou sem novo cenário sócio - econômico -
político.
II - Erros quanto à qualidade do levantamento de campo.
Fazendo censo ou amostragem, o procedimento do levantamento da informação
______________________________________________________________________ 4
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

é fundamental: a seriedade, a forma criteriosa e o treinamento da equipe que faz o


levantamento de campo são pontos críticos da pesquisa de opinião. O trabalho de
campo é o calcanhar de Aquiles do projeto que pode ser tecnicamente perfeito, mas se
os entrevistadores não forem competentes, não funciona.
III - Erros inerentes ao levantamento por amostragem.
A estatística não tem pretensão de fazer estimativas exatas, ela admite o erro
como sendo fato inerente e inevitável nos seus procedimentos de estimação. O erro é
um parceiro constante na atividade profissional do Estatístico, mesmo na estimação de
aspectos objetivos da população onde se podem usar instrumentos de medida, como
por exemplo, nas avaliações da altura, do peso ou da pressão arterial das pessoas,
ainda assim, a estimativa por amostragem da média destas medidas estaria sujeita à
erros. Aliás, mesmo que se fizesse um censo, não há como eliminar erros. Não há
medida sem erro. A pesquisa eleitoral por amostragem é a técnica estatística utilizada
para se conseguir uma prévia rápida e confiável com erro previsto e com baixo custo.
Numa pesquisa de opinião onde os atributos avaliados têm natureza intangível,
todas as fontes de erros se aglutinam em volta dos dados levantados: a inépcia do
entrevistador, a mentira do entrevistado, a alteração do cenário sócio – econômico -
político, a mudança espontânea de opinião do eleitor. E quanto se faz a expansão da
amostra para a PA, se soma a tudo isso o erro amostral que apesar de controlado e ter
confiabilidade controlada, perde-se precisão na estimativa. Em conseqüências de todos
esses erros atuando ao mesmo tempo no processo, têm-se inevitavelmente avaliações
esfumaçadas da realidade através da tecnologia da amostragem. Então se pode
afirmar com segurança que na pesquisa de opinião por amostragem os métodos de
expansão produzem estimativas, erros e confiabilidades que devem ser encarados
mais como sendo uma ordem de grandeza, ou talvez uma aproximação não refinada
dos verdadeiros valores.
Portanto, pesquisa de opinião é uma área de informação, seja censitária ou por
amostragem, que se caracteriza pela fragilidade dos dados levantados, inclusive do
ponto de vista da amostragem do erro e da confiabilidade estatística da estimativa.
______________________________________________________________________ 5
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

Todavia, para se ter avaliação da opinião eleitoral de uma população num certo
momento, com rapidez, com baixo custo e com alguma confiabilidade, a pesquisa por
amostragem é o melhor procedimento técnico que se pode lançar mão.
Outra questão crucial que envolve a pesquisa de opinião e gera intermináveis
debates e discussões acaloradas, resulta da dificuldade, ou melhor, impossibilidade de
avaliar a qualidade dos resultados no momento da divulgação dos resultados. Faltam
referências que sirvam para aferir as estimativas. No caso particular da pesquisa
eleitoral, a única referência confiável é o resultado final das urnas. Mas este só poderia
ser confrontado com o resultado da pesquisa de “boca de urna”, que cada vez mais,
perde importância dada à rapidez da apuração eleitoral.
Quando as previsões das pesquisas realizadas com alguma antecedência ou
próximas ao pleito são confirmadas no dia da eleição, então tudo vai a mil maravilhas,
as empresas fizeram “seu dever de casa”. Quando não, é sempre possível argumentar
que o projeto estatístico estava correto, mas as previsões não se verificaram devido a
mudanças de última hora do cenário (decretação de feriado na véspera do pleito,
boatos em cima do evento, declarações de última hora de cacique político, etc). Quase
sempre estas discussões são inconclusas e terminam no “deixa pra lá”, por falta
absoluta de critério que consiga separar as forças políticas que atuaram na última hora
modificando o cenário político e o erro da pesquisa.
Para passar ao leitor alguns aspectos técnicos deste poderoso instrumental
estatístico que é a Teoria da Amostragem usaremos como base o mais elementar dos
métodos, denominada Amostragem Aleatória Simples o primeiro a ser criado e referido
de forma abreviado pela sigla (AAS), o qual será discutido na PARTE II. O AAS por ter
sido pioneiro na Teoria da Amostragem servirá de contra ponto didático para o leitor
poder entender as dificuldades impostas pelo método Amostragem por Cota (AC) que
é o procedimento mais usado pelos Institutos de Pesquisa. Mas apesar de dominar a
prática da pesquisa de opinião, o método AC não é considerado um método de
amostragem no sentido estritamente teórico, não é da mesma natureza que os

______________________________________________________________________ 6
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

métodos AAS ; Amostragem Estratificada e Amostragem de Conglomerado, entre


outros mais elaborados e não mencionados nesta resenha.
AC é um procedimento que usa bom senso junto com técnicas estatísticas, e foi
concebido para contornar a limitação imposta pela impossibilidade da seleção aleatória
dos entrevistados, seja pela inexistência ou deficiência do cadastro, seja por questão
de custo ou prazo de execução. Os resultados obtidos por AC não estão a rigor sob
controle do profissional Estatístico, mas se tratando de pesquisa eleitoral não chega
ser um grave defeito, já que os demais também não estão sob controle, como já dito,
devido à natureza subjetiva da informação. Inclusive AC é usado internacionalmente
desde a década de 1950, mas também, desde então é atacado principalmente na área
acadêmica e tem sido motivo de intermináveis discussões. Enquanto isso continua
sendo usado ininterruptamente pelos Institutos de Pesquisa de Opinião, logo se torna
necessário buscar maior compreensão dos aspectos especiais que justificam sua
reconhecida adequação na aplicação da Pesquisa Eleitoral. Na PARTE III far-se-á uma
discussão detalhada deste método.

PARTE II - Amostragem Aleatória Simples (AAS )


Aproveitaremos a leve estrutura da AAS que é o mais simples dos métodos,
para simular os conceitos da margem de erro, quase sempre fixada em 3% pelas
empresas de pesquisa. O 3% parece ser obrigatório, mas não é, sua fixação virou
moda. Também será explicada a confiabilidade da estimativa, Nível de Confiança, que
nunca é mencionado pelos Institutos de Pesquisa e diremos o porquê desse segredo.
Para ilustrar o que acontece numericamente na pesquisa eleitoral simularemos
uma situação usando AAS na qual somente o erro amostral (inevitável) é admitido. Isto
é, consideraremos condições ideais sem os erros do tipo I e do tipo II. E, para isolar e
discutir somente o erro tipo III far-se-á uso de uma PA de 100.000 eleitores, que no
caso corresponderá a um arquivo de dados com cem mil linhas. Representado por um
enorme quadro (matriz), onde cada linha é um eleitor com seus dados demo-sócio-
econômicos que constituirão as colunas da matriz (Sexo, Idade, Grau de Instrução e
______________________________________________________________________ 7
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

Classe de Renda) e finalmente a última coluna indicará em quem o eleitor vai votar.
Além disso, nossos eleitores possuem a grande virtude de não mentir e tampouco
mudam de opinião em quem vão votar entre os quatro hipotéticos candidatos do pleito
(A, B, C e D). Se o leitor preferir, pode imaginar que D não é um candidato, ele pode
significar a soma daqueles que disseram que: vão anular o Voto; estão indecisos; vão
deixar em branco; não vão votar. O quadro da PA com as características demo - sócio
-econômicas é apresentado abaixo, onde alguns códigos (Idade e Renda) estão
simbolizando valores numéricos usados no procedimento da simulação e foram frutos
da nossa imaginação só para ilustrar numericamente as propriedades estatísticas do
processo da AAS.
Quadro Representativo das Características da PA com Voto Fixado
NO do SEXO IDADE GRAU RENDA VOTO
TÍTULO INSTRU
T1 F I1 1O R1 A
T2 F I2 3O R2 D
T3 M I3 PÓS R3 C

T99.998 M I 99.998 2O R99.998 B


T99.999 F I 99.999 1O R99.999 E
T100.000 M I 100.000 3O R100.000 D

O próximo passo é selecionar da PA formada pelas cem mil linhas, uma amostra cujo
tamanho será fixada arbitrariamente em mil eleitores (n=1.000 linhas). O processo
______________________________________________________________________ 8
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

aleatório de seleção será admitido equiprovável, isto é, a priori todos os elementos


terão igual probabilidade (1/100.000) de compor a amostra. Para tanto, o leitor pode
fazer analogia da situação descrita como sendo um grande globo do tipo sorteio da
mega-sena contendo 100.000 bolas (PA), onde cada bola significa um eleitor com
características demo-sócio - econômicas registrada na sua superfície, juntamente com
o seu Voto. A amostra será constituída por sorteio de 1.000 bolas sem reposição.
Iniciaremos nossa análise fazendo as estatísticas do quadro numérico de fato
utilizado na simulação, ou seja, o censo das características da população dos cem mil
eleitores. Portanto, os resultados que apresentaremos a seguir são provenientes das
estatísticas registradas nas cem mil bolas, onde as informações: Idade, Instrução e
Renda foram agregadas em categorias, por exemplo, as idades foram agrupadas em
(Jovem, Adulta e Madura) e etc. Na prática da pesquisa eleitoral a estatística das
características é da mesma natureza dos dados Censitários do IBGE, com a diferença
que estes embutem em seu valor os três tipos de erros mencionados. Mas, nossas
bolinhas não mentem vale o registrado, é de fato uma situação ideal não encontrada na
prática da pesquisa de opinião.

Quadro 1: Estatística das Características da População de 100.000 Eleitores


QUANTO AO SEXO QUANTO A IDADE
PROPOR PROPOR
SEXO FREQ % FREQ ÇÃO %
ÇÃO IDADE
ÇÃO
FEMININO 53136 0,5314 53,14 JOVEM 36288 0,3629 36,29
MASCULINO 46864 0,4686 46,86 ADULTA 56611 0,5661 56,61
TOTAL 100.000 1,0000 100,00 MADURA 7101 0,0710 7,10
TOTAL 100.000 1,0000 100,00
QUANTO A INSTRUÇÃO QUANTO A RENDA
INSTRU PROPOR PROPOR
FREQ % FREQ %
ÇÃO ÇÃO RENDA ÇÃO
FUNDA CLASSE
MENTAL
81720 0,8172 81,72 D/E
76545 0,7655 76,55
CLASSE
MÉDIO 11712 0,1171 11,71 C
13633 0,1363 13,63
CLASSE
SUPERIOR 6568 0,0657 6,57 A/B
9822 0,0982 9,82
Total 100.000 1,0000 100,00 Total 100.000 1,0000 100,00

______________________________________________________________________ 9
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

As Características são consideradas variáveis explicativas da preferência do Voto, ou


melhor, admite-se existência de correlação não nula entre a Intenção de Voto e as
Características. Claro que as citadas aqui são as mais usadas, mas elas não são as
únicas de interesse, vai depender do perfil dos candidatos, por exemplo, se existir
candidatos de diversas correntes religiosas, então crença religiosa seria característica
relevante ou se os candidatos tivessem etnias diferentes, então raça seria importante.
Na AAS as características dos eleitores não são usadas na estimação da
variável de interesse, Intenção de Voto, elas são importantes nos demais métodos:
Estratificado, Conglomerado e Cota. Mas, foram introduzidas aqui para criar uma
“ponte” com AC e servirá para justificar a origem desse procedimento. Também será
útil para explicar a terminologia “amostra representativa” usada tanto na linguagem de
leigos como pelas empresas de pesquisa e tão incompreendida por estudiosos da
área.
Quanto à Intenção de Voto, que é nossa variável de interesse, ou seja, aquela
que será estimada com amostra de tamanho 1.000 pode-se observar a distribuição da
Intenção de Voto atribuída arbitrariamente para a população de 100.000 eleitores.

Quadro 2: Estatística da Intenção de Voto na População dos 100.000 Eleitores

CANDIDATOS FREQUÊNCIA PROPORÇÃO COMPOSIÇÃO (%)


CAND_A 49.975 0,4998 50,0
CAND_B 27.016 0,2702 27,0
CAND_C 16.994 0,1699 17,0
CAND_D 6.015 0,0602 6,0
TOTAL 100.000 1,0000 100, 0

A seguir daremos em forma de gráfico de barra a composição dos Votos por tipo
de característica para a população de 100.000 eleitores. Não seria necessário destacar
que na prática, tanto a informação do Quadro 2 quanto os gráficos dados a seguir são
obviamente informações desconhecidas. Estamos admitindo aqui seu conhecimento só

______________________________________________________________________ 10
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

para mostrar ao leitor a situação que foi engendrada na simulação. Portanto estamos
fazendo um jogo, fingimos desconhecer a real situação e aplicamos a técnica da AAS
para estimar e confrontar os resultados com os da população. Desta forma o leitor terá
oportunidade de ganhar confiança com os conceitos dos procedimentos estatísticos no
caso de uma situação ideal, apesar dela não existir na prática.
Gráfico 1:Gráfico de barras (%) dos 100.000 Votos por Característica do Eleitor.

VOTOS POR SEXO


VOTOS POR IDADE
VOTO
60,0% CAND_A
CAND_B
CAND_C
40,0%
%

CAND_D

20,0%

0,0%
FEMININO MASCULINO
SEXO

VOTOS POR INSTRUÇÃO VOTOS POR RENDA


100,0% VOTO 100,0% VOTO
CAND_A
80,0% CAND_B
CAND_C
CAND_A
60,0% CAND_D 80,0% CAND_B
%

CAND_C
40,0%
60,0% CAND_D
%

20,0%

0,0% 40,0%
FUNDAMENTAL SUPERIOR
MÉDIO
INSTRUÇÃO 20,0%

0,0%
CLASSE CLASSE CLASSE
E/D C B/A
RENDA

______________________________________________________________________ 11
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

Na AAS o Estatístico joga com três parâmetros relacionados entre si através de uma
única fórmula obtida da aproximação normal: o tamanho da amostra, a margem de erro
e o nível de confiança; fixado dois deles o terceiro é determinado pela fórmula. Então,
quando o tamanho da amostra e a margem de erro são fixados, que é exatamente o
que fazem os Institutos de Pesquisa, então o nível de confiança é conseqüência direta
do resultado da fórmula e seu valor é variável para cada candidato. Faremos 500
estimativas das proporções de Votos para cada uma das 500 amostras selecionadas
de tamanho 1.000, repetidamente retiradas do globo e devolvidas antes de retirar a
próxima amostra, que darão 500 resultados de uma PA estática.
Na prática para obter uma rodada de resultados, as Empresas de Pesquisa
fazem uso de uma única amostra de 1.000 eleitores. Então à medida que o tempo
avança e a eleição se aproxima as opiniões vão se modificando, por isso à empresa
faz sucessivas rodadas de pesquisas ao longo do tempo e gera a curva de evolução
das estimativas de votos de cada candidato. Na simulação, as 500 amostras são de
uma população fictícia e imutável, de convicção férrea quanto ao Voto no prazo do
estudo.
Apresentamos a seguir estatísticas das estimativas das 500 amostras de
1.000 eleitores. A simulação tipo mega-sena foi substituída por processo
computacional gerado pelo autor e pode facilmente ser reproduzida por especialistas.
Adotar-se-á a notação PV_s para designar proporção de um candidato genérico.

Quadro 3: Estatísticas das 500 Estimativas das Proporções de Votos.

PV_A PV_B PV_C PV_D


Nº de Amostras 500 500 500 500
Média 0,4977 0,2700 0,1708 0,0614
Mediana 0,4980 0,2700 0,1710 0,0610
Moda 0,50 0,27 0,16 0,06
Desvio Padrão 0,0166 0,0137 0,0127 0,0074
Mínimo 0,43 0,23
2 0,14 0,04
Máximo 0,55 0,32 0,21 0,09

Impressionante! Vejam que para cada Candidato a média, a moda e a mediana que

______________________________________________________________________ 12
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

são medidas de posição das 500 estimativas estão praticamente em cima dos valores
verdadeiros da população original (Quadro 2). As demais são medidas de dispersão,
óbvio que o Intervalo {Min, Max} sempre inclui 100% das estimativas. O Desvio Padrão
(DP) define uma gama de intervalos. Na hipótese da distribuição Normal (Sino) que é
padrão para o caso estudado, tem-se a propriedade: o valor da média “mais ou menos
1xDP” inclui 68% dos casos observados, com “mais ou menos 2xDP” inclui 96% e com
“mais ou menos 3xDP” inclui praticamente 100% dos casos.
Gráfico 2:Histogramas das 500 Estimativas de PV_A à PV_D.

______________________________________________________________________ 13
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

P V _A P V _B
60

60 50

40
Frequencia

Frequencia
40
30

20
20
10

M ea n =0,5 0 M ean = 0,27


0 S td. D e v. 0 S td. D ev.
0,42 0,44 0,46 0,48 0,50 0,52 0,54 =0,0 17 0 ,22 0,2 4 0,2 6 0 ,28 0,30 0 ,32 =0,014
N = 500 N =500
P V _A P V _B

P V _C P V _D
80 100

80
60
Frequencia

Frequencia

60
40
40

20
20

M ean =0,17 M ean =0,06


0 Std. D ev. 0 Std. D ev.
0,12 0,14 0,16 0,18 0,20 0,22 =0,013 0,04 0,05 0,06 0,07 0,08 0,09 0,10 = 0,007
N =500 N =500
P V _C P V_D

Surpreendentemente! Os gráfic o s confirmam o comportamento Normal (Sino) das


estimativas dos PV_s das 500 amostras. O histograma é uma informação estatística
dada sob forma de gráfico que representa a freqüência ocorrida dentro de intervalos
arbitrários de valores de PV_s e traça o perfil da chamada curva de distribuição de
freqüência das observações. Nos histogramas verificamos uma curva em negrito que
significa a curva Normal teórica que se ajusta aos dados, com um milhão de amostras

______________________________________________________________________ 14
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

elas coincidiram com os histogramas.


Mas, antes de passar aos próximos resultados obtidos é importante alertar que
quando se fixa a margem de erro (3% só pra não contrariar) da estimativa, se obtém o
nível de confiança (probabilidade do verdadeiro valor pertencer ao intervalo definido
pela estimativa ±3%) que segundo a fórmula difere para cada estimativa e para cada
candidato. Então para as 500 estimativas dos 4 candidatos se pode calcular os níveis
de confiança correspondentes. No quadro a seguir apresentamos as estatísticas do
nível de confiança dos 500 Intervalos calculados segundo a fórmula da aproximação
Normal da margem de erro igual a 3% para cada um dos 4 candidatos.

Quadr o 4 : Nível de Confian ç a (aprox. Norm al) do s 50 0 Interval o s c o m Marge m de 3 % .

ESTATÍSTICAS DA CONFIABILIDADE (NÍVEL DE CONFIANÇA)

CONF_A CONF_B CONF_C CONF_D


N 500 500 500 500
Média 94,24 96,74 98,82 99,99
Mediana 94,23 96,74 98,83 99,99
Moda 94,22 96,46 98,81 99,99
Desvio Padão ,02 ,28 ,25 ,01
Minimo 94,22 95,89 98,12 99,90
Maximo 94,46 97,50 99,44 100,00

Pelos valores das estatísticas concluímos que o nível de confiança de cada candidato é
praticamente constante. Por exemplo, a estimativa PV_A tem confiabilidade 94,23%
(mediana), que significa que com a amostra de tamanho igual a 1.000, o verdadeiro
valor PV_A=0,50 do candidato A estará contido em 94,23% dos intervalos construídos
(valor estimado mais ou menos 3%). Analogamente, PV_D = 6% estaria contido em
99,99% dos intervalos com margem 3% e assim seriam interpretados os demais
valores 96,74% e 98,82% respectivamente para os candidatos B e C.
Por outro lado ao invés de aplicar a fórmula da aproximação Normal que dá o
nível de confiança para cada estimativa como no Quadro 4 podemos usar diretamente
os 500 valores estimados pela simulação para verificar a freqüência que o verdadeiro
valor do percentual de votos caiu dentro do intervalo definido pelo valor estimado mais

______________________________________________________________________ 15
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

e menos 3% notação INTER_s. Isto é, usar as estimativas simuladas para constatar a


adequação da fórmula (aprox. Normal). Os quadros abaixo mostram a freqüência de
inclusão para cada verdadeiro valor (50%; 27%;17%; 6%) nos 500 INTER_s.

Quadro 5: Freqüência da Inclusão do valor real PV_s nos 500 INTER_s.


PV_A=50%
INTER_A de PV_A

Frequencia %
FORA DO INTER_A 30 6,0
DENTRO DO INTER_A 470 94,0
Total 500 100,0

PV_B=27%
INTER_B de PV_B

Frequencia %
FORA DO INTER_B 15 3,0
DENTRO DO INTER_B 485 97,0
Total 500 100,0

PV_C=17%
INTERVALO_C de PV_C

Frequencia %
FORA DO INTER_C 9 1,8
DENTRO DO INTER_C 491 98,2
Total 500 100,0

PV_D= 6%
INTERVALO_D de PV_D

Frequencia %
FORA DO INTER_D 1 ,2
DENTRO DO INTER_D 499 99,8
Total 500 100,0

É fantástica a comparação dos resultados obtidos no Quadro 5 com os do


Quadro 4. Os valores do Quadro 4 resultam da aplicação da teoria estatística usando a
aproximação da distribuição Normal para determinar 500 níveis de confiabilidade para
______________________________________________________________________ 16
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

os 500 intervalos com 3% de erro. Enquanto isso no Quadro 5 tem-se freqüências


observadas da inclusão do valor verdadeiro (real) nos 500 intervalos de confiança
construídos. Não fossem os estorvos causados pelos erros tipos I e II, os resultados da
pesquisa com AAS teriam alta probabilidade de refletir a realidade do cenário eleitoral.
Infelizmente as empresas omitem os níveis de confiança e deixam transparecer
que há 100% de certeza de inclusão das estimativas nos “3% para mais e pra menos”
para todas estimativas. Esse é o segredo, induzir a certeza que o valor verdadeiro está
incluído no intervalo, e pior, ao mesmo tempo para todos os casos. Isso é falso.

Esta é a forma mais comum de transmitir os resultados para o público, mesmo


que ocorra absurdo de ter candidato com PV_s estimado em 1% ou 2% de proporção
de Votos, ainda assim as empresas insistem com a margem de “3% para mais ou para
menos”. Tal tolice é expressa na divulgação das pesquisas, mas a mídia e os Institutos
preferem fazer de desentendidos, comprometendo a credibilidade da informação.
Outro aspecto importante é chamar atenção para um fato pouco comentado que
diz respeito à interpretação da confiabilidade da margem de erro. Como vimos antes,
ela assume valor diferente para cada estimativa de PV_s. No exemplo simulado estão
todos a cima dos 94% e no caso de D é quase certeza. Todavia estes valores valem
para cada PV_s isoladamente, em outras palavras, se o leitor avaliar a confiabilidade
de inclusão concomitantemente das estimativas dentro das suas respectivas margens,
então a confiabilidade conjunta é reduzida e tal fato é previsível pela teoria estatística.
Mas, para o leitor pouco familiarizado com a teoria apresentaremos os resultados
gerados pela simulação. Seja “INTER_A/B” a designação da inclusão concomitante de
PV_A=50% no intervalo INTER_A e PV_B=27% no intervalo INTER_B. Da mesma
forma para mais de dois candidatos, exemplo, “INTER_A/B/C” e “INTER_A/B/C/D” a
inclusão concomitante para três e quatro intervalos.
Quadro 6:Freqüência da Inclusão Concomitante dos valores reais das PV_s.
PV_A=50% e PV_B=27%
“INTER_A/B” FREQ %
______________________________________________________________________ 17
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

FORA DOS DOIS 2 0,4


DENTRO DE UM 41 8,2
DENTRO DOS DOIS 457 91,4
TOTAL 500 100,0
Segundo as estatísticas da tabela INTER_A/B numa amostra a probabilidade
dos verdadeiros valores PV_A e PV_B estarem ao mesmo tempo dentro das suas
respectivas margens de erro é 91,4%, notar (ver Quadro 4 e Quadro 5) que cada um
tem aproximadamente e respectivamente 94% e 97%.
PV_A=50%, PV_B=27% e PV_C=17%.
“INTER_A/B/C” FREQ %
FORA DOS TRÊS 0 0
DENTRO DE UM 3 0,6
DENTRO DE DOIS 49 9,6
DENTRO DOS TRÊS 449 89,8
TOTAL 500 100,0
Da tabela INTER_A/B/C conclui-se que numa amostra a probabilidade dos
verdadeiros valores de PV_A, PV_B e PV_C estarem ao mesmo tempo fora dos três
intervalos é zero e dentro das suas respectivas margens de erro corresponde a 89,8%.
PV_A=50%, PV_B=27%, PV_C=17% e PV_D= 6%
“INTER_A/B/C/D” FREQ %
FORA DOS TRÊS 0 0
DENTRO DE UM 0 0
DENTRO DE DOIS 3 0,6
DENTRO DE TRÊS 48 9,8
DENTRO DOS QUATROS 448 89,6
TOTAL 500 100,0
Na tabela INTER_A/B/C/D tem-se que a probabilidade numa mesma amostra
dos valores reais de PV_A, PV_B, PV_C e PV_D estarem ao mesmo tempo fora dos
quatro ou dentro de somente um intervalo é zero. Dentro dos quatro intervalos ao
mesmo tempo a chance é 89,6%. Devido à alta confiabilidade de 99,99% do PV_D
quase não há redução na probabilidade dentro dos três da tabela anterior.
No Gráfico 3 po d e - s e visu alizar a c o nfigur a ç ã o da pertin ê n ci a do s reai s val or e s
no s res p e c tiv o s interv al o s de c o nfian ç a cruz a n d o PV_A e PV_B (2 dimensões) e no
Gráfic o 3 c o m PV_A, PV_B e PV_C (3 dimensões).

______________________________________________________________________ 18
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

Gráfico 2: 500 Estimativas de PV_A e PV_B e as pertinências nos seus respectivos


Intervalos com 3% de erro

IN TE R _A /B
0 ,3 2
FO R A D O S D O IS (A /B )
D E N TR O D E U M D E LE S
D E N TR O D O S D O IS (A /B )

0 ,3 0

0 ,2 8
PV_B

0 ,2 6

0 ,2 4

0 ,2 2

0,42 0 ,44 0 ,46 0,4 8 0,50 0 ,52 0 ,54


P V _A

Gráfico 3: 500 Estimativas de PV_A, PV_B e PV_C e as pertinências nos seus


respectivos Intervalos com 3% de erro.

______________________________________________________________________ 19
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

INTER_A/B/C
DENTRO DE UM DELES
DENTRO DE DOIS DELES
DENTRO DOS TRÊS

0,32

0,30

0,28
PV_B

0,26

0,24

0,22
0,42 0,44 0,14
0,46 0,48 0,16
0,50 0,52 0,18
0,54 0,20
PV_A PV_C

Observar que estimativas tão afastadas quanto às representadas pelos valores


mínimo e máximo do Quadro 3, exemplo PV_A=0,43 quando deveria ser 0,50 ocorreu
em pelo menos uma das 500 amostras, tal fato propaga erros nas demais estimativas
desta amostra, pois devemos lembrar que a soma das estimativas é igual a 1 (um) em
cada uma das 500 amostra. Se uma amostra apresentar estimativa muito abaixo do
valor real para um candidato, então os demais valores da amostra se expandem para
compensar, para estimativa alta os demais valores se contraem para compensar.
Para que o leitor tenha idéia da importância da confiabilidade, destacamos que é
fácil planejar uma pesquisa com 1% de margem de erro, o que daria uma fortíssima
______________________________________________________________________ 20
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

sensação de precisão. Mas, se a confiabilidade fosse igual a 10%, então significaria


que 90% das estimativas estariam fora das suas respectivas margens, e a situação
seria trágica na inclusão concomitante. Logo, a divulgação usada pelos Institutos: “três
pra mais e três pra menos” é um recado simples e direto, mas é enganoso e induz a
uma interpretação falsa. Mais uma vez a fidedignidade da informação é arranhada.
Uma solução seria fixar o tamanho da amostra e a confiabilidade, por exemplo
ao nível de 95%, deixando a margem de erro variável e associada a cada candidato,
isto evitaria o fato inaceitável de anunciar estimativa PV_ s de 1% ou 2% com margem
de 3%. Mas, público não teria o impacto psicológico dado pela informação quando se
fixa o erro e deixa transparecer que todas as estimativas estão dentro das margens.
Outra questão importante na divulgação dos resultados diz respeito ao esdrúxulo
termo “Empate Técnico” usado pelos Institutos. Termo não existente em Estatística é
um jargão restrito a linguagem dos Institutos de Opinião e significa uma tentativa de
transmitir uma indecisão com disfarce técnico, tal fato ocorre pela proximidade das
estimativas não permitindo afirmar quem está na frente. Mas em nenhum momento os
Institutos admitem esta situação que poderia ser resolvida talvez com o aumento da
amostra. No trabalho do Estatístico as indecisões são normais, isto se dá quando não
há “diferença significativa” entre as estimativas, tal dúvida é obtida pela técnica “Teste
de Hipótese Estatística”. Basta lembrar outra frase muito usada pelos Estatísticos:
dentro da sua seriedade na atividade de bem informar a Sociedade: “O resultado da
amostra não permite rejeitar a hipótese nula de igualdade das estimativas”. O problema
Infelizmente, não se resume só a questão semântica, o conceito “Empate Técnico” não
traduz a realidade dos fatos. Para discutir esse erro crasso dos Institutos vamos
construir uma nova PA com 100.000 eleitores gerando igualdade de Votos para os
candidatos A e B, ou seja, a nova PA será criada com a seguinte composição:
A= 47% ; B=47% ; C=5% e D=1%.
Neste caso o empate não é “técnico”, é real. Em seguida realizamos outra simulação
com o mesmo método AAS também com 1.000 eleitores para estimar 200 resultados,
isto é, obteremos 200 estimativas da variável PV_A e PV_B na população onde ambos

______________________________________________________________________ 21
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

são iguais a 47%. Então, considerando margem de erro de 3% e o critério “Empate


Técnico” dos Institutos, obtivemos a seguinte estatística;

EMPATE TÉCNICO

Frequencia %
NÀO EMPATADO 132 66,0
EMPATADO 68 34,0
Total 200 100,0

Logo, das 200 amostras concluiríamos com o critério do “Empate Técnico” pela
existência de 68 empates. Por outro lado, pela técnica estatística “Teste de Hipótese”
não se encontrou nenhuma diferença significativa nos resultados apurados, então as
200 estimativas PV_A e PV_B estariam 100% empatados, que corresponde fielmente à
realidade. Logo, quando de fato existe empate, o critério “Empate Técnico” só acertaria
34% e erraria 66% das vezes. Lamentável!

Vamos finalmente retomar a conversa sobre as características demo-sócio-


econômicas dos eleitores da primeira PA, não usadas até agora no método AAS .
Todavia, ela é fundamental para a aplicação do método AC, pois são elas que
determinam o procedimento de seleção dos eleitores da amostra e, por isso, dão nome
ao método. Ao mesmo tempo em que fazíamos seleção aleatória dos eleitores, sem
nenhuma preocupação com seus dados, registrávamos a título de informação as
características demo-sócio-econômicas dos entrevistados para ajudar o leitor captar a
idéia do procedimento AC. Insistimos que, em nenhum estágio da simulação com AAS
as características foram usadas na seleção do eleitor ou na estimação de qualquer
parâmetro da amostra. Daremos a seguir estatísticas das características demo-sócio-
econômicas das 500 amostras de 1.000 eleitores.

Quadro 7: Estatísticas das Características observadas nas 500 amostras.

______________________________________________________________________ 22
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

QUANTO AO SEXO

FEMININO MASCULINO
N 500 500
Média ,5301 ,4699
Mediana ,5301 ,4699
Moda ,51 ,46
Desvio ,01567 ,01567
Minimo ,48 ,42
Maximo ,58 ,52

QUANTO A IDADE

JOVEM ADULTA MADURA


N 500 500 500
Média ,3630 ,5651 ,0719
Mediana ,3634 ,5646 ,0711
Moda ,36 ,56 ,07
Desvio ,01473 ,01553 ,00900
Mínimo ,31 ,52 ,04
Máximo ,40 ,61 ,10

QUANDO A INSTRUÇÃO

FUNDAMENTAL MÉDIO SUPERIOR


N 500 500 500
Média ,8157 ,1181 ,0662
Mediana ,8163 ,1181 ,0661
Moda ,81 ,12 ,07
Desvio ,01195 ,01036 ,00772
Minimo ,78 ,09 ,05
Maximo ,85 ,15 ,10

QUANTO A RENDA

CLASSE A/B CLASSE C CLASSE D/E


N 500 500 500
Média ,0990 ,1367 ,7643
Mediana ,0991 ,1361 ,7648
Moda ,10 ,13 ,77
Desvio ,00981 ,01081 ,01363
Mínimo ,07 ,11 ,72
Máximo ,13 ,17 ,81

É intuitivo que a escolha dos atributos para caracterizar os eleitores apresenta

______________________________________________________________________ 23
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

níveis de correlação diferentes de zero com as intenções de Voto: o nível de renda, por
exemplo, os pobres têm preferência por uns candidatos e os ricos por outros; também
o grau de instrução do eleitor deve apresentar correlação não nula com diferentes
candidatos, os eleitores com ensino fundamental têm preferências por uns candidatos
e aqueles com curso superior por outros. E assim deve ocorrer com as demais
Características, daí a afirmação que as Características do eleitor explicam o Voto.
Apesar da apresentação das estatísticas do Quadro 7 ter formato diferente das
estatísticas mostradas no Quadro1, elas guardam grande similaridade. No Quadro 1
temos as freqüência (censo) das características da população dos 100.000 eleitores,
enquanto nas tabelas do Quadro 7 apresentamos medidas de posição e dispersão dos
valores da composição das características das 500 amostras de 1.000 eleitores.
É gritante a superposição dos valores, em todos os casos há aderência entre
medidas de posição das 500 amostras com os reais valores da população. Veja por
exemplo, a mediana da composição do Sexo F/M nas 500 amostras 0,53/0,47; e a
mediana no caso da Idade da composição J/A/M é 0,36/0,57/0,07. As superposições
também ocorrem nas outras características. É simplesmente fenomenal.
Foi desta simples e conhecida propriedade: “Replicando-se AAS para estimar
Intenção de Voto, também são reproduzidas com fidelidade a composição demo -sócio
-econômicas dos eleitores da PA” que certamente brotou a semente da concepção do
procedimento amostral conhecido por AC.

PARTE III. AMOSTRAGEM POR COTA (AC).


Então por que não partir de uma amostra que reproduza a composição definida
pelas características da população? Ou seja, poder-se-ia gerar uma amostra de 1.000
eleitores com características iguais à composição (%) das tabelas do Quadro1 da
página 4. Daí o nome Amostragem por Cota.
Para confirmar o bom senso da proposta, vamos supor que se tenha uma
amostra só de eleitores jovens, ou ainda, se tivéssemos uma amostra somente de
eleitores com instrução superior, então os resultados da expansão das intenções de

______________________________________________________________________ 24
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

Votos perderiam credibilidade. Por outro lado, se o Instituto de Pesquisa informa que a
amostra montada reproduz a composição das Características da população que
explicam a Intenção de Voto do eleitor, qualquer pessoa ficaria predisposta a admitir
confiabilidade dos resultados. Pela facilidade de execução, pelo baixo custo, pela
rapidez e por reproduzir igual composição das Características da população, AC
ganhou adeptos. E foi desta mesma semente que certamente germinou o termo
“amostra representativa” usada na terminologia da pesquisa por cota. O termo já é
adotado de forma generalizada na prática e até em livros de estatística, mas se
“amostra representativa” fosse usada somente no sentido de reproduzir Características
da população que explicassem a variável de interesse, julgo que seria aceitável e
poderia ser incorporado ao jargão estatístico no caso da AC, como, aliás, já vem
acontecendo na literatura moderna.
Entretanto, na prática a representatividade das Características rompe com a
base fundamental da seleção aleatória (amostra), que como já foi declarado pelo autor
dessa resenha é a essência da Teoria da Amostragem. O grande mal-entendido que
pode acompanhar o uso do termo “amostra representativa” é associá-lo a idéia de
seleção aleatória dos elementos da PA. Julgo que pela forma como vem sendo usada
essa subjacente falácia esta se enraizando e os termos estão virando sinônimos. Acho
difícil, infelizmente, conseguir reverter esta situação. A ilação entre os termos é ardilosa
e provavelmente este raciocínio venha prevalecer.
Mas qual o grave problema gerado pela aplicação da AC que tanto incomoda
os Estatísticos? É a não existência do critério aleatório de seleção dos eleitores
que formarão as cotas, portanto, a amostra. Ou seja, dado um eleitor definido
por suas características, não se conhece a chance dele participar da AC. Este é
o pecado mortal em amostragem, sem esta preciosa informação, não se pode
conhecer a qualidade da estimativa, perde-se controle do erro e de seu nível de
confiabilidade, que já não era dominado pelo Estatístico, dado a subjetividade da
opinião e por causa dos erros do tipo I e II. Evitamos esta heresia na Parte I
______________________________________________________________________ 25
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

idealizando uma população conhecida, onde pelo método AAS cada eleitor tinha
igual chance de pertencer à amostra, situação fictícia que só serviu para o leitor
entender as propriedades do método. Na AC, o pessoal de campo é orientado
para entrevistar tantos e quantos eleitores, com tais e quais características, sem
informar onde estão e quantos são. Como selecioná-los? Torna-se inviável o
conhecimento da lei da seleção. Este é o grande problema com AC. Na prática
quando se torna impossível fazer a seleção aleatória, quase sempre por razões
de custo e de prazo, então se recorre ao método AC como última alternativa.
Como se conduz o trabalho de campo com AC? A entrevista pode ser feita
na rua e neste caso o entrevistado não precisa se identificar e muito menos dar
endereço. Óbvio que o anonimato é uma relevante vantagem para que o eleitor se
sinta à vontade em dar sua opinião. Mas a abordagem de rua começa por identificar as
Características “no olho”, o que não é tão simples, mesmo para aquelas relativamente
aparentes (sexo e idade) e outras nem tanto (renda e instrução). Para piorar a
situação, a abordagem acaba sendo dirigida para aquelas pessoas: simpáticas, menos
agitadas, com aspecto receptivo, transmitindo disponibilidade de tempo, os que gostam
de dar opinião, aqueles curiosos, pessoas solidárias ou solitárias e até aqueles que
sentiram simpatia pelo entrevistador (a). Por outro lado, evitam-se as pessoas de “cara
amarrada”; de “nariz em pé”; apressadas; ou em situações embaraçosas tais como:
acompanhadas por crianças, carregando pacotes, namorando, esperando condução,
comendo e etc. Além disso, por falha do “critério do olho” ocorre com freqüência a
abordagem de pessoas com cotas já completadas, que são dispensadas da entrevista,
gerando constrangimentos. Este é outro aspecto que explica a extensão do uso da AC,
a inexistência de uma estrutura rígida de seleção do entrevistado. Dentro da área
pesquisada designada ao entrevistador, se uma pessoa está indisponível ou é arredia a

dar opinião ou pertence a uma cota já completada, ela é simplesmente substituída pela
próxima alternativa, o objetivo é preencher as cotas designadas.
A pesquisa também pode ser feita por visita a domicílios, numa combinação de

______________________________________________________________________ 26
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

metodologias de amostragem com seleção aleatória seguida de seleção sistemática e


finalmente combinada com cota. É considerado um grande aperfeiçoamento teórico,
embora não resolva totalmente o problema, além do mais encarece muito a pesquisa e
o aumento do custo/benefício não é do agrado das empresas de pesquisa.
Por telefone; obviamente somente para aqueles que o possuem, buscando nas
residências uma pessoa disposta a responder com características pré-estabelecidas,
num horário quase sempre de descanso ou lazer. Perde-se muito na qualidade, um
entrevistador “ao vivo” sempre possui melhores condições de fornecer dados confiáveis
do que o entrevistador por telefone. Mas, continua sem controle da seleção do eleitor.
O Estatístico sem domínio da lei aleatória que rege a seleção da amostra fica
impedido de conhecer as propriedades das suas estimativas. Ademais compromete o
cálculo do erro e do intervalo de confiança das estimativas. O desconhecimento da lei
de seleção (métodos não probabilísticos) determina não existência de embasamento
teórico do método de estimação. Os cálculos do erro e da confiabilidade são realizados
por fórmulas gerais e aproximadas, baseadas em propriedades de grandes amostras.
Mesmo sem respaldo teórico rigoroso, a amostragem por cota é largamente
usada na prática, principalmente por razões de custo e de rapidez na execução. É o
método mais rápido e mais barato quando comparado com qualquer outro método de
amostragem probabilística. Ademais, seu uso ao longo dos últimos 50 anos demonstra
que os resultados obtidos com AC são satisfatórios, basta considerar que se não fosse
assim, não estaria sendo usado a tanto tempo em vários Países. Pela dificuldade de
criar um modelo de simulação para o procedimento AC, talvez impossibilidade, sua
discussão e análise têm se realizado no campo teórico ou tem se restringido a
comparações empíricas particulares. Ainda pode-se contar com abundantes
opiniões de “especialistas”, mas faz-se necessário aprofundamento teórico de
suas propriedades e estudos mais detalhados das limitações para dominar as
condições de uso de AC, que continuará sendo, provavelmente, a metodologia
preferencial das empresas de pesquisa de opinião. As pesquisas eleitorais tiveram um

______________________________________________________________________ 27
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA

forte impulso com a abertura democrática no País com a primeira eleição para o cargo
de Presidente da Republica em 1989. O uso sistemático de AC durante estes 20 anos
de prática de Pesquisa Política já deve ter gerado aperfeiçoamentos na metodologia.
Descrevemos aqui as idéias básicas que circulam nos meios técnicos, mas óbviamente
os avanços obtidos provavelmente pelos grandes Institutos, não são divulgados e
registrados nos TRE`s. Estes constituem o acervo técnico “não patenteado“ melhor
entendido como “o pulo do gato” e obviamente mantido em sigilo. Durante todo esse
tempo o meio acadêmico vem batendo com insistência na metodologia “supostamente”
aplicada e divulgada, mas contribuído pouco com idéias de aprimoramento da AC,
temos notícias de algumas propostas, mas sem informação dos resultados.
Importante que o tamanho da amostra seja ampliado para garantir propriedades
assintóticas (melhora a qualidade da estimação à medida que a amostra cresce). Tudo
isso acarreta aumento de custo da pesquisa e há de se avaliar o custo/benefício.
Finalmente encerramos esta resenha, corroborando e aplaudindo a decisão do
Tribunal Superior Eleitoral-TSE obrigando o registro da Metodologia e do Estatístico
responsável pela pesquisa eleitoral no TRE-Tribunal Regional Eleitoral. Reforçada pela
determinação que o Estatístico e a Empresa executora devam estar registrados nos
CONRE’s, Conselho Regional de Estatística. O controle das pesquisas eleitorais no
Brasil protege a Sociedade em geral de resultados espúrios gerados por incompetência
técnica, manipulação dos resultados ou manobras estratégicas. Mas, ainda há espaço
para se avançar muito mais no monitoramento das pesquisas políticas. A ação do
sistema CONFE/CONRE deverá ser dirigida no sentido de estreitar a troca de
informação com a estrutura institucional TSE/TRE, divulgando e orientando como
analisar as metodologias e programando procedimentos no controle da qualidade das
pesquisas políticas no País.

______________________________________________________________________ 28
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br

Você também pode gostar