Escolar Documentos
Profissional Documentos
Cultura Documentos
PARTE I - INTRODUÇÃO.
Todavia, para se ter avaliação da opinião eleitoral de uma população num certo
momento, com rapidez, com baixo custo e com alguma confiabilidade, a pesquisa por
amostragem é o melhor procedimento técnico que se pode lançar mão.
Outra questão crucial que envolve a pesquisa de opinião e gera intermináveis
debates e discussões acaloradas, resulta da dificuldade, ou melhor, impossibilidade de
avaliar a qualidade dos resultados no momento da divulgação dos resultados. Faltam
referências que sirvam para aferir as estimativas. No caso particular da pesquisa
eleitoral, a única referência confiável é o resultado final das urnas. Mas este só poderia
ser confrontado com o resultado da pesquisa de “boca de urna”, que cada vez mais,
perde importância dada à rapidez da apuração eleitoral.
Quando as previsões das pesquisas realizadas com alguma antecedência ou
próximas ao pleito são confirmadas no dia da eleição, então tudo vai a mil maravilhas,
as empresas fizeram “seu dever de casa”. Quando não, é sempre possível argumentar
que o projeto estatístico estava correto, mas as previsões não se verificaram devido a
mudanças de última hora do cenário (decretação de feriado na véspera do pleito,
boatos em cima do evento, declarações de última hora de cacique político, etc). Quase
sempre estas discussões são inconclusas e terminam no “deixa pra lá”, por falta
absoluta de critério que consiga separar as forças políticas que atuaram na última hora
modificando o cenário político e o erro da pesquisa.
Para passar ao leitor alguns aspectos técnicos deste poderoso instrumental
estatístico que é a Teoria da Amostragem usaremos como base o mais elementar dos
métodos, denominada Amostragem Aleatória Simples o primeiro a ser criado e referido
de forma abreviado pela sigla (AAS), o qual será discutido na PARTE II. O AAS por ter
sido pioneiro na Teoria da Amostragem servirá de contra ponto didático para o leitor
poder entender as dificuldades impostas pelo método Amostragem por Cota (AC) que
é o procedimento mais usado pelos Institutos de Pesquisa. Mas apesar de dominar a
prática da pesquisa de opinião, o método AC não é considerado um método de
amostragem no sentido estritamente teórico, não é da mesma natureza que os
______________________________________________________________________ 6
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA
Classe de Renda) e finalmente a última coluna indicará em quem o eleitor vai votar.
Além disso, nossos eleitores possuem a grande virtude de não mentir e tampouco
mudam de opinião em quem vão votar entre os quatro hipotéticos candidatos do pleito
(A, B, C e D). Se o leitor preferir, pode imaginar que D não é um candidato, ele pode
significar a soma daqueles que disseram que: vão anular o Voto; estão indecisos; vão
deixar em branco; não vão votar. O quadro da PA com as características demo - sócio
-econômicas é apresentado abaixo, onde alguns códigos (Idade e Renda) estão
simbolizando valores numéricos usados no procedimento da simulação e foram frutos
da nossa imaginação só para ilustrar numericamente as propriedades estatísticas do
processo da AAS.
Quadro Representativo das Características da PA com Voto Fixado
NO do SEXO IDADE GRAU RENDA VOTO
TÍTULO INSTRU
T1 F I1 1O R1 A
T2 F I2 3O R2 D
T3 M I3 PÓS R3 C
O próximo passo é selecionar da PA formada pelas cem mil linhas, uma amostra cujo
tamanho será fixada arbitrariamente em mil eleitores (n=1.000 linhas). O processo
______________________________________________________________________ 8
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA
______________________________________________________________________ 9
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA
A seguir daremos em forma de gráfico de barra a composição dos Votos por tipo
de característica para a população de 100.000 eleitores. Não seria necessário destacar
que na prática, tanto a informação do Quadro 2 quanto os gráficos dados a seguir são
obviamente informações desconhecidas. Estamos admitindo aqui seu conhecimento só
______________________________________________________________________ 10
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA
para mostrar ao leitor a situação que foi engendrada na simulação. Portanto estamos
fazendo um jogo, fingimos desconhecer a real situação e aplicamos a técnica da AAS
para estimar e confrontar os resultados com os da população. Desta forma o leitor terá
oportunidade de ganhar confiança com os conceitos dos procedimentos estatísticos no
caso de uma situação ideal, apesar dela não existir na prática.
Gráfico 1:Gráfico de barras (%) dos 100.000 Votos por Característica do Eleitor.
CAND_D
20,0%
0,0%
FEMININO MASCULINO
SEXO
CAND_C
40,0%
60,0% CAND_D
%
20,0%
0,0% 40,0%
FUNDAMENTAL SUPERIOR
MÉDIO
INSTRUÇÃO 20,0%
0,0%
CLASSE CLASSE CLASSE
E/D C B/A
RENDA
______________________________________________________________________ 11
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA
Na AAS o Estatístico joga com três parâmetros relacionados entre si através de uma
única fórmula obtida da aproximação normal: o tamanho da amostra, a margem de erro
e o nível de confiança; fixado dois deles o terceiro é determinado pela fórmula. Então,
quando o tamanho da amostra e a margem de erro são fixados, que é exatamente o
que fazem os Institutos de Pesquisa, então o nível de confiança é conseqüência direta
do resultado da fórmula e seu valor é variável para cada candidato. Faremos 500
estimativas das proporções de Votos para cada uma das 500 amostras selecionadas
de tamanho 1.000, repetidamente retiradas do globo e devolvidas antes de retirar a
próxima amostra, que darão 500 resultados de uma PA estática.
Na prática para obter uma rodada de resultados, as Empresas de Pesquisa
fazem uso de uma única amostra de 1.000 eleitores. Então à medida que o tempo
avança e a eleição se aproxima as opiniões vão se modificando, por isso à empresa
faz sucessivas rodadas de pesquisas ao longo do tempo e gera a curva de evolução
das estimativas de votos de cada candidato. Na simulação, as 500 amostras são de
uma população fictícia e imutável, de convicção férrea quanto ao Voto no prazo do
estudo.
Apresentamos a seguir estatísticas das estimativas das 500 amostras de
1.000 eleitores. A simulação tipo mega-sena foi substituída por processo
computacional gerado pelo autor e pode facilmente ser reproduzida por especialistas.
Adotar-se-á a notação PV_s para designar proporção de um candidato genérico.
Impressionante! Vejam que para cada Candidato a média, a moda e a mediana que
______________________________________________________________________ 12
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA
são medidas de posição das 500 estimativas estão praticamente em cima dos valores
verdadeiros da população original (Quadro 2). As demais são medidas de dispersão,
óbvio que o Intervalo {Min, Max} sempre inclui 100% das estimativas. O Desvio Padrão
(DP) define uma gama de intervalos. Na hipótese da distribuição Normal (Sino) que é
padrão para o caso estudado, tem-se a propriedade: o valor da média “mais ou menos
1xDP” inclui 68% dos casos observados, com “mais ou menos 2xDP” inclui 96% e com
“mais ou menos 3xDP” inclui praticamente 100% dos casos.
Gráfico 2:Histogramas das 500 Estimativas de PV_A à PV_D.
______________________________________________________________________ 13
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA
P V _A P V _B
60
60 50
40
Frequencia
Frequencia
40
30
20
20
10
P V _C P V _D
80 100
80
60
Frequencia
Frequencia
60
40
40
20
20
______________________________________________________________________ 14
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA
Pelos valores das estatísticas concluímos que o nível de confiança de cada candidato é
praticamente constante. Por exemplo, a estimativa PV_A tem confiabilidade 94,23%
(mediana), que significa que com a amostra de tamanho igual a 1.000, o verdadeiro
valor PV_A=0,50 do candidato A estará contido em 94,23% dos intervalos construídos
(valor estimado mais ou menos 3%). Analogamente, PV_D = 6% estaria contido em
99,99% dos intervalos com margem 3% e assim seriam interpretados os demais
valores 96,74% e 98,82% respectivamente para os candidatos B e C.
Por outro lado ao invés de aplicar a fórmula da aproximação Normal que dá o
nível de confiança para cada estimativa como no Quadro 4 podemos usar diretamente
os 500 valores estimados pela simulação para verificar a freqüência que o verdadeiro
valor do percentual de votos caiu dentro do intervalo definido pelo valor estimado mais
______________________________________________________________________ 15
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA
Frequencia %
FORA DO INTER_A 30 6,0
DENTRO DO INTER_A 470 94,0
Total 500 100,0
PV_B=27%
INTER_B de PV_B
Frequencia %
FORA DO INTER_B 15 3,0
DENTRO DO INTER_B 485 97,0
Total 500 100,0
PV_C=17%
INTERVALO_C de PV_C
Frequencia %
FORA DO INTER_C 9 1,8
DENTRO DO INTER_C 491 98,2
Total 500 100,0
PV_D= 6%
INTERVALO_D de PV_D
Frequencia %
FORA DO INTER_D 1 ,2
DENTRO DO INTER_D 499 99,8
Total 500 100,0
______________________________________________________________________ 18
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA
IN TE R _A /B
0 ,3 2
FO R A D O S D O IS (A /B )
D E N TR O D E U M D E LE S
D E N TR O D O S D O IS (A /B )
0 ,3 0
0 ,2 8
PV_B
0 ,2 6
0 ,2 4
0 ,2 2
______________________________________________________________________ 19
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA
INTER_A/B/C
DENTRO DE UM DELES
DENTRO DE DOIS DELES
DENTRO DOS TRÊS
0,32
0,30
0,28
PV_B
0,26
0,24
0,22
0,42 0,44 0,14
0,46 0,48 0,16
0,50 0,52 0,18
0,54 0,20
PV_A PV_C
______________________________________________________________________ 21
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA
EMPATE TÉCNICO
Frequencia %
NÀO EMPATADO 132 66,0
EMPATADO 68 34,0
Total 200 100,0
Logo, das 200 amostras concluiríamos com o critério do “Empate Técnico” pela
existência de 68 empates. Por outro lado, pela técnica estatística “Teste de Hipótese”
não se encontrou nenhuma diferença significativa nos resultados apurados, então as
200 estimativas PV_A e PV_B estariam 100% empatados, que corresponde fielmente à
realidade. Logo, quando de fato existe empate, o critério “Empate Técnico” só acertaria
34% e erraria 66% das vezes. Lamentável!
______________________________________________________________________ 22
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA
QUANTO AO SEXO
FEMININO MASCULINO
N 500 500
Média ,5301 ,4699
Mediana ,5301 ,4699
Moda ,51 ,46
Desvio ,01567 ,01567
Minimo ,48 ,42
Maximo ,58 ,52
QUANTO A IDADE
QUANDO A INSTRUÇÃO
QUANTO A RENDA
______________________________________________________________________ 23
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA
níveis de correlação diferentes de zero com as intenções de Voto: o nível de renda, por
exemplo, os pobres têm preferência por uns candidatos e os ricos por outros; também
o grau de instrução do eleitor deve apresentar correlação não nula com diferentes
candidatos, os eleitores com ensino fundamental têm preferências por uns candidatos
e aqueles com curso superior por outros. E assim deve ocorrer com as demais
Características, daí a afirmação que as Características do eleitor explicam o Voto.
Apesar da apresentação das estatísticas do Quadro 7 ter formato diferente das
estatísticas mostradas no Quadro1, elas guardam grande similaridade. No Quadro 1
temos as freqüência (censo) das características da população dos 100.000 eleitores,
enquanto nas tabelas do Quadro 7 apresentamos medidas de posição e dispersão dos
valores da composição das características das 500 amostras de 1.000 eleitores.
É gritante a superposição dos valores, em todos os casos há aderência entre
medidas de posição das 500 amostras com os reais valores da população. Veja por
exemplo, a mediana da composição do Sexo F/M nas 500 amostras 0,53/0,47; e a
mediana no caso da Idade da composição J/A/M é 0,36/0,57/0,07. As superposições
também ocorrem nas outras características. É simplesmente fenomenal.
Foi desta simples e conhecida propriedade: “Replicando-se AAS para estimar
Intenção de Voto, também são reproduzidas com fidelidade a composição demo -sócio
-econômicas dos eleitores da PA” que certamente brotou a semente da concepção do
procedimento amostral conhecido por AC.
______________________________________________________________________ 24
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA
Votos perderiam credibilidade. Por outro lado, se o Instituto de Pesquisa informa que a
amostra montada reproduz a composição das Características da população que
explicam a Intenção de Voto do eleitor, qualquer pessoa ficaria predisposta a admitir
confiabilidade dos resultados. Pela facilidade de execução, pelo baixo custo, pela
rapidez e por reproduzir igual composição das Características da população, AC
ganhou adeptos. E foi desta mesma semente que certamente germinou o termo
“amostra representativa” usada na terminologia da pesquisa por cota. O termo já é
adotado de forma generalizada na prática e até em livros de estatística, mas se
“amostra representativa” fosse usada somente no sentido de reproduzir Características
da população que explicassem a variável de interesse, julgo que seria aceitável e
poderia ser incorporado ao jargão estatístico no caso da AC, como, aliás, já vem
acontecendo na literatura moderna.
Entretanto, na prática a representatividade das Características rompe com a
base fundamental da seleção aleatória (amostra), que como já foi declarado pelo autor
dessa resenha é a essência da Teoria da Amostragem. O grande mal-entendido que
pode acompanhar o uso do termo “amostra representativa” é associá-lo a idéia de
seleção aleatória dos elementos da PA. Julgo que pela forma como vem sendo usada
essa subjacente falácia esta se enraizando e os termos estão virando sinônimos. Acho
difícil, infelizmente, conseguir reverter esta situação. A ilação entre os termos é ardilosa
e provavelmente este raciocínio venha prevalecer.
Mas qual o grave problema gerado pela aplicação da AC que tanto incomoda
os Estatísticos? É a não existência do critério aleatório de seleção dos eleitores
que formarão as cotas, portanto, a amostra. Ou seja, dado um eleitor definido
por suas características, não se conhece a chance dele participar da AC. Este é
o pecado mortal em amostragem, sem esta preciosa informação, não se pode
conhecer a qualidade da estimativa, perde-se controle do erro e de seu nível de
confiabilidade, que já não era dominado pelo Estatístico, dado a subjetividade da
opinião e por causa dos erros do tipo I e II. Evitamos esta heresia na Parte I
______________________________________________________________________ 25
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA
idealizando uma população conhecida, onde pelo método AAS cada eleitor tinha
igual chance de pertencer à amostra, situação fictícia que só serviu para o leitor
entender as propriedades do método. Na AC, o pessoal de campo é orientado
para entrevistar tantos e quantos eleitores, com tais e quais características, sem
informar onde estão e quantos são. Como selecioná-los? Torna-se inviável o
conhecimento da lei da seleção. Este é o grande problema com AC. Na prática
quando se torna impossível fazer a seleção aleatória, quase sempre por razões
de custo e de prazo, então se recorre ao método AC como última alternativa.
Como se conduz o trabalho de campo com AC? A entrevista pode ser feita
na rua e neste caso o entrevistado não precisa se identificar e muito menos dar
endereço. Óbvio que o anonimato é uma relevante vantagem para que o eleitor se
sinta à vontade em dar sua opinião. Mas a abordagem de rua começa por identificar as
Características “no olho”, o que não é tão simples, mesmo para aquelas relativamente
aparentes (sexo e idade) e outras nem tanto (renda e instrução). Para piorar a
situação, a abordagem acaba sendo dirigida para aquelas pessoas: simpáticas, menos
agitadas, com aspecto receptivo, transmitindo disponibilidade de tempo, os que gostam
de dar opinião, aqueles curiosos, pessoas solidárias ou solitárias e até aqueles que
sentiram simpatia pelo entrevistador (a). Por outro lado, evitam-se as pessoas de “cara
amarrada”; de “nariz em pé”; apressadas; ou em situações embaraçosas tais como:
acompanhadas por crianças, carregando pacotes, namorando, esperando condução,
comendo e etc. Além disso, por falha do “critério do olho” ocorre com freqüência a
abordagem de pessoas com cotas já completadas, que são dispensadas da entrevista,
gerando constrangimentos. Este é outro aspecto que explica a extensão do uso da AC,
a inexistência de uma estrutura rígida de seleção do entrevistado. Dentro da área
pesquisada designada ao entrevistador, se uma pessoa está indisponível ou é arredia a
dar opinião ou pertence a uma cota já completada, ela é simplesmente substituída pela
próxima alternativa, o objetivo é preencher as cotas designadas.
A pesquisa também pode ser feita por visita a domicílios, numa combinação de
______________________________________________________________________ 26
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA
______________________________________________________________________ 27
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br
CONSELHO FEDERAL DE ESTATÍSTICA
forte impulso com a abertura democrática no País com a primeira eleição para o cargo
de Presidente da Republica em 1989. O uso sistemático de AC durante estes 20 anos
de prática de Pesquisa Política já deve ter gerado aperfeiçoamentos na metodologia.
Descrevemos aqui as idéias básicas que circulam nos meios técnicos, mas óbviamente
os avanços obtidos provavelmente pelos grandes Institutos, não são divulgados e
registrados nos TRE`s. Estes constituem o acervo técnico “não patenteado“ melhor
entendido como “o pulo do gato” e obviamente mantido em sigilo. Durante todo esse
tempo o meio acadêmico vem batendo com insistência na metodologia “supostamente”
aplicada e divulgada, mas contribuído pouco com idéias de aprimoramento da AC,
temos notícias de algumas propostas, mas sem informação dos resultados.
Importante que o tamanho da amostra seja ampliado para garantir propriedades
assintóticas (melhora a qualidade da estimação à medida que a amostra cresce). Tudo
isso acarreta aumento de custo da pesquisa e há de se avaliar o custo/benefício.
Finalmente encerramos esta resenha, corroborando e aplaudindo a decisão do
Tribunal Superior Eleitoral-TSE obrigando o registro da Metodologia e do Estatístico
responsável pela pesquisa eleitoral no TRE-Tribunal Regional Eleitoral. Reforçada pela
determinação que o Estatístico e a Empresa executora devam estar registrados nos
CONRE’s, Conselho Regional de Estatística. O controle das pesquisas eleitorais no
Brasil protege a Sociedade em geral de resultados espúrios gerados por incompetência
técnica, manipulação dos resultados ou manobras estratégicas. Mas, ainda há espaço
para se avançar muito mais no monitoramento das pesquisas políticas. A ação do
sistema CONFE/CONRE deverá ser dirigida no sentido de estreitar a troca de
informação com a estrutura institucional TSE/TRE, divulgando e orientando como
analisar as metodologias e programando procedimentos no controle da qualidade das
pesquisas políticas no País.
______________________________________________________________________ 28
Av. Rio Branco, n.º 277, grupo 909 - Centro - Rio de Janeiro / RJ - CEP 20.040-009
- Telefax (21) 2220-1058 – Tel. (21) 2262-1709
http://www.confe.org.br/ confe@confe.org.br