Você está na página 1de 10

INE 7002 - Amostragem

7 - AMOSTRAGEM
No Captulo 6 apresentamos as principais etapas do planejamento de uma pesquisa
estatstica. Na Seo 6.2.2 - Coleta de Dados, vimos que h duas formas de conduzir um estudo: por
censo ou por amostragem, sendo que o censo consiste em simplesmente em estudar todos os
elementos da populao, e a amostragem pesquisa apenas uma pequena parte dela, suposta
representativa do todo. Avaliamos quando era aconselhvel ou no usar amostragem. Para realizar
um estudo por amostragem, de maneira que seus resultados sejam vlidos e possam generalizados
para a populao algumas tcnicas precisam ser empregadas. Estas tcnicas constituem o contedo
deste Captulo. A essncia deste processo mostrada na figura 1:
AMOSTRAGEM

POPULAO

Amostra

Generalizao

Figura 1 - Processo de amostragem e generalizao

7.1 - Plano de Amostragem


Uma vez tendo decidido realizar a pesquisa selecionando uma amostra da populao
preciso elaborar o plano de amostragem. O plano de amostragem consiste em definir as unidades
amostrais, modo como a amostra ser retirada (o tipo de amostragem), e o prprio tamanho da
amostra.
As unidades amostrais so as unidades selecionadas para se chegar aos elementos da prpria
populao. Podem ser os prprios elementos da populao, quando h acesso direto a eles, ou
qualquer outra unidade que possibilite chegar at eles: selecionar os domiclios como unidades de
amostragem, para chegar at as famlias (que so os elementos da populao); selecionar as turmas
como unidades de amostragem, para chegar at os alunos (que so os elementos da populao).
A definio de como a amostra ser retirada consiste em definir o tipo de amostragem, e
podemos ver um resumo dos tipos na Figura 2:

INE 7002 - Amostragem

Aleatria (casual) simples


Sistemtica
Amostragem Probabilstica
(Aleatria)

Estratificada
Por Conglomerados
A esmo
Intencional (por julgamento)

Amostragem No Probabilstica
(No Aleatria)

Por cotas
Bola de neve

Figura 2 - Tipos de amostragem

Os tipos de amostragem probabilstica sero estudados na Seo 7.2, a amostragem no


probabilstica na Seo 7.3, e o clculo do tamanho de amostra ser visto na Seo 7.4.

7.2 - Amostragem Probabilstica


A amostragem probabilstica tambm chamada de aleatria ou casual. A sua importncia
decorre do fato de que apenas os resultados provenientes de uma amostra probabilstica podem ser
generalizados estatisticamente para a populao da pesquisa. O que significa estatisticamente?
Significa que podemos associar aos resultados uma probabilidade 1 de que estejam corretos, ou seja
uma medida da confiabilidade das concluses obtidas. Se a amostra no for probabilstica no h
como saber se h 95% ou 0% de probabilidade de que os resultados sejam corretos, e as tcnicas de
inferncia estatstica2 porventura utilizadas tero validade questionvel.
A condio primordial para uso da amostragem probabilstica que "todos os elementos da
populao tenham uma probabilidade maior do que zero de pertencerem amostra". Tal condio
materializada se:
H acesso a toda a populao. Ou seja, no h teoricamente
problema em selecionar nenhum dos elementos, todos poderiam
ser pesquisados.

1
2

Os conceitos de Probabilidade sero vistos no Captulo 8.


Os conceitos de Inferncia Estatstica sero vistos no Captulo 9.

INE 7002 - Amostragem

H possibilidade de obter uma listagem dos elementos da populao,


concretizando ento o acesso a todos os elementos. Se pensarmos em uma
pesquisa de opinio, seria uma listagem com todos os possveis respondentes.

Os elementos da amostra so selecionados atravs de alguma forma


de sorteio no viciado: tabelas de nmeros aleatrios, nmeros
pseudo-aleatrios gerados por computador. Com a utilizao de
sorteio elimina-se a ingerncia do pesquisador na obteno da
amostra, e garante-se que todos os integrantes da populao tem
probabilidade de pertencer amostra.
Vamos ver ento os diversos tipos de amostragem probabilstica.
7.2.1 - Amostragem aleatria (casual) simples
Este tipo de amostragem probabilstica somente recomendvel se a populao for
homognea em relao varivel de interesse. H uma listagem dos elementos da populao,
atribuem-se nmeros a eles, e atravs de alguma espcie de sorteio no viciado (por meio de tabelas
de nmeros aleatrios3 ou nmeros pseudo-aleatrios gerados por computador) os integrantes da
amostra so selecionados. Neste tipo de amostragem probabilstica todos os elementos da populao
tm a mesma probabilidade de pertencer amostra.
Exemplo 7.1 - Queremos realizar uma pesquisa de opinio sobre a qualidade de um curso
universitrio, que tem cerca de 1000 alunos, perguntando aspectos relativos ao encadeamento das
disciplinas no currculo. Decidimos utilizar amostragem aleatria simples para selecionar os
respondentes. Este mtodo de amostragem o mais apropriado?
A amostragem aleatria simples pode ser utilizada quando houver homogeneidade na populao
em relao varivel de interesse. No presente caso estamos interessados na opinio dos alunos
sobre o currculo. razovel imaginar que um aluno da oitava fase tenha um conhecimento
diferente do currculo do que outro da segunda fase, acarretando em diferentes opinies, que
deveriam ser registradas. Se utilizarmos uma amostragem aleatria simples, totalmente por acaso,
apenas alunos das fases mais adiantadas, ou das fases iniciais, comprometendo o resultado da
pesquisa. Assim, como no h homogeneidade na populao acerca da varivel de interesse, a
amostragem aleatria simples no apropriada para este caso.
Se a amostra for retirada com o auxlio de um computador o processo da amostragem
aleatria simples pode tomar muito tempo, pois para uma grande populao, sendo os nmeros
selecionados ao acaso, o programa poderia escolher o nmero 235634 e logo em seguida o nmero
7. Esta "flutuao" pode fazer com que a retirada da amostra leve algum tempo. O mesmo se aplica
se for utilizada uma tabela de nmeros aleatrios.
7.2.2 - Amostragem sistemtica
Quando a lista de respondentes for muito grande a utilizao de amostragem aleatria
simples pode ser um processo moroso. Utiliza-se ento uma variao, a amostragem sistemtica,
que tambm supe que a populao homognea em relao varivel de interesse, mas que
consistem em retirar elementos da populao a intervalos regulares, at compor o total da amostra.
A amostragem sistemtica somente pode ser retirada se a ordenao da lista no tiver relao com a
3

Ver BARBETTA,P. A. Estatstica Aplicada s Cincias Sociais. Ed. da UFSC, 4 ed. Florianpolis, 2002.

INE 7002 - Amostragem

varivel de interesse: imagine que queremos obter uma amostra de idades de uma listagem
justamente ordenada desta forma, neste caso a amostragem sistemtica no seria apropriada (a no
ser que reordenssemos a lista).
O procedimento para a amostragem sistemtica:
- obtm-se o tamanho da populao (N);
- calcula-se o tamanho da amostra (n) - espere pela Seo 7.5;
- encontra-se o intervalo de retirada k = N/n
# se k for fracionrio, deve-se aumentar n at tornar o resultado inteiro;
# se N for um nmero primo, excluem-se por sorteio alguns elementos da populao para
tornar k inteiro.
- sorteia-se o ponto de partida (um dos k nmeros do primeiro intervalo), usando uma tabela de
nmeros aleatrios, ou qualquer outro dispositivo (isso precisa ser feito para garantir que todos os
elementos da populao tero chance de pertencer amostra).
- a cada k elementos da populao retira-se um para a amostra, at completar o valor de n.
Veja a Figura 3:

1...k

...N

Populao

Amostra
1

Figura 3 - Amostragem sistemtica

Exemplo 7.2 - Uma operadora telefnica pretende saber a opinio de seus assinantes comerciais
sobre seus servios na cidade de Florianpolis. Supondo que h 25037 assinantes comerciais, e a
amostra precisa ter no mnimo 800 elementos, mostre como seria organizada uma amostragem
sistemtica para selecionar os respondentes.
A operadora dispe de uma lista ordenada alfabeticamente com todos os seus assinantes, o
intervalo de retirada ser:
k = N/n = 25037/800 = 31,2965
Como o valor de k fracionrio algo precisa ser feito. Aumentar o tamanho da amostra no
resolver o problema, porque 25037 um nmero primo. Como no podemos reduzir o tamanho de
amostra, devendo permanecer igual a 800, se excluirmos por sorteio 237 elementos da populao,
e refizermos a lista teremos:
k = N/n = 24800/800 = 31
A cada 31 assinantes um retirado para fazer parte da amostra. Devemos sortear o ponto de
partida: um nmero de 1 a 31 (do 1o ao 31o assinante). Imagine que o sorteio resultasse em 5,
ento amostra seria (nmero de assinantes):
{5, 36, 67, 98, ...., 24774}
7.2.3 - Amostragem Estratificada
bastante comum que a populao alvo de uma pesquisa seja heterognea em relao
varivel de interesse. No caso de uma pesquisa eleitoral para governador, por exemplo, podemos

INE 7002 - Amostragem

esperar que a opinio deva ser diferente dependendo da idade, classe social e mesmo profisso dos
entrevistados. Contudo podemos supor que haja certa homogeneidade de opinio dentro de cada
grupo. Ento se supe que haja heterogeneidade entre os estratos, mas homogeneidade dentro dos
estratos, e que eles sejam mutuamente exclusivos (cada elemento da populao pode pertencer a
apenas um estrato). Para garantir que a amostra seja representativa da populao precisamos
garantir que os diferentes estratos sejam nela representados.
A seleo dos elementos de cada estrato pode ser feita
usando amostragem aleatria simples ou sistemtica.

Sorteio no viciado

Figura 4 - Amostragem estratificada

A amostragem estratificada pode ser:


- proporcional, quando o nmero de elementos selecionados
de cada estrato proporcional ao seu tamanho na populao
(por exemplo, se o estrato representa 15% da populao, 15%
da amostra dever ser retirada dele);
- uniforme, quando o mesmo nmero de elementos so
selecionados de cada estrato.
A amostragem estratificada proporcional possibilita
resultados melhores, mas exige um grande conhecimento da
populao (para saber quantos so e quais so os tamanhos
dos estratos). A amostragem estratificada uniforme mais
usada em estudos comparativos.

7.2.4 - Amostragem por conglomerados


Teoricamente a amostragem estratificada proporcional apresenta os melhores resultados
possveis. A grande dificuldade em implement-la deve-se ao grau de conhecimento necessrio
sobre a populao, que geralmente no existe ou impraticvel de ser obtido. Uma forma
alternativa de amostragem consiste no uso de conglomerados.
Os conglomerados tambm so grupos mutuamente exclusivos de elementos da populao,
mas so definidos de forma mais arbitrria do que os estratos: bastante comum definir os
conglomerados geograficamente. Por exemplo, os bairros de uma cidade, que constituiriam
conglomerados de domiclios.
O procedimento para a amostragem por conglomerados:
- divide-se a populao em conglomerados;
- sorteiam-se os conglomerados (usando tabela de nmeros aleatrios ou qualquer outro mtodo no
viciado);
- pesquisam-se todos os elementos dos conglomerados sorteados, ou sorteiam-se elementos deles.
Veja a Figura 5:

INE 7002 - Amostragem

Observar todos os
elementos dos
conglomerados
sorteados.

Sorteio
de
conglomerados

Sortear alguns
elementos dos
conglomerados
sorteados.

Figura 5 - Amostragem por conglomerados


4

Exemplo 7.3 - Pesquisa Nacional por Amostra de Domiclios (PNAD) do IBGE. Coleta
informaes demogrficas e scio-econmicas sobre a populao brasileira. Utiliza amostragem por
conglomerados.
Primeiro estgio: amostras de municpios (conglomerados) para cada uma das regies geogrficas
do Brasil;
Segundo estgio: setores censitrios sorteados em cada municpio (conglomerado sorteado);
Terceiro estgio: domiclios sorteados em cada setor censitrio.
A utilizao de amostragem por conglomerados permite uma reduo substancial nos custos
de obteno da amostra, sem comprometer em demasia a preciso, e em alguns casos a nica
alternativa possvel.

7.3 - Amostragem No Probabilstica


A obteno de uma amostra probabilstica exige que se obtenha uma listagem com os
elementos da populao. Em suma, exige acesso a todos os elementos da populao, que a
populao acessvel seja igual populao alvo. Nem sempre possvel obter tal listagem na
prtica, o que teoricamente inviabilizaria a retirada de uma amostra aleatria. Ento deve-se
recorrer amostragem no probabilstica.
Ao usar a amostragem no probabilstica o pesquisador no sabe qual a probabilidade de
que um elemento da populao tem de pertencer amostra. Portanto, os resultados da amostra no
podem ser estatisticamente generalizados para a populao, porque no se pode estimar o erro
amostral. Se as caractersticas da populao acessvel forem semelhantes s da populao alvo os
resultados podem ser equivalentes aos de uma amostragem probabilstica, mas no podemos
garantir a sua confiabilidade.
A amostragem no probabilstica pode ser usada
Alguns dos usos habituais da amostragem no probabilstica so os seguintes:
a) Como etapa preliminar em projetos de pesquisa;
b) em projetos de pesquisa qualitativa;
c) em casos onde a populao de trabalho no pode ser enumerada.
E os vrios tipos de amostragem no probabilstica.

MOREIRA, Daniel Augusto. Levantamentos Amostrais - Mestrado em Administrao de Empresas - FECAP- SP.

INE 7002 - Amostragem

Amostragem a esmo5. Neste caso o pesquisador procura ser o mais aleatrio possvel, mas sem
fazer um sorteio formal. Imagine um lote de 10000 parafusos, do qual queremos tirar uma amostra
de 100, se fssemos realizar uma amostragem aleatria simples o processo seria muito trabalhoso.
Ento simplesmente retiramos os elementos a esmo. Este tipo de amostragem tambm pode ser
utilizado quando a populao for formada por material contnuo (gases, lquidos, minrios),
bastando homogeneizar o material e proceder a retirada da amostra.
Amostragem por julgamento (intencional). O pesquisador deliberadamente escolhe alguns
elementos para fazer parte da amostra, com base no seu julgamento de aqueles seriam
representativos da populao. Este tipo de amostragem bastante usado em estudos qualitativos.
Obviamente o risco de obter uma amostra viciada grande, pois se baseia totalmente nas
preferncias do pesquisador, que pode se enganar (involuntria ou "voluntariamente").
Amostragem por cotas. Parece semelhante a uma amostragem estratificada proporcional, da qual
se diferencia por no empregar sorteio na seleo dos elementos. A populao dividida em vrios
subgrupos, na realidade comum dividir em um grande nmero para compensar a falta de
aleatoriedade, e seleciona-se uma cota de cada subgrupo, proporcional ao seu tamanho. Por
exemplo, em uma pesquisa de opinio eleitoral poderamos dividir a populao de eleitores por
sexo, nvel de instruo, faixas de renda entre outros aspectos, e obter cotas proporcionais ao
tamanho dos grupos (que poderia ser obtido atravs das informaes do IBGE). Na amostragem por
cotas os elementos da amostra so escolhidos pelos entrevistadores (de acordo com os critrios...),
geralmente em pontos de grande movimento, o que sempre acarreta certa subjetividade (e impede
que qualquer um que no esteja passando pelo local no exato momento da pesquisa possa ser
selecionado). Na prtica muitas pesquisas so realizadas utilizando amostragem por cotas.
Exemplo 7.46 - Imagine que queremos saber a opinio dos eleitores do bairro Goiaba sobre o
governo municipal. Supe-se que as principais variveis que condicionariam as respostas seriam
sexo, idade e classe social. O bairro apresenta a seguinte composio demogrfica para as variveis:
Sexo
Masculino
Masculino
Masculino
Feminino
Feminino
Feminino
Masculino
Masculino
Masculino
Feminino
Feminino
Feminino
Masculino
Masculino
Masculino
Feminino
Feminino
Feminino

Idade (faixa etria)


18| -- 35
18| -- 35
18| -- 35
18| -- 35
18| -- 35
18| -- 35
35| -- 60
35| -- 60
35| -- 60
35| -- 60
35| -- 60
35| -- 60
Mais de 60
Mais de 60
Mais de 60
Mais de 60
Mais de 60
Mais de 60

Classe social
A
B
C
A
B
C
A
B
C
A
B
C
A
B
C
A
B
C

% populacional
1%
4%
10%
1%
2%
9%
5%
8%
12%
4%
8%
10%
1%
9%
3%
3%
7%
3%

Se, por exemplo, o tamanho de nossa amostra fosse igual a 200 (200 pessoas sero entrevistadas),
o nmero de pessoas deveria ser dividido de forma proporcional: 1% do sexo masculino, com idade
entre 18 e 25 anos, da classe A, totalizando 2 pessoas; 4% do sexo masculino, com idade entre 18 e
25 anos, da classe B, totalizando 8 pessoas, e assim por diante. Os entrevistadores receberiam suas
cotas, e deveriam escolher pessoas, em pontos de movimento do referido bairro, que se aproximem
5
6

COSTA NETO, P.L. da O. Estatstica. So Paulo. Edgard Blcher, 1977.


Adaptado de MARCONI, Marina de A., LAKATOS, Eva Maria. Tcnicas de Pesquisa - 5a ed. So Paulo: Atlas, 2003.

INE 7002 - Amostragem

dos critrios e entrevist-las, recolhendo suas opinies sobre o governo municipal. Usualmente os
resultados so generalizados estatisticamente para a populao, empregando as tcnicas que sero
vistas no Captulo 9, mas rigorosamente os resultados da amostragem por cotas NO TM
VALIDADE ESTATSTICA, visto que no contemplam o princpio de aleatoriedade na seleo da
amostra.
Amostragem "bola de neve" 7. "Particularmente importante quando difcil identificar
respondentes em potencial. A cada novo respondente que identificado e entrevistado, pede-se que
identifique outros que possam ser qualificados como respondentes".
H ainda a amostragem por convenincia (selecionam-se elementos supostos semelhantes
populao, e que esto disponveis) e a de passantes eventuais (selecionam-se aqueles que estejam
passando pelos pesquisadores no momento; comum conjugar este tipo com a amostragem por
cotas).

7.4 - Tamanho de uma amostra aleatria


A determinao do tamanho de amostra um dos aspectos mais controversos da tcnica de
amostragem, e envolve uma srie de conceitos (probabilidade, inferncia estatstica e a prpria
teoria da amostragem). Neste tpico apresentaremos uma viso simplificada para obter o tamanho
mnimo de uma amostra aleatria simples que atenda aos seguintes requisitos:
- estamos interessados no parmetro (ver Seo 1.2) proporo de uma determinada caracterstica
na populao (os casos em que h interesse na mdia de uma varivel quantitativa sero vistos no
Captulo 9);
- a confiabilidade dos resultados da amostra deve ser igual a aproximadamente 95% (ou seja, h
95% de probabilidade de que a proporo populacional esteja no intervalo definido pelos resultados
da amostra - maiores detalhes no Captulo 9);
- estamos fazendo uma estimativa exagerada do tamanho de amostra (no Captulo 9 aprenderemos
como trabalhar com outros tipos de estimativa);
- no vamos nos preocupar com aspectos financeiros relacionados ao tamanho da amostra (embora
obviamente seja uma considerao importante).
O primeiro passo para calcular o tamanho da amostra definir o erro amostral tolervel, que
ser chamado de e0. Este erro o valor mximo que o pesquisador admite errar na estimativa do
parmetro. Lembrem-se das pesquisas de opinio eleitoral: "o candidato Fulano est com 18% de
inteno de voto, a preciso da pesquisa de 3% para mais ou para menos". O 3% o valor do erro
amostral tolervel, ento o percentual de pessoas declarando o voto no candidato Fulano igual a
18% 3%. Alm disso, h uma probabilidade de que este intervalo no contenha o valor real do
parmetro (ou seja, o percentual de eleitores que declaram o voto no candidato), pelo fato de que
estamos usando uma amostra. Os detalhes a respeito sero apresentados no Captulo 9.
razovel imaginar que quanto menor o erro amostral tolervel escolhido maior ser o
tamanho da amostra necessrio para obt-lo. Isso fica mais claro ao ver a frmula para obteno da
primeira estimativa do tamanho de amostra:

n0

1
2
e0

MOREIRA, Daniel Augusto. Levantamentos Amostrais - Mestrado em Administrao de Empresas - FECAP- SP.

INE 7002 - Amostragem

Onde e0 o erro amostral tolervel, e n 0 a primeira estimativa do tamanho de amostra. Se o


tamanho da populao, N, for conhecido podemos corrigir a primeira estimativa:
N n0
n
N n0
Exemplo 7.3 - Obter o tamanho mnimo de uma amostra aleatria simples, admitindo com alto grau
de confiana, um erro amostral mximo de 4%, supondo que a populao tenha:
a) 200 elementos.
b) 200 000 elementos.
Observe a diferena entre os tamanhos das duas populaes: a da letra b mil vezes maior. Como
a primeira estimativa, n0 no depende do tamanho da populao, e o erro amostral 4% para
ambas podemos calcul-lo apenas uma vez. Devemos dividir o 4% por 100 antes de substituir na
frmula:

n0

1
1

625
2
(0,04) 2
e0

Ento nossa primeira estimativa, para um erro amostral de 4%, retirar uma amostra de 625
elementos.
a) Obviamente precisamos corrigir a primeira estimativa, pois a populao conta com apenas 200
elementos. Ento:
N n 0 200 625
n

151,51
N n 0 200 625
Precisamos arredondar, sempre para cima, o tamanho mnimo da amostra. Ento a amostra
dever ter pelo menos 152 elementos para garantir um erro amostral de 4%. Observe que a
amostra representa 76% da populao...
b) Corrigindo a primeira estimativa com o tamanho da populao:
N n 0 200000 625
n

623,05
N n 0 200000 625
Arredondando, a amostra dever ter no mnimo 624 elementos para garantir um erro amostral de
4%. Observe que a amostra representa 0,312% da populao...
Poderamos ter usado diretamente a primeira estimativa, 625 elementos, pois a correo no
causou grande mudana. Este exemplo prova que no precisamos de grandes amostras para obter
uma boa preciso nos resultados.
A Figura 6 mostra um grfico relacionando tamanhos de amostra para diferentes tamanhos
de populao, considerando um erro amostral tolervel igual a 3% (bastante usado em pesquisas de
opinio eleitoral).
T a m a n h o s m n im o s d e a m o s tr a :
e r r o a m o s tr a l d e 3 %

T a m a n h o d a a m o s tra

1200
1000
800
600
400
200
0
0

5000

10000

15000

20000

25000

T a m a n h o d a p o p u la o

Figura 6 - Tamanho de amostra x tamanho da populao (e0 = 3%)

Observe que ocorre um fenmeno


chamado saturao. A partir de um
determinado tamanho de populao,
para o mesmo erro amostral, o ritmo
de crescimento do tamanho da
amostra vai diminuindo, para 20000
elementos ou mais praticamente no
h mais aumento. Isso mostra que
no h necessidade de retirar, por
exemplo, 50% da populao para ter
uma boa amostra.

INE 7002 - Amostragem 10

Uma vez calculado o tamanho mnimo da amostra, basta retirar os elementos utilizando
alguma espcie de sorteio no viciado. Se a populao dividir-se em subgrupos, o procedimento
deve ser realizado para cada um deles, e o tamanho da amostra total ser a soma deles.

7.5 - Fontes de erro em pesquisas por amostragem


O erro amostral tolervel (mencionado na Seo 7.4) considera que a amostra foi retirada
seguindo rigorosamente o plano de amostragem, e que no houve viesamento algum por parte do
pesquisador. Caso contrrio, ou seja, se ocorrem erros no amostrais, o erro amostral no pode
mais ser garantido. Estes erros poderiam ser:
- problemas no instrumento de pesquisa (questionrio ambguo, opes no conseguem medir as
respostas do respondente);
- problemas com as pessoas que aplicam a pesquisa (entrevistadores mal treinados, cansados ou
simplesmente inadequados para funo);
- falta de resposta (uma parcela da amostra pode recusar-se a participar da pesquisa, ao menos em
um primeiro momento).
- erro de cobertura (bastante comum em pesquisas que usam questionrios por correio, drop-off ou
on-line, em suma a diferena entre a populao alvo e a acessvel, somente os interessados
respondem pesquisa, o que pode causar tendncia nos resultados).