Você está na página 1de 36

Aula 12.

Levantamentos, parte 2
Amostragens

Carolina Parra Martínez

Técnicas de Pesquisa em Economia – 1/2021

24 de Setembro de 2021

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 1 / 19


Planejamento do levantamento por amostragem


a) Definição dos objetivos.

b) Operacionalização dos conceitos.

c) Delimitação do universo.

d) Identificação dos dados a serem coletados.
e) Escolha da técnica de coleta de dados (Aula 01/10)
f) Determinação do tipo de amostragem.
g) Seleção da amostra.
h) Organização do trabalho de campo.
i) Previsão da análise dos dados.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 2 / 19


Tipos de amostragem

Amostragem probabilística:
1 Amostragem aleatória simples
2 Amostragem sistemática
3 Amostragem estratificada
4 Amostragem por conglomerados
5 Amostragem por estágios

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 3 / 19


Tipos de amostragem

Amostragem probabilística:
1 Amostragem aleatória simples
2 Amostragem sistemática
3 Amostragem estratificada
4 Amostragem por conglomerados
5 Amostragem por estágios

Amostragem não probabilística:


1 Amostragem por acessibilidade
2 Amostragem por tipicidade
3 Amostragem por quotas

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 3 / 19


Amostragem aleatória simples

A AAS é basicamente atribuir um número único a cada elemento da


população-alvo e fazer um sorteio para escolher alguns dos elementos.

Formas de fazer: sorteio com papeis, tábuas de números aleatórios:


Excel, R, Python . . . com os comandos ALEATORIOENTRE(·),
sample(·) e randint(·), entre outros.

Exemplo: Escolher 10 dos 76 alunos aleatoriamente para apresentar o


trabalho final no dia 5/11.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 4 / 19


Amostragem sistemática

Variação da AAS mas requer que os elementos sejam ordenados pela


posição. Ex: fila de pessoas, candidatos a um concurso.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 5 / 19


Amostragem sistemática

Variação da AAS mas requer que os elementos sejam ordenados pela


posição. Ex: fila de pessoas, candidatos a um concurso.

Exemplo: Amostra do 20% dos candidatos a uma vaga para uma


pesquisa. Devemos escolher aleatoriamente um número entre 1 e 5
(amplitude = 5), digamos 3 e escolher os candidatos número 3, 8, 13,
18, 23, etc.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 5 / 19


Amostragem sistemática

Variação da AAS mas requer que os elementos sejam ordenados pela


posição. Ex: fila de pessoas, candidatos a um concurso.

Exemplo: Amostra do 20% dos candidatos a uma vaga para uma


pesquisa. Devemos escolher aleatoriamente um número entre 1 e 5
(amplitude = 5), digamos 3 e escolher os candidatos número 3, 8, 13,
18, 23, etc.

Em geral, se o número de candidatos for N e o tamanho da amostra


n. Calcular k = [N/n] e uma partida aleatória entre 1 e k.

Para amostras pequenas, o tamanho da amostra pode variar com a


partida. Uma alternativa é escolher uma partida entre 1 e N e
escolher de k em k até completar n elementos.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 5 / 19


Amostragem estratificada

Divide-se a população em subgrupos (estratos) como sexo, idade,


classe social.

Se a amostragem for proporcional, deve respeitar as proporções da


população. Ex: 70% maiores ou com 18 anos e 30% menores de
idade.

Escolhe-se então, uma amostra aleatória em cada subgrupo.

A amostragem estratificada tem a vantagem de garantir a


representatividade.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 6 / 19


Amostragem por conglomerados

É indicada quando é difícil a identificação de seus membros. Ex:


quarteirões, famílias, organizações, fazendas, etc.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 7 / 19


Amostragem por conglomerados

É indicada quando é difícil a identificação de seus membros. Ex:


quarteirões, famílias, organizações, fazendas, etc.

Ex: Em um levantamento da população de uma cidade, pode-se usar


um mapa para identificar os quarteirões, colher uma amostra de
quarteirões e logo fazer a contagem dos residentes.

Esta amostragem tem vantagens quando o custo de listar toda a


população é elevado.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 7 / 19


Tipos de amostragens

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 8 / 19


Amostragem por estágios

É indicada quando a população está dispersa numa grande área,


como um estado ou um país.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 9 / 19


Amostragem por estágios

É indicada quando a população está dispersa numa grande área,


como um estado ou um país.

Ex: uma pesquisa cujo universo são todos os domicílios do Brasil,


num primeiro estágio poderiam ser selecionadas regiões geográficas
imediatas. Num segundo estágio, municípios. Num terceiro, bairros,
logo quarteirões e finalemente domicílios.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 9 / 19


Amostragem por estágios

É indicada quando a população está dispersa numa grande área,


como um estado ou um país.

Ex: uma pesquisa cujo universo são todos os domicílios do Brasil,


num primeiro estágio poderiam ser selecionadas regiões geográficas
imediatas. Num segundo estágio, municípios. Num terceiro, bairros,
logo quarteirões e finalemente domicílios.

A PNAD (até 2015) utilizou uma amostragem em 3 estágios de


seleção: municípios, setores e domicílios. Veja as diferenças com a
PNAD contínua em LINK.

Em cada estágio podem ser definidos procedimentos amostrais


diversos (aleatório, sistemático ou estratificado).

É a amostragem mais utilizada por órgãos oficiais e pelos grandes


institutos quando as pesquisas requerem alto grau de precisão.
Carolina Parra (UERJ) TPE 24 de Setembro de 2021 9 / 19
Amostragens não aleatórios

Amostragem por acessibilidade: Tem pouco rigor. É aplicado em


estudos exploratórios ou qualitativos, onde não é requerido elevado
nível de precisão.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 10 / 19


Amostragens não aleatórios

Amostragem por acessibilidade: Tem pouco rigor. É aplicado em


estudos exploratórios ou qualitativos, onde não é requerido elevado
nível de precisão.

Amostragem por tipicidade: Consiste em selecionar um subgrupo da


população que, com base nas informações disponíveis, possa ser
considerado representativo de toda a população. Ex: escolher uma
cidade típica para um estudo sobre o país.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 10 / 19


Amostragens não aleatórios

Amostragem por acessibilidade: Tem pouco rigor. É aplicado em


estudos exploratórios ou qualitativos, onde não é requerido elevado
nível de precisão.

Amostragem por tipicidade: Consiste em selecionar um subgrupo da


população que, com base nas informações disponíveis, possa ser
considerado representativo de toda a população. Ex: escolher uma
cidade típica para um estudo sobre o país.
Amostragem por quotas: Dentre as amostragens não probabilísticas é
o que apresenta maior rigor. Consta de três fases:
a) Classificar a população em função das características relevantes ao
estudo.
b) Determinar a proporção da população que deve ser alocada em cada
classe.
c) Fixar as quotas antes de selecionar os elementos a serem pesquisados.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 10 / 19


Extensão da amostra

Para que uma amostra represente as características do universo, deve ter


uma extensão mínima. Este numero mínimo depende de 4 fatores.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 11 / 19


Extensão da amostra

Para que uma amostra represente as características do universo, deve ter


uma extensão mínima. Este numero mínimo depende de 4 fatores.

Extensão do universo: No universo finito (N < 100.000) o tamanho


da amostra é relativo ao tamanho do universo.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 11 / 19


Extensão da amostra

Para que uma amostra represente as características do universo, deve ter


uma extensão mínima. Este numero mínimo depende de 4 fatores.

Extensão do universo: No universo finito (N < 100.000) o tamanho


da amostra é relativo ao tamanho do universo.

Nível de confiança estabelecido: A distribuição das informações,


ajusta-se geralmente à curva normal. O nível de confiança é a área
sob a curva normal em termos dos desvios-padrão em torno à média.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 11 / 19


Curva de Gauss (normal)

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 12 / 19


Extensão da amostra

Erro máximo permitido: Existe um erro de medição, o qual diminui


com o tamanho da amostra. É expresso em termos percentuais e os
mais comuns na pesquisa social oscilam entre 3 e 5 %

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 13 / 19


Extensão da amostra

Erro máximo permitido: Existe um erro de medição, o qual diminui


com o tamanho da amostra. É expresso em termos percentuais e os
mais comuns na pesquisa social oscilam entre 3 e 5 %

Percentagem de incidência do fenômeno: O tamanho da amostra


depende da estimativa previa.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 13 / 19


Extensão da amostra

Erro máximo permitido: Existe um erro de medição, o qual diminui


com o tamanho da amostra. É expresso em termos percentuais e os
mais comuns na pesquisa social oscilam entre 3 e 5 %

Percentagem de incidência do fenômeno: O tamanho da amostra


depende da estimativa previa.

σ 2 pqN
n=
e 2 (N − 1) + σ 2 pq

n = tamanho da amostra; σ = nível de confiança (em desvios-padrão);


p = porcentagem de incidência; q = 100 − p;
N = tamanho da população; e = erro máximo permitido.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 13 / 19


Extensão da amostra, exemplo

Considere uma pesquisa que tenha por objetivo verificar quantos dos
10.000 empregados de uma fábrica X são sindicalizados.

• Presume-se que esse número não seja maior que 30% do total.

• O nível de confiança desejado é 95 % (isto é, 2 desvios-padrão).

• O erro tolerado é no máximo 3%.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 14 / 19


Extensão da amostra, exemplo

Considere uma pesquisa que tenha por objetivo verificar quantos dos
10.000 empregados de uma fábrica X são sindicalizados.

• Presume-se que esse número não seja maior que 30% do total.

• O nível de confiança desejado é 95 % (isto é, 2 desvios-padrão).

• O erro tolerado é no máximo 3%.

Assim, N = 10.000, p = 30, q = 70, σ = 2, e = 3. Logo,

σ 2 pqN 22 · 30 · 70 · 10.000 84.000.000


n= = = = 853.
e 2 (N − 1) + σ 2 pq 32 · (9.999) + 22 · 30 · 70 98.391

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 14 / 19


Extensão da amostra, caso população infinita

Quando a população é muito numerosa ( > 100.000 elementos), ela pode


ser considera infinita. Como a contribuição do termo σ 2 pq é pequena e
pode ser ignorada, o termo N/(N − 1) ≈ 1, logo:

σ 2 pq
n=
e2

n = tamanho da amostra; σ = nível de confiança (em d-p);


p = porcentagem de incidência; q = 100 − p;

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 15 / 19


Margem de erro da amostra

A margem de erro só pode ser calculada uma vez coletado os dados com
as percentagens de incidência real do fenômeno. Os limites de confianças
são obtidos a partir da equação:

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 16 / 19


Margem de erro da amostra

A margem de erro só pode ser calculada uma vez coletado os dados com
as percentagens de incidência real do fenômeno. Os limites de confianças
são obtidos a partir da equação:

r
pq
σp =
n

σp = erro-padrão ou desvio da percentagem com que se verifica um dado


fenômeno.
p = porcentagem com que se verifica o fenômeno; q = 100 − p;
n = número de elementos da amostra.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 16 / 19


Margem de erro, exemplo

Considere uma pesquisa com 1.000 pessoas adultas na qual se verificou


que 30% bebem café pelo menos uma vez por dia. Qual é a probabilidade
de que tal resultado seja verdadeiro em todo o universo?

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 17 / 19


Margem de erro, exemplo

Considere uma pesquisa com 1.000 pessoas adultas na qual se verificou


que 30% bebem café pelo menos uma vez por dia. Qual é a probabilidade
de que tal resultado seja verdadeiro em todo o universo?

s
30 · 70
r
pq
σp = = = 1, 45.
n 1.000

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 17 / 19


Margem de erro, exemplo

Considere uma pesquisa com 1.000 pessoas adultas na qual se verificou


que 30% bebem café pelo menos uma vez por dia. Qual é a probabilidade
de que tal resultado seja verdadeiro em todo o universo?

s
30 · 70
r
pq
σp = = = 1, 45.
n 1.000

Como σp = 1, 45 corresponde a um desvio, então para um nível de

confiança de 95% (2 desvios), o resultado da pesquisa apresentará uma


margem de erro de 2σp = 2, 90. Logo, é provável(95%) que número de
consumidores esteja entre 27, 1% e 32, 9% do total da população.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 17 / 19


Organização do trabalho de campo

Muitas falhas nos levantamentos decorrem de fatores alheios à


amostragem. É importante prestar atenção aos seguintes items:

a) Constituição das equipes. Ex: PNAD conta com coordenador,


supervisor, pesquisador e auxiliar.

b) Treinamento das equipes. Em geral envolve dois níveis e envolve


orientações sobre os objetivos da pesquisa, organização da pesquisa,
definição dos conceitos básicos e forma e conteúdo das questões.

c) Procedimentos de campo. Em geral envolvem a listagem, seleção e a


entrevista.

d) Controle de qualidade da coleta de dados. É necessário um controle


dos trabalhos de coleta para minimizar erros nos resultados dos
levantamentos.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 18 / 19


Previsão da análise dos dados

É necessário determinar os procedimentos referentes à análise dos dados já


desde o planejamento.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 19 / 19


Previsão da análise dos dados

É necessário determinar os procedimentos referentes à análise dos dados já


desde o planejamento.

Dentre os procedimentos que podem ser determinados a priori estão:


1 Codificação dos dados.
2 Tabulação: manual ou eletrónica?
3 Análise estatística
4 Programas estatísticos a serem utilizados.

Carolina Parra (UERJ) TPE 24 de Setembro de 2021 19 / 19

Você também pode gostar