Você está na página 1de 34

TEORIA DA AMOSTRAGEM E DE

ESTIMAÇÃO

Prof. Samuel Martim de Conto


AMOSTRA conforme o tipo da pesquisa:
• QUALITATIVA:
• Automaticamente não é probabilística, ou seja, não precisa de
cálculos;
• Depende essencialmente do pesquisador e depende também do
tamanho da população;
• Obviamente, que não recomenda-se poucas entrevistas. O ideal é
levar em consideração o critério de “saturação” das entrevistas;
• Definido como “sujeitos da pesquisa”.

• QUANTITATIVA:
• Pode ser probabilística ou não probabilística;
• Quando probabilística, envolve cálculos para a sua definição;
• Possibilita a inferência dos resultados.

PESQUISA EM ADMINISTRAÇÃO 2
Finalidades da amostragem

Análise Inferencial
Conclusões em relação a populações a partir de
amostras através de:

• Estimações

• Decisões Estatísticas

• Relações entre variáveis

PESQUISA EM ADMINISTRAÇÃO 3
Então, utilizamos a metodologia
de Pesquisa Quantitativa,
obtida a partir de:

O caldeirão de sopa...
O universo.
Amostras
representativas
Aquela “colherada” na mão...
do universo
A amostra.

Retornar a mesma
colher no caldeirão...

O gostinho especial, que ninguém faz igual.

PESQUISA EM ADMINISTRAÇÃO 4
Esta amostra é representativa da população?

Ao selecionar uma amostra devemos considerar alguns


critérios de acordo com o tipo de pesquisa. Exemplo:
região, sexo, nível sócio-econômico, idade...

PESQUISA EM ADMINISTRAÇÃO 5
Controle de Qualidade

Contexto: uma linha de produção industrial.

Problemas:
(1) Como o fabricante pode garantir que o
processo de produção está sob controle?

(2) Como o fabricante pode garantir que


as especificações do produto estão
de acordo com as indicadas na embalagem?

PESQUISA EM ADMINISTRAÇÃO 6
EXEMPLO NUMA PESQUISA ELEITORAL

Barack Obama conquista voto entre trabalhadores


de baixa renda

Pesquisa do jornal "Washington Post" aponta que o


candidato democrata à presidência dos Estados
Unidos, Barack Obama, tem o dobro das intenções de
voto entre os trabalhadores de baixa renda.

PESQUISA EM ADMINISTRAÇÃO 7
Por que usar amostras?

• Custo da Pesquisa;
• Limitações do tempo;
• Impossibilidade de dispor de todos os
elementos da população;
• Destruição da unidade de investigação;
• Populações infinitas.

PESQUISA EM ADMINISTRAÇÃO 8
Classificação das amostragens

Técnicas de Amostragem

Não-probabilísticas Probabilísticas

Por Conveniência Aleatória Simples

Multi-etapa
Por Julgamento Sistemática

Proporcional ou por cotas Estratificada

Bola de Neve Por Conglomerado

PESQUISA EM ADMINISTRAÇÃO 9
Classificação das amostragens
Amostras não-probabilísticas:
o Não utilizam processo de seleção aleatória.
o As estimativas obtidas não são estatisticamente
projetáveis sobre a população.
o Indicadas para estudos exploratórios e para fazer
comparações.

Amostras Probabilísticas:
o Cada elemento da população tem uma chance fixa de
ser incluído na amostra.
o A amostra é selecionada por processo aleatório.
o As estimativas obtidas são estatisticamente
projetáveis sobre a população.
o Indicadas para estudos descritivos e para fazer
comparações
PESQUISA EM ADMINISTRAÇÃO 10
Amostras não probabilísticas

Por acessibilidade (acidental) ou conveniência:


• Forma destituída de qualquer rigor estatístico. O
pesquisador seleciona os elementos a que tem acesso,
admitindo que esses possam, de alguma forma
representar o universo.

Por tipicidade, intencional ou julgamento:


• Consiste na seleção de um subgrupo do universo que,
com base em informações disponíveis, que possa ser
considerado representativo do universo. Requer o
conhecimento do universo e de seus subgrupos.
• O pesquisador usa seu julgamento para selecionar
membros da população por que tenham bons prospectos
para informações relevantes.

PESQUISA EM ADMINISTRAÇÃO 11
Amostras não probabilísticas
Por cotas: desenvolvida em quatro fases:
• Classificação do universo em função de propriedades
tidas como relevantes ao fenômeno a ser estudado
(exemplo: sexo, idade, grau de instrução);
• Determinação da proporção do universo a ser colocada
em cada classe,com base na constituição conhecida ou
presumida do universo;
• Fixação de cotas para cada observador ou entrevistador
encarregado de selecionar elementos da população
pesquisada, de modo tal que a amostra seja
proporcionalmente de todas as classes observadas;
• Seleção dos elementos pelo pesquisador com base na
conveniência ou julgamento segundo às cotas.
Bola de Neve:
• O pesquisador seleciona de forma aleatória um grupo
inicial de pesquisados e estes fornecem informações que
conduzem aos demais entrevistados (exemplo: listar a
população e selecionar os entrevistados através do uso
da Tabela de Números Aleatórios. Estes indicam outros,
etc.).
PESQUISA EM ADMINISTRAÇÃO 12
Amostras probabilísticas

Aleatória simples:
• Números aleatórios determinam quais elementos serão
incluídos na amostra.
Como obter:
• Por sorteio, através de programas estatísticos (Excel) ou
por intermédio de Tabelas de Números Aleatórios (livros
de estatística);
• Exemplo: 35, 49, 71, 112, 132, 149, 201, 244, etc.

PESQUISA EM ADMINISTRAÇÃO 13
Amostras probabilísticas

Aleatória sistemática:
• A amostra é escolhida, selecionando-se um ponto de
partida aleatório e tomando-se cada i-ésimo elemento
sucessivamente do arcabouço amostral.
Como obter:
Exemplo: população = 1000 elementos e amostra de 100
elementos;
• Divide-se 1000/100 = 10;
• Selecionar um em cada 10 elementos;
• Sortear um número de 1 a 10, como, por exemplo, 03;
• Exemplo de sequência: 03, 13, 23, 33, 43, 53, etc.

PESQUISA EM ADMINISTRAÇÃO 14
Amostras probabilísticas
Aleatória estratificada:
• Divisão da população em estratos e escolha dos elementos
de cada estrato por um processo aleatório;

• Definir os estratos: classe social, idade, sexo, profissão,


grau de instrução, bairros, linha, turno, diferentes
máquinas, etc;

• Todos os estratos devem ser pesquisados;


• O número de elementos de cada estrato é proporcional a
representatividade percentual do estrato sobre o número
total de elementos da população.

PESQUISA EM ADMINISTRAÇÃO 15
Amostras probabilísticas
 Amostragem estratificada
Quando a população divide-se em
subpopulações (estratos)

PESQUISA EM ADMINISTRAÇÃO 16
População* Domicílio**
15 a 19 20 a 24 25 a 29 30 a 34 35 a 39
MUNICÍPIOS anos anos anos anos anos Total Urbano Rural
Anta Gorda 486 491 411 391 465 2.244 562 1.130
Amostra 7 7 6 5 7 32 11 21
Urbano 2 2 2 2 3 33% 67%
Rural 5 5 4 3 4
Arvorezinha 911 876 781 660 721 3.949 1.539 1.236
Amostra 13 13 11 9 10 56 31 25
Urbano 7 7 6 5 6 55% 45%

Exemplo de
Rural 6 6 5 4 4
Coqueiro Baixo 101 81 31 60 86 359 45 354
Amostra 2 1 0 1 1 5 1 4

amostragem
Urbano 1 0 0 0 0 11% 89%
Rural 1 1 0 1 1
Dois Lajeados 266 246 232 221 238 1.203 393 470

probabilística
Amostra 4 4 3 2 4 17 8 9
Urbano 2 2 1 1 2 46% 54%
Rural 2 2 2 1 2

estratificada
Doutor Ricardo 137 141 138 164 168 748 132 453
Amostra 2 2 2 2 3 11 2 9
Urbano 0 0 0 1 1 23% 77%
Rural 2 2 2 1 2
Encantado 1.593 1.626 1.463 1.464 1.467 7.613 4.935 727
Amostra 23 23 20 21 21 108 94 14
Urbano 20 20 18 18 18 87% 13%
Rural 3 3 2 3 3
Ilópolis 415 388 308 269 285 1.665 503 601
Amostra 6 6 5 3 4 24 11 13
Urbano 3 3 2 1 2 46% 54%
Rural 3 3 3 2 2
Muçum 366 319 290 313 329 1.617 1.208 298
Amostra 5 5 4 4 5 23 18 5
Urbano 4 4 3 3 4 80% 20%
Rural 1 1 1 1 1
Nova Bréscia 237 244 185 176 177 1.019 461 870
Amostra 3 4 3 2 3 15 5 10
Urbano 1 1 1 1 1 35% 65%
Rural 2 3 2 1 2
Putinga 341 322 268 217 265 1.413 419 859
Amostra 5 5 4 3 3 20 7 13
Urbano 2 2 1 1 1 33% 67%
Rural 3 3 3 2 2
Relvado 176 153 99 107 119 654 218 479
Amostra 3 2 1 1 2 9 3 6
Urbano 1 1 0 0 1 31% 69%
Rural 2 1 1 1 1
Roca Sales 703 750 630 593 652 3.328 1.470 1.439
Amostra 10 10 9 8 10 47 24 23
Urbano 5 5 5 4 5 51% 49%
Rural 5 5 4 4 5
Vespasiano Corrêa 152 208 168 143 154 825 116 472
Amostra 2 3 3 2 2 12 2 10
Urbano 0 1 1 0 0 20% 80%
Rural 2 2 2 2 2
Micro Região 5.884 5.845 5.004 4.778 5.126 26.637 11.956 9.034
Amostra 85 85 71 63 75 379 217 162
Urbano 48 48 40 37 44 57% 43%
Rural 37 37 31 26 31 17
PESQUISA EM ADMINISTRAÇÃO
Amostras probabilísticas
Aleatória por conglomerados:
• Divisão da população em subpopulações mutuamente
excludentes e coletivamente exaustivas. Escolha aleatória
de uma amostra de conglomerados e extração aleatória
dos elementos de cada conglomerado selecionado.
• Conglomerados: classe social, grau de instrução, famílias,
agências, edifícios, quadras;
• São selecionados alguns conglomerados representativos
dos demais, logo nem todos são pesquisados;

Uma variante é a aleatória por área:


• No caso, os conglomerados são áreas
geográficas. Exemplo: bairros da cidade de
Lajeado.
PESQUISA EM ADMINISTRAÇÃO 18
 Amostragem por conglomerados
Usada quando a população pode ser dividida em
subpopulações (conglomerados) heterogêneos
representativos da população global. A amostragem é
feita sobre os conglomerados, e não mais sobre os
indivíduos da população.

PESQUISA EM ADMINISTRAÇÃO 19
Ibope e Datafolha divergem no Rio
Valor Econômico 30/9/2008

A divergência entre pesquisas de opinião acirrou o clima na reta final


de campanha no Rio. Enquanto o Ibope mostrou Gabeira em
terceiro lugar, com 10%, o Datafolha registrou alta expressiva do
candidato, de 11% para 15%, o que garantia um empate técnico
com o segundo colocado, Marcelo Crivella. Nos dois levantamentos,
Paes lidera, com 29% dos votos.

Para Montenegro (Presidente do Ibope), a diferença de resultados


deveu-se às metodologias e sugeriu que o temporal que caiu na
sexta-feira no Rio pode ter distorcido os dados do Datafolha, que faz
pesquisas na rua. O Ibope faz pesquisa domiciliar. "Quando se faz
pesquisa na rua em ponto de fluxo com dilúvio, não se encontra
muitas pessoas, se encontra mais os economicamente ativos",
disse. Ele acrescenta que o Rio, por ter um eleitor mais velho e mais
pobre faz com que Crivella esteja melhor na pesquisa do Ibope
(realizada entre terça-feira e quinta-feira), com 24%, ante 18%
apurados pelo Datafolha na quinta e sexta-feira.

PESQUISA EM ADMINISTRAÇÃO 20
Esclarecimentos sobre pesquisas eleitorais
por Hélio Radke Bittencourt (Professor na PUCRS)
Jornal Zero Hora, 30 de setembro de 2008
Freqüentemente sou questionado acerca da confiabilidade nos resultados
de pesquisas eleitorais publicadas nos meios de comunicação de massa. A
desconfiança de muitos quase sempre tem como argumento o fato de não
terem sido entrevistados nem conhecerem alguém que o tenha. Uma cidade
como Porto Alegre, por exemplo, tem 1.038.885 eleitores aptos a votar na
próxima eleição, os quais são potenciais alvos de investigação durante todo
o período eleitoral. Durante esse período, os institutos responsáveis pelas
pesquisas apresentam resultados baseados em amostras que geralmente
variam de 600 a 1,2 mil eleitores. O simples fato de que o tamanho amostral
corresponde, no máximo, a 0,12% da população de eleitores faz com que o
principal argumento dos descrentes seja posto em xeque.
Outro questionamento comum, e perfeitamente aceitável, recai sobre a
possibilidade de generalização das pesquisas eleitorais. Será que podemos
projetar os resultados de uma amostra para toda a população? Conhecendo
a opinião de mil eleitores, poderemos projetá-la para 1 milhão? Por mais
estranho que pareça, a resposta é sim!
A teoria que sustenta a inferência estatística permite não só estimarmos o
resultado da eleição, como atribuirmos probabilidades de acerto às
estimativas. Tais probabilidades de acerto são geralmente iguais ou
superiores a 95%, mas raramente ultrapassam 99%. Em virtude disso, o uso
da palavra “certeza” é vedado na pesquisa por amostragem.

PESQUISA EM ADMINISTRAÇÃO 21
Tamanho de Amostras probabilísticas

Erro amostral

Indica a precisão da amostra, ou seja, o erro


máximo admitido entre o resultado encontrado
pela amostra e o verdadeiro valor da população.

=  - onde  = zx


Medição do erro

• Erro absoluto – em valores - 

• Erro relativo – em percentual - r


PESQUISA EM ADMINISTRAÇÃO 22
Distribuição Normal

É a distribuição de valores que representa uma maior


concentração em torno de um valor médio, representado
por uma curva contínua, denominada como curva do sino
ou curva de Gauss.

PESQUISA EM ADMINISTRAÇÃO 23
Distribuição Normal

PESQUISA EM ADMINISTRAÇÃO 24
Tamanho de Amostras probabilísticas

Depende:

• Valor que pode ser gasto na pesquisa;


• Tamanho da população e se é finita ou infinita;
• Erro amostral que aceitamos cometer;
• Grau de precisão (Grau de Confiança ou Nível de
Significância) que queremos usar na pesquisa.

Por exemplo:
se o Grau de Confiança é de 95%, o Nível de Significância é de 5%;
se o Nível de Significância é de 3%, o Grau de Confiança é de 97%.

PESQUISA EM ADMINISTRAÇÃO 25
Medidas Inferenciais

Qualitativas – Frequências e proporções


nominal
Médias, desvio-padrão,
Quantitativas - variância, coeficiente de
número variabilidade, etc.

PESQUISA EM ADMINISTRAÇÃO 26
Tamanho de amostras
Variável quantitativa
Erro amostral absoluto
População infinita População finita
2 2 2
 z  z  N
n    n  2 2 2
    ( N  1)  z 
Onde:
Onde:
n = número de elementos da amostra;
n = número de elementos da amostra;
e = diferença aceita entre os valores
e = diferença aceita entre os valores
das médias da amostra e da população
das médias da amostra e da população
Z = coeficiente de confiança;
Z = coeficiente de confiança;
N = Tamanho da população;
 = desvio-padrão da população, ou seu substituto (s)
estimado. = desvio-padrão da população, ou seu substituto
(s) estimado.
Valores de Z:
95% z = 1,96
PESQUISA EM ADMINISTRAÇÃO 99% z = 2,58
Tamanho de amostras
Variável quantitativa
Erro amostral relativo
População infinita População finita
2
2 2
 z  z  N
n    n  2 2 2
 r   r ( N  1)  z 
Onde:
Onde:
n = número de elementos da amostra;
n = número de elementos da amostra;
r = percentual de diferença para mais e para menos aceito
r = percentual de diferença para mais e para entre os valores das médias da amostra e da população
menos aceito entre os valores das médias da
amostra e da população Z = coeficiente de confiança;
Z = coeficiente de confiança; N = Tamanho da população;
 = coeficiente de variabilidade (quando  = coeficiente de variabilidade (quando
desconhecido estimado
desconhecido estimado em 50% ou 0,5.
em 50% ou 0,5.
Valores de Z:
95% z = 1,96
PESQUISA EM ADMINISTRAÇÃO 99% z = 2,58
Tamanho de amostras
Variável qualitativa
Erro amostral relativo
População infinita População finita
2
z pq z pq N 2
n  2 n  2
r 2
 r ( N  1)  z p q
Onde: Onde:
n = número de elementos da amostra; n = número de elementos da amostra;
r = erro relativo amostral (0,05 = 5%); r = erro relativo amostral (0,05 = 5%);
Z = coeficiente de confiança; Z = coeficiente de confiança;
p = probabilidade de ocorrência (quando N = Tamanho da população;
desconhecida 50% ou 0,5); p = probabilidade de ocorrência (qdo desconhecida 50% ou
q = diferença do P para 100 (100 – 50 = 50 0,5);
ou 0,5). q = diferença do P para 100 (100 – 50 = 50
ou 0,5). Valores de Z:
95% z = 1,96
PESQUISA EM ADMINISTRAÇÃO 99% z = 2,58
Intervalo de confiança para médias
Amostras com 30 elementos ou mais
Desvio padrão populacional
Conhecido Desconhecido
 x   x 
  x  z x   x  z sx
Amostras com menos de 30 elementos
Desvio padrão populacional
Conhecido Desconhecido
 x   x 
  x  t x   x  t sx
PESQUISA EM ADMINISTRAÇÃO 30
2
z  N2
Exercício 1 n  2
 r ( N  1)  z 2 2
1 - Uma empresa não encontrando a resposta para o seu problema, está buscando, através
de uma pesquisa, a solução a ser implementada. Para desenvolver os trabalhos, a
empresa buscou informações relativas à população a ser estudada. Os dados coletados
são os seguintes:
Tamanho da população: 50.000 domicílios.
Uniformidade da população: a população apresenta uma distribuição heterogênea, cujo
coeficiente de variabilidade pode ser estimado com sendo de 45%, que, no entanto,
analisada por bairro torna-se homogênea.
TABELA 1 - População por bairro
Bairro Domicílios %
A 10.000 20%
B 20.000 40%
C 15.000 30%
D 5.000 10%
Total 50.000 100%

A pesquisa deve ser desenvolvida considerando um erro relativo máximo de 3,5% e segundo
um nível de significância de 2%.
Considerando os dados acima, comente a metodologia a ser adotada nesta pesquisa, em
termos de:
1.1 Tamanho da amostra (considere a população com tamanho finito);
1.2 Sistema(s) de seleção dos domicílios pelo método probabilístico;
1.3 Apresentação da distribuição da amostra por bairro e o critério de seleção de cada
domicílio.
PESQUISA EM ADMINISTRAÇÃO 31
2
z  N2
Exercício 2 n  2
 r ( N  1)  z 2 2
2 – Uma empresa quer estabelecer um programa para avaliar lotes de produção, no sentido
de garantir que os produtos estejam segundo os padrões de qualidade definidos. Para
desenvolver o processo de avaliação, a empresa pretende utilizar um sistema amostral.
As informações necessárias a serem consideradas para definir o processo de amostragem são
as seguintes: 1. Tamanho do lote: 20.000 (N) unidades. 2. Uniformidade de fabricação:
A empresa utiliza 3 linhas de produção que apresentam variabilidades diferentes na
uniformidade de produção. Assim, pode-se considerar que o processo como um todo
trabalha com uma variância relativa de 0,16 (λ).
A empresa considera como limite para aprovação do lote um afastamento de, no máximo,
3% (Er 0,03) do padrão estabelecido.
A distribuição das quantidades do lote por cada linha está apresentada na Tabela 2.

TABELA 2 – Distribuição das quantidades do lote por linhas de produção


Linha de produção Tamanho do lote %
A 4.000 20%
B 10.000 50%
C 6.000 30%
Total 20.000 100%

O processo de amostragem deve ser desenvolvido segundo um nível de


significância de 4% (z = 2,05). Considerando os dados acima, comente a
metodologia a ser adotada na definição da amostra, em termos de:
2.1 tamanho da amostra;
2.2 sistema(s) de seleção das unidades pelo método probabilístico;
2.3 apresentação da distribuição da amostra por linhas de produção e o critério
de seleção de cada unidade.
PESQUISA EM ADMINISTRAÇÃO 32
Exercícios 3 e 4
3 – O responsável pela avaliação de qualidade de um novo motor para
automóveis quer verificar se o mesmo está dentro dos padrões de qualidade
definidos pela empresa. O novo motor foi desenvolvido para fazer em média
25 Km com um litro de gasolina, a uma velocidade aproximadamente
constante de 100 Km por hora, com um desvio padrão de 2 Km por litro.
Para que se possa fazer o controle de qualidade com um grau de confiança
de 95% e definindo que o erro amostral não pode ultrapassar 1 km por litro,
qual deve ser o tamanho da amostra a ser usada no controle? 2
 z 
n 
  
4 - O responsável pela qualidade de fabricação de erva testou uma máquina
que prepara os pacotes e deseja estabelecer um programa de controle para
cada lote produzido. Baseado no resultado do acompanhamento, nas
condições ideais de regulagem da máquina que embala pacotes, obteve-se,
como padrão, o peso médio de 1 kg e desvio padrão de 0,080 Kg, isto é, um
coeficiente de variabilidade de 0,08 ou 8%. Para que se possa fazer o
controle do lote com um grau de confiança de 95% e definido que as
amostras, para estarem dentro do padrão, não podem ultrapassar em 2,5%
da média, ou seja, um erro relativo de 0,025 ou 2,5%, qual deve ser o
tamanho da amostra a ser usada no controle?
2
 z 
n   
PESQUISA EM ADMINISTRAÇÃO
  r 33
Exercício 5
• 5- Você foi encarregado de fazer uma auditoria em relação
aos pagamentos efetuados pela sua empresa durante o ano de
2000. Considerando que estas notas, que estão arquivadas
por ordem de emissão, cuja média de valor é de 500,00, com
um desvio padrão de 60,00, são de um número relativamente
grande (5.000), o que demandaria muito tempo para fazer a
conferência de todas, pede-se que a mesma seja feita através
de amostragem. Com um nível de significância de 3%
(z=2,17) e um erro de 20,00, quantas notas você analisaria?

z 2 . 2 . N
n 2
 . N  1  z 2 . 2

PESQUISA EM ADMINISTRAÇÃO 34

Você também pode gostar