Você está na página 1de 62

Universidade Estadual da Paraíba

AMOSTRAGEM I

Candidato: David Venancio da Cruz


davidvenacio@hotmail.com

26/03/2022
Introdução
1

O que é amostragem?
A teoria da amostragem estuda as relações existentes entre uma população e as amostras
extraídas dessa população. E útil para avaliação de grandezas desconhecidas da população,
ou para determinar se as diferenças observadas entre duas amostras são devidas ao acaso ou
se são verdadeiramente significativas.

davidvenacio@hotmail.com |
Introdução
1

O que é amostragem?
A teoria da amostragem estuda as relações existentes entre uma população e as amostras
extraídas dessa população. E útil para avaliação de grandezas desconhecidas da população,
ou para determinar se as diferenças observadas entre duas amostras são devidas ao acaso ou
se são verdadeiramente significativas.
Amostragem é o processo de determinação de uma amostra a ser pesquisada. A amostra é
uma parte de elementos seleccionada de uma população estatística.

davidvenacio@hotmail.com |
Introdução
Conceitos básicos 2

▶ População - Coleção de todos os possíveis elementos ou objetos de interesse.


▶ Censo - Levantamento efetuado sobre toda uma população.
▶ Amostra - Porção ou parte de uma população de interesse.
▶ Amostragem - Método de seleção de uma amostra da população.
▶ Parâmetro - Medida numérica calculada para dados da população.
▶ Estimador - Fórmula matemática que permite calcular um valor (ou um conjunto de
valores) para um parâmetro.
▶ Estimativa - Valor do estimador calculado em uma amostra. Medida numérica
calculada para dados da amostra.

davidvenacio@hotmail.com |
Introdução
AMOSTRA OU CENSO? 3

Fazer levantamentos, estudos, pesquisas, sobre toda uma população (censo) é, em geral,
muito difícil. Isto se deve à vários fatores.
▶ Redução dos custos;
▶ Velocidade de Execução;
▶ Praticidade;
▶ Maior Acurácia
Quando a população é pequena, quando a característica de interesse é de fácil mensuração
ou quando há necessidade de alta precisão, pode não ser interessante a realização de uma
amostragem.

davidvenacio@hotmail.com |
Etapas de um levantamento
4

Em linhas gerais, podemos distinguir no método estatístico as seguintes etapas:

davidvenacio@hotmail.com |
Etapas de um levantamento
Definição do problema 5

▶ Formulação completa do problema a ser estudado


▶ Qual a unidade amostral?
▶ Quais perguntas que quero obter resposta?
▶ Qual a meta a ser alcançada diante do problema em questão?
▶ Levantamento de outros trabalhos realizados na mesma área e trabalhos análogos.

davidvenacio@hotmail.com |
Etapas de um um levantamento
Planejamento 6

Consiste em se determinar o procedimento necessário para resolver o problema e, em es-


pecial, como levantar informações sobre o objeto de estudo. Nesta fase, deve-se levar em
consideração:
▶ A construção adequada de um questionário;
▶ O tipo de levantamento que será realizado:
(i) censo (ii) amostragem
▶ O cronograma de atividades;
▶ Os custos envolvidos;
▶ O exame das informações disponíveis;
▶ O delineamento da amostra.

davidvenacio@hotmail.com |
Etapas de um levantamento
Coleta dos dados 7

Fase de caráter operacional, compreende à coleta das informações propriamente ditas. Se


refere à obtenção de dados, com um objetivo determinado.
Os dados podem ser classificados em:
Dados primários: quando são publicados pela própria pessoa ou instituição que os obteve.
Dados secundários: quando são publicados por outras pessoas ou instituições.

davidvenacio@hotmail.com |
Etapas de um levantamento
Apuração dos dados; Apresentação e resumo dos dados; Análise e interpretação. 8

Apuração dos dados


▶ Após ser feita uma crítica aos questionários utilizados buscando observações incom-
pletas e/ou incorretas, deve-se então realizar a condensação, processamento ou tabula-
ção dos dados.
Apresentação e resumo dos dados
▶ A apresentação, consiste em apresentar os dados através de tabelas e gráficos, tornando
mais fácil o exame do fenômeno sob estudo.
▶ No resumo, calculam-se medidas cuja finalidade principal é descrever o fenômeno que
se está investigando.
Análise e interpretação
▶ O interesse maior reside em se tirar conclusões que auxiliem o pesquisador a resolver
seu problema. As conclusões são baseadas na observação das tabelas, gráficos e medi-
das resumo.
davidvenacio@hotmail.com |
Tipos de levantamento
9

▶ Não-probabilísticas - não se atribui probabilidade a cada elemento da população.


✓ Amostra intencional: Composta por elementos da população seleccionados intencional-
mente pelo investigador, porque este considera que esses elementos possuem caracterís-
ticas típicas ou representativas da população. Exemplo: escolha de localidades ”repre-
sentativas”em tempo de eleições legislativas.
✓ Amostra ”snowball”: Tipo de amostra intencional em que o investigador escolhe um
grupo inicial de indivíduos e pede-lhes o nome de outros indivíduos pertencentes a mesma
população.
✓ Amostra por quotas: As amostras são obtidas dividindo a população por categorias ou
estratos e selecionando um certo número (quota) de elementos de cada categoria de modo
não aleatório.
✓ Amostra por conveniência: Os elementos são escolhidos por conveniência ou por facili-
dade. As amostras obtidas desta forma não são representativas da população e em geral
são enviesadas.

davidvenacio@hotmail.com |
Tipos de levantamento
10

▶ Probabilísticas - cada elemento da população tem uma probabilidade (não nula) de ser
escolhido.
Os métodos de amostragem aleatória são caracterizados por todos os elementos da
população poderem ser selecionados de acordo com uma probabilidade pré-definida e
em que se podem avaliar objetivamente as estimativas das propriedades da população
obtidas a partir da amostra.
Uma das vantagens da amostragem aleatória e a possibilidade de estimar as margens
de erro dos resultados que são devidas à amostragem. Além disso, a amostragem
aleatória evita o enviesamento das amostras que acontece sempre que se usa a opinião
e a experiência para escolher as amostras.

davidvenacio@hotmail.com |
Tipos de levantamento
11

▶ Métodos de amostragem aleatória:


✓ Amostragem Aleatória Simples (AAS) - A amostragem aleatória simples consiste em
escolher uma amostra de uma população, tal que cada elemento da população tenha a
mesma probabilidade de ser selecionado.
✓ Amostragem Aleatória Estratificada (AAE) - A população em estudo é composta de
subpopulações que não se sobrepõem e, juntas, abrangem a totalidade da população.
Nesse caso, a amostragem será feita em cada subpopulação (estrato).
✓ Amostragem Aleatória por Conglomerados (AAC) - O conglomerado é um conjunto de
elementos formando uma unidade amostral. Se a unidade amostral for indivíduo e forem
sorteados domicílios, então a amostragem é por conglomerado
✓ Amostragem Sistemática (AS) - Baseada na ordenação natural dos dados, seleciona-se
um ponto de partida aleatório e então cada k-ésimo elemento da população é selecionado
até se completar a amostra de tamanho n.

davidvenacio@hotmail.com |
Tipos de levantamento
12

▶ ✓ Amostragem por Múltiplos Estágios (AME) - Combinação dos métodos anteriores.


✓ Amostragem por Quotas (AQ) - A proporção de elementos em cada estrato é feita antes
de ir a campo e a amostragem continua até que a “quota” necessária tenha sido atingida.
Estratificações mais comum: áreas geográficas, sexo, idade, etc.

davidvenacio@hotmail.com |
Parâmetros de interesse
13

Em geral, os parâmetros de interesse associados à uma variável são:


▶ Total populacional: τ = Ni=1 yi
P

▶ Média populacional: µ = Nτ = N1 Ni=1 yi


P

▶ Variância populacional: σ 2 = N1 Ni=1 (yi − µ)2


P

▶ Proporção populacional: p = N1 Ni=1 yi


P

davidvenacio@hotmail.com |
Exemplo
Bolfarine 14

Considere uma população formada por três domicílios, B = 1, 2, 3 e que se observam as


seguintes variáveis: nome (do chefe), sexo, idade, fumante ou não, renda bruta (mensal em
salários mínimos) familiar e número de trabalhadores.

Variável Valores Notação


Unidade 1 2 3 i
Nome do chefe Ada Beto Ema ai
Sexo 0 1 0 xi
Idade 20 30 40 yi
Fumante 0 1 1 gi
Renda Familiar 12 30 18 fi
nº de trabalhadores 1 3 2 ti

davidvenacio@hotmail.com |
Exemplo
Bolfarine 15

▶ Parâmetro populacional
▶ Variável idade: D = (20, 30, 40).
▶ Variáveis (f,t): D = 12 30 18
1 3 2
▶ Função paramétrica (chamaremos de parâmetros):
▶ Média das variáveis renda e número de trabalhadores.
θ = (20, 2)
▶ Renda média por trabalhador.
θ = 10

davidvenacio@hotmail.com |
Planejamento amostral
16

▶ Planejamento amostral: mecanismo que associa a probabilidade de ocorrência de


cada amostra possível P(s), ou seja:

P(.) : S(B) → [0, 1]


X
P(s) ≤ 0 : P(s) = 1
s:s∈S

davidvenacio@hotmail.com |
Cont. do Exemplo
Bolfarine 17

▶ Exemplos de amostra: s1 = (1, 2), s2 = (2, 1), s3 = (1, 1, 3), s4 = (3), s5 =


(2, 2, 1, 3, 2).
▶ Conjunto de todas as amostras possíveis (com reposição):
S1 (B) = {(1), (2), (3), (1, 1), (1, 2), ..., (2, 2, 1, 3, 2), ...)}
▶ Conjunto de todas as amostras possíveis de tamanho 2 (com reposição):
S2 (B) = {(1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3), (3, 1), (3, 2), (3, 3)}.
▶ Exercício: obter todas as amostras possíveis para um sorteio sem reposição:

davidvenacio@hotmail.com |
Cont. do Exemplo: planos amostrais
Bolfarine 18

▶ Plano A: Sorteia-se com igual probabilidade um elemento de B e anota-se a unidade


sorteada. Este elemento é devolvido à população e sorteia-se um segundo elemento do
mesmo modo. SA = {11, 12, 13, 21, 22, 23, 31, 32, 33}.
(
1/9, se i ∈ S
PA (S) =
0, se i ∈
/S

davidvenacio@hotmail.com |
Cont. do Exemplo: planos amostrais
Bolfarine 19

▶ Plano B: Sorteia-se com igual probabilidade um elemento de B e anota-se a unidade


sorteada. Este elemento é retirado da população e sorteia-se um segundo elemento do
mesmo modo. SB = {12, 13, 21, 23, 31, 32}.
(
1/6, se i ∈ S
PB (S) =
0, se i ∈
/S

davidvenacio@hotmail.com |
Cont. do Exemplo: planos amostrais
Bolfarine 20

▶ Plano C: Sorteia-se um elemento de B com probabilidade proporcioanal ao número


de trabalhadores. Sem repor o domicílio selecionado, sorteia-se um segundo também
com probabilidade igual ao número de trabalhadores. SC = {12, 13, 21, 23, 31, 32}.

P(12) = ...

davidvenacio@hotmail.com |
Cont. do Exemplo: Estatísticas e distribuições amostrais
Bolfarine 21

▶ Considere que o interesse reside nas variáveis (f,t):


 
12 30 8
D=
1 3 2

Considere os planos amostrais A e B e a estatística R = h(Ds): razão entre o total da renda


familiar e o número de trabalhadores.

davidvenacio@hotmail.com |
Introdução a amostragem simples
22

A finalidade de uma amostra é a de descrever, indiretamente, a população. Portanto, é


necessário que as amostras coletadas guardem características as mais próximas possíveis da
população. Este qualidade é denominada representatividade.

Representatividade: Qualidade que as amostras devem ter, e que corresponde a elas terem,
ou reproduzirem, as mesmas propriedades da população.

davidvenacio@hotmail.com |
Introdução a amostragem simples
23

O procedimento básico para garantir representatividade nas amostras é o sorteio.

Sorteio: Procedimento pelo qual é conferida a mesma probabilidade, a todos os elementos


de um conjunto, de serem tomados.

O sorteio também é chamado de Aleatorização ou Casualização. Quando a obtenção de


uma amostra sofreu algum mecanismo de sorteio, ela é chamada de Amostra Aleatória. A
coleta de amostras aleatórias é chamada de Amostragem Aleatória.

davidvenacio@hotmail.com |
Introdução a amostragem simples
24

Amostra Aleatória Amostra que sofreu algum mecanismo de sorteio no processo de coleta.
O sorteio garante representatividade porque evita tendenciosidades no momento da coleta.
A amostragem pode ser classificada conforme a Figura 1.

davidvenacio@hotmail.com |
Introdução a amostragem simples
25

Independente da natureza da amostragem (AAS, AAE, AAC ou AS), ela pode ainda ser
com reposição ou sem reposição:

davidvenacio@hotmail.com |
Introdução a Amostragem simples
26

Na amostragem com reposição, os elementos da população, à medida que são sorteados, são
devolvidos à população, e podem eventualmente ser sorteados de novo. Quando a amostra-
gem é sem reposição, os elementos são sorteados apenas uma vez.

davidvenacio@hotmail.com |
Amostragem aleatória simples
27

Na prática, a realização do sorteio no processo de AAS é feita mediante várias possibilida-


des. Pode-se, por exemplo, escrever em papeizinhos os N elementos da população, colocá-
los em uma caixa, e sorteá-los. Pode-se ainda identificar os elementos com um número, e
sorteá-los mediante tabelas de números aleatórios, ou funções randômicas na calculadora
ou computador.
O plano é descrito do seguinte modo:
▶ Utilizando-se um procedimento aleatório, sorteia-se com igual probabilidade um ele-
mento da população (N).
▶ Repete-se o processo anterior até que sejam sorteados n unidades, tendo sido este nú-
mero prefixado anteriormente.

davidvenacio@hotmail.com |
Amostragem aleatória simples
28

▶ Caso seja permitido o sorteio de uma unidade mais de uma vez, tem-se o processo
AAS com reposição, que será indicado por ASSc. Quando o elemento sorteado é
removido de N elementos do sorteio do próximo têm-se o plano ASS sem reposição,
que será indicado por ASSs. O primeiro procedimento é também conhecido como ASS
irrestrito e o segundo é também conhecido como ASS restrito.

davidvenacio@hotmail.com |
Amostragem aleatória simples
28

▶ Caso seja permitido o sorteio de uma unidade mais de uma vez, tem-se o processo
AAS com reposição, que será indicado por ASSc. Quando o elemento sorteado é
removido de N elementos do sorteio do próximo têm-se o plano ASS sem reposição,
que será indicado por ASSs. O primeiro procedimento é também conhecido como ASS
irrestrito e o segundo é também conhecido como ASS restrito.

Do ponto de vista prático, o plano ASSs é muito mais interessante, pois satisfaz o princípio
intuitivo que “não se ganha mais informação se uma mesma unidade aparece mais de uma
vez na amostra”. Por outro lado, o plano ASSc, introduz vantagens matemáticas e
estatísticas, como a independência entre as unidades sorteadas, que facilita em muito a
determinação das propriedades dos estimadores das quantidades populacionais de interesse

davidvenacio@hotmail.com |
O que é uma amostra aleatória
29

Suponha que temos uma população de N elementos e desejamos tomar uma amostra de n
desses elementos. Pode ser demonstrado pela teoria matemática das permutações e combi-
nações, que o número T de possíveis amostras, de n elementos, retiradas sem reposição, de
N
uma população composta de N elementos, é denotada por ( ) e é obtida por:
n
 
N N!
T= =
n n!(N − n)!

Por exemplo, se uma população contém 25 elementos e nós desejamos tomar uma amostra
de n = 5 desses elementos, então da relação 1, com N = 25 e n = 5.

davidvenacio@hotmail.com |
O que é uma amostra aleatória
Definição 30

Uma amostra aleatória simples de n elementos de uma população de N elementos, é um


N
procedimento no qual, cada uma das ( ) possíveis amostras de n elementos, tenha a
n
N
mesma probabilidade de seleção, digamos, 1/( ) . Se o processo de obtenção das
n
amostras for com reposição, esta probabilidade será de 1/N n . .

davidvenacio@hotmail.com |
Inferência numa amostra aleatória simples
31

Obtidos os dados de uma amostra, são feitos cálculos estatísticos para que se tenha condi-
ções de obter as conclusões do estudo. Para tanto deve-se considerar a seguinte notação:

População Amostra
Nº de elementos N n
Observações y1 , y2 , ..., yN y1 , y2 , ..., yn
1 PN 1 Pn
µ= yi y= yi
N i=1 n i=1
1 PN 1 Pn
σ2 = (yi − µ)2 s2 = (yi − y)2
N i=1 n − 1 i=1

davidvenacio@hotmail.com |
Inferência numa amostra aleatória simples
32

Os tamanhos da população e da amostra permitem estabelecer duas relações importantes:


n
1. Fração de amostragem =
N
N
2. Fator de expansão =
n

Quando a fração de amostragem é menor que 0.05, isto é, a amostra tem menos de 5% da
população, a população é considerada infinita. Se 0.05 ≥ Nn a população é considerada
finita.

davidvenacio@hotmail.com |
Inferência numa amostra aleatória simples
33

O estimador y, da média da média µ de uma população, baseado numa amostra aleatória de


n elementos, é dada por:
n
1X
y= yi
n
i=1

Este estimador é não-viciado ou não-tendencioso, isto é, E[y] = µ.

davidvenacio@hotmail.com |
Inferência numa amostra aleatória simples
34

A variância do estimador de µ , no caso da população infinita é dada por:

σ2
Var(y) = ,
n
e no caso da população finita por:

σ2 N − n
Var(y) =
n N−1

davidvenacio@hotmail.com |
Inferência numa amostra aleatória simples
35

Com os dados de uma amostra, pode-se estimar a variância da média, bem como seu erro
padrão. No caso da população infinita a estimativa da variância da média é dada pela ex-
pressão:

S2
Var(y) = ,
n
em que, S2 é o valor obtido para variância amostral. O erro-padrão da média de uma amostra
extraída de uma população infinita é calculado por:

S
S(y) = √ ,
n

davidvenacio@hotmail.com |
Inferência numa amostra aleatória simples
36

Para o calculo da variância amostral e o erro-padrão da média no caso de população finita


são acrescentados o fator de correção aos cálculos, ou seja:
r
S2 N − n S N−n
Var(y) = e S(y) = √ ,
n N−1 n N−1

Se a distribuição de uma determinada variável aleatória de uma população for normal, pode-
se construir um intervalo de confiança, com a probabilidade igual a (1 − α), para a média
desta população, a partir de uma amostra, baseando-se na distribuição da variável aleatória
t, usando a seguinte expressão:

davidvenacio@hotmail.com |
Inferência numa amostra aleatória simples
37

IC(µ) = y ± tα/2 S(y)


S
IC(µ) = y ± tα/2 √
n
em que, tα/2 é uma valor na tabela de t com v = n − 1 graus de liberdade a área a sua direita
a α/2 .

davidvenacio@hotmail.com |
Inferência numa amostra aleatória simples
38

O intervalo de confiança para µ, com a probabilidade igual a (1α), para uma população
finita é dado por:
r
S N−n
IC(µ) = y ± tα/2 √
n N−1

davidvenacio@hotmail.com |
Tabela de Números aleatórios
39

Tabela de Números Aleatórios


57 72 00 39 84 84 41 79 67 71 40 21 13 97 56 49 86 54 08 93 29 68 74 54 83
28 80 53 51 59 09 93 98 87 58 70 27 71 77 17 06 32 02 78 62 16 74 69 65 17
92 59 18 52 87 30 48 86 97 48 35 25 18 88 74 03 62 98 38 58 65 86 42 41 03
90 38 12 91 74 30 19 75 89 07 50 64 15 59 71 88 13 74 95 30 52 78 30 11 75
80 91 16 94 67 58 60 82 06 66 90 47 56 18 46 45 11 12 35 32 45 50 41 13 43

22 01 70 31 32 96 91 92 75 40 16 54 29 72 74 99 00 95 97 61 00 98 24 30 07
56 24 10 04 30 20 46 29 90 53 53 11 05 84 41 21 64 79 19 76 29 51 62 60 66
79 44 92 62 02 96 86 64 30 00 94 56 69 30 20 59 87 87 35 44 22 50 97 78 19
53 99 66 45 08 89 78 50 77 53 37 25 77 41 27 62 38 02 23 57 62 01 41 60 35
18 92 87 35 88 56 05 21 36 51 39 28 50 14 66 85 79 30 19 79 72 66 64 31 45

53 08 58 96 63 05 61 25 70 22 50 41 28 96 62 66 43 63 06 63 01 32 79 85 22
03 58 80 29 28 76 89 51 18 24 88 89 46 47 48 59 19 29 87 03 10 33 99 67 12
27 07 81 88 65 69 49 98 00 28 04 70 51 30 01 47 18 97 33 21 85 82 45 43 24
05 21 08 59 01 06 22 24 98 91 81 17 55 44 66 16 07 73 07 66 10 12 31 78 58
40 36 13 27 84 30 82 33 36 39 69 42 05 58 64 61 12 33 89 27 89 52 66 71 93

54 60 25 28 85 88 20 00 10 59 61 05 36 61 33 72 01 01 19 01 61 10 51 20 91
71 51 63 40 76 71 11 73 73 52 37 31 60 45 88 92 73 43 71 28 04 98 09 02 48
61 02 01 81 73 92 60 66 73 58 53 34 42 68 26 38 34 03 27 44 96 04 46 65 93
82 55 93 13 46 30 95 26 55 06 96 17 65 91 72 39 79 96 12 49 52 80 63 26 99
89 98 54 14 21 74 13 57 68 19 86 28 60 89 47 33 15 26 28 77 45 38 48 08 08

00 99 84 84 14 67 95 13 77 58 90 14 50 79 42 73 63 31 06 60 43 40 12 55 04
62 41 50 78 20 48 05 88 43 52 98 03 19 93 92 03 04 97 25 84 95 95 03 63 31
94 27 90 69 24 68 09 92 11 86 07 63 83 19 32 99 51 15 55 71 09 27 02 67 00
44 89 29 28 84 36 28 25 15 82 87 74 18 97 25 76 10 63 26 76 02 26 74 53 28
97 30 76 95 33 21 10 54 26 95 66 65 52 04 99 36 58 48 03 08 93 63 58 17 96

39 16 58 04 44 80 15 59 59 83 90 95 54 66 81 84 39 60 85 38 88 66 33 35 69
60 78 11 03 26 67 50 34 09 61 31 30 20 76 93 66 30 83 51 09 33 83 64 76 05
03 19 23 47 62 89 57 77 91 33 88 47 60 59 37 54 39 48 77 67 49 85 38 43 91
41 28 52 67 56 25 39 59 96 65 51 36 90 32 22 39 33 05 22 99 03 39 97 96 99
77 54 98 50 39 25 37 42 52 97 10 03 56 04 92 81 66 86 70 01 48 89 55 82 10
davidvenacio@hotmail.com |
Exemplo
Amostra Aletória 40

Uma cidade turística tem 30 hotéis de três estrelas. Pretende-se conhecer o custo médio da
diária para apartamento de casal. Os valores populacionais consistem nos seguintes preços
diários (em dólares): 25, 20, 35, 21, 22, 24, 25, 30, 38, 24, 20, 20, 25, 20, 19, 25, 23, 24, 28,
24, 24, 22, 28, 26, 23, 25, 22, 27, 25, 23. Extraia uma amostra aleatória simples de tamanho
10 desta população por sorteio.

davidvenacio@hotmail.com |
Exemplo
Amostra Aletória 41

1º passo: Elaborar a relação dos dados brutos da população, ordenando os números com
uma numeração aleatória. Como dispomos de um conjunto de elementos de 30 números
começaremos pelo 00 até o 29.
N.º Hotel Custo N.º Hotel Custo N.º Hotel Custo N.º Hotel Custo N.º Hotel Custo N.º Hotel Custo
00 - $25 06 - $25 11 - $25 16 - $20 21 - $22 26 - $22
01 - $20 07 - $30 12 - $20 17 - $24 22 - $28 27 - $27
02 - $35 08 - $38 13 - $19 18 - $28 23 - $26 28 - $25
03 - $21 09 - $24 14 - $25 19 - $24 24 - $23 29 - $23
04 - $22 10 - $20 15 - $23 20 - $24 25 - $25

davidvenacio@hotmail.com |
Exemplo
Amostra Aletória 42

2º Passo: Agora iremos sortear o valor de n, aqui num tamanho igual a 10, utilizando a
tabela de números aleatórios. Utilizaremos a tabela agrupando 2 em 2 números pois nossa
amostra é de dois dígitos, começando de qualquer ponto na vertical ou na horizontal, até
conseguirmos sortear o tamanho de n existente.

3º Passo: Os números sorteados, os que não têm na amostra são descartados, e no nosso
caso como não utilizaremos as repetições, pois queremos um sorteio sem reposição, então
também serão descartadas as repetições.

davidvenacio@hotmail.com |
Dimensão da amostra
Amostra aleatória simples - caso infinito 43

Para uma população infinita, a semi-amplitude do intervalo de confiança.


S
e = tα/2 S(y) = tα/2 √
n0

é chamado erro de estimativa.


O erro de estimativa pode, e, pode ser pré-fixado de acordo com os objetivos de um estudo,
permitindo calcular o tamanho de uma amostra, ou seja:
 2
S tα/2 S
e = tα/2 √ ⇒ n0 =
n0 e

davidvenacio@hotmail.com |
Dimensão da amostra
Amostra aleatória simples - caso finito 44

No caso de população finita a expressão do erro é dada por:


r
S N−n
e = tα/2 S(y) = tα/2 √
n0 N − 1

Trabalhando-se algebricamente com a expressão tem-se


n0
n=
n0 − 1
1+
N

davidvenacio@hotmail.com |
Dimensão da amostra
Amostra aleatória simples 45

Ao dimensionar uma amostra, considera-se que a população é infinita, obtendo o tamanho


n0 e, numa segunda etapa, relaciona-se n0 com N fazendo-se a correção para a população
finita obtendo o tamanho n. Se n0 for menor que 5% de N, a correção torna-se desprezível
e o tamanho da amostra é aquele obtido em n0 .

Não podemos evitar a ocorrência do ERRO AMOSTRAL, porém podemos limitar seu
valor através da escolha de uma amostra de tamanho adequado. Obviamente, o ERRO
AMOSTRAL e o TAMANHO DA AMOSTRA seguem sentidos contrários . Quanto maior
o tamanho da amostra, menor o erro cometido e vice-versa.

davidvenacio@hotmail.com |
Dimensão da amostra
Exemplo 46

Exemplo 1

Uma pesquisa é planejada para determinar as despesas médicas anuais das famílias dos
empregados de uma grande empresa. A gerência da empresa deseja ter 95% de confiança
de que a média da amostra está no máximo com uma margem de erro de ±$50 da média
real das despesas médicas familiares. Um estudo-piloto indica que o desvio-padrão pode
ser calculado como sendo igual a $400.
1. Qual o tamanho de amostra necessário?
2. Se a gerência deseja estar certa em uma margem de erro de ±$25, que tamanho de
amostra será necessário?

davidvenacio@hotmail.com |
Amostra Aleatória simples para a proporção
47

Freqüentemente em levantamentos por amostragem deseja-se estimar a proporção de uni-


dades da população que apresentam uma determinada característica. Em alguns casos, o
atributo é levantado pela resposta Sim ou Não a determinadas perguntas, que são comuns
nas pesquisas eleitorais. Assim os dados da população são subdivididos em duas categorias:

1. C: dados que possuem o atributo;


2. C1 : dados que não possuem o atributo.

davidvenacio@hotmail.com |
Amostra Aleatória simples para a proporção
48

Como os dados são qualitativos, utiliza-se uma variável binária, yi , para quantificar os re-
sultados. A variável yi assume os seguintes valores:
(
1, se o elemento estiver contido em C
yi =
0, se o elemento estiver contido em C1

davidvenacio@hotmail.com |
Amostra Aleatória simples para a proporção
49

As fórmulas de calculo se baseiam na seguinte notação:

População Amostra
Nº de elementos N n
Observações y1 , y2 , ..., yN y , y , ..., yn
P N P1 N 2
Nº de elementos de C i=1 yi = A i=1 yi = a
Nº de elementos de C1 N−A n−a
A a
Proporção de C p= p=
b
N n
N−A n−a
Proporção de C1 q=1=p= q = 1−b
b p=
N n

davidvenacio@hotmail.com |
Amostra Aleatória simples para a proporção
50

O estimador b p, da proporção p de uma característica da população com base em uma amos-


tra aleatória de n elementos, é dado por:
n
1X
p=
b yi
n
i=1

Este estimador é não-viciado ou não-tendencioso, isto é,

p] = p
E[b

davidvenacio@hotmail.com |
Amostra Aleatória simples para a proporção
51

A variância do estimador de p, no caso da população infinita é dada por:

p(1 − p)
Var(p) = ,
n
E no caso de uma população finita:

p(1 − p) N − n
Var(p) =
n N−1

davidvenacio@hotmail.com |
Amostra Aleatória simples para a proporção
52

Como os dados de uma amostra, pode-se estimar a variância de uma proporção, bem como
o erro padrão. No caso da população infinita a estimativa da variância de uma proporção é
dada por
p(1 − b
b p)
p) =
Var(b ,
n
e o erro padrão é dado por: r
p(1 − b
b p)
S(bp) = ,
n

davidvenacio@hotmail.com |
Amostra Aleatória simples para a proporção
Intervalo de Confiança 53

De acordo com o Teorema do Limite Central a distribuição de p é aproximadamente normal


p(1 − b p)
, quando n → ∞.
b
com média E[b p] = p e variância Var(b p) =
n
Admitindo que o tamanho da amostra seja suficientemente para que a aproximação normal
de verifique, pode-se utilizar a distribuição normal padrão (z) para construir um intervalo
de confiança para p de acordo com a expressão:
 
1
IC(p) = b p ± Zα/2 s(b
p) +
2n
" r #
p (1 − b p) 1
p ± Zα/2
b
= b +
n−1 2n

davidvenacio@hotmail.com |
Amostra Aleatória simples para a proporção
Intervalo de Confiança 54

No caso de uma população finita, o erro padrão de uma proporção é dado por:
r
p (1 − b
b p) N − n
p) =
s(b
n−1 N−1
e o intervalo de confiança para p é obtido pela expressão:
" r #
p (1 − b
p) N − n 1
p ± Zα/2
b
IC(p) = b +
n − 1 N − 1 2n

davidvenacio@hotmail.com |
Dimensão da amostra
Caso Infinito 55

O erro de estimativa num intervalo de confiança para p em uma população infinita desprezando-
se a correção de continuidade é:
s
p (1 − b
b p)
e = Zα/2
n0 − 1

que resolvendo para n0 fornece:

2 p (1 − b
b p)
n0 = Zα/2 2
+1
e

davidvenacio@hotmail.com |
Dimensão da amostra
Caso finito 56

No caso da população finita têm-se a expressão:


s
p (1 − b
b p) N − n
e = Zα/2
n0 − 1 N − 1

que elevada ao quadrado e trabalhada definitivamente fornece:


n0
n=
n0 − 1
1+
N

davidvenacio@hotmail.com |
Exemplo
57

Questão
Foi realizada uma pesquisa numa cidade sobre a preferência do eleitorado nas vésperas do
segundo turno de uma eleição para prefeito. Os resultados obtidos foram os seguintes:

Candidato Nº de eleitores favoravéis


A 503
B 529
Brancos/Nulos 66
Indecisos/Não respondeu 102
Total 1200

davidvenacio@hotmail.com |
Exemplo
58

1. Estime a proporção de votos de cada candidato e os respectivos erros de estimativa


(α = 0, 05).
2. Pelos resultados obtidos, se a eleição tivesse sido realizada no mesmo dia da pesquisa
seria possível prever o candidato vitorioso?
3. Qual deveria ser o tamanho da amostra para que fosse possível prever o candidato
vitorioso com uma confiança de 95% e um erro de 2%?

davidvenacio@hotmail.com |
Referências
59

BUSSAB, W. O.; MORETTIN, P. A. – Estatística Básica. Atual Editora, São Paulo, 2008.

BOLFARINE, H., BUSSAB, W.O., Elementos de Amostragem. Ed. Edgard Blucher; Edi-
ção: 1ª 2005.

NUNES, N. Amostragem Probabilistica. EDUSP. 1998. 125p.

Notas de aulas. Prof: Patricia.

davidvenacio@hotmail.com |

Você também pode gostar