Você está na página 1de 281

7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

Universidade de S˜ao Paulo


Instituto de Matem´ atica e Estatı́stica

Elementos de Amostragem

Heleno Bolfarine e Wilton O. Bussab

Maio, 2004

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 1/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

ii

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 2/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

Conte´ udo

1 No¸cões b´asicas 1
1.1 Palavras-chave . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Guia para um levantamento amostral . . . . . . . . . . . . . . . . . . 2
1.3 O que se pretende conhecer? . . . . . . . . . . . . . . . . . . . . . . . 3
1.3.1 Qual a quest˜ao a ser respondida? . . . . . . . . . . . . . . . . 3
1.3.2 A operacionaliza¸cão dos conceitos . . . . . . . . . . . . . . . 4
1.3.3 Variáveis e atributos . . . . . . . . . . . . . . . . . . . . . . . 5
1.3.4 Especica¸cão dos parˆametros . . . . . . . . . . . . . . . . . . 5
1.4 De quem se está falando . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4.1 Unidade elementar, amostral e resposta . . . . . . . . . . . . 6

1.4.2 As diversas popula¸cões possı́veis . . . . . . . . . . . . . . . . 7


1.5 Como obter os dados? . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.5.1 Tipos de investiga¸cão . . . . . . . . . . . . . . . . . . . . . . 11
1.5.2 Métodos de coleta de dados . . . . . . . . . . . . . . . . . . . 12
1.5.3 Planejamento e sele¸cão da amostra . . . . . . . . . . . . . . . 14
1.5.4 Tipos b´asicos de amostras . . . . . . . . . . . . . . . . . . . . 15
1.5.5 Classica¸cão de amostras probabilı́sticas . . . . . . . . . . . . 16
1.5.6 Estimadores e erros amostrais . . . . . . . . . . . . . . . . . . 19
1.5.7 Tamanho da amostra . . . . . . . . . . . . . . . . . . . . . . . 21

1.5.8 Censo ou amostragem . . . . . . . . . . . . . . . . . . . . . . 22


1.6 Coleta dos dados (trabalho de campo) . . . . . . . . . . . . . . . . . 22
1.7 Prepara¸cão dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.8 Análises estatı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.9 Erros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.9.1 Erros amostrais . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.9.2 Erros n˜ao amostrais . . . . . . . . . . . . . . . . . . . . . . . 29

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 3/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

iv CONTE ÚDO

1.10 Apresenta¸cão dos resultados . . . . . . . . . . . . . . . . . . . . . . . 31


1.11 Divulga¸cão do banco de dados (disponibilidade) . . . . . . . . . . . . 32
Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

2 Deni¸cões e nota¸ cões b´


asicas 37
2.1 Popula¸cão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.2 Amostras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.3 Planejamento amostral . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.4 Estatı́sticas e distribui¸ cões amostrais . . . . . . . . . . . . . . . . . . 47
2.5 Estimadores e suas propriedades . . . . . . . . . . . . . . . . . . . . 52

2.6 Express˜oes úteis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54


Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
Te´oricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

3 Amostragem aleat´ oria simples 61


3.1 Denições e nota¸cões . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.2 Amostragem aleat´oria simples com reposi¸cão . . . . . . . . . . . . . 62
3.2.1 Propriedades da estatı́stica t(s) . . . . . . . . . . . . . . . . . 65
3.2.2 Estima¸cão do total e da média populacional . . . . . . . . . . 65
3.2.3 Estima¸cão da variˆancia populacional . . . . . . . . . . . . . . 66
3.2.4 Normalidade assint´ otica e intervalos de conan¸ ca . . . . . . . 68
3.2.5 Determina¸cão do tamanho da amostra . . . . . . . . . . . . . 69
3.2.6 Estima¸cão de propor¸cões . . . . . . . . . . . . . . . . . . . . 71
3.2.7 Otimalidade de y na AASc . . . . . . . . . . . . . . . . . . . 73
3.3 Amostragem aleat´oria simples sem reposi¸cão . . . . . . . . . . . . . 74
3.3.1 Propriedades da estatı́stica t(s) . . . . . . . . . . . . . . . . . 75
3.3.2 Estima¸cão do total e da média populacional . . . . . . . . . . 76
3.3.3 Estima¸cão da variˆancia populacional . . . . . . . . . . . . . . 76
3.3.4 Normalidade assint´ otica e intervalos de conan¸ ca . . . . . . . 78
3.3.5 Determina¸cão do tamanho da amostra . . . . . . . . . . . . . 79
3.3.6 Estima¸cão de propor¸cões . . . . . . . . . . . . . . . . . . . . 80
3.3.7 Otimalidade de y na AASs . . . . . . . . . . . . . . . . . . . 82
3.4 Compara¸cão entre AASc e AASs . . . . . . . . . . . . . . . . . . . . 82
Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
Te´oricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 4/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

CONTE ÚDO v

4 Amostragem estraticada 93
4.1 Nota¸cão e relações úteis . . . . . . . . . . . . . . . . . . . . . . . . . 96
4.2 Estima¸cão do total e da média populacional . . . . . . . . . . . . . . 100
4.3 Alocação da amostra pelos estratos . . . . . . . . . . . . . . . . . . . 101
4.3.1 Alocação proporcional . . . . . . . . . . . . . . . . . . . . . . 102
4.3.2 Alocação uniforme . . . . . . . . . . . . . . . . . . . . . . . . 103
4.3.3 Alocação ótima de Neyman . . . . . . . . . . . . . . . . . . . 104
4.3.4 Efeito do planejamento . . . . . . . . . . . . . . . . . . . . . 106
4.4 Normalidade assint´otica e intervalos de conan¸ ca . . . . . . . . . . . 109
4.5 Determina¸cão do tamanho da amostra . . . . . . . . . . . . . . . . . 109

4.6 Estima¸cão de propor¸cões . . . . . . . . . . . . . . . . . . . . . . . . . 110


Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
Te´oricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

5 Estimadores do tipo raz˜


ao 127
5.1 Estima¸cão da raz˜ao, do total e da m´
edia populacional com AAS . . 128
5.2 Estima¸cão da variˆancia populacional . . . . . . . . . . . . . . . . . . 133
5.3 Compara¸cão entre os estimadores raz˜ ao e expans˜ao . . . . . . . . . . 133
5.4 Normalidade assint´otica e intervalos de conan¸ ca . . . . . . . . . . . 135
5.5 Determina¸cão do tamanho da amostra . . . . . . . . . . . . . . . . . 135
5.6 Estima¸cão do total e da média populacional com AE . . . . . . . . . 136
Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
Te´oricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

6 Estimadores do tipo regress˜


ao 145
6.1 Estima¸cão do total e da média populacional com AAS . . . . . . . . 146
6.2 Compara¸cão entre os estimadores regress˜ ao e razão . . . . . . . . . . 149
6.3 Normalidade assint´otica e intervalos de conan¸ ca . . . . . . . . . . . 150
6.4 Determina¸cão do tamanho da amostra . . . . . . . . . . . . . . . . . 151
6.5 Estima¸cão da média populacional com AE . . . . . . . . . . . . . . . 151
Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
Te´oricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156

7 Amostragem por conglomerados em um est´ agio 159


7.1 Nota¸cão e relações úteis . . . . . . . . . . . . . . . . . . . . . . . . . 162
7.2 Plano amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
7.3 Estimadores da média por elemento . . . . . . . . . . . . . . . . . . 167

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 5/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

vi CONTE ÚDO

7.4 Coecientes de correla¸cão intraclasse . . . . . . . . . . . . . . . . . . 172


7.4.1 Conglomerados de igual tamanho . . . . . . . . . . . . . . . . 174
7.4.2 Conglomerados de tamanhos desiguais . . . . . . . . . . . . . 177
7.5 Estima¸cão de propor¸cões . . . . . . . . . . . . . . . . . . . . . . . . . 179
7.6 Normalidade assint´otica e intervalos de conan¸ ca . . . . . . . . . . . 180
7.7 Determina¸cão do tamanho da amostra . . . . . . . . . . . . . . . . . 180
7.8 Amostragem sistem´atica . . . . . . . . . . . . . . . . . . . . . . . . . 181
7.8.1 Rela¸cões com a AC . . . . . . . . . . . . . . . . . . . . . . . . 182
Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
Te´oricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193

8 Amostragem em dois est´


agios 197
8.1 Notação e plano amostral . . . . . . . . . . . . . . . . . . . . . . . . 201
8.2 Estimadores da média por elemento . . . . . . . . . . . . . . . . . . 201
8.2.1 N conhecido . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
8.2.2 Estimador raz˜ao . . . . . . . . . . . . . . . . . . . . . . . . . 207
8.2.3 Média simples . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
8.3 Conglomerados de igual tamanho . . . . . . . . . . . . . . . . . . . . 210
8.3.1 Estimador para a média por elemento . . . . . . . . . . . . . 210
8.3.2 Uso da correla¸cão intraclasse . . . . . . . . . . . . . . . . . . 211
8.3.3 Eciência do plano amostral em dois est´ agios . . . . . . . . . 212
8.3.4 Tamanho ´otimo de b . . . . . . . . . . . . . . . . . . . . . . . 213
Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
Te´oricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219

9 Estima¸ c˜
ao com probabilidades desiguais 225
9.1 Caso geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
9.2 Amostragem por conglomerados . . . . . . . . . . . . . . . . . . . . . 230
9.3 Estimador raz˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
9.4 Amostragem em dois est´agios . . . . . . . . . . . . . . . . . . . . . . 231
9.5 O estimador de Horwitz–Thompson . . . . . . . . . . . . . . . . . . 232
9.6 Amostragem de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . 235
Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
Te´oricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 6/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

CONTE ÚDO vii

10 Resultados assint´ oticos 239


10.1 Estimador média amostral . . . . . . . . . . . . . . . . . . . . . . . . 239
10.2 Estimador raz˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
10.3 Estimador regress˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
10.4 Amostragem por conglomerados . . . . . . . . . . . . . . . . . . . . . 244
10.5 Ilustra¸cão numérica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
Exerc´ıcios te´oricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247

11 Exerc´ıcios complementares 249

A Rela¸ c˜
ao de palavras-chave 261

B T´opicos para um levantamento amostral 265

Referências bibliogr´ acas 269

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 7/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

viii CONTE ÚDO

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 8/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

Lista de Figuras

1.1 Compara¸cões das popula¸cões alvo, referida e amostrada . . . . . . . 10


1.2 Critérios para classicar pesquisas . . . . . . . . . . . . . . . . . . . 12
1.3 Critérios para classicar amostras probabilı́sticas . . . . . . . . . . . 17

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 9/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

x LISTA DE FIGURAS

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 10/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

Lista de Tabelas

1.1 Tipos de amostras . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.1 Popula¸cão de três domicı́lios . . . . . . . . . . . . . . . . . . . . . . . 39


2.2 Distribui¸cão amostral de r na AASc . . . . . . . . . . . . . . . . . . 49
2.3 Distribui¸cão amostral de r na AASs . . . . . . . . . . . . . . . . . . 49
2.4 Distribui¸cão amostral de f na AASc . . . . . . . . . . . . . . . . . . 51
2.5 Distribui¸cões amostrais de f 1 , f 2 , f 3 , δ1 , δ2 , δ3 na AASc . . . . . . . 51
2.6 Distribui¸cão de f 1 na AASc . . . . . . . . . . . . . . . . . . . . . . . 52
2.7 Distribui¸cão de δ1 na AASc . . . . . . . . . . . . . . . . . . . . . . . 52
2.8 Popula¸cão de 180 domicı́lios . . . . . . . . . . . . . . . . . . . . . . . 60

2
3.1
3.2
Valores de y, s e P (s) para as amostras
Distribui¸cão amostral de y na AASc . .
s
.
em
. . S. AASc . . . . . . . . .
. . . . . . . . . . . .
67
68
3.3 Distribui¸cão amostral de s2 na AASc . . . . . . . . . . . . . . . . . . 68
Valores de y, s 2 e P (s) para as amostras
3.4 s em
SAASs . . . . . . . . . 77
3.5 Distribui¸cão amostral de y na AASs . . . . . . . . . . . . . . . . . . 77
3.6 Distribui¸cão amostral de s2 na AASs . . . . . . . . . . . . . . . . . . 78

4.1 Uma popula¸cão estraticada . . . . . . . . . . . . . . . . . . . . . . . 97

5.1 Distribui¸cões amostrais de f , t e f R na AASc . . . . . . . . . . . . . 129

6.1 Distribui¸cão amostral de f Reg na AASc . . . . . . . . . . . . . . . . 149

7.1 Distribui¸cão amostral de y na AC . . . . . . . . . . . . . . . . . . . . 161


7.2 Popula¸cão disposta em conglomerados . . . . . . . . . . . . . . . . . 162
7.3 Pares possı́veis dentro do conglomerado α . . . . . . . . . . . . . . . 173
7.4 Amostras sistem´aticas . . . . . . . . . . . . . . . . . . . . . . . . . . 182
7.5 Distribui¸cão de ysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 11/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

xii LISTA DE TABELAS

8.1 Espa¸co amostral e probabilidades na A2E . . . . . . . . . . . . . . . 199


8.2 Valores de y e y2c1 na A2E . . . . . . . . . . . . . . . . . . . . . . . 200

9.1 Tamanhos dos grupos . . . . . . . . . . . . . . . . . . . . . . . . . . 226


9.2 Distribui¸cão de y c . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
9.3 Distribui¸cão amostral de ˆτ ppz . . . . . . . . . . . . . . . . . . . . . . 229
9.4 Distribui¸cão amostral de ˆτ HT . . . . . . . . . . . . . . . . . . . . . . 235

10.1 Probabilidades de coberturas estimadas (em porcentagem) . . . . . . 246

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 12/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

Cap´ıtulo 1

No¸cões b´
asicas

A experiência com amostragem é fato corrente no cotidiano. Basta lembrar como um


cozinheiro verica o tempero de um prato que est´ a preparando, como alguém testa
a temperatura de um prato fumegante de sopa, ou ainda como um médico detecta
as condi¸cões de um paciente através de exames de sangue. Poderiam ser listados
outros exemplos que usam procedimentos amostrais mais complicados, mas todos
com o mesmo objetivo: obter informa¸ cões sobre o todo baseando-se no resultado de
uma amostra.
Por´
em, o uso inadequado de um procedimento amostral pode levar a um viés
de interpreta¸ cão do resultado. Por exemplo, n˜ ao mexer bem a sopa antes de retirar
uma colher para experimentar pode levar a subavalia¸ cão da temperatura do prato
todo com consequências deagrad´ aveis para o usu´ario.
Em estudos mais sosticados, onde as informa¸ cões são obtidas através de le-
vantamentos amostrais, é comum o usu´ ario car t˜ao envolvido na apura¸ cão e inter-
preta¸cão dos dados que “esquece” de vericar poss´ıveis viéses origin´ arios do protocolo
de escolha da amostra.
O uso de amostras que produzam resultados con´ aveis e livres de viéses é o
desejo de todos. Entretanto, estes conceitos n˜ ao são triviais e precisam ser estabe-

lecidos para o uso cientı́co dos processos amostrais. Desse modo, necessita-se de
teoria que descreva as propriedades e impropriedades de alguns protocolos de obter
amostras. Esse é o objetivo do livro: apresentar os princ´ıpios b´ asicos de uma “Teo-
ria de Amostragem”. Cursos introdut´ orios de inferência estatı́stica também ensinam
a fornecer resultados para o todo baseando-se em resultados da amostra, porém a
ênfase é dada para popula¸ cões innitas, ou o que é muito mais comum, a amostra é
retirada de uma distribui¸ cão de probabilidade. N˜ao se discute muito como a amostra

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 13/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

2 No¸cões b´asicas

é obtida, garante-se apenas que as observa¸ cões foram obtidas independentemente,


com igual probabilidade, e retiradas de uma mesma popula¸ cão teoricamente innita.
Aqui a popula¸cão será nita, e possivelmente enumer´ avel ou pass´ıvel de descri¸ cão.
Neste capı́tulo pretende-se dar uma vis˜ ao geral das quest˜oes envolvidas em um
plano amostral e que servir´ a para um primeiro contato com aspectos metodol´ ogicos
emergentes de uma pesquisa de tal natureza.

1.1 Palavras-chave
Toda teoria, e amostragem n˜ ao foge a regra, necessita de um conjunto de conceitos
e termos técnicos sobre a qual ela se fundamenta. Estes conceitos ir˜ ao aparecendo
pelos diversos capı́tulos conforme se tornarem necess´ arios. Porém, é conveniente para
unicar a linguagem e tornar mais clara a explica¸ cão, denir alguns desses conceitos,
mesmo que de forma abreviada. No Apêndice A est˜ ao listadas e descritas algumas
palavras-chave que atendem a esse objetivo. Recomendamos ao leitor consult´ a-lo
sempre que tiver d´uvidas em rela¸cão a algum dos conceitos mencionados.

1.2 Guia para um levantamento amostral


Ao optar por uma pesquisa quantitativa, levantamento ou experimenta¸ cão, é
necessário que o pesquisador planeje, execute, corrija e analise adequadamente o
procedimento proposto e usado. Isto signica tomar uma série de medidas e cui-
dados antes da realiza¸ cão, durante a aplica¸ cão e depois da pesquisa efetuada. Sem
esses passos dicilmente pode-se garantir resultados convincentes e con´ aveis. Um
estatı́stico experiente desenvolve os seus pr´ oprios procedimentos, escritos ou n˜ ao,
para conduzir ou orientar uma pesquisa quantitativa, mas ter´ a muita diculdade em
transmitir esses conhecimentos sem a pr´ atica e o convı́vio cotidiano com o aprendiz.
Um dos métodos para transferir conhecimento e agilizar o treinamento nesta ativi-

dade é através da apresenta¸ cão de uma lista de t´opicos que devam ser abordados em
uma pesquisa quantitativa, ou melhor, apresentando o chamado “checklist”. Estas
listas nunca s˜ao denitivas ou completas. Em primeiro lugar elas traduzem as idios-
sincrasias de seus formuladores, e em segundo, dicilmente conseguem prever todas
as possı́veis situa¸ cões de um mundo t˜ao rico e complexo como as pesquisas quanti-
tativas. Portanto, devem ser usadas como um guia aproximado para planejamento
e execução de um plano amostral.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 14/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

1.3 O que se pretende conhecer? 3

Apresentamos no Apˆ
endice B a nossa lista de pontos. Ela é resultante de
nossas discuss˜oes, conhecimento, aprendizado, experiência e pr´ atica. Além de servir
como referência, aproveitaremos a rela¸ cão para abordar alguns t´ opicos que raramente
aparecem em livros de técnicas de amostragem. Tais assuntos s˜ ao fundamentais
para aqueles que tenham que conduzir ou assessorar um levantamento amostral, e
ousamos armar que se estes procedimentos metodol´ ogicos não forem adequados,
não existe técnica estatı́stica, por melhor ou mais sosticada que seja, que possa
produzir resultados idˆ oneos.
Embora exista alguma aparente ordem na sequência das atividades, a pr´ atica
nem sempre age deste modo. Salta-se de um ponto para outro de acordo com as

necessidades, lembran¸ cas e informa¸cões que vão aparecendo. Entretanto, seguir


os pontos mencionados ter´ a a vantagem de uma apresenta¸ cão aparentemente mais
racional, servindo também como roteiro para apresenta¸ cão do relat´orio.
As seções seguintes abordar˜ ao alguns dos item mencionados, procurando ex-
plicar um pouco mais sobre o seu signicado. Os assuntos n˜ ao serão obrigatoria-
mente tratados nem na ordem nem no grupo onde apareceu mencionado. Os demais
capı́tulos deste livro, relacionados com as técnicas de amostragem, abordam com
maior profundidade os itens contidos no grupo intitulado Planejamento e Sele¸ cão
de Amostra .

1.3 O que se pretende conhecer?


1.3.1 Qual a quest˜
ao a ser respondida?

Usualmente o objetivo geral de uma pesquisa é ´ obvio. Na maioria das vezes pode ser
resumida em uma pergunta. As diculdades come¸ cam ao se procurar em respostas
a esta pergunta. Qual o potencial do mercado no municı́pio X para consumir um
novo produto cultural? Deve-se investigar as pessoas mais ricas ou as de maior
nı́vel educacional? O conhecimento substantivo do assunto abordado ajuda muito a

estabelecer os melhores caminhos em busca de uma resposta? Estudar levantamentos


semelhantes realizados no passado, ou em outras regi˜ oes, é uma das melhores fontes
para identicar e operacionalizar objetivos, bem como obter sugest˜ oes de como o
problema pode ser resolvido. Pode-se aprender muito com erros cometidos por
outros pesquisadores.
Portanto, uma das maiores diculdades de qualquer pesquisa é a formula¸ cão
correta dos seus objetivos gerais e operacionais. Exige muito conhecimento especı́co

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 15/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

4 No¸cões b´asicas

da área de interesse, muito trabalho de pesquisa bibliogr´ aca e grande habilidade


criativa por parte dos pesquisadores envolvidos. Em pesquisas quantitativas, a si-
tua¸cão agrava-se pela necessidade de transformar estes objetivos em quest˜ oes opera-
cionais quantic´aveis. A literatura, e a experiência mais ainda, é rica em exemplos
e situa¸cões onde a distˆancia entre o objetivo genérico e a resposta quantitativa ope-
racional é muito grande. Pense, por exemplo, na quest˜ ao: renda é uma boa maneira
de operacionalizar o conceito de classe social para uma famı́lia? Caso a resposta seja
armativa, o que é melhor: renda familiar total ou renda familiar per capita?
Pode-se até postular que “um problema corretamente denido j´ a est´a resol-
vido”, pois em sua formula¸cão vem embutida a solu¸cão.

Quase sempre um levantamento amostral tem m´ ultiplos objetivos, mas para


efeitos pr´aticos é conveniente prender-se a um conjunto pequeno de quest˜ oes-chave e
que precisam ser respondidas. Isto facilitar´ a o trabalho de planejamento. As demais
quest˜oes farão parte de um conjunto de objetivos secund´ arios, que poder˜ao ou não
ser adequadamente respondidos pela pesquisa. Deve-se evitar fortemente a tenta¸ cão
de acrescentar quest˜ oes só para aproveitar o levantamento.

1.3.2 A operacionaliza¸ cão dos conceitos

Um dos maiores desaos das pesquisas quantitativas é a cria¸ cão de bons indicadores
(vari´aveis, escalas) que representem adequadamente os conceitos (constructos) de
interesse. S˜ao exemplos de constructos: inteligência, nı́vel s´ ocio-econômico, desem-
penho escolar, potencial de mercado, ansiedade, satisfa¸ cão, etc. Para inteligência
é bem conhecido o quociente de inteligência (QI) como um indicador. O critério
Brasil, antigo ABA/ABIPEME, aquele que combina grau educacional, condi¸ cões da
moradia e bens possuı́dos é muito usado para expressar o nı́vel s´ ocio-econômico. O
Ministério da Educa¸ cão aplica uma série de provas para avaliar desempenho escolar
(SAEB, ENEM, Prov˜ ao, Pisa, etc.). J´a para o potencial de mercado, procura-se
criar uma escala medindo as componentes do conceito operacional: “pessoas, com

dinheiro e disponibilidade para gastar”. Estas escalas, muitas vezes mal entendidas
e erroneamente empregadas, s˜ ao aceitas e largamente usadas por terem sido vali-
dadas, isto é, foram criadas, analisadas contextualmente, comparadas e vericada
a pertinência entre os valores na escala e o signicado dentro do conceito. Alguns
indicadores s˜ao medidos por meio de uma ´unica vari´avel mensur´avel, outras, que é
o mais comum, s˜ao combina¸cões de resultados de v´arias perguntas quantic´ aveis.
Boa parte dos conte´udos dos livros de metodologia de pesquisa dedica-se a prescre-

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 16/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

1.3 O que se pretende conhecer? 5

ver métodos e processos para transformar conceitos te´ oricos em escalas con´aveis e
validadas. Dentro da vasta literatura disponı́vel, recomenda-se o livro de Pedhazur
e Schmelkin (1991), pela sua abordagem mais quantitativa.

1.3.3 Vari´
aveis e atributos
Associada a cada unidade elementar (UE - veja a deni¸cão na Seção 1.4.1) existir´a
uma ou mais caracterı́sticas de interesse ´ a pesquisa. S˜ao as chamadas vari´aveis
ou atributos. Por exemplo, em um estudo onde a UE é a famı́lia pode-se estar
interessado na renda familiar total, no n´ umero de membros, no sexo ou educa¸ cão
do chefe, etc. J´a para a UE empresa, o interesse pode ser no faturamento total,
lucratividade, ramo de atividade econˆ omica, consumo de energia elétrica, etc.
O objetivo especı́co da pesquisa é que orienta a escolha e deni¸ cão da UE e
das vari´aveis a serem coletadas. Em pesquisa de Marketing, sobre o poder de compra,
uma das vari´aveis mais usadas é a renda familiar total. J´a para um estudo sobre
polı́tica de emprego é mais indicado analisar a renda individual do trabalhador.
Em algumas situa¸ cões a escolha da UE é muito mais complexa. Por exemplo, em um
estudo sobre o comportamento de setores ligados ` a industria de alimenta¸ cão, como
tratar o restaurante dentro de uma grande montadora de autom´ oveis? Observe que
dependendo da deni¸ cão, o mesmo estabelecimento poderia ser tratado de modo

diferente caso a explora¸cão fosse própria ou terceirizada.

1.3.4 Especica¸ cão dos parˆ ametros


Com os conceitos de interesse da pesquisa traduzidos em vari´ aveis mensur´aveis,
necessita-se tornar bem claro quais as caracterı́sticas populacionais ( parˆametros )
que dever˜ao ser estimados pela amostra. A falta de uma inequı́voca deni¸ cão inicial
tem sido fatal para muitas pesquisas.
Suponha que o objetivo de um levantamento seja medir o crescimento das
vendas das empresas do setor de vestu´ ario em um determinado ano. Isso pode

ser medido, pelo menos, de duas maneiras: (i) como a média do crescimento de
cada empresa (vendas deste ano/vendas do ano anterior, para cada empresa) ou,
(ii) raz˜ao entre o total de vendas de todas as empresas neste ano dividido pelo
total de vendas das empresas no ano passado. Estes resultados podem ser bem
diferentes, principalmente se as grandes empresas tiverem comportamento distinto
das pequenas. A escolha de um outro parˆ ametro é fundamental na orienta¸ cào do
desenho amostral.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 17/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

6 No¸cões b´asicas

Quando o levantamento exige, além de estimativas para a popula¸ cão toda,


também para estratos e/ou subpopula¸ cões, deve-se redobrar o cuidado no planeja-
mento para garantir estimadores adequados para o todo e as partes. É bom lembrar
que podem ser usadas diferentes formas de parˆ ametros para vari´ aveis em estratos
distintos.

1.4 De quem se est´


a falando
1.4.1 Unidade elementar, amostral e resposta

A unidade elementar , ou simplesmente elemento de uma popula¸ cão é o objeto ou


entidade portadora das informa¸ cões que pretende-se coletar. Pode ser uma pessoa,
famı́lia, domicı́lio, loja, empresa, estabelecimento, classe de alunos, escola, etc. É
muito importante que a unidade elementar seja claramente denida para que o
processo de coleta e an´alise tenha sempre um signicado preciso e uniforme. Por
exemplo, o conceito de fam´ılia parece ser “natural”, mas sem uma deni¸ cão adequada
pessoas distintas teriam a mesma diculdade de dar uma mesma classica¸ cão para
situa¸cões especiais. Veja um destes casos: suponha que em um domicı́lio vive um
casal com lhos adultos, inclusive uma de suas lhas casada, com o genro e um neto.
Deve-se considerar uma ou duas famı́lias? Suponha agora que a lha é divorciada,
e claro o genro não vive com eles, mudaria alguma coisa na sua deni¸ cão? Nestas
situa¸cões em vez de tentar criar deni¸ cões próprias, recomenda-se fortemente buscar
estudos j´a realizados onde esses problemas j´ a foram estudados e as deni¸cões serão
mais amplas e permitir˜ ao compara¸cões entre diferentes pesquisas. Para o exemplo
citado acima sugere-se consultar os manuais de metodologia de pesquisa editados
pelo IBGE.
Qualquer plano amostral far´ a recomenda¸cões para selecionar elementos da
popula¸cão por meio das unidades amostrais. Pode ser formada por uma ´unica
unidade elementar ou por v´ arias. Uma pesquisa eleitoral usa eleitores como sendo a

unidade elementar. Um levantamento pode escolher um ponto da cidade e entrevis-


tar os cem primeiros eleitores que passam por l´ a. Usou-se a unidade elementar como
unidade amostral. Um plano alternativo decidiu selecionar domic´ılios e entrevistar
todos os eleitores residentes nos domic´ılios escolhidos. A unidade elementar conti-
nua sendo eleitor mas agora a unidae amostral passou a ser domicı́lio, um conjunto
de unidades elementares. Como ser´ a visto mais a frente, os planos amostrais em
múltiplos est´agios empregam diferentes unidades amostrais em um mesmo planeja-

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 18/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

1.4 De quem se est´


a falando 7

mento. Por exemplo, uma amostra de eleitores pode ser obtida selecionando primeiro
algumas cidades, quateir˜ oes dentro das cidades, domicı́lios dentro dos quateir˜ oes e
nalmente eleitores dentro dos domic´ılios.
Às vezes é conveniente ressaltar quem é a unidade respondente ou a unidade
de resposta . Um exemplo pode ajudar a entender o conceito. O censo demogr´ aco
tem uma primeira parte com quest˜ oes simples sobre cada morador do domicı́lio, tais
como sexo, idade, grau de instru¸ cão, etc. Um ´unico morador pode responder por
todos os outros; usualmente elege-se o chefe, ou cˆ onjuge como unidade de resposta.

1.4.2 As diversas popula¸ cões poss´ıveis

Como já foi dito, o objetivo da amostragem é fazer arma¸ cões sobre uma popula¸ cão
baseando-se no resultado (informa¸ cão) de uma amostra. Assim, n˜ ao sabendo exa-
tamente de onde foi retirada a amostra, n˜ ao se sabe para quem pode-se estender as
conclus˜oes, ou seja, para que popula¸cão pode ser feita a inferência.
Inicialmente convém lembrar que entende-se por popula¸ c˜
ao a reunião de
todas as unidades elementares denidas no item anterior.
Como no caso dos objetivos, come¸ca-se falando de uma popula¸ cão genérica e
freqüentemente ´obvia. Por exemplo, na pesquisa de potencial de mercado menci-
onada acima, decide-se investigar a renda individual dos moradores do municı́pio.
Portanto, a popula¸ cão é formada por todos os moradores do municı́pio. Ser´ a que os
jovens irão consumir o produto? E os moradores da regi˜ ao rural? Assim, em uma
segunda aproxima¸ cão operacional, a popula¸cão passa a ser os adultos (maiores de 18
anos), moradores da regi˜ ao urbana de X . Restam ainda outras d´ uvidas: como tratar
os inativos e aqueles que n˜ao têm renda? Conforme a resposta, pode ser necess´ ario
a redenir a popula¸ c˜ao ob jetivo (ou popula¸cão alvo).
A obten¸cão de uma amostra, qualquer que seja o plano amostral adotado,
necessita de uma rela¸cão das unidades elementares. O ideal seria dispor de um rol
seqüencial dessas unidades para que se pudesse fazer uma escolha conveniente das

unidades que comporiam a amostra. Entretanto, raramente disp˜ oe-se de tais listas.
No exemplo acima, dever-se-ı́a dispor da rela¸ cão dos moradores de X , o que parece
ser bem pouco prov´avel que exista. Felizmente, existem informa¸ cões, mais ou menos
atualizadas, que podem ser usadas como alternativas para (descrever) a rela¸ cão
das unidades. Podem ser mapas, v´ arias listas que reunidas descrevem boa parte
do universo, censos, etc. Essas fontes que descrevem o universo a ser investigado
formam o chamado sistema de referências . As unidades que aparecem nessas

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 19/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

8 No¸cões b´asicas

listas muitas vezes s˜ao chamadas de unidades de listagem .


Para o exemplo de potencial mencionado acima, pode-se usar como sistema de
referência a rela¸ cão dos Setores Censit´arios (SC) empregada pelo IBGE nos Censos
Demogr´acos. O municı́pio é dividido em pequenas ´ areas que reunidas recobrem
toda a ´area do municı́pio. Durante a realiza¸ cão do censo, cada SC é designado a um
entrevistador que se encarrega de aplicar o question´ ario em todos os moradores de
cada domicı́lio. Aos interessados, o IBGE fornece o mapa do SC, o n´ umero e tipo de
domic´ılios existentes, o total de moradores e uma série de outras informa¸ cões agrega-
das. Na regi˜ao urbana, cada SC engloba cerca de 300 domicı́lios. Essas informa¸ cões
são atualizadas de 10 em 10 anos, e algumas vezes em prazos menores. Analisando a

rela¸cão de SC do munic´ıpio X , observa-se que em alguns deles existem quartéis, inter-


natos, alojamentos, etc., os chamados domic´ılios coletivos . Também constata-se
que alguns SC s˜ao formados especicamente por favelas, e neste momento n˜ ao inte-
ressaria ao levantamento. Decide-se assim, n˜ ao entrevistar os domicı́lios coletivos e
nem as favelas. Informa¸cões recentes sobre o crescimento da cidade, desde a ´ ultima
atualiza¸cão dos SC, informa que a cidade j´a est´a invadindo SC que s˜ao classicados
como rurais, mas n˜ao se sabe quais. Assim, devido `a particularidade do sistema
de referência, a popula¸ cão que servir´a de base para a escolha da amostra pode ser
denida como: “todos os moradores adultos, com residência em domicı́lios parti-
culares classicados no ´ultimo censo como moradores de regi˜ ao urbana, excluindo
moradores de favelas”. Repare que a deni¸ cão operacional baseada no sistema de
referência n˜ao é obrigatoriamente a mesma que a popula¸ cão alvo. Chamaremos esta
de popula¸ cão referenciada ou popula¸cão referida.
Selecionada a amostra, passa-se ao trabalho de campo, onde os dados ser˜ ao
coletados. Por diversas raz˜ oes não se conseguem informa¸cões sobre algumas uni-
dades selecionadas, e em compensa¸ cão aparecem dados para outras unidades que
não estavam previstas inicialmente. Unidades inexistentes, recusas, domic´ılios va-
gos, ou fechados, impossibilidade de acessar a unidade (condomı́nios fechados) s˜ ao
alguns dos motivos para se perder unidades. Cria¸ cão de novos conjuntos habitacio-

nais, transforma¸ cão de casas em corti¸cos, etc. podem ser motivos de aparecimento
de unidades n˜ao selecionadas a priori. Em todo caso, tem-se uma amostra que foi
retirada de uma popula¸ cão que n˜ao é exatamente a referida. Se a cidade tiver mui-
tos condomı́nios fechados aos quais n˜ ao foram permitido o acesso, e sabendo que
nestes locais moram pessoas de alta renda, a estimativa do potencial de mercado
será subestimada. Assim, a inferência referir-se-´ a apenas a uma nova popula¸ cão: a
popula¸ c˜ao amostrada . Ela só pode ser descrita ap´os a realiza¸cão do levantamento

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 20/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

1.4 De quem se est´


a falando 9

de campo, e procura-se ressaltar quais as possı́veis diferen¸ cas que ela possa ter com
a popula¸cão referida.
A Figura 1.1 procura ilustrar as rela¸ cões existentes entre as diferentes po-
pula¸cões. Como a amostra foi retirada da popula¸ cão amostrada é apenas sobre ela
que valem as inferências estat´ısticas. A an´ alise qualitativa, e algumas vezes até a
quantitativa, das caracterı́sticas das unidades perdidas e das agregadas, permite ava-
liar quais as consequências em estender estas conclus˜ oes para a popula¸cão referida.
O conhecimento substantivo do assunto de pesquisa e das caracterı́sticas das unida-
des distintas nas duas popula¸ cões, permite ao pesquisador avaliar as consequências
de usar as conclus˜oes da popula¸cão referida para a popula¸ cão alvo.

No exemplo em quest˜ao, estima-se estatisticamente qual o potencial relativo


de pessoas na popula¸cão amostrada. Para a popula¸ cão referida, pode-se apenas
dizer que essa porcentagem deve ser maior que a da popula¸ cão amostrada, n˜ao
se saberia precisar o quanto, pois deixaram-se de lado informa¸ cões desconhecidas
sobre moradores mais ricos da cidade. Ao eliminar do sistema de referência as
favelas e os domic´ılios coletivos, elimina-se tamb´
em uma parte dos mais pobres. Se
este contingente for maior que o dos moradores dos condomı́nios fechados ent˜ ao o
potencial relativo da popula¸ cão alvo é menor do que o da popula¸cão amostrada.
Novamente, n˜ao se sabe precisar os valores sem outros estudos ou informa¸ cões.
Em sua opini˜ao, e ainda usando o exemplo acima, a inclus˜ ao dos moradores
rurais na popula¸ cão alvo, de que modo afetaria o potencial de compra da cidade?
Caso a pesquisa deva produzir respostas para partes preestabelecidas da po-
pula¸cão, isto deve ser conhecido antes da deni¸ cão do plano amostral. Suponha
que no exemplo anterior pretendia-se conhecer o mercado potencial separado dos
moradores da regi˜ao sul e norte. Assim, antes de denir a amostra, devia-se separar
o sistema de referências nos SC do sul e do norte, ou seja, é como se estivesse tra-
balhando com duas popula¸ cões. Cada uma dessas subpopula¸ cões é chamada de um
estrato . Estratica¸cão é uma das estratégias mais usadas em desenhos amostrais.
É utilizado tanto para dar respostas a partes da popula¸ cão como para melhorar os

processos de estima¸cão. Será visto em outros capı́tulos como a estratica¸ cão é um


recurso poderos´ıssimo dentro da Amostragem.
Existe uma forte tenta¸ cão em usar a pesquisa amostral para conhecer detalhes
de todas as partes da popula¸ cão, e para tanto, exageram ao estabelecer o n´ umero
de estratos. Esta op¸ cão freqüentemente implica em tamanhos de amostras econo-
micamente invi´aveis. Uma solu¸cão de compromisso é considerar os fatores b´ asicos
como estratos e os secund´arios como subclasses. Estas s˜ao partes da subpopula¸ cão

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 21/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 22/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

1.5 Como obter os dados? 11

ter um n´umero insignicante de representantes de uma das categorias de gênero,


invalidando qualquer conclus˜ ao.
Solicita-se a aten¸cão para a diferen¸ca entre estrato e subclasse. Ambas repre-
sentam partes da popula¸ cão, porém a primeira é contemplada no desenho amostral
garantindo-se `a priori, estimativas con´ aveis. J´a a segunda, a qualidade das esti-
mativas depender´ a da presen¸ca ou não de unidades sucientes em cada subclasse.
Maiores esclarecimentos sobre estas diferen¸ cas aparecer˜ao nos capı́tulos técnicos.
Uma última palavra de advertência sobre os cuidados em denir as popula¸ cões.
Não se duvida em armar, que o sucesso de um levantamento amostral baseia-se
fortemente no conhecimento que se tem sobre a popula¸ cão. Deve-se gastar boa parte

do tempo (mais de 50%) estudando e denindo a popula¸ cão. Dever-se-ia conhecer


tanto sobre ela que talvez fosse até dispens´ avel a realizac˜ao da pesquisa.

1.5 Como obter os dados?


1.5.1 Tipos de investiga¸ c˜
ao

Uma das etapas importantes de uma pesquisa quantitativa e muitas vezes relegada
a um segundo plano, é o levantamento dos dados da(s) caracter´ıstica(s) de interesse.
Um exemplo bem conhecido de coleta de dados s˜ ao os chamados censos populacio-
nais, realizados no Brasil pelo IBGE, que procuram determinar o n´ umero de pessoas
existentes no paı́s, segundo algumas caracterı́sticas importantes como sexo, idade,
nı́vel educacional, etc. Porém, mesmo no censo, nem todas as vari´ aveis são obtidas
entrevistando todas as pessoas. Devido aos altos custos envolvidos, e o uso das
informa¸cões de forma mais agregada, outras caracter´ısticas como renda, ocupa¸ cão,
etc., s˜ao obtidas através de amostras, entrevistando apenas os moradores de parte
dos domic´ılios, algo em torno de um em cada dez domic´ılios. Outro exemplo de le-
vantamento amostral bastante divulgado ultimamente s˜ ao as pesquisas de inten¸cão
de votos.

Tipos de levantamento como os divulgados acima s˜ ao mais “passivos” pois


procuram identicar caracterı́sticas da popula¸ cão sem interferir nos resultados, s˜ ao
as chamadas pesquisas de levantamento de dados ( survey , em inglês). Outras vezes
deseja-se saber o que acontece com determinada vari´ avel quando as unidades s˜ ao
submetidas a tratamentos especiais controlados. Por exemplo, o uso de determinada
vacina diminui a incidência de certa doen¸ ca? A altura com que um produto é exposto
na gôndola aumenta a oportunidade de venda? Nesses casos é necess´ ario trabalhar

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 23/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

12 No¸cões b´asicas

com grupos que recebam o tratamento e outros que sirvam como controle. S˜ ao os
conhecidos planejamentos de experimentos, ou simplesmente experimenta¸ cão.
Outros critérios poderiam ser utilizados para identicar tipos de pesquisa. Na
Figura 1.2 apresentam-se quatro poss´ıveis critérios dicotˆ omicos para classicar uma
pesquisa. S´o a combina¸cão de suas alternativas j´ a produziria 16 possı́veis tipos de
pesquisas quantitativas.

a. participa¸ cão do pesquisador


nos resultados

experimenta¸cão levantamento

b. objetivo da an´alise

descritivo anal´ıtico

c. complexidade dos dados

simples multivariado

d. amplitude da coleta

censo amostra

Figura 1.2: Critérios para classicar pesquisas

Neste livro a preocupa¸cão maior ser´a em apresentar pesquisas do tipo levan-


tamento, com objetivos descritivos de dados simples obtidos de amostras. Eventu-
almente ser˜ao tratados dados multivariados.

1.5.2 M´
etodos de coleta de dados

Escolhido o tipo de investiga¸cão é necess´ario decidir que método ser´ a usado para
obter os dados. Os coment´ arios feitos a seguir ser˜ao muito mais adequados para
pesquisas amostrais, embora se apliquem tamb´ em para outras situa¸ cões.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 24/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 25/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 26/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 27/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

16 No¸cões b´asicas

Tabela 1.1: Tipos de amostras


Critério do Procedimento de sele¸ cão
“amostrista” probabilı́stico n˜ ao probabilı́stico
objetivo amostras probabilı́sticas amostras criteriosas
subjetivo amostras quase-aleat´ orias amostras intencionais

aleat´orio simples como amostras aleat´ orias simples para descrever um determinado
procedimento de sele¸cão. Entende-se por amostras aleat´ orias simples as amostras
obtidas através de um protocolo de sele¸ cão chamado plano aleat´ orio simples.
Alguns exemplos de planos amostrais:

• probabilı́stica: amostragem aleat´ oria estraticada proporcional;


• quase-aleat´oria: amostragem por quotas;
• criteriosas: uso do conceito de cidade t´ıpica;
• intencional: j´uri de especialistas, volunt´ arios.
1.5.5 Classica¸ c˜
ao de amostras probabil´ısticas
A qualidade do sistema de referências e outras informa¸ cões disponı́veis orientam o
desenho do plano amostral mais adequado para atingir os objetivos da pesquisa. As
múltiplas possibilidades dessas caracter´ısticas podem gerar uma grande variedade
de planos amostrais. Como sempre, a apresenta¸ cão sistem´atica destas possibilidades
ca mais fácil quando agrupadas por alguns critérios, gerando tipologias de planos
amostrais. Usar-se-´a aqui os critérios propostos por Kish (1965) e resumidos na
Figura 1.3.
A combina¸cão dos resultados de cada um desses critérios apontados gera 32
possı́veis planos amostrais. Por exemplo, usando as primeiras op¸ cões de cada critério
tem-se o conhecido plano de Amostragem Aleat´ oria Simples . Ou seja, cada
unidade elementar é sorteada com igual probabilidade, individualmente, sem estra-

tica¸cão, e um único est´agio e seleção aleat´oria. Neste livro ser˜ao abordados alguns
destes planos e fornecidos instrumentos para que sejam exploradas as principais
propriedades dos demais.
Quando o sistema de referências (SR) é perfeito , isto é, quando ele lista uma
a uma todas as unidades de an´ alise, é poss´ıvel ent˜ ao usar um processo onde cada
unidade é sorteada diretamente com igual probabilidade de pertencer ` a amostra.
A melhor maneira para denir este plano é descrevendo o processo de sorteio que

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 28/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

1.5 Como obter os dados? 17

a. Probabilidade de sele¸ cão


da unidade amostral

igual distinta

b. Unidade amostral

uma unidade de elementos


resposta (elementar) (conglomerado)

c. Divisão em estratos

não estraticada estraticada

d. Número de est´agios

um único mais de um

e. Seleção das unidades

aleat´oria sistem´atica

Figura 1.3: Critérios para classicar amostras probabil´ısticas

seria o seguinte: “da rela¸cão de unidades do SR sorteie, com igual probabilidade


de pertencer `a amostra, o primeiro elemento da amostra, repita o processo para o
segundo e assim sucessivamente até sortear o ´ ultimo elemento programado para a

amostra”. As amostras assim obtidas denem o plano de Amostragem Aleat´ oria


Simples (AAS). Introduzindo o critério da reposi¸ cão ou não da unidade sorteada an-
tes do sorteio seguinte, obtém-se uma primeira dicotomia deste plano: Amostragem
Aleat´oria Simples com e sem reposi¸cão (AASc e AASs). Do ponto de vista pr´atico
dever-se-ia usar sempre amostras sem reposi¸ cão, pois não estaria sendo incorporada
nova informa¸cão se uma mesma unidade fosse sorteada novamente. Entretanto, do
ponto de vista estatı́stico a reposi¸ cão recomp˜oe o universo tornando mais f´acil de-

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 29/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 30/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 31/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 32/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

1.5 Como obter os dados? 21

1.5.7 Tamanho da amostra

O erro padr˜ao do estimador, como ser´a visto em capı́tulos posteriores, decresce


a medida que aumenta o tamanho da amostra. Assim, um ponto chave de um
levantamento amostral é a xa¸ cão do tamanho da amostra.
Uma amostra muito grande pode implicar em custos desnecess´ arios, enquanto
que uma amostra pequena pode tornar a pesquisa inconclusiva. Suponha um levan-
tamento amostral cujo ob jetivo é prever qual dentre os dois ´ unicos poss´ıveis partidos
ter´a maior porcentagem de votos v´ alidos - exclu´ıdos nulos e brancos. Aceite também
que foi utilizado um plano amostral aleat´ orio simples (AAS) e um dos partidos ob-
teve 56% dos votos. Caso tivesse sido usada uma amostra de 100 eleitores, o intervalo
de 95% de conan¸ca indicaria um n´umero entre 46% e 66%, portanto inconclusivo
para armar se partido ganharia ou n˜ ao a eleição. J´a uma amostra de 400 eleitores
indicaria o intervalo entre 51% e 61%, sugerindo a vit´ oria do partido. Por outro
lado, uma amostra de 1600 eleitores deniria o intervalo entre 53,5% e 59,5 im-
plicando no uso desnecess´ario de 1200 unidades a mais. O problema real é muito
mais complexo que o apresentado aqui, mas o exemplo d´ a uma boa ilustra¸ cão dos
problemas estatı́sticos envolvidos na determina¸ cão do tamanho da amostra.
Um dos aspectos pouco discutidos em cursos de amostragem é aquele associado
aos custos de um levantamento. Este t´ opico é fundamental para o delineamento de
toda a pesquisa, desde a deni¸ cão dos objetivos possı́veis de serem respondidos,
passando pelo tamanho da amostra economicamente vi´ avel e chegando até a escolha
da sostica¸cão do modelo de an´alise a ser adotado. Recomenda-se ` aqueles que
venham a se dedicar a pr´ atica de amostragem que estudem mais profundamente
este aspecto, podendo consultar principalmente o livro de Kish (1965) e Lansing e
Morgan (1971).
Como já foi mencionado, muitas vezes a precis˜ ao estatı́stica desejada para a
pesquisa esbarra nas limita¸ cões impostas pelo or¸camento, obrigando a decidir entre
realizar a pesquisa baixando a precis˜ ao desejada ou n˜ao realizar o levantamento.

Isto nos remete ao compromisso para xar o tamanho da amostra, ou mesmo para a
pesquisa como um todo, em procurar dentro das restri¸ c˜oes impostas pelo or¸camento,
desenhar uma amostra que atinja os objetivo, produzindo estimativas com a menor
imprecis˜ao poss´ıvel .
Embora neste livro a determina¸ cão do tamanho da amostra ser´ a sempre feita
levando em conta os aspectos da precis˜ ao estatı́stica, acredita-se que na maioria dos
casos a decisão segue a proposi¸cão acima, isto é, as limita¸ cões orçament´arias denem

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 33/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 34/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

1.6 Coleta dos dados (trabalho de campo) 23

tado, deixar esta escolha para o entrevistador. Sem d´ uvida ele escolher´a um membro
presente na casa na hora da entrevista, introduzindo um viés na pesquisa. Provavel-
mente este levantamento ter´ a uma propor¸cão bem maior de mulheres. Se n˜ao forem
tomados cuidados, o trabalho de campo pode arruinar totalmente uma pesquisa.
Assim, deve-se planejar e usar procedimentos que minimizem os erros, ou viéses
introduzidos na coleta de dados.
Jessen (1978) resume estes cuidados na seguinte frase: “as medidas s˜ao aque-
las ´obvias; selecionar boas pessoas, trein´ a-las bem e vericar se fazem o trabalho
corretamente” .
O volume de trabalho para operacionalizar essas medidas ir´ a depender prin-

cipalmente do tamanho da pesquisa e do fato da pesquisa ser pontual (ad-hoc) ou


peri´odica. Para pesquisas pequenas, o treinamento de pessoal envolvido é bem re-
duzido, podendo chegar ao caso de ser apenas o pr´ oprio pesquisador. Em pesquisas
peri´odicas o esforço deve ser maior para elaborar manuais e material de consulta que
serão usados freq¨uentemente. Entretanto, pode-se apresentar sucintamente alguns
coment´arios em como evitar viéses nos cuidados mencionados por Jessen.

Recrutamento. Para pesquisas grandes, realizadas uma ´ unica vez, recomenda-se


a contrata¸cão de empresas especializadas que possuam pesquisadores prossi-
onais e que estejam acostumadas com a aplica¸ cão e administra¸cão deste tipo

de trabalho. A alternativa, freq¨ uentemente mais barata, ser´ a a de executar


o trabalho todo de contratar entrevistadores, listadores, supervisores, checa-
dores, etc., cada um deles com um perl pr´ oprio, desenvolver programas de
qualidade da coleta, etc. Com uma sele¸ cão impr´opria ou “caseira”, corre-se
o risco de pagar caro pelo noviciado. Para pesquisas peri´ odicas, e com a ne-
cessidade constante de renova¸ cão e substitui¸cão de pessoas envolvidas pode-se
criar um n´ucleo permanente de sele¸cão de pessoal, com a vantagem adicional
da escolha ser dirigida para os objetivos especı́cos do trabalho.

Treinamento. O pessoal de pesquisa deve ser bem treinado n˜ ao apenas com os

conceitos, deni¸cões, uso do instrumento de mensura¸ cão, etc., mas também


com os melhores procedimentos para extrair as informa¸ cões desejadas. Existem
técnicas bem desenvolvidas acerca de como abordar as pessoas, de postura, de
entona¸cão de voz e outras. Ou ainda, o treinamento para uma pesquisa frente
a frente é bem diferente de uma por telefone. Em pesquisas muito grandes
os problemas envolvidos com o treinamento s˜ ao enormes e requerem muitas
vezes o uso de mecanismos bastante especiais. Apenas imagine os cuidados

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 35/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

24 No¸cões b´asicas

que devem ser tomados para o treinamento de mais de 150 mil entrevistadores
para a realizac˜ao do censo populacional brasileiro. Nestes casos, e na maioria
deles, recomenda-se a ado¸cão de manuais escritos para cada uma das tarefas:
listagem, entrevistas, checagem, codica¸ cões, etc.
Embora o treinamento procure prever todas as situa¸ cões que serão encontradas,
é preciso dar instru¸ cões sobre situa¸cões imprevistas. Por exemplo, na casa
sorteada, tem mais de um domicı́lio e v´ arias famı́lias, ou ainda, n˜ ao se consegue
encaixar a pross˜ao do chefe em nenhum dos casos listados. O entrevistador
deveria entrar em contato com a supervis˜ ao, ou ent˜ao anotar o maior n´umero
poss´ıvel de informa¸cão para poss´ıvel corre¸ cão no escrit´orio.

Verica¸ cão. É importante que se tenha um processo de controle contı́nuo da qua-


lidade do trabalho de campo. A verica¸ cão deve ser realizada em v´arias
etapas do trabalho do pesquisador. No inı́cio da pesquisa deve-se fazer um
acompanhamento mais meticuloso para verica¸ cão do entendimento correto
dos conceitos, da identica¸cão exata das unidades selecionadas e de resposta,
aprimorando e corrigindo-as imediatamente. Além de verica¸ cões rotineiras
deve-se ter um plano de verica¸ cão aleat´oria, onde uma subamostra é reen-
trevistada para apurar desde fraude até a qualidade das informa¸ cões obtidas.
Este procedimento permite avaliar a magnitude de alguns viéses introduzidos
pelo trabalho de coleta de dados.
A supervis˜ao de campo deve estar em permanente contato com os respons´ aveis
do planejamento para obter os esclarecimentos sobre quest˜ oes amb´ıguas e de-
cisões a serem tomadas para casos imprevistos. Também, o contato com os
respons´aveis com o processamento dos dados ajuda a esclarecer e remover in-
forma¸cões desencontradas e os erros mais comuns cometidos pelo pessoal de
campo.

Registro. Muitas ocorrências e decis˜ oes imprevistas acontecem nesta fase e é muito

importante que se mantenha um registro atualizado das mesmas para futuras


avalia¸cões do desempenho do levantamento. As estatı́sticas e qualica¸ cões
sobre as unidades perdidas e as incluı́das indevidamente é que permitir˜ ao a
descri¸cão pormenorizada da populaç˜ao amostrada . As dúvidas e inadequa¸cões
apresentadas pelos entrevistadores, bem como os esclarecimentos prestados
ajudar˜ao a entender a qualidade, signicado e dedignidade das respostas ob-
tidas.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 36/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

1.7 Prepara¸ c˜
ao dos dados 25

1.7 Prepara¸ cão dos dados


Se não for devidamente avaliada, planejada e executada a constru¸ cão inicial do banco
de dados pode-se tornar a etapa mais demorada de um processo de levantamento de
informa¸cões.
Usando uma imagem bastante simplicada, pode-se descrever o banco de da-
dos como sendo uma matriz de n +1 linhas por p+1 colunas. As linhas correspondem
às n unidades respondentes e as colunas ` as p vari´aveis de interesse. A primeira co-
luna descreve a identica¸ cão da unidade respondente, enquanto que a primeira linha
denomina as vari´aveis. A célula (i,j) contém os dados codicados da j-ésima vari´ avel
para a i-ésima unidade respondente. Estes dados devem estar disponı́veis em um
meio que permita o f´acil acesso e manipula¸cão, imagina-se um meio eletrˆonico con-
veniente.
A constru¸cão desta tabela exige: (i) transcri¸ cão; (ii) minucioso escrut´ınio da
qualidade e (iii) disponibiliza¸ cão das informa¸cões.

Transcri¸ cão. Esta tem sido a fase mais demorada do processo, porém tem sido
aquele segmento onde a tecnologia vem apresentando solu¸ cões bem competen-
tes. Quanto menos haja interven¸ cão na transcri¸cão de um meio para outro,
menor a possibilidade de introdu¸ cão de erros na pesquisa. Deve-se procu-
rar balancear o custo de uso de recursos mais sosticados com a qualidade e
rapidez para a execu¸cão desta tarefa.

Qualidade dos dados. Antes de liberar os dados para a an´ alise deve-se ter cer-
teza da boa qualidade dos mesmos. O escrut´ınio cr´ıtico dos dados passa pela
identica¸cão de erros de transcri¸ cão, de inconsistências e outros tipos de enga-
nos. A corre¸cão pode ser feita com a ajuda da lembran¸ ca e interpreta¸ cão dos
pesquisadores, com o apoio de processos autom´ aticos e, quando for necess´ario,
revisitar a unidade sorteada.

A utiliza¸cão de programas autom´ aticos de an´alise da consistência l´ogica das


respostas é uma das ferramentas mais poderosas na detec¸ cão de vários tipos
de erros. O conhecimento substantivo do instrumento de pesquisa associado ` a
habilidade do pesquisador possibilita a constru¸ cão de bons mecanismos de de-
tec¸cão autom´atica de erros. Hoje em dia, com o uso de instrumentos eletrˆ onicos
de entrada de dados, este tipo de controle vem sendo feito no ato de coleta,
não aceitando a entrada de dados inconsistentes.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 37/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 38/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

1.8 An´alises estat´ısticas 27

“vari´avel” nos estudos. O emprego de tabelas cruzadas para algumas carac-


ter´ısticas decompostas pelos estratos, ou por fatores geogr´ acos, econˆomicos,
demogr´acos, etc., permite adquirir maior conhecimento de seus signicados.
A compara¸cão com resultados de outras pesquisas con´ aveis, tais como os
censos, permite avaliar a qualidade do levantamento.

Plano tabular. Com esse tı́tulo entende-se ` aquele conjunto m´ınimo de tabelas e
modelos estatı́sticos que foram denidos “a priori” para responder aos objetivos
iniciais da pesquisa.
O exercı́cio, realizado antes da obten¸ cão dos dados, de imaginar operacional-
mente como os recolhidos na pesquisa responderiam aos objetivos da pesquisa,
além de ajudar, e muito, o planejamento amostral evita divulgar os resulta-
dos em prazos distantes do trabalho de campo tornando-os desinteressantes.
Serve também para que sejam previamente preparados, escolhidos e testados
os programas computacionais necess´ arios para sua execu¸cão. Usualmente, es-
tas primeiras respostas s˜ ao fornecidas por tabelas de duplas entradas, daı́ o
nome de plano tabular.
Junto com a divulga¸cão da aplica¸cão do plano tabular, recomenda-se que
também sejam apresentados os erros amostrais, permitindo avaliar qual a con-
abilidade apresentada pela pesquisa. Para pesquisas com um n´ umero muito
grande de vari´aveis deve-se procurar modos adequados e resumidos para di-
vulga¸cão dos erros. Pode-se encontrar exemplos de como divulgar os erros
amostrais consultando os compêndios de metodologia publicados pelo IBGE.

An´alises adicionais. Os levantamentos estatı́sticos de um modo geral possuem


muito mais informa¸cões do que aquelas usadas para responder aos objetivos
iniciais. Pode-se, em uma segunda etapa, voltar a explorar os dados para
testar novas hi´oteses ou mesmo para especular sobre rela¸ cões inesperadas. Um
único levantamento amostral sobre condi¸ cões de vida realizado pela Funda¸ cão

SEADE, produziu mais de 10 trabalhos em um perı́odo de 3 anos. Durante


pelo menos 10 anos, até que um novo seja realizado, os censos demogr´ acos são
investigados, em v´arias dimens˜oes e por pesquisadores de diversas institui¸ cões.
Também os modelos de an´ alise podem ser bem mais sosticados do que sim-
ples tabelas descritivas, desde que haja tempo para investigar a adequa¸ cão e
pertinência dos mesmos. Na mencionada pesquisa da Funda¸ cão SEADE, al-
guns estudos foram novamente analisados empregando-se modelos para dados

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 39/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

28 No¸cões b´asicas

categ´oricos e outros modelos multivariados.

Uma das consequências mais importantes da an´ alise dos dados é a possibilidade
de cria¸cão de novas vari´aveis (ı́ndices) resultante da combina¸ cão de outras, e
que descrevam de maneira mais adequada os conceitos pretendidos. Voltando
à pesquisa do SEADE, usaram-se combina¸ cões do grau de educa¸cão do chefe e
de um segundo membro da famı́lia para criar um grau de educa¸ cão da fam´ılia.
De modo mais sosticado, e com técnicas estatı́sticas criou-se uma condi¸ cão
de qualidade de emprego da famı́lia.

1.9 Erros
Todo levantamento amostral ou n˜ ao, est´a sujeito a produzir diferen¸ cas entre o
parˆametro populacional θ, de interesse, e o valor t empregado para estim´ a-lo. A


diferen¸ca t θ é considerada como o erro da pesquisa . Vários fatores podem agir
sobre esta diferen¸ca e faz parte da avalia¸cão detect´a-las, tentar medı́-las e avaliar
suas conseq¨uências. Para facilitar a exposi¸ cão, dividir-se-˜ao os fatores que afetam
esta diferen¸ca em dois grandes grupos:

• erros devido ao plano amostral;


• erros devidos `a outros fatores.
O primeiro deles, j´a mencionado na Se¸cão 1.5.6, talvez seja equivocadamente
chamado de erro. Melhor seria cham´ a-lo de desvio, objeto controlado pelos processos
estat´ısticos que ser˜ ao devidamente tratados nos demais cap´ıtulos deste livro. Estes
desvios tendem a desaparecer com o crescimento do tamanho da amostra.
Os erros do segundo grupo s˜ao resultantes de inadequa¸ cões dos processos de
mensura¸cão, entrevistas, codica¸cões, etc. Eles permanecem mesmo em censos po-
pulacionais. Eles ser˜ao analisados nas se¸cões abaixo.

A qualidade do levantamento est´ a associada `a capacidade do pesquisador em


evitar, ou se n˜ao for possı́vel, procurar manter esta diferen¸ ca em nı́veis aceit´aveis.
O conceito mais amplo da qualidade do levantamento deveria ser expresso em uma
medida do erro total, contendo a mensura¸ cão dos erros amostrais e avalia¸ cões, qua-
litativas ou quantitativas, dos possı́veis efeitos dos demais erros. Para estes ´ ultimos
é extremamente desej´ avel que seja feita uma interpreta¸ cão substantiva das poss´ıveis
conseq¨uências das dire¸ cões e magnitudes dos seus vieses.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 40/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 41/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 42/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

1.10 Apresenta¸ c˜
ao dos resultados 31

1.10 Apresenta¸ c˜
ao dos resultados
O relat´orio do plano amostral presta contas para uma determinada audiência sobre os
procedimentos adotados para escolha e coleta das unidades elementares portadoras
dos dados de interesse do levantamento.
Um plano amostral tecnicamente perfeito e corretamente aplicado pode n˜ ao ter
sua qualidade reconhecida devido a um relat´ orio mal escrito e/ou mal organizado. As
propostas para desenvolver competências em se comunicar s˜ ao bem conhecidas e n˜ao
serão abordadas aqui. Apenas insiste-se que consultem as bibliotecas especializadas
e pratiquem as recomenda¸ cões sugeridas. H´a muita similaridade entre relat´ orios
descrevendo planos amostrais e outros tipos de relat´ orios cientı́cos, desse modo,
sugerimos consultar também livros que tratam deste assunto, tais como Eco (1977)
ou Babbie (1999). Ressaltam-se a seguir na elabora¸ cão do relat´orio alguns pontos
espec´ıcos que devem ser considerados.
Como os relat´orios podem ter diferentes formatos e tamanhos, deve-se em
primeiro lugar decidir para qual audiência ele est´ a sendo escrito. Caso seja dirigido
a um p´ublico afeito `a linguagem de amostragem ser´ a poss´ıvel usar um vocabul´ ario
mais técnico do que aquele destinado ao p´ ublico leigo.
Algumas vezes o relat´orio do plano amostral é apenas uma pequena parte
dentro da se¸cão de metodologia, devendo ent˜ ao ser bastante conciso e direto. Outras
vezes ele é o produto nal de seu trabalho, devendo incluir a descri¸ cão de todas as
etapas bem como a descri¸cão, constru¸cão e análise do banco de dados, e, neste caso
o relat´orio será muito mais amplo e detalhado.
Sugere-se como pr´atica de trabalho, escrever sempre um relat´ orio completo,
elaborado conforme o desenrolar do levantamento. Ele servir´ a como uma espécie de
diário e mem´oria. A partir dele você poder´ a extrair outros produtos que sejam de
interesse. Você poder´ a usar os itens mencionados no Apêndice B como guia, sem a
necessidade de respeitar a ordem apresentada.
Resumindo, qualquer que seja o tipo de relat´ orio usado, ele deve mencionar

pelo menos os seguintes itens: prop´ositos, as diversas popula¸ cões, sistema de re-
ferência, unidades amostrais, plano de sele¸ cão, procedimento de coleta, desempenho
da amostra, tamanho, sistema de pondera¸ cão, fórmulas para os erros amostrais e
avalia¸cões dos possı́veis efeitos dos erros n˜ao amostrais.
Quando o relat´orio também inclui a an´ alise, distinga bem os resultados des-
critivos da amostra dos que fazem inferências populacionais. Para grandes volumes
de dados, onde a apresenta¸ cão dos erros amostrais pode poluir e dicultar a lei-

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 43/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

32 No¸cões b´asicas

tura de cada tabela, sugere-se a ado¸ cão de procedimentos agregados que avaliem
erros aproximados globais. Grandes institutos de pesquisa costumam usar este tipo
de apresenta¸cão para os erros amostrais (consulte, por exemplo, as publica¸ cões do
IBGE).

1.11 Divulga¸ c˜
ao do banco de dados (disponibilidade)
Falta `a maioria dos bancos de dados obtidos por levantamentos amostrais, uma do-
cumenta¸cão bem elaborada “que descreva a utilidade das vari´ aveis e liste os v´ınculos
entre os c´odigos e os atributos que comp˜oem as vari´aveis” (Babie, 1999), conforme

mencionado na Se¸cão 1.7. Essa ausência deve-se ao fato de que na maioria das vezes,
os dados ser˜ao produzidos e analisados por uma ´ unica pessoa ou grupo, tornando
aparentemente dispens´ avel esse trabalho. Entretanto, esse descuido j´ a causou mui-
tos prejuı́zos, tempo perdido e duplica¸ cão de trabalho ao se analisar o mesmo banco
de dados em ocasi˜oes distintas.
Manter um banco de dados organizado e documentado deve ser uma preo-
cupa¸cão priorit´aria dos “amostristas” e dos analistas de dados. Os primeiros usam-
no para bem caracterizar os sistemas de pondera¸ cão e recodicções, e os segundos
para descrever as recodica¸ cões, novas vari´aveis e indicadores criados.
O Banco de Dados junto com esse dicion´ ario descritivo permite oferecer mais
um servi¸co: disponibilizar a pesquisa para um p´ ublico maior, gra¸cas as facilidades
oferecidas hoje pela comunica¸cão eletrˆonica. Como orienta¸cão para organizar esse
servi¸co, sugere-se consultar os bancos de dados disponı́veis no IBGE e SEADE.

Exerc´ıcios
1.1 Apresente uma quest˜ ao ligada `a sua área de interesse e que poderia ser res-
pondida por um levantamento amostral. Aproveite para denir claramente
quais seriam os seguintes conceitos na sua pesquisa:

a. unidade de pesquisa;
b. popula¸cão;
c. instrumento de coleta de dados;
d. unidade respondente;
e. poss´ıvel sistema de referência;

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 44/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

1.11 Divulga¸ c˜
ao do banco de dados (disponibilidade) 33

f. unidade amostral mais prov´ avel;


g. unidades amostrais alternativas.

Discuta também como você xaria o tamanho da amostra a outros t´ opicos que
achar relevantes.

1.2 Desenhe um plano amostral, ressaltando os pontos discutidos neste capı́tulo


para responder ao seguinte problema: “ Deseja-se conhecer o n´umero total de
palavras existente no livro texto Bolfarine e Bussab ”.

1.3 Planeja-se uma pesquisa para determinar a propor¸ cão de crian¸cas do sexo
masculino com idade inferior a 15 anos, moradoras de uma cidade. Sugerem-
se três procedimentos:

a. Para cada menino de uma amostra de n meninos (retirada da popula¸ cão


de meninos menores de 15 anos) pede-se que informe quantos irm˜ aos e
irm˜as ele tem;
b. Toma-se uma amostra de n famı́lias e pergunta-se o n´ umero de meninos
e meninas menores de 15 anos existentes;
c. Procura-se casualmente n crian¸cas de 15 anos e além de anotar o sexo do

entrevistado pergunta-se o n´ umero de irm˜aos e irmãs que eles possuem


na faixa et´aria de interesse.

Analise os planos amostrais acima e justique suas arma¸ cẽs. Diga e justique
qual deles você usaria, ou ent˜ ao proponha um outro.

1.4 A comissão de pós-gradua¸cão de sua universidade pretende fazer uma pes-


quisa cuja popula¸cão alvo é formada por todos os alunos de p´ os-gradua¸cão.
Um dos principais ob jetivos é estimar a propor¸ cão dos favor´aveis a uma de-
terminada mudan¸ ca nas exigências do exame de qualica¸ cão, e espera-se que
essa propor¸cão seja da ordem de 5%. Imagine a situa¸ cão na sua universidade
e proponha um plano amostral, destacando: sistema de referência, tamanho
da amostra, UPA, USA, f´ ormulas de estimadores e variˆ ancias.

1.5 Sugira um esquema amostral aproximado para escolher amostras aleat´ orias
nos seguintes casos:

a. Árvores em uma oresta;

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 45/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

34 No¸cões b´asicas

b. Crian¸cas abaixo de 5 anos e que tiveram sarampo;


c. Oper´arios em ind´ustrias têxteis.

Em cada caso, sugira uma vari´ avel que poderia ser estudada, qual a lista de
elementos a que você teria acesso e fa¸ ca as suposi¸cões (razo´aveis) necess´arias
para resolver o problema.

1.6 Uma rede banc´aria tem liais espalhadas por todo o paı́s e seu pessoal es-
pecializado (cerca de 20 mil) é removido freq¨ uentemente de um ponto para
outro. Deseja-se selecionar uma amostra de 10% do atual pessoal especiali-
zado, para uma pesquisa contı́nua durante os pr´ oximos anos. Pretende-se obter
informa¸cões sobre o progresso da rma, mudan¸ ca de emprego, etc. A sele¸cão
de uma amostra aleat´ oria de 2 mil indivı́duos seria muito cara, por quest˜ oes
de identica¸cão. Foi proposto ent˜ ao que se sorteasse uma letra (digamos S) e
todos os funcion´arios com sobrenomes come¸cando com essa letra fariam parte
da amostra. A inicial do sobrenome tem a vantagem de ser facilmente identi-
cável, porque as chas dos funcion´arios são arquivadas em ordem alfabética.
Quais as crı́ticas que você faria a este plano? Sugira um plano “melhor”, mas
ainda baseado nas vantagens da ordem alfabética. Descreva sucintamente o
seu novo plano.

1.7 Descreva sucintamente como pode ser incorporado num plano amostral o co-
nhecimento de vari´aveis auxiliares da popula¸ cão.

1.8 O IME-USP formou no ano passado a sua sétima turma de bacharéis em Es-
tatı́stica e deseja fazer um levantamento atrav´
es de amostra, com m´ ultiplos
prop´ositos. Os principais objetivos s˜ ao: estimar a propor¸cão de formandos
que realmente exercem a pross˜ ao e estimar o sal´ario médio. Proponha um
esquema amostral e aponte as diculdades que provavelmente ser˜ ao encontra-
das.

1.9 Fa¸ca uma lista de pontos essenciais para propor, executar e analisar um le-
vantamento amostral.

1.10 Um pesquisador pretende estimar o consumo médio de ´ agua por domic´ılio


em uma cidade. Discuta as vantagens e desvantagens em usar as seguintes
UPA’s:

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 46/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 47/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

36 No¸cões b´asicas

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 48/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

Cap´ıtulo 2

Deni¸cões e nota¸ cões b´


asicas

Neste capı́tulo considera-se formalmente os conceitos introduzidos no cap´ıtulo ante-


rior. Estas deni¸cões serão usadas com bastante freq¨ uência nos cap´ıtulos seguintes.
A primeira se¸cão dene os parˆametros (fun¸cões paramétricas) populacionais de inte-
resse, quantidades estas que s˜ ao fun¸cões das caracterı́sticas populacionais associadas
a cada unidade. Nas se¸cões seguintes tratam-se das quantidades relacionadas com
amostras que s˜ao os estimadores e estimativas dos parˆ ametros populacionais.
Ressalta-se que estas apresenta¸ cões estar˜ao restritas primordialmente ` as po-
pula¸cões “nitas”, embora sejam facilmente export´ aveis para as popula¸cões inni-
tas (modelos te´oricos, distribui¸cões de probabilidade). A teoria e abordagem, nes-
tas ´ultimas popula¸cões, são bastante exploradas em livros de inferência estat´ıstica,
básicos ou avan¸cados, veja, por exemplo, Bussab e Morettin (2004). Para estudos
mais aprofundados, distin¸ cões e integra¸cão dos dois conceitos sugere-se o livro de
Cassel et al (1977).

2.1 Popula¸ c˜
ao
Popula¸ cão ou Universo é o conjunto
Ude todas as unidades elementares de
interesse. É indicado por

U= {1, 2, . . . , N },
onde N é o tamanho xo e algumas vezes desconhecido da popula¸ cão.
Elemento Populacional é a nomenclatura usada para denotar qualquer ele-
mento i
∈U. É também conhecido por unidade elementar.
Caracter´ıstica(s) de Interesse será usado para denotar a vari´ avel ou o
vetor de informa¸cões associado a cada elemento da popula¸ cão. Será representado

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 49/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

38 Deni¸ cões e nota¸ cões b´asicas

por
Yi , i
∈ ,U
ou, no caso multivariado,

Y i = ( Yi1 , . . . , Yip ), i
∈ .U
A unidade elementar pode ser, por exemplo, estabelecimento agrı́cola e a carac-
terı́stica de interesse a vari´ avel produ¸cão (em dinheiro) agrı́cola ou o n´ umero de
tratores, ou ainda a vari´ avel qualitativa “tipo de apropria¸ cão da terra” (dono, me-
eiro, alugado, etc.).
Parâmetro Populacional é a nomenclatura utilizada para denotar o vetor
correspondente a todos os valores de uma vari´ avel de interesse que denota-se por

D = ( Y1 , . . . , YN ),

no caso de uma ´unica caracterı́stica de interesse, e pela matriz

D = ( Y 1 , . . . , Y N ),

no caso em que para cada unidade da popula¸ cão tem-se associado um vetor Y i de
caracterı́sticas de interesse.
Fun¸c˜ ao Paramétrica Populacional é uma caracter´ıstica numérica qualquer
da popula¸cão, ou seja, uma express˜ao numérica que condensa funcionalmente os Yi ’s
(ou Y i ’s), i
∈U
. Tal fun¸cão numérica ser´ a denotada por

θ(D ).

Esta fun¸cão pode ser, por exemplo, o total, as médias, ou ainda o quociente de dois
totais. É comum utilizar-se a express˜ ao parˆametro populacional de interesse, ou
simplesmente parˆametro populacional.

Exemplo 2.1 Considere a popula¸cão formada por três domic´ılios = 1, 2, 3 e


U { }
que est˜ao sendo observadas as seguintes vari´ aveis: nome (do chefe), sexo, idade,
fumante ou n˜ao, renda bruta familiar e n´ umero de trabalhadores. A popula¸ cão est´a
descrita na Tabela 2.1.
Portanto, para os dados descritos na Tabela 2.1, os seguintes parˆ ametros populaci-
onais podem ser denidos:

i. para a vari´avel idade,


D = (20 , 30, 40) = Y ;

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 50/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

2.1 Popula¸ cão 39

Tabela 2.1: Popula¸ cão de três domicı́lios


Vari´avel Valores Nota¸cão
unidade 1 2 3 i
nome do chefe Ada Beto Ema Ai
sexo 1
0 1 0 Xi
idade 20 30 40 Yi
fumante 2
0 1 1 Gi
renda bruta familiar 12 30 18 Fi
n o de trabalhadores 1 3 2 Ti
1
0: feminino; 1: masculino.
2
0: não fumante; 1: fumante.

ii. para o vetor ( F i , Ti ) ,


12 30 18
D = .
1 3 2

Com rela¸cão à fun¸cões paramétricas populacionais, tem-se:

i. idade média,
20 + 30 + 40
θ(Y ) = θ(D ) = = 30;
3
ii. média das vari´aveis renda e n´umero de trabalhadores,
12+30+18
3 20
θ(D ) = 1+3+2 = ;
3 2

iii. renda média por trabalhador,


12 + 30 + 18
θ(D ) = = 10.
1+3+2

Para uma vari´ avel de interesse, os parˆametros populacionais mais usados s˜ ao:

a. total populacional, N
θ(D ) = θ(Y ) = τ = Yi ;
i=1

b. média populacional,
N
1
θ(D ) = θ(Y ) = µ = Y = Yi ;
N i=1

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 51/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

40 Deni¸ cões e nota¸ cões b´asicas

c. variância populacional, representada por


N
1 2
θ(D ) = θ(Y ) = σ 2 =
N i=1
(Yi
−µ) ,

ou, às vezes,


N
1 2
θ(D ) = θ(Y ) = S 2 =
N
− 1 i=1
(Yi
−µ) .

Conforme ser´a visto nos capı́tulos seguintes, a variˆ ancia populacional aparece
diretamente na express˜ ao das variˆancias dos estimadores considerados.

Para vetores bidimensionais, isto é, duas vari´ aveis de interesse, representadas
por ( X, Y ), são bastante usuais os seguintes parˆ ametros:
d. covariˆancia populacional,

θ(D ) = σXY = C ov[X, Y ]


N
1
=
N i=1
(X i
−µX ) (Yi −µY ) ,
ou, às vezes,
N
1
θ(D ) = S XY =
N 1
(X i
−µX ) ( Yi −µY ) ,
onde µX = N −N i=1

X i /N e µY = i=1 Yi /N denotam as médias populacionais


i=1
correspondentes `as vari´aveis X e Y, respectivamente.

Pode-se também ter interesse pela:

e. correla¸cão populacional,
σXY
θ(D ) = ρXY = ;
σX σY

f. razão populacional,
θ(D ) = ττY = µµY = R,
X X
N N
onde τ X = i=1 X i e τY = i=1 Yi ;

g. razão média populacional,


N
1 Yi
θ(D ) = R = .
N i=1
Xi

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 52/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

2.2 Amostras 41

2.2 Amostras
Considere uma popula¸ cão xa

U= {1, 2, . . . , N }.
Deni¸ cão 2.1 Uma seq¨uência qualquer de n unidades de
U, é denominada uma
amostra ordenada de
U
, isto é,

s = ( k1 , . . . , k n )

tal que

ki .
O r´otulo ki é chamado de i-ésimo componente de s.
∈U

U { }
Exemplo 2.2 Seja = 1, 2, 3 . Os vetores s1 = (1 , 2), s2 = (2 , 1), s3 = (1 , 1, 3),
s 4 = (3) e s5 = (2 , 2, 1, 3, 2) são exemplos de amostras ordenadas de .
U
Deni¸ cão 2.2 Seja f i (s) a vari´avel que indica o n´umero de vezes (freq¨uência) que
a i-ésima unidade populacional aparece na amostra s. Seja δi (s) a vari´avel bin´aria
que indica a presen¸ca ou n˜ao da i-ésima unidade na amostra s, isto é,

1, se i s
δi (s) = 0, se i / s .∈
Exemplo 2.3 Usando as amostras do Exemplo 2.2, tem-se para a vari´ avel freq¨uência
f que f 1 (s 1 ) = 1, f 2 (s 1 ) = 1, f 3 (s 1 ) = 0, f 1 (s 5 ) = 1, f 2 (s 5 ) = 3 e f 3 (s 5 ) = 1. Com
rela¸cão a vari´avel presen¸ca δ, temos, por exemplo, que δ1 (s 1 ) = 1 , δ2 (s 1 ) = 1 ,
δ3 (s 1 ) = 0 , e δ1 (s 5 ) = 1, δ2 (s 5 ) = 1, δ3 (s 5 ) = 1.

Deni¸ cão 2.3 Chama-se de tamanho n(s) da amostra s, a soma das freq¨uências
das unidades populacionais na amostra, isto é,
N
n(s) = f i (s).
i=1

Chama-se de tamanho efetivo ν (s) da amostra s ao n´umero de unidades populacio-


nais distintas presentes na amostra s, isto é,
N
ν (s) = δi (s).
i=1

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 53/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

42 Deni¸ cões e nota¸ cões b´asicas

Exemplo 2.4 Usando os dados do Exemplo 2.3, observa-se que:

n(s 1 ) = 1 + 1 + 0 = 2 , enquanto que ν (s 1 ) = 1 + 1 + 0 = 2 .

Também,

n(s 5 ) = 1 + 3 + 1 = 5 enquanto que ν (s 5 ) = 1 + 1 + 1 = 3 .

Verique que: n(s 2 ) = 2 e ν (s 2 ) = 2, enquanto que n(s 4 ) = 1 e ν (s 4 ) = 1.

SU
Deni¸ cão 2.4 Seja ( ), ou simplesmente
S
o conjunto de todas as amostras
(seq¨uências ordenadas) de
U SU
, de qualquer tamanho. E n ( ), a subclasse de to-
das as amostras de tamanho n.

Exemplo 2.5 (Continua¸cão do Exemplo 2.4) Como


U= {1, 2, 3}, ent˜ao:
S( U) = {(1) , (2), (3) , (1, 1), (1, 2), (1, 3), (2, 1), . . . , (2, 2, 1, 3, 2), . . . }
e

S2 ( U) = {(1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3), (3, 1), (3, 2), (3, 3)}.
Quando n˜ao houver d´uvidas em rela¸cão ao universo, usa-se a nota¸cão simpli-
cada:

S {
= 1, 2, 3, 11, 12, 13, 21, . . . , 22132, . . .
}
e

S2 = {11, 12, 13, 21, 22, 23, 31, 32, 33}.


Algumas vezes, como ser´a visto adiante, é interessante trabalhar com amostras
não ordenadas. Por exemplo, as amostras (1,2) e (2,1) s˜ ao consideradas a mesma.
No caso de amostras n˜ao ordenadas sem reposi¸cão, uma amostra é um subconjunto

U
de elementos de . O número de amostras ordenadas de tamanho n, com reposi¸cão,
é N n , enquanto que, sem reposi¸ cão, é dado pelo coeciente binomial Nn .

2.3 Planejamento amostral


Conforme mencionado anteriormente, o objetivo é apresentar procedimentos amos-
trais probabilı́sticos, ou seja, aqueles que permitem associar a cada amostra uma
probabilidade conhecida de ser sorteada. O modo como essas probabilidades s˜ ao as-
sociadas é que ir´a denir um planejamento amostral. Isto leva ` a seguinte deni¸cão:

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 54/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

2.3 Planejamento amostral 43

Deni¸ cão 2.5 Uma funç˜ao P (s) denida em


S( U), satisfazendo
P (s)
≥0, para qualquer s
∈(SU)
e tal que
P (s) = 1 ,
{ s ;s ∈S}

é chamado um planejamento amostral ordenado.

Exemplo 2.6 Considere


U { } SU
= 1, 2, 3 e o respectivo ( ) constru´ıdo no Exemplo
2.5. Considere os seguintes exemplos de planejamentos amostrais:

• Plano A ,
P (11) = P (12) = P (13) = 1/9
P (21) = P (22) = P (23) = 1/9
P (31) = P (32) = P (33) = 1/9
P (s) = 0 , para as demais s
∈S ;

• Plano B ,

P (12) = P (13) = P (21) = P (23) = P (31) = P (32) = 1 / 6


P (s) = 0 , para as demais s ;
∈S
• Plano C ,
P (2) = 1 / 3
P (12) = P (32) = 1 / 9
P (112) = P (132) = P (332) = P (312) = 1 / 27
P (111) = P (113) = P (131) = P (311) = 1 / 27
P (133) = P (313) = P (331) = P (333) = 1 / 27
P (s) = 0 , para as demais s ;
∈S
• Plano D ,
P (12) = 1 / 10 P (21) = 1 / 6
P (13) = 1 / 15 P (31) = 1 / 12
P (23) = 1 / 3 P (32) = 1 / 4
P (s) = 0 , para as demais s ;
∈S
• Plano E ,
P (12) = P (32) = 1 / 2
P (s) = 0 , para as demais s
∈. S

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 55/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

44 Deni¸ cões e nota¸ cões b´asicas

Do exposto acima constata-se que é possı́vel criar innitos planejamentos


amostrais. Entretanto, descrever probabilidades associadas a cada amostra passa
a ser uma tarefa bastante ´ ardua, principalmente para popula¸ cões grandes. Seria
muito mais f´acil se existissem descri¸cões que permitissem associar, ou calcular, as
probabilidades correspondentes a cada amostra de
S
. No Exemplo 2.6, plano C,
o planejamento amostral poderia ser descrito mais facilmente da seguinte maneira:
“sorteie uma unidade ap´ os a outra, repondo a unidade sorteada antes de sortear a
seguinte, até o surgimento da unidade 2 ( i = 2 ) ou até que 3 unidades tenham sido
sorteadas ”. É fácil vericar que com esta descri¸ cão reproduz-se as probabilidades
consideradas naquele exemplo.

Podem ser usados v´arios tipos de descritores para representar as probabili-


dades associadas a cada amostra. Um deles muito utilizado na abordagem cl´ assica
da amostragem é a descri¸ cão do planejamento através das regras para o sorteio da
amostra.

Exemplo 2.7
U= {1, 2, 3}, como no Exemplo 2.6, e a seguinte regra de sorteio:
Seja

i. Sorteia-se com igual probabilidade um elemento de


U, e anota-se a unidade
sorteada;

ii. Este elemento é devolvido ` a popula¸cão e sorteia-se um segundo elemento do

mesmo modo.
Com estas regras, a probabilidade de ocorrer a amostra 11, ser´ a

P (1 no 1o sorteio) P (1 no 2o sorteio 1 no 1o sorteio)


P (11) =
1 1 1
|
=
×
3 3
= .
9
De modo an´alogo, conclui-se que s´o ter˜ao probabilidades n˜ao nulas, as amostras de

S2 , isto é,

S {
2 = 11, 12, 13, 21, 22, 23, 31, 32, 33 .
}
Quanto ao planejamento amostral, este ser´ a dado por

P (s) =
1/ 9, se i s
∈ .

0, se i / s
Observe que este é o mesmo plano amostral descrito no Exemplo 2.6, plano A. Inci-
dentalmente, este plano amostral, um dos mais simples, é conhecido como Amostra-
gem Aleat´oria Simples, com reposi¸cão, e será estudado detalhadamente no pr´ oximo
cap´ıtulo.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 56/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

2.3 Planejamento amostral 45

Observa-se que para a maioria dos planejamentos, atribui-se probabilidade


nula para muitas amostras de
S
. Por isso é comum, ao apresentar um plano amostral
A, restringir
S S
a alguma subclasse A , contendo apenas as amostras s, tais que
P (s) > 0. Isto facilita bastante a apresenta¸ cão dos resultados. É evidente que
quanto mais complexas as regras que descrevem os planos amostrais, mais dif´ıceis
serão os procedimentos para a determina¸ cão das probabilidades associadas ao espa¸ co

S
amostral . Neste livro ser˜ao abordados os planos amostrais mais simples e mais
usados, e que servem de base para planos amostrais mais complexos.
Outro conjunto de planos muito ´ uteis e simples, s˜ao aqueles de tamanho xo,
ou seja, possuem probabilidades diferentes de zero apenas para a subclasse n (veja
S
o Exemplo 2.7). Ser´a visto que as suas probabilidades s˜ ao mais simples de serem
determinadas.

Exemplo 2.8 Retorne aos dados do Exemplo 2.1, lembrando que


U {
= 1, 2, 3 e que
}
o domicı́lio 1 tem um trabalhador, o 2 tem três enquanto que o 3 tem dois. Considere
o seguinte plano amostral A, que ser´a mais tarde chamado de PPT (Probabilidade
Proporcional ao Tamanho).

i. Sorteia-se um elemento de
Ucom probabilidade proporcional ao n´ umero de
trabalhadores;

ii. Sem repor o domicı́lio selecionado, sorteia-se um segundo também com proba-
bilidade proporcional ao n´ umero de trabalhadores.

Ent˜ao

SA = {12, 13, 21, 23, 31, 32},


de modo que

P (1 no 1o sorteio) P (1 no 2o sorteio 1 no 1o sorteio)


P (12) =
1 3 1
|
=
6 5× =
10
.

De modo similar, 3 1 1
P (21) = 6
1
×32 = 6,
1
P (13) = 6
2
×51 = 15 ,
1
P (31) = 6
3
×42 = 12 ,
1
P (23) = 6
2
×33 = 3 e
1
P (32) = 6 ×4 = 4.
Observe que este plano é o mesmo apresentado no Exemplo 2.6, plano D.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 57/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

46 Deni¸ cões e nota¸ cões b´asicas

Deste ´ultimo exemplo, observa-se claramente a facilidade em calcular as pro-


babilidades associadas com os planos amostrais “equiprobabilisticos”, e aqueles em
que reposi¸cão est´a presente nas regras de sele¸ cão. Considera-se equiprobabil´ısticos
aqueles planos A, onde cada s
∈S
A tem a mesma probabilidade de ser sorteada.
Os tipos de planejamentos amostrais mais utilizados e que ser˜ ao abordados
com mais detalhes nos capı́tulos seguintes s˜ ao:

Amostragem Aleat´ oria Simples (AAS). Seleciona-se seqüencialmente cada uni-


dade amostral com igual probabilidade, de tal forma que cada amostra tenha a
mesma chance de ser escolhida. A sele¸cão pode ser feita com ou sem reposi¸cão.

Amostragem Estraticada (AE). A popula¸cão é dividida em estratos (por exem-


plo, pelo sexo, renda, bairro, etc.) e a AAS é utilizada na sele¸ cão de uma
amostra de cada estrato.

Amostragem por Conglomerados (AC). A popula¸cão é dividida em subpo-


pula¸cões (conglomerados) distintas (quarteir˜ oes, residências, fam´ılias, bairros,
etc.). Alguns dos conglomerados s˜ao selecionados segundo a AAS e todos os
indiv´ıduos nos conglomerados selecionados s˜ ao observados. Em geral é menos
eciente que a AAS ou AE, mas por outro lado, é bem mais econˆ omica. Tal
procedimento amostral é adequado quando é poss´ıvel dividir a popula¸ cão em

um grande n´umero de pequenas subpopula¸ cões.


Amostragem em Dois Est´ agios (A2E). Neste caso, a popula¸cão é dividida em
subpopula¸cões como na AE ou na AC. Num primeiro est´ agio, algumas sub-
popula¸cões são selecionadas usando a AAS. Num segundo est´ agio, uma amos-
tra de unidades é selecionada de cada subpopula¸ cão selecionada no primeiro
est´agio. A AE e a AC podem ser consideradas, para certas nalidades como
casos particulares da A2E.

Amostragem Sistem´ atica (AS). Quando existe disponı́vel uma listagem de in-
divı́duos da popula¸ cão, pode-se sortear, por exemplo, um nome entre os 10
primeiros indiv´ıduos, e ent˜ ao observar todo décimo indiv´ıduo na lista a partir
do primeiro indiv´ıduo selecionado. A sele¸ cão do primeiro indivı́duo pode ser
feita de acordo com a AAS. Os demais indiv´ıduos que far˜ ao parte da amostra
são ent˜ao selecionados sistematicamente.

Também ser˜ ao estudados os estimadores raz˜ ao e regress˜a o para o total e a


média populacionais, que exploram uma poss´ıvel rela¸ cão linear entre a vari´avel de

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 58/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

2.4 Estat´ısticas e distribui¸ cões amostrais 47

interesse y e alguma vari´avel auxiliar x, usualmente conhecida como vari´ avel inde-
pendente na teoria de regress˜ ao linear.

2.4 Estat´ısticas e distribui¸ cões amostrais


Como já foi discutido, o objetivo principal da amostragem é adquirir conhecimentos
sobre vari´aveis (caracterı́sticas) de interesse, e desse modo, é necess´ ario caracterizar
as vari´aveis de interesse também na amostra. Conforme j´ a foi comentado na Se¸cão
2.1, associada a cada unidade i, tem-se uma caracterı́stica Y i , que pode ser reunida
na matriz (ou vetor) de dados populacionais D . Agora, xada uma amostra s,

s = ( k1 , k 2 , . . . , k n ),

sabe-se que associado a cada elemento kj tem-se um vetor de caracterı́sticas Y kj .

Deni¸ cão 2.6 Chama-se de dados da amostra s à matriz ou vetor das observa¸c˜oes
pertencentes a amostra, isto é,

d s = ( Yk , Yk , . . . , Yk n ) = ( Yk i , k i
1 2
∈s).
Quando s percorre todos os pontos poss´ıveis de um plano amostral A, tem-se asso-
ciado um vetor aleat´orio que ser´a representado por S
d = y = ( y1 , . . . , y i , . . . , y n ),

onde yi é a vari´avel aleat´oria que indica os poss´ıveis valores que podem ocorrer na
i-ésima posi¸c˜ao da amostra.
Observa¸ cão: Quando as observa¸c˜oes s˜ao multidimensionais, os dados da amostra
passam a ser a matriz d s = ( Y k i , i

s), e tem-se associado a matriz aleat´ oria
d = ( y 1 , . . . , y n ).

Neste texto considera-se que as n unidades s˜ao amostradas seq¨uencialmente,


de modo que associadas `as n unidades selecionadas têm-se as vari´ aveis aleat´orias

(2.1) y1 , . . . , y n ,

onde cada yi pode assumir valores do parˆ ametro populacional D = ( Y1 , . . . , YN ).


Para uma particular amostra s, tem-se que ( y1 , . . . , y n ) = d s .

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 59/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

48 Deni¸ cões e nota¸ cões b´asicas

Deni¸ cão 2.7 Qualquer caracter´ıstica numérica dos dados correspondentes a amos-
tra s é chamada de estat´ıstica, ou seja, qualquer fun¸ c˜ao h(d s ) que relaciona as
observa¸c˜oes da amostra s.

Exemplo 2.9 Voltando ao Exemplo 2.1, considere a amostra s = (12). Desse modo,
tem-se para o vetor ( F i , Ti ) a seguinte matriz de dados da amostra:

12 30
ds = .
1 3

As médias
12 + 30
f = 2 = 21
e
1+3
t= = 2,
2
ou, a raz˜ao
12 + 30
r = = 10 , 5,
1+3
são exemplos de estatı́sticas calculadas na amostra acima.

tivos pontos amostrais e suas probabilidades. Fixada agora uma estatı́stica S


Escolhido um plano amostral A, tem-se associado o par ( A , P A ) dos respec-
h(d s ),

S
quando s percorre A , ter-se-´a associado uma vari´avel aleat´oria H (d s ) associada ao

S
par ( A , P A ). E considere também a nota¸ cão

ph = P A (s
∈AS; H (d s ) = h),

que denota a probabilidade sobre o conjunto de todas as amostras s tais que H (d s ) =


h. Conhecendo-se todos os valores de h e as suas respectivas probabilidades, tem-
se bem identicada a (distribui¸ cão da) vari´avel aleat´oria H (reveja o conceito de

vari´avel aleat´oria, por exemplo, em Bussab e Morettin, 2004). Tem-se ent˜ ao:

Deni¸ cão 2.8 A distribui¸c˜ao amostral de uma estat´ıstica h(d s ) segundo um plano
amostral A, é a distribui¸c˜ao de probabilidades de H (d s ), denida sobre A , com
S
funç˜ao de probabilidade dada por

ph = P A (s
∈AS; H (d s ) = h) = P (h).

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 60/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

2.4 Estat´ısticas e distribui¸ cões amostrais 49

Exemplo 2.10 Para o conhecido exemplo onde


U= {1, 2, 3} com os dados amos-
trais
12 30 18 Fi
D = = ,
1 3 2 Ti
i
∈U , considere a estat´ıstica r = h(d s ) como sendo a raz˜ao entre o total da renda
familiar e o número de trabalhadores na amostra. Considere também os planos
amostrais A e B estudados no Exemplo 2.6. Assim, encontram-se as seguintes dis-
tribui¸cões amostrais:

a. Plano amostral A (A=AAS com reposi¸ cão=AASc)

s: 11 12 13 21 22 23 31 32 33
P (s): 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9
h(d s ) = r : 12 10,5 10 10,5 10 9,6 10 9,6 9

de modo que

Tabela 2.2: Distribui¸ cão amostral de r na AASc


h: 9 9,6 10 10,5 12
ph : 1/9 2/9 3/9 2/9 1/9

b. Plano amostral B (A=AAS sem reposi¸ cão=AASs)

s: 12 13 21 23 31 32
P (s): 1/6 1/6 1/6 1/6 1/6 1/6
h(d s ) = r : 10,5 10 10,5 9,6 10 9,6

de modo que

Tabela 2.3: Distribui¸ cão amostral de r na AASs


h: 9,6 10 10,5
ph : 1/3 1/3 1/3

A distribui¸cão amostral, e conceitos derivados, s˜ ao básicos para o uso e ava-


liação inteligente dos procedimentos amostrais. Eles ser˜ ao usados aqui para avaliar
as propriedades e vantagens de um plano amostral, e/ou estat´ıstica, sobre seus con-
correntes.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 61/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

50 Deni¸ cões e nota¸ cões b´asicas

Considere dados: um plano amostral A, uma estat´ıstica H (d s ), s


∈ASe seja
ph a função de probabilidade correspondente ao plano amostral. Ent˜ ao, o valor
esperado (média) da vari´avel H será

E A [H ] = hp h ,

com a somat´oria estendida a todos os valores distintos de h. Pode-se modicar um


pouco esta deni¸cão para express´a-la em fun¸cão das probabilidades de cada amostra.
É fácil vericar, para s
∈S
A , que

ph = P A (s
∈AS; H (d s ) = h)
= P (H (d s ) = h) = P (s)
A
{ s ;s ∈SA } { s ∈SA ;h ( d )= h }
s

e que permite escrever a express˜ ao acima do seguinte modo:

E A [H ] = h(d s )P A (s).
{ s ;s ∈SA }

Quando n˜ao houver d´uvidas, deixar-se-´a de lado o ı´ndice do somat´orio.


Também s˜ ao importantes os seguintes conceitos:

• variância de uma estat´ıstica H , ou seja,

}{ − }
V ar A [H ] = h(d ) E A [H ] 2 P A (s);
s

{ s ;s ∈SA

e quando houver duas estat´ısticas H (d s ) e G(d s ), pode-se usar a

• covariˆ ancia ou correla¸ c˜


ao , que são, respectivamente,

Cov A [H, G ] =
s ∈SA
{h(d ) −E A [H ]} {g(d ) −E A [G]}P A (s)
s s

e
CovA [H, G ]
Corr A [H, G ] = .
V ar A [H ]V ar A [G]

Exemplo 2.11 Usando os dados do exemplo anterior e o plano amostral (a), tem-
se:
1 1 1 91, 2
E AASc [r ] = 12
9
+ 10 , 5 + . . . + 9 =
9 9 9
= 10, 13 ∼
e
21 21 1
−10, 13) 9 =∼0, 6289.
2
V ar AASc [r ] = (12
−10, 13) 9
+ (10 , 5
−10, 13) 9
+ . . . + (9

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 62/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

2.4 Estat´ısticas e distribui¸ cões amostrais 51

Tabela 2.4: Distribui¸ cão amostral de f na AASc


s: 11 12 13 21 22 23 31 32 33
f: 12 21 15 21 30 24 15 24 18
P (s): 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9

Considere agora também a estat´ıstica f , média da vari´avel F na amostra observada,


cuja distribui¸cão amostral é apresentada na Tabela 2.4. Tem-se E AASc [f ] = 20,
V ar AASc [f ] = 28 e
1 1
Cov AASc [r, f ] = (12 10, 13)(12 20) + (10 , 5 10, 13)(21 20) +
9 9
+(9 −−10, 13)(18−− 1
− −
20) = 1, 80
9
− ···
Deste modo, tem-se que

∼√0, −
1, 80
6289 28 ∼−
Corr AASc [r, f ] = = 0, 4289.
×
Para outras propriedades de r veja o Exercı́cio 2.4.

Denido um plano amostral A, as vari´aveis f i (s) e δi (s), da Deni¸cão 2.2,


também passam a possuir uma distribui¸ cão de probabilidade associada, cujas pro-
priedades ser˜ao muito ´uteis no estudo dos futuros planos amostrais. Indicar-se-´ a
estas vari´aveis por f i (A) e δi (A).

Exemplo 2.12 Considere o plano amostral A denido no Exemplo 2.6. Para cada
amostra, tem-se associado as vari´ aveis f 1 , f 2 , f 3 , δ1 , δ2 , δ3 , cujos valores e respectivas
probabilidades s˜ao dados na Tabela 2.5. Ou resumindo, N˜ ao é dif´ıcil vericar que

Tabela 2.5: Distribui¸ cões amostrais de f 1 , f 2 , f 3 , δ1 , δ2 , δ3 na AASc


s: 11 12 13 21 22 23 31 32 33
P (s): 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9
f 1: 2 1 1 1 0 0 1 0 0
f 2: 0 1 0 1 2 1 0 1 0
f 3: 0 0 1 0 0 1 1 1 2
δ1 : 1 1 1 1 0 0 1 0 0
δ2 : 0 1 0 1 1 1 0 1 0
δ3 : 0 0 1 0 0 1 1 1 1

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 63/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

52 Deni¸ cões e nota¸ cões b´asicas

Tabela 2.6: Distribui¸ cão de f 1 na AASc Tabela 2.7: Distribui¸ cão de δ1 na AASc
h(d s ) = f 1 : 0 1 2 h(d s ) = δ1 : 0 1
ph : 4/9 4/9 1/9 ph : 4/9 5/9

as vari´aveis f 2 e f 3 tem a mesma distribui¸ cão que f 1 , enquanto que δ2 e δ3 tem a



mesma distribui¸cão que δ1 , com E A [f 1 ] = 2/ 3 = 0, 67 e E A [δ1 ] = 5/ 9 = 0, 56, que ∼
representam, respectivamente, o n´ umero médio (esperado) de vezes que o elemento
(1, 2 ou 3) pertence `a amostra e o valor esperado de uma amostra conter o elemento
(1, 2 ou 3).

Devido à sua importˆancia, considere agora a


Deni¸ cão 2.9 Indica-se por πi (A) a probabilidade do i-ésimo elemento de , per-
U
tencer `a amostra segundo o planejamento A, e πij (A) a probabilidade do i-ésimo e
j -ésimo elementos pertencerem simultˆ aneamente `a amostra. Deste modo,

π i (A) = P A (δi = 1)
= P A (δi (s) = 1) = P A (s).
{ s ;s ∈SA } { s ;s ⊃i }

De maneira similar, tem-se que

π ij (A) = P A (s).
{ s ;s ⊃{i,j }}

Exemplo 2.13 Continuando o exemplo anterior, verica-se que


5
π 1 = π2 = π3 =
9
e que
2
π 12 = π 13 = π 23 = .
9
Para melhor familiariza¸ cão com a Denição 2.9, recomenda-se trabalhar o
Exerc´ıcio 2.3.

2.5 Estimadores e suas propriedades


O ob jetivo principal da amostragem é produzir estimadores para parˆ ametros popu-
lacionais desconhecidos. Isto é feito escolhendo-se uma estatı́stica que tenha propri-
edades convenientes em rela¸ cão ao parˆametro populacional. Quando associa-se uma

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 64/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

2.5 Estimadores e suas propriedades 53

estat´ıstica com a express˜ ao que ir´a “estimar” o parˆ ametro populacional ela recebe o
nome de estimador . O valor numérico do estimador, para dada amostra, chama-se
estimativa .
Simbolicamente, o objetivo é estimar um parˆ ametro populacional θ(D ). Isto
será feito através de uma estatı́stica obtida a partir dos dados amostrais d s , o es-
timador que ser´a representado por θ̂(d s ). Quando n˜ao houver d´uvidas, quanto `as
caracterı́sticas que est˜ ao sendo estimadas, os s´ımbolos acima ser˜ ao abreviados para
θ e θ̂(s), respectivamente.
Como já foi discutido, as propriedades de um estimador dependem da sua dis-
tribui¸cão amostral, e as principais qualidades procuradas em amostragem s˜ ao: pe-

quenos vieses (vı́cios) e pequenas variˆ ancias. Além da variˆ ancia j´a denida, também
são usados os seguintes conceitos:

Deni¸ cão 2.10 Um estimador θ̂(d s ) é dito n˜ao viciado segundo um plano amostral
A, se
E A θ̂ = θ.

Caso ele seja viciado, tem-se

Deni¸ cão 2.11 O viés do estimador θ̂(d s ), segundo o plano amostral A, é dado
por

B A θ̂ = E A θ̂
e o Erro Quadr´atico Médio por
−θ = E A θ̂
−θ;
2
EQM A θ̂ = E A θ̂
− θ .

Com essa deni¸cão é f´acil vericar que

EQM A θ̂ = V arA θ̂ + B A2 θ̂ .

Observe que para uma amostra particular s, a diferença θ̂(s) θ, mostra



o desvio entre o valor estimado e o valor que se desejaria conhecer, ou seja, o erro

cometido pelo uso da amostra e do estimador θ̂ para estimar a quantidade de interesse


(parˆametro) θ. Esse desvio é usualmente conhecido por erro amostral. Para uma
dada amostra, o erro amostral s´ o pode ser calculado, na situa¸ cão improv´avel de
θ ser conhecido. Por isso, a estratégia de avalia¸ cão em amostragem n˜ao é julgar
o resultado particular de uma amostra, mas do plano amostral. Isto é, usando
um plano amostral A, quais as propriedades do estimador, segundo estas ´ ultimas
medidas, avaliadas principalmente pelo viés e o EQM.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 65/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

54 Deni¸ cões e nota¸ cões b´asicas

Exemplo 2.14 Usando os resultados do Exemplo 2.11 tem-se


E AASc [r ] = 10, 13 ∼
e V arAASc [r ] = 0, 6289.

Suponha que o parˆametro de interesse seja a renda média por trabalhador, R, ou


seja,
12 + 30 + 18 60
R= = = 10.
1+3+2 6
Observa-se ent˜ao que r é um estimador viesado para R , pois E AASc [r ] = R. O v´ıcio
é dado por

B AASc [r ] = 10, 13
−10 = 0 , 13,
de modo que
EQM AASc [r ] = ∼0, 6289 + 0, 132 = 0 , 6458.
Suponha agora que o parˆ ametro de interesse seja a renda média familiar µF = 20.
Observe que
E AASc f = 20

e
V ar AASc f = 28 ,

implicando que f é n˜ao viciado para µ F , ou seja,

B AASc f = 0 ,

de modo que
EQM AASc f = V arAASc f = 28 .

2.6 Express˜ oes ´uteis


Nesta se¸cão serão apresentadas algumas express˜ oes muito usadas na deriva¸ cão das
propriedades de estimadores que ser˜ ao abordadas nos pr´ oximos capı́tulos. Considera-
se ent˜ao:

• soma dos desvios quadr´ aticos


N N
2
Yi2 2
(2.2)
i=1
(Yi
−µ) =
i=1
−N µ ;

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 66/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

2.6 Express˜ oes ´uteis 55

• soma dos produtos dos desvios de duas vari´aveis


N N
(2.3)
i=1
(Yi
−µY ) (X i
− µX ) =
i=1
X i Yi
−Nµ X µY ;
• soma dos produtos de uma mesma vari´ avel
N
2
+ N 2 µ2 .
(2.4)
i= j
Yi Yj =
−i=1 Yi
A express˜ao (2.4) é obtida elevando-se ao quadrado ambos os membros da
N
igualdade i=1 Yi = Nµ. Express˜oes equivalentes também valem para a amostra

observada.
O tamanho n (s) de uma amostra é dada por
N
(2.5) n(s) = f i (s).
i=1

Assim, xado um plano amostral A, o tamanho médio (ou esperado) e a


variˆancia do tamanho da amostra ser´ a
N
(2.6) E A [n ] = E A [f i ]
i=1
e
N
(2.7) V ar A [n ] = V ar A [f i ] + Cov A [f i , f j ],
i=1 i= j

respectivamente. Ressalte-se que a soma i = j envolve um total de N (N 1) par-



celas. Existe uma classe bastante grande e importante de planos amostrais que s˜ ao
“simétricos”, ou seja, para os quais as esperan¸ cas, variˆancias e covariˆancias s˜ao as
mesmas para todas as vari´ aveis, isto é,

E A [f i ] = E A [f ], V ar A [f i ] = V arA [f ] e CovA [f k , f l ] = CovA [f, f ],

para i = 1 , . . . , N , com f = f k e f = f l , k = l = 1 , . . . , N . Para estes planos


amostrais, tem-se que
(2.8) V ar A [n ] = N V ar A [f ] + N (N
−1)Cov A [f, f ].

Para aqueles planos, que além da propriedade acima, possuem tamanho xo,
tem-se também V arA [n] = 0, implicando em:
V ar A [f ]
(2.9) Cov A [f, f ] =
− −N 1
.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 67/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

56 Deni¸ cões e nota¸ cões b´asicas

Dentre os planos amostrais com a propriedade (2.9) (ou seja, sim´


etricos e xos),
destacam-se os planos AAS com e sem reposi¸cão.
Para uma amostra s considere a estatı́stica t correspondente a soma dos valores
observados na amostra, isto é,

(2.10) t(s) = Yk i .
k i ∈s

Correspondendo ao espa¸ co amostral


SA , tem-se associado a v´ariavel aleat´oria
n
t= yi ,
i=1

onde as vari´aveis aleat´orias yi estão dadas em (2.1). Usando a vari´ avel auxiliar
f i , pode-se reescrever a express˜ao acima, como fun¸cão de todas as observa¸cões da
popula¸cão, ou seja,
N
(2.11) t(s) = Yi = f i (s)Yi
i ∈s i=1
Note que a vari´avel aleat´oria t denida acima pode ser escrita em termos das vari´ aveis
alet´orias f i como
N
t= f i Yi .
i=1
Para um plano amostral A, tem-se as propriedades:
N
(2.12) E A [t] = Yi E A [f i ]
i=1
e
N
(2.13) V ar A [t] = Yi2 V arA [f i ] + Yi Yj Cov A [f i , f j ].
i=1 i= j

Para a classe dos planos amostrais simétricos e de tamanho xo considerados


acima, tem-se que
N
(2.14) E A [t] = E A [f ] Yi = E A [f ]τ
i=1
e, além disto, usando (2.9),
N
V arA [f ]
Yi2
V ar A [t] = V arA [f ]
i=1
− −
N 1 i= j
Yi Yj

N
1
Yi2
= V arA [f ]
i=1
−N −1 i = j Yi Yj

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 68/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

2.6 Express˜ oes ´uteis 57

N N
(2.4) 1
= V arA [f ] Y2 Y 2 + N 2 µ2
−N −1 −i=1
i=1 i
N
i

N
(Yi µ) 2
= V arA [f ]

N 1 i=1 −
(2.15) = V arA [f ]NS 2 .

Dado que V arA [t] = E A t 2 2


−E A [t], pode-se tirar uma rela¸cão adicional muito
útil, ou seja,
E A t 2 = V arA [t] + E A2 [t],

que no caso simples ( n xo e simetria), usando (2.14) e (2.15), passa a ser

(2.16) E A t 2 = V arA [f ]N S 2 + E A2 [f ]τ 2 .

Outra estatı́stica bastante ´ util é a soma de quadrados das observa¸ cões da


amostra, isto é,
N
(2.17) s 2q (s) = 2
Yi = f i (s)Yi2 .
i ∈s i=1

Logo,
N
E A s 2q = Yi2 E A [f i ].
i=1
No caso particular em que n é xo e o plano é simétrico, vem
N
E A s 2q = E A [f ] Yi2 ,
i=1

ou ainda, usando (2.2), tem-se que

(2.18) E A s 2q = E A [f ] Nσ 2 + Nµ 2 = E A [f ]N σ 2 + µ2 .

Para duas vari´ aveis quaisquer f i e f j (ou δi e δj ), correspondentes a um plano


amostral A qualquer, pode-se mostrar também que

(2.19)
{
E A [f i ] = E A E A [f i f j ] ,
| }
e
(2.20)
{ | }
V ar A [f i ] = E A V ar A [f i f j ] + V ar A E A [f i f j ] ,
{ | }
i = j = 1, . . . , N .

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 69/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

58 Deni¸ cões e nota¸ cões b´asicas

Exerc´ıcios
2.1 Usando um pacote computacional conveniente, simule uma popula¸ cão de ta-
manho N = 100, onde a caracterı́stica de interesse Y é gerada a partir da dis-
tribui¸cão normal com média 50 e variˆancia 16, que denotamos por N (50, 16).
Encontre o total τ , a média populacional µ e a variância populacional S 2 , da
popula¸cão que foi simulada.

2.2 Considere a popula¸cão dada na Tabela 2.8, onde X denota o n´umero de apar-
tamentos nos condom´ınios observados e Y denota o n´umero de apartamentos
alugados. Os espa¸cos em branco devem ser interpretados como zero. Encontre:

a. µY , τY e SY2 ;
b. µX , τ X e S X2 ;
c. a propor¸cão P de condomı́nios com mais de 20 apartamentos alugados e
a variˆancia populacional correspondente a vari´ avel Wi que assume o valor
1 se o i-ésimo condom´ınio possui mais que 20 apartamentos alugados e 0
caso contr´ario, i = 1 , . . . , 180.

2.3 Para cada um dos planos amostrais B, C, D e E do Exemplo 2.6:

a. Construa as distribui¸ cões das vari´aveis f e δ ;


i i
b. Calcule E [δi ] e V ar[δi ];
c. Encontre π i e π ij , para todo i e j .

2.4 Para os planos amostrais B, C, D e E denidos no Exemplo 2.6, calcule


EQM [r ], C ov r, f e Corr r, f , usando os dados do Exemplo 2.10.

2.5 Considere o Exemplo 2.1. Seja z, a média de fumantes na amostra observada.


Encontre E [z] e V ar [z] para os planos amostrais A e B do Exemplo 2.6.

2.6 Considere uma popula¸cão com N = 6 elementos, isto é, = 1, . . . , 6 ,


U {
com o vetor de caracterı́sticas populacionais D = (2 , 6, 10, 8, 10, 12). Desta }
popula¸cão, uma amostra de n = 2 elementos é selecionada sem reposi¸ cão.
Considere o plano amostral A que associa a cada possı́vel amostra de A a
S
mesma probabilidade.

a. Calcule V arA [f i ] e CovA [f i , f j ], i = j , para algum i e j que você escolher.


Você acha que o plano amostral é simétrico? Por quê?

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 70/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

2.6 Express˜ oes ´uteis 59

b. Seja t(s) o total da amostra s. Encontre a distribui¸ cão de t(s). Calcule


E A [t] e V arA [t].
c. Usando (b), verique se a média amostral y é um estimador n˜ ao viciado
de µ. Calcule V ar [y].

2.7 Para o plano amostral C denido no Exemplo 2.6:

a. Encontre E [n] e V ar[n], onde n indica o tamanho da amostra;


b. Verique se o plano amostral é simétrico;
c. Usando os dados do Exemplo 2.10 encontre a distribui¸ cão da raz˜ao r .

i. Verique se r é um estimador n˜ ao viciado de R = F /T , onde F e T


são as médias populacionais das vari´ aveis F i e Ti .
ii. Calcule E QM [r ].

2.8 Para o plano amostral A do Exemplo 2.6, calcule Cov[f 1 , f 2 ] e verique a


validade de (2.9).

Te´oricos
2.9 Verique a validade das express˜oes (2.18) e (2.19).

2.10 Para a amostragem aleat´ oria simples sem reposi¸cão (AASs), encontre a dis-
tribui¸cão de y1 , . . . , y n dadas em (2.1), para um popula¸ cão com N elementos.
Verique que
E [yi ] = Y , V ar [yi ] = −
N 1 2
N
S ,

i = 1 , . . . , n , e que
S2

Cov [yi , y j ] =
N
.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 71/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

60 Deni¸ cões e nota¸ cões b´asicas

Tabela 2.8: Popula¸ cão de 180 domic´ılios


i Yi Xi i Yi Xi i Yi Xi i Yi Xi i Yi Xi i Yi Xi
1 19 23 31 47 53 61 67 110 91 34 48 121 1 3 151 6 37
2 17 18 32 27 28 62 44 57 92 13 24 122 22 37 152 4 11
3 25 33 33 80 90 63 43 81 93 16 27 123 25 30 153 9 24
4 84 89 34 52 68 64 15 23 94 21 32 124 2 3 154 54 102
5 91 114 35 90 99 65 17 25 95 12 14 125 4 4 155 50 82
6 48 66 36 78 89 66 29 59 96 10 18 126 7 13 156 9 24
7 48 61 37 46 48 67 18 27 97 50 61 127 15 24 157 6 18
8 20 25 38 35 48 68 14 22 98 58 65 128 10 19 158 5 18
9 34 46 39 59 62 69 24 29 99 17 25 129 5 17 159 1 3
10 42 58 40 27 33 70 35 44 100 41 68 130 8 13 160 1 6

11 35 44 41 33 43 71 48 53 101 3 8 131 8 18 161 1


12 55 66 42 27 37 72 20 27 102 4 12 132 1 162 2 7
13 42 61 43 9 14 73 24 28 103 18 27 133 4 10 163 2 8
14 36 45 44 9 15 74 55 62 104 1 3 134 1 4 164 3 12
15 13 20 45 12 21 75 43 56 105 1 3 135 3 9 165 1 4
16 7 16 46 49 68 76 13 22 106 3 6 136 5 166 6 8
17 8 15 47 60 81 77 19 22 107 6 14 137 14 20 167 3 9
18 18 26 48 35 59 78 48 57 108 5 15 138 3 5 168 3 7
19 20 22 49 11 23 79 44 57 109 5 14 139 5 13 169 5 12
20 18 22 50 21 32 80 36 46 110 4 9 140 1 170 3 10

21 2 51 22 36 81 3 8 111 1 14 1 11 23 171 1
22 23 29 52 10 16 82 2 4 112 4 142 19 39 172 1
23 3 53 9 15 83 13 18 113 7 12 143 5 9 173 1
24 19 29 54 7 16 84 34 42 114 7 22 144 2 174 2 4
25 11 21 55 3 8 85 28 32 115 3 11 145 3 5 175 1
26 11 15 56 5 25 86 23 28 116 12 27 146 12 26 176 1
27 42 54 57 2 11 87 8 14 117 11 20 147 4 10 177 2
28 28 42 58 8 9 88 69 76 118 27 38 148 14 35 178 1 1
29 8 13 59 14 19 89 2 19 119 14 31 149 4 179 1
30 2 60 5 5 90 5 9 120 2 4 150 20 38 180 1

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 72/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

Cap´ıtulo 3

Amostragem aleat´ oria simples

Amostragem aleat´ oria simples (AAS) é o método mais simples e mais importante
para a sele¸cão de uma amostra. Além de servir como um plano pr´ oprio, o seu
procedimento é usado de modo repetido em procedimentos de m´ ultiplos est´agios.
Ele pode ser caracterizado através da deni¸ cão operacional: “de uma lista com
N unidades elementares, sorteiam-se com igual probabilidade n unidades”. V´arios
métodos para sortear as unidades que far˜ ao parte da amostra ser˜ ao comentados
nas seções seguintes. Para simplicar a nota¸ cão e estando o plano bem denido,

·
usar-se-´a a nota¸cão E [ ] no lugar de E A [ ].
·
3.1 Deni¸ cões e nota¸ cões
A principal caracteriza¸ cão para o uso do plano AAS é a existência de um sistema de
referências completo, descrevendo cada uma das unidades elementares. Deste modo
tem-se bem listado o universo

U= {1, 2, . . . , N }.
O plano é descrito do seguinte modo:

i. Utilizando um procedimento aleat´ orio (tabela de n´umeros aleat´orios, urna,


etc.), sorteia-se com igual probabilidade um elemento da popula¸ cão ;
U
ii. Repete-se o processo anterior até que sejam sorteadas n unidades, tendo sido
este n´umero pré-xado anteriormente;

iii. Caso seja permitido o sorteio de uma unidade mais de uma vez, tem-se o pro-
cesso AAS com reposi¸cão. Quando o elemento sorteado é removido de antes
U

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 73/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

62 Amostragem aleat´ oria simples

do sorteio do pr´oximo, tem-se o plano AAS sem reposi¸cão. O primeiro pro-


cedimento, também conhecido como AAS irrestrito, ser´ a indicado por AASc,
enquanto que o segundo, conhecido como AAS restrito, ser´ a designado por
AASs.

Do ponto de vista pr´atico, o plano AASs é muito mais interessante, pois vai
de encontro ao princı́pio intuitivo de que “n˜ ao se ganha mais informa¸cão se uma
mesma unidade aparece mais de uma vez na amostra”. Por outro lado, o plano
AASc, introduz vantagens matem´ aticas e estat´ısticas, como a independência entre
as unidades sorteadas, que facilita em muito a determina¸ cão das propriedades dos
estimadores das quantidades populacionais de interesse. Basta observar na maioria
dos assuntos tratados em livros de inferência h´ a imposi¸cão de que as unidades que
fazem parte da amostra sejam independentes. Deste modo, iniciar-se-´ a este capı́tulo
derivando-se as propriedades dos estimadores para o caso AASc, e depois para AASs.
Também ser˜ ao exploradas compara¸ cões entre os métodos, procurando ressaltar as
respectivas vantagens e ganhos. Considere também associado a cada unidade i, uma
caracterı́stica populacional unidimensional de interesse, Yi , i

U. Neste capı́tulo
serão consideradas inferências para os seguintes parˆ ametros de interesse (j´ a denidos
na Seção 2.1):
N N N N
1 2 1 2 2 1 2
τ = i=1 Yi , µ = Y = N i=1 Yi , σ = N i=1 (Yi
−µ) e S = N
−1 i=1 (Yi −µ) .

3.2 Amostragem aleat´ oria simples com reposi¸ cão


Inicialmente s˜ao apresentadas algumas propriedades gerais do plano AASc, como a
sua implementa¸cão e também as probabilidades de inclus˜ ao de primeira e segunda
ordem. Em seguida, apresenta-se estimadores para o total, a média e a variˆ ancia
populacionais, e s˜ao estudadas as suas propriedades, como vı́cio e variˆ ancia.
A AASc opera da seguinte forma:

i. A popula¸cão est´a numerada de 1 a N , de acordo com o sistema de referências,


ou seja,

U {
= 1, . . . , N ;
}
ii. Utilizando uma tabela de n´ umeros aleat´orios, ou programa de computador,
sorteia-se, com igual probabilidade, uma das N unidades da popula¸ cão;

iii. Rep˜oe-se essa unidade na popula¸ cão e sorteia-se um elemento seguinte;

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 74/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

3.2 Amostragem aleat´ oria simples com reposi¸ c˜


ao 63

iv. Repete-se o procedimento até que n unidades tenham sido sorteadas.

Com o plano amostral AASc denido acima, é f´ acil vericar que a vari´avel f i ,
número de vezes que a unidade i aparece na amostra (ver Deni¸ cão 2.2), apresenta
as propriedades estabelecidas no teorema seguinte.

Teorema 3.1 Para o plano amostral AASc, a vari´ avel f i , n´umero de vezes que a
unidade i aparece na amostra segue uma distribui¸ c˜ao binomial com parˆametros n e
1/N , denotadas por
1
f i b n;
N
,

de modo que n
(3.1) E [f i ] = ,
N
n 1
(3.2) V ar[f i ] =
N
1
− N
,
n
1
(3.3) πi = 1
− − 1
N
,
n n
1 2
(3.4) π ij = 1
− 2 1
− N
+ 1
− N
,

i, j = 1 , . . . , N , e
n

i, j = 1 , . . . , N .
Cov [f i , f j ] =
− N2,

Prova. Os resultados (3.1) e (3.2) seguem diretamente do fato de que se a vari´ avel


aleat´oria X b(n; p) ent˜ao (ver Bussab e Morettin, 2004) a fun¸ cão de proba-
bilidade de X é tal que

n k n− k
P (X = k) =
k
p (1
− p) ,

com E [X ] = np e V ar[X ] = np(1


inclus˜ao, tem-se que −p). Com rela¸cão às probabilidades de

πi = P (f i = 0) = 1
−0 P (f i = 0)n n
n 1 1 1
= 1
− 0 N
1
−N =1
− −N
1

Nn n
(3.5) = −N(Nn −1) ,

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 75/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

64 Amostragem aleat´ oria simples

e que

π ij =
∩f j = 0) = 1 −P (f i = 0 ∪f j = 0)
P (f i = 0
=
− − ∩
1 P (f i = 0) + P (f j = 0) P (f i = 0 f j = 0)
1 n 1 n 2 n
= 1
− 1 −N + 1 −N − 1 −N
1 n 2 n
=
− −N
1 2 1 + 1
−N
n n n
(3.6) =
N
−2(N −N1)n + ( N −2) ,
vericando assim (3.3) e (3.4). Note que em (3.5) o numerador denota o
número de amostras que contém a unidade i e o denominador denota o n´umero
total de amostras AASc de n unidades em uma popula¸ cão com N unidades. De
maneira similar, em (3.6) o numerador denota o n´ umero de amostras AASc
de tamanho n que contém o par ( i, j ). Pelo plano AASc, cada tentativa é
independente e qualquer um dos N elementos populacionais tem a mesma
probabilidade 1 /N de ser sorteado. Isso caracteriza para ( f 1 , f 2 , . . . , f N ) a
distribui¸cão multinomial (ver Ross, 2002), com parˆ ametros ( n; 1/ N , . . . , 1/N ),
que denotamos por

(f 1 , . . . , f N )
∼M (n; 1/ N , . . . , 1/N ),

de onde segue que 1 1 n


(3.7) Cov [f i , f j ] =
−n N N =
−N 2 ,
para todo i = j = 1 , . . . , N . Relembre que se ( X 1 , . . . , X N )
∼M (n; p1 , . . . , p N )
ent˜ao,
E [X i ] = np i , V ar [X i ] = np i (1 pi )

e
Cov [X i , X j ] =
−np i pj ,
i = 1 , . . . , N , j = 1 , . . . , N e i = j . Note de (3.7) que a covariˆancia de dois
elementos quaisquer de ( f 1 , . . . , f N ) é constante, ou seja, é a mesma qualquer
que seja o par considerado. Isto é também decorrente do car´ ater simétrico do
plano AASc, ou seja, que probabilidades associadas a eventos envolvendo os
pares ( f i , f j ) não dependem dos indices i e j , i, j = 1 , . . . , N , i = j . Uma
forma alternativa de obter o resultado (3.7) é através da f´ ormula (2.9), pois,
sendo C ov[f i , f j ] = constante , para i = j vem que
V ar[f i ] 1 n 1 n
Cov [f i , f j ] =
− −
N 1
=
−N − 1N
1
− N
=
−N2
.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 76/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

3.2 Amostragem aleat´ oria simples com reposi¸ c˜


ao 65

3.2.1 Propriedades da estat´ıstica t (s)

O resultado apresentado a seguir é bastante ´ util na obten¸cão das propriedades dos


estimadores do total e da média populacional.

Teorema 3.2 A estat´ıstica t(s), total da amostra, denida por

t(s) = Yi
i ∈s

tem, para o plano AASc, as seguintes propriedades:

E [t] = nµ

e
V ar[t] = nσ 2 .

Prova. Quando s percorre SAASc , de (2.14) e do Teorema 3.1 vem que


N
n
E [t] = E [f ] Yi = τ = nµ
i=1
N

e combinando este resultado com (2.15), obtém-se

V ar[t] = V ar[f ]N S 2 = n
N
N
−1
N
NS 2 = n N
−1 S 2 = nσ 2 ,
N
onde f denota o n´umero de vezes que uma unidade qualquer de
Uaparece na
amostra.

3.2.2 Estima¸ c˜
ao do total e da m´
edia populacional
Dos resultados acima, derivam-se estimadores n˜ ao viesados para µ e τ , resumidos
no seguinte teorema.

Teorema 3.3 A média amostral


1 t(s)
(3.8) y= Yi = = µ̂
n i ∈s
n

é um estimador n˜ ao viesado da média populacional µ dentro do plano AASc, e ainda

σ2
(3.9) V ar [y] = .
n

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 77/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

66 Amostragem aleat´ oria simples

Corol´ ario 3.1 Dentro do plano AASc, a estat´ıstica


N
(3.10) T (s) = ˆτ = N y = t(s)
n
é um estimador n˜ ao viesado do total populacional, com
σ2
V ar[T ] = N 2 .
n
O estimador T (s) em (3.10) é usualmente conhecido por estimador expans˜ ao
do total populacional. Note que o total populacional pode ser escrito como τ =
i ∈s Yi + / s Yi enquanto que ˆτ = ny + ( N
i∈ n)y, de modo que (N n)y estima
− −
a parte n˜ao observada, / s Yi , de τ .
i∈

3.2.3 Estima¸ cão da variˆ


ancia populacional
Nesta se¸cão considera-se o problema da estima¸ cão das variˆancias populacional e
amostral.

Teorema 3.4 Dentro do plano AASc, a estat´ıstica


1 2
s2 =
(3.11)
n
− 1 i ∈s
(Yi
−y) ,

é um estimador n˜ ao viesado da variˆancia populacional σ2 .

Prova. Note que

2 2 2 2 t2
s 2q
(n
−1)s =
i ∈s
(Yi
−y) =
i ∈s
Yi
−ny =
− n
,

de modo que
1
1)s 2 = E s 2q
E t2 ,
E (n
− n −
onde s2q
= i ∈s Yi2 . Por outro lado, de (2.16), (2.18), (3.1) e (3.2), podemos
escrever que
2 2 2 2 2 n 2 2
E sq = N σ + µ E [f ] = N σ + µ N = nσ + nµ
e que

E t2 = NS 2 V ar[f ] + τ 2 E 2 [f ]
n2 2
= NS 2
n
N
1
1
N − +
N2
τ = nS 2
N
N
−1
+ n 2 µ2
2 2 2
= nσ + n µ ,

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 78/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

3.2 Amostragem aleat´ oria simples com reposi¸ c˜


ao 67

onde f denota o n´umero de vezes que uma unidade qualquer de


Uaparece na
amostra. Combinando os dois ´ ultimos resultados, obtém-se
2
= nσ 2 + nµ 2 2 2 2
E (n
−1)s −σ −nµ = (n
−1)σ ,
o que demonstra o teorema.

Combinando os resultados apresentados nos teoremas e corol´ ario apresentados


acima, pode-se produzir estimadores n˜ ao viesados para a variˆancia dos estimadores
de µ e τ , que est˜ao condensados no corol´ario apresentado abaixo.

Corol´
ario 3.2 Para o plano amostral AASc, a estat´ıstica

s2
(3.12) var [y] = V ar [y] = ,
n
é um estimador n˜ ao viesado da variˆancia da média amostral, V ar [y], e

s2
(3.13) var [T ] = V ar[T ] = N 2 ,
n
é um estimador n˜ ao viesado de V ar[T ].

Exemplo 3.1 Volte aos dados do Exemplo 2.1 e considere a vari´ avel renda familiar,
onde o universo é
U { }
= 1, 2, 3 e o parâmetro populacional é D = (12 , 30, 18), com
as seguintes fun¸cões paramétricas: τ = 60, µ = 20 e σ2 = 168 / 3 = 56. Denido o
plano amostral AASc, com n = 2, tem-se associado a
U
o seguinte espa¸co amostral

SAASc = {11, 12, 13, 21, 22, 23, 31, 32, 33}.
A Tabela 3.1 considerada a seguir apresenta os valores dos estimadores y e s2 ,
calculados para cada amostra em AASc .
S
Tabela 3.1: Valores de y, s2 e P (s) para as amostras s em
SAASc
s: 11 12 13 21 22 23 31 32 33
P (s): 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9
y: 12 21 15 21 30 24 15 24 18
s2: 0 162 18 162 0 72 18 72 0

As Tabelas 3.2 e 3.3 apresentam as distribui¸ cões amostrais de y e s2 .

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 79/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

68 Amostragem aleat´ oria simples

Tabela 3.2: Distribui¸ cão amostral de y na AASc


y: 12 15 18 21 24 30
P (y): 1/9 2/9 1/9 2/9 2/9 1/9

Tabela 3.3: Distribui¸ cão amostral de s2 na AASc


s2: 0 18 72 162
2
P (s ): 3/9 2/9 2/9 2/9

Tem-se portanto as seguintes propriedades:

E [y] = 20, e V ar[y] = 56 = 28 .


2
Note também que
504
E s2 = = 56 = σ 2 ,
9
como já era esperado, pois conforme visto no Teorema 3.4, s2 é um estimador n˜ ao
viesado de σ2 .

3.2.4 Normalidade assint´ otica e intervalos de conan¸ ca

Conforme o tamanho da amostra aumenta, as distribui¸ cões de y e de T vão se


aproximando da distribui¸ cão normal, de acordo com o Teorema do Limite Central
(TLC), tanto para o caso da AASc como para a AASs. No Capı́tulo 10 s˜ ao discutidas
condi¸cões para a validade do TLC para v´ arias classes de estimadores (veja também o
Exerc´ıcio 3.10). Ent˜ ao, para n sucientemente grande, temos, com rela¸ cão à AASc,
que
(3.14)
y µ a
σ 2 /n
− ∼
N (0, 1),

e
(3.15)
T τ a
N σ 2 /n
− ∼N (0, 1),

onde N (0, 1) denota uma vari´ avel aleat´oria com distribui¸cão normal com média zero
e variˆancia 1. Os resultados (3.14) e (3.15) possibilitam a obten¸ cão de intervalos de
conan¸ca aproximados para y e T . Ent˜ao, com rela¸cão à média populacional, temos
de (3.14) que, para n sucientemente grande,

(3.16) P |y σ−2 /nµ| ≤ zα 1


−α,

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 80/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

3.2 Amostragem aleat´ oria simples com reposi¸ c˜


ao 69

onde zα é a ordenada da N (0, 1) de tal forma que a ´area na densidade da N (0, 1) no

− −
intervalo ( zα ; zα ) é igual a 1 α . Como σ2 é desconhecido, ele é substituı́do por
seu estimador n˜ao viciado s 2 , que para n grande é bem pr´oximo de σ 2 . A express˜ao
(3.16) pode ser escrita como

s2 s2
P y
− zα
n ≤ ≤ µ y + zα
n
1
−α,
de onde segue que
s2 s2
(3.17) y
− zα
n
; y + zα
n

é um intervalo de conan¸ ca para µ com coeciente de conan¸ca aproximadamente


igual a 1 α . A interpreta¸ cão freqüentista do intervalo de conan¸ ca est´a baseada
no fato de que se forem observadas 100 amostras AAS, e constru´ıdos 100 intervalos
de conan¸ca baseados nestas amostras, ent˜ ao, aproximadamente 100(1 α )% dos

intervalos devem conter µ.

3.2.5 Determina¸ c˜
ao do tamanho da amostra
Nesta se¸cão, discute-se a determina¸ cão do tamanho da amostra n de tal forma que o
estimador obtido tenha um erro m´ aximo de estima¸cão igual a B, com determinado
grau de conan¸ca (probabilidade). De maneira mais especı́ca, o problema consiste
em determinarmos n de modo que

(3.18) P( y
| −µ| ≤B ) 1
−α.
De acordo com (3.14), tem-se, para n grande, que

σ2
(3.19) P
| − |≤
y µ zα
n
1
−α.
Ent˜ao, para B xado, comparando (3.18) e (3.19), a solu¸ cão para o problema
acima consiste em determinar n de tal forma que
σ
B = zα
√n ,
ou equivalentemente,
B2 σ2
(3.20) = .
zα2 n

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 81/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

70 Amostragem aleat´ oria simples

Resolvendo (3.20) em n , obtém-se

σ2 σ2
(3.21) n= =
(B/z α ) 2 D

de modo que D = B 2 /z α2 .
Para a determina¸ cão do tamanho da amostra é preciso xar o erro m´ aximo
desejado ( B ), com algum grau de conan¸ca (zα ) e possuir algum conhecimento a
priori da variabilidade da popula¸ cão (σ 2 ). Os dois primeiros s˜ao xados pelo pes-
quisador, e quanto ao terceiro, a resposta exige mais trabalho. O uso de pesquisas
passadas, “adivinha¸ cões” estatı́sticas, ou amostras pilotos s˜ ao os critérios mais usa-

dos. Em muitos casos, uma amostra piloto pode fornecer informa¸ cão suciente
sobre a popula¸cão, de tal forma que pode-se obter um estimador inicial razo´ avel
para σ2 . Em outros casos, pesquisas amostrais efetuadas anteriormente sobre a po-
pula¸cão tamb´em podem fornecer estimativas iniciais bastante satisfat´ orias para σ2 .
Um outro procedimento, talvez menos dispendioso, seria considerar um intervalo
onde aproximadamente 95% dos indivı́duos da popula¸ cão estariam concentrados, e
aı́, igualar ao comprimento deste intervalo a quantidade 4 σ. Terı́amos ent˜ ao um
valor aproximado para σ2 . Tal procedimento é baseado no fato de que no intervalo
compreendido entre a média menos dois desvios padr˜ oes e a média mais dois des-
vios padr˜oes (média 2DP ), tem-se em popula¸cões (aproximadamente) simétricas,

±
aproximadamente 95% da popula¸ cão.

Exemplo 3.2 Considere novamente a popula¸ cão do Exemplo 2.1. Suponha que
uma amostra AASc de tamanho n = 10 da vari´avel renda familiar apresente os
valores: 12, 18, 12, 18, 18, 30, 12, 12, 18 e 30. Para esta amostra, y = 18 e s 2 = 48.
Portanto, de (3.17) segue que um intervalo de 95% de conan¸ ca para µ é dado por
18 1, 96 48/ 10, ou seja, (13, 71;22, 29). Com s 2 = 48, para ter uma amostra que
± √
apresenta uma estimativa com erro m´ aximo B = 2 com γ = 0 , 95, de modo que

D = 2/ (2 2 ) = 0 , 5, é necess´ario que

48
n= = 96.
0, 5

Pode-se também considerar o tamanho da amostra que com probabilidade γ


apresenta um erro m´ aximo relativo r para a média populacional, ou seja,

P
y
−µ µ ≤ r = γ.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 82/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

3.2 Amostragem aleat´ oria simples com reposi¸ c˜


ao 71

Identicando a quest˜ ao acima com aquela indicada pela express˜ ao (3.18), tem-se que
a solução para n é apresentada por (3.21) com B = rµ. Assim, além de estimativa
preliminar para σ 2 necessita-se também de uma estimativa preliminar para µ.

3.2.6 Estima¸ c˜
ao de propor¸ cões
De maneira geral, em muitas situa¸ cões, existe interesse em estudar a propor¸ cão de
elementos em certa popula¸ cão que possuem determinada caracter´ıstica, como ser ou
não um item defeituoso, ser ou n˜ao eleitor de determinado partido polı́tico e assim
por diante. Nestas situa¸ cões, a cada elemento da popula¸ cão est´a associada a vari´avel

1, se o elemento i possui a caracterı́stica


Yi = 0, caso contr´ario .

Ent˜ao,
N
1
P = Yi = µ
N i=1
é a propor¸cão de unidades na popula¸ cão que possuem a caracterı́stica de interesse.
No caso em que se est´a estudando, a propor¸ cão de itens defeituosos produzidos
em uma linha de produ¸ cão, por exemplo, a popula¸cão dos valores de Y não é de
interesse primordial. É mais importante a obten¸ cão de informa¸cão sobre a propor¸cão
P de tais itens que est˜ao dentro de limites aceit´ aveis.
Desde que Yi toma apenas os valores 0 e 1, pode-se escrever (veja o Exercı́cio
3.31)
N
1
2
(Yi P ) 2 = P (1 P ).
(3.22) σ =
N i=1 − −
Dada uma amostra observada s de tamanho n, seja m o número de elementos
da amostra que possuem a determinada caracterı́stica. De acordo com o Teorema
3.3, tem-se com rela¸cão à AASc que um estimador n˜ao viciado de P é dado por
1 m
p = P̂ = y = Yi = ,
n i ∈s
n
e que
σ2 PQ
V ar P̂ =
= ,
n n

onde Q = 1 P . De acordo com o Teorema 3.4, tem-se que um estimador n˜ ao
viciado de σ2 é dado por
n n
(3.23) s2 = P̂ Q̂ = pq,
n
− 1 n
− 1

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 83/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

72 Amostragem aleat´ oria simples


onde q = Q̂ = 1 P̂ . Conseqüentemente, pelo Corol´ ario 3.2, tem-se que um estimador
não viciado de V ar[P̂ ] é dado por
P̂ Q̂
var [p] = .

n 1
A seguir, h´a um resumo dos resultados obtidos acima.

Teorema 3.5 Um estimador n˜ao viciado de P baseado na AASc é dado por


m
p = P̂ = y = ,
n
com
(3.24) V ar P̂ = P Q .
n
Além disso, um estimador n˜ ao viciado de V ar P̂ é

P̂ Q̂
var [p] = .

n 1
Utilizando-se a aproxima¸ cão normal discutida na Se¸ cão 3.2.4, um intervalo de
conan¸ca aproximado para P é dado por

P̂ Q̂ P̂ Q̂
(3.25) P̂ zα ; P̂ + zα .
− n
−1 n
−1
Notando-se que o produto P Q (e portanto P̂ Q̂) é sempre menor que 1 / 4, segue
de (3.25) que um intervalo de conan¸ ca conservativo para P é dado por

1 1

− zα
4(n
− 1)
; P̂ + zα
4(n
− 1)
.

Como no caso da média amostral, pode-se considerar o tamanho da amostra


n de tal forma que
(3.26) P ( P̂ P B ) 1 α.

| − |≤ −
Utilizando os resultados obtidos para a média amostral da Se¸ cão 3.2.4, pode-se
mostrar que o valor de n , tal que (3.26) é aproximadamente satisfeita, é dado por
PQ
(3.27) n= ,
D
onde D é denido como em (3.21). Mas, para utilizar a f´ ormula (3.27), é necess´ ario
um valor (estimador) para P . Tal estimador pode ser obtido utilizando-se pesquisas

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 84/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

3.2 Amostragem aleat´ oria simples com reposi¸ c˜


ao 73

anteriores ou uma amostra piloto. Uma forma alternativa, que produz um valor
conservativo para n consiste em utilizar o fato de que P Q
de (3.27) que
≤1/ 4. Neste caso, tem-se
1
n= ,
4D
onde, como antes, D = B 2 /z α2 .

Exemplo 3.3 Considere novamente a amostra AASc obtida no Exemplo 3.2. Pretende-
se estimar a propor¸cão P de pessoas na popula¸cão com renda familiar maior que 18
unidades. Portanto, da amostra selecionada obtem-se p = 2 / 10 = 0 , 2. Um intervalo
de 95% de conan¸ca para P baseado na amostra acima segue de (3.25) e é dado por

± ×
0, 2 1, 96 0, 2 0, 8/ 9, ou seja, (0, 00;0, 46), que é portanto bastante grande, dado
que o tamanho da amostra é bastante pequeno.

3.2.7 Otimalidade de y na AASc

Nesta se¸cão discute-se a otimalidade de y em relação à AASc, sem reposi¸cão na


classe dos estimadores lineares de µ. Considera-se novamente as vari´ aveis alet´orias
y1 , . . . , y n dadas em (2.1), ou seja, a vari´avel yi assume os valores Y1 , . . . , YN , com
probabilidade 1 /N , ou seja, P (yi = Yj ) = 1 /N , j = 1 , . . . , N . Note que com rela¸cão
à AASc, as vari´aveis yi são independentes.

Deni¸ cão 3.1 Um estimador linear de µ é uma fun¸c˜ao de d s dada por


n
ys = i yi ,
i=1

onde as i s˜ao constantes conhecidas.

Note que y é linear com i = 1 /n , i = 1 , . . . , n . O lema a seguir estabelece as


condi¸cões para que ys seja não viciado (veja o Exercı́cio 3.36).

Lema 3.1 Um estimador ys é n˜ao viciado para µ se, e somente se,


n
i = 1.
i=1

Teorema 3.6 Com rela¸c˜ao à AASc, na classe dos estimadores lineares n˜ ao vicia-
dos, y é o de menor variˆancia (´otimo).

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 85/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

74 Amostragem aleat´ oria simples

Prova. Como as vari´aveis yi são independentes, temos que


n
V ar [ys ] = σ2 2
i
i=1
n
2 2
σ2
=
i=1
i
− + n
n 2
2 1 1
(3.28) = σ
i=1
i
− n
+
n
,

onde a última igualdade segue devido a que = 1 /n , de acordo com o Lema


3.1. Portanto, (3.28) é mı́nima quando i = 1 /n , i = 1 , . . . , n , o que prova o
resultado.

3.3 Amostragem aleat´ oria simples sem reposi¸ cão


A amostragem aleat´ oria simples sem reposi¸cão (AASs) opera de modo idêntico ` a
AASc, alterando-se apenas (iii), que passa a ser:
iii. Sorteia-se um elemento seguinte, com o elemento anterior sendo retirado da
popula¸cão.
Portanto, cada elemento da popula¸ cão só pode aparecer uma vez na amostra.
Com esta deni¸cão tem-se:

Teorema 3.7 Com rela¸c˜ao à AASs, a vari´avel f i , n´umero de vezes que a unidade
i aparece na amostra, obedece a distribui¸ c˜ao de Bernoulli (ver Bussab e Morettin,
2004) com probabilidade de sucesso n/N , denotado por f i b(1; n/N ), e que satisfaz:
n n

P (f i = 1) =
N
e P (f i = 0) = 1
N
,

de modo que
n
E [f i ] = ,
N
n n
V ar[f i ] =
N
1
N − ,
n
πi = ,
N
π ij =
n n 1
−,
e
N N 1

Cov [f i , f j ] =

n N n
N2 N 1
, −
i = 1, . . . , n e i = j = 1, . . . , N .

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 86/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

3.3 Amostragem aleat´ oria simples sem reposi¸ c˜


ao 75

Prova. A demonstra¸cão deste teorema é similar ` aquela feita para a AASc, e ca a
cargo do leitor (veja o Exercı́cio 3.30).
Conv´
em ressaltar ainda a similaridade entre muitos dos resultados que os dois
planos apresentam, e que embora as f´ ormulas sejam diferentes, s˜ ao pr´oximas quando
N , o tamanho da popula¸ cão, tende a ser grande quando comparada com o tamanho
da amostra. Por exemplo, quando N é grande com rela¸cão a n ,
N
−n1 1,
N

de modo que
n
Cov AASc [f i , f j ] = 2

e N

Cov AASs [f i , f j ] =
n N n

N2 N 1
, −

i = 1 , . . . , n , i = j = 1 , . . . , n , são muito pr´oximos. Observe que para n = 1, as
fórmulas coincidem (Por que?).

3.3.1 Propriedades da estat´ıstica t (s)

Apresenta-se a seguir algumas propriedades da estatı́stica t(s) = i ∈s Yi , o total da


amostra, que ser˜ao utilizadas na se¸cão seguinte, quando s˜ao apresentados estimado-

res do total e da média populacionais e suas propriedades.


Teorema 3.8 Com rela¸c˜ao à AASs, a estat´ıstica t(s) tem as seguintes propriedades:

E [t] = nµ

e
2
V ar[t] = n(1
−f )S ,
onde f = n/N é denominada fra¸ c˜ao amostral.

Prova. Quando s percorre


SAASs , tem-se por (2.14) que
N n
E [t] = E [f ] Yi = τ = nµ
i=1
N

e por (2.15), que

V ar[t] = V ar[f ]NS 2


n n
NS 2 = n(1 2
=
N
1
−N −f )S .

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 87/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

76 Amostragem aleat´ oria simples

3.3.2 Estima¸ cão do total e da m´


edia populacional
Como estimadores da média e do total populacionais, considera-se ˆ µ = i ∈s Yi /n ,
a média amostral, e ˆ τ = T (s) = Ny , respectivamente. O estimador T (s) é usu-
almente conhecido como estimador expans˜ ao, pois pode ser escrito como T (s) =

− −
ny + ( N n)y, de modo que as N n unidades fora da amostra s˜ ao também es-
timadas por y. Os resultados a seguir mostram que os estimadores acima s˜ ao não
viesados e apresentam também express˜ oes para as suas variˆancias com rela¸cão à
AASs, denominadas variˆ ancias amostrais.

Corol´ ario 3.3 Com rela¸c˜ao à AASs, um estimador n˜ ao viciado do total populaci-

onal é N
T (s) = N y = t(s),
n
cuja variˆancia amostral é dada por

S2
V ar[T ] = N 2 (1
− f)
n
.

Corol´ ario 3.4 Com rela¸c˜ao à AASs, a média amostral


n
1 t(s)
y= Yi =
n i ∈s
n

é um estimador n˜ ao viesado da média populacional, com variˆ ancia amostral dada


por
S2
V ar[y] = (1 f ) .
n −
3.3.3 Estima¸ cão da variˆ
ancia populacional
Apresenta-se a seguir um estimador n˜ ao viesado para a variˆancia populacional S 2 ,
com rela¸cão ao planejamento AASs. Tal estimador ser´ a usado na obten¸cão de esti-
madores n˜ao viesados para as variˆancias amostrais apresentadas nos Corol´ arios 3.3
e 3.4.

Teorema 3.9 A variˆancia da amostra


1 2
s2 =
n
−1 i ∈ s
(Yi
−y)
é um estimador n˜ ao viesado da variˆancia populacional S 2 para o planejamento
AASs.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 88/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

3.3 Amostragem aleat´ oria simples sem reposi¸ c˜


ao 77

Prova. Fica a cargo do leitor seguir os passos usados na demonstra¸ cão do Teorema
3.4 para concluir a demostra¸ cão (veja o Exercı́cio 3.33).

Corol´
ario 3.5 Para o plano amostral AASs, a estat´ıstica

s2
var [y] = V ar[y] = (1
− f)
n
é um estimador n˜ ao viesado de V ar[y] e

s2
var [T ] = V ar[T ] = N 2 (1
− f)
n
é um estimador n˜ ao viesado de V ar[T ].

Exemplo 3.4 Considere novamente os dados do Exemplo 2.1 e o interesse pela


vari´avel renda familiar, onde, como no Exemplo 3.1,
U {
= 1, 2, 3 e o parâmetro
}
populacional é D = (12 , 30, 18), com as fun¸cões paramétricas τ = 60, µ = 20 e
S 2 = 84. Denido o plano amostral AASs, com n = 2, tem-se associado a o
U
espa¸co amostral

S {
AASs = 12, 21, 31, 13, 23, 32 .
}
A Tabela 3.4 considerada a seguir apresenta os valores de y e s 2 para cada uma das

S
amostras em AASs .

Tabela 3.4: Valores de y, s 2 e P (s) para as amostras s em


s : 12 21 13 31 23 32
SAASs
P (s): 1/6 1/6 1/6 1/6 1/6 1/6
y: 21 21 15 15 24 24
s2: 162 162 18 18 72 72

As Tabelas 3.5 e 3.6 apresentam as distribui¸ cões amostrais de y e s2 .

Tabela 3.5: Distribui¸ cão amostral de y na AASs


y: 15 21 24
P (y): 1/3 1/3 1/3

Temos da Tabela 3.5 que


2 84
E [y] = 20 e V ar[y] = 1
− 3 2
= 14.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 89/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

78 Amostragem aleat´ oria simples

Tabela 3.6: Distribui¸ cão amostral de s2 na AASs


s 2 : 18 72 162
2
P (s ): 1/3 1/3 1/3

Portanto, y é um estimador n˜ao viesado para µ e com variância bem menor que a
variˆancia apresentada pelo planejamento AASc. Da Tabela 3.6, tem-se que
1
E [s 2 ] = (18 + 72 + 162) = 84 ,
3
um resultado j´a esperado, pois, conforme visto no Teorema 3.9, s2 é um estimador
não viesado de S 2 .

3.3.4 Normalidade assint´ otica e intervalos de conan¸ ca


Todos os resultados apresentados para o caso com reposi¸ cão tem o seu equivalente
para a AASs, mudando apenas a express˜ ao correspondente `a variˆancia amostral.
Assim, para a AASs temos os seguintes resultados:

− y
µ
(1 f )s /n ∼
2
a
N (0, 1),


T τ a
N (0, 1)

e −
N (1 f )s 2 /n

P |−|
y µ
(1 f )s 2 /n ≤


1 α,

resultando no intervalo de conan¸ ca para µ,

s2 s2
y
− zα (1
− f)
n
; y + zα (1
− f)
n
.

Um intervalo de conan¸ ca para τ com coeciente de conan¸ca aproximada-


mente igual a 1 α pode ser constru´ıdo de maneira an´ aloga ao intervalo constru´ıdo


acima para µ. Veja o Exerc´ıcio 3.34.

Exemplo 3.5 Uma pesquisa amostral foi conduzida com o objetivo de se estudar
o ı´ndice de ausência ao trabalho em um determinado tipo de ind´ ustria. Uma AAS
sem reposi¸cão de mil oper´arios de um total de 36 mil é observada com rela¸ cão ao
número de faltas n˜ao justicadas em um perı́odo de 6 meses. Os resultados obtidos
foram:

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 90/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

3.3 Amostragem aleat´ oria simples sem reposi¸ c˜


ao 79

Faltas: 0 1 2 3 4 5 6 7 8
Trabalhadores: 451 162 187 112 49 21 5 11 2
Para esta amostra tem-se que uma estimativa de µ é dada por y = 1 , 296. Observa-se
2
também que s = 2 , 397. Usando a aproxima¸cão normal, tem-se que um intervalo
de 95% de conan¸ca para µ é dado por (1 , 201;1, 391).

3.3.5 Determina¸ c˜
ao do tamanho da amostra
Para adaptar os resultados desenvolvidos na Se¸ cão 3.2.5 para o caso AASs, basta
observar que
S2 S2 S2
V ar AASs [y] = (1 f ) = = ,

onde
n
− n/ (1 f ) n

n
n = ,
1 f

obtendo-se uma express˜ ao semelhante `a do caso AASc, ou seja,
S2
. n =
D
Para a obten¸ cão do tamanho efetivo da amostra note que, sendo
n
n = ,
1 n/N

obtém-se imediatamente que
n
n= ,
1 + n /N
de modo que
S 2 /D 1
n= S 2 /D
= 2
,
1+ D/S + 1 /N
N
2 2
onde D = B /z α.
Note que o tamanho da amostra neste caso, é menor que o
tamanho da popula¸ cão N . No caso da AASc, o tamanho da amostra para atingir
determinada precis˜ ao (expressa através de B) pode ser maior que o tamanho da
popula¸cão. Todas as corre¸cões feitas anteriormente para o caso AASc também se
aplicam para este caso. Pode-se mostrar de maneira similar ao desenvolvimento
acima que o tamanho da amostra para que (veja o Exercı́cio 3.35)

P( T
| −τ | ≤B ) 1
−α,
é dado por
N
(3.29) n= .
D/ (NS 2 ) + 1

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 91/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

80 Amostragem aleat´ oria simples

Exemplo 3.6 Considere a popula¸cão dos oper´arios faltosos do Exemplo 3.5. Pode-
se encontrar n tal que B = 0 , 05, com α = 0 , 05. Ent˜ao, como, neste caso D =
(0, 05/ 2) 2 = 0 , 00065, tem-se que

1
n= ∼0,00065
2,397 + 1
36.000

= 3.466.

Pode-se também considerar o caso em que o interesse é pelo erro m´ aximo


relativo como no caso da AASc considerado na Se¸ cão 3.2.5. Veja também o Exerc´ıcio
3.42.

3.3.6 Estima¸ cão de propor¸ cões


Discute-se nesta se¸cão a estima¸cão de uma propor¸cão P no caso de uma AASs de
tamanho n de uma popula¸cão de N “uns” (sucessos) e “zeros” (fracassos). Desde
que Yi toma apenas os valores 1 e 0, podemos escrever (veja o Exercı́cio 3.31)
N
1 N
S2 = P )2 =
(3.30)
N
− 1 i=1
(Yi
− N
− 1
P (1
−P ).
Dada uma amostra observada s de tamanho n , seja m o número de elementos
da amostra que possuem a determinada caracterı́stica. De acordo com o Corol´ ario
3.4, tem-se com rela¸cão à AASs que um estimador n˜ao viciado de P é dado por

p = P̂ = y = n1 Yi = m
n,
i ∈s
e que
S2
V ar[P̂ ] = (1
=
N n PQ
,
− f) −
n N 1 n


onde Q = 1 P . De acordo com o Teorema 3.9, tem-se que um estimador n˜ ao
viciado de S 2 é dado por
n n
(3.31) s2 = P̂ Q̂ = pq
n 1 n 1
− −
onde q = Q̂ = 1
−P̂ . Conseqüentemente, um estimador n˜ ao viciado de V ar[P̂ ] é

dado por
P̂ Q̂
var [p] = (1
−f ) n − 1 .
Utilizando-se a aproxima¸ cão normal discutida na Se¸ cão 3.3.4, um intervalo de
conan¸ca aproximado para P é dado por

P̂ Q̂ P̂ Q̂
(3.32) P̂
−zα (1
−f ) n −1 ; P̂ + zα (1
−f ) n − 1 .

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 92/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

3.3 Amostragem aleat´ oria simples sem reposi¸ c˜


ao 81

Notando-se que o produto P Q (e portanto P̂ Q̂) é sempre menor que 1 / 4, segue


de (3.32) que um intervalo de conan¸ ca conservativo para P é dado por


− zα −
1 f
; P̂ + zα
1 f
− .

4(n 1) 4(n 1)

Como no caso da média amostral, pode-se considerar o tamanho da amostra
n de tal forma que
(3.33)
| −P | ≤B )
P ( P̂ 1
−α.
Utilizando-se os resultados obtidos para a média amostral na Se¸ cão 3.3.5,
pode-se mostrar que o valor de n tal que (3.33) é aproximadamente satisfeita é dado
por
N
(3.34) n= .
(N
−1)D/ (P Q ) + 1
Mas, para utilizar a f´ormula (3.34), é necess´ ario de um valor (estimador) para P .
Tal estimador pode ser obtido utilizando-se pesquisas anteriores ou uma amostra
piloto. Uma forma alternativa, que produz um valor conservativo para n consiste


em utilizar o fato de que P Q 1/ 4. Neste caso, tem-se de (3.34) que

N
n= ,
4(N

1)D + 1

onde, como antes, D = B 2 /z α2 .

Exemplo 3.7 No Exemplo 3.5, suponha que até 3 faltas (3 dias) em 6 meses seja
considerado aceit´avel. Ent˜ao, a propor¸cão de trabalhadores tirando mais que 3 dias
de folga não justicada em 6 meses, é
88
p= = 0 , 088.
1000
De (3.34), tem-se que um intervalo de conan¸ ca para P , com α = 0 , 05, é dado por

0, 088
± 1, 96 1
− 36.000
1.000
×−
0, 088 0, 912 ,
1.000 1

ou seja, (0 , 071;0, 105). Para ter uma estimativa com B = 0 , 01 com γ = 0 , 95, temos

que D = (0, 01/ 2) 2 = 0 , 000025, de modo que de (3.34) segue que é preciso observar
36.000
n= (36 .000 − 1) × 0,000025
+1

= 2.948.
0,088 × 0,912

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 93/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

82 Amostragem aleat´ oria simples

3.3.7 Otimalidade de y na AASs

Como na Se¸cão 3.2.7, considere a classe dos estimadores lineares ys da média po-
pulacional µ, com a condição de não viciosidade estabelecida pelo Lema 3.1, ou
seja = 1 /n . Note que neste caso as vari´aveis yi não são independentes, pois,


P (yi = Yk , y j = Yl ) = 1 /N (N 1), i = j = 1 , . . . , N , e k = l = 1 , . . . , N .

Teorema 3.10 Com rela¸c˜ao à AASs, na classe dos estimadores lineares n˜ ao vicia-
dos, y é o de menor variˆancia (´otimo).

Prova. Suponha, sem perda de generalidade, que s =


{1, . . . , n }. Não é dif´ıcil
mostrar que (veja o Exercı́cio 3.37)
n n n
S2
(3.35) V ar[ys ] =
N
N
− 1
S 2 2
i
− N
i j = S 2 2
i
−N
1
.
i=1 i=1 j = i i=1

Ent˜ao, para que a variˆancia (3.35) seja mı́nima, é necess´ ario que
n− 1 n− 1 2
2

i=1
i + 1
− i=1 i

seja mı́nimo. Diferenciando com rela¸ cão a i e igualando a zero, temos que
n− 1
i =1
− j =1 j = n,i = 1, . . . , n
−1.
Note que a segunda derivada com rela¸ cão a i é positiva. Assim, i = n,
i = 1 , . . . , n , e como ni=1 i = 1, tem-se que
1
i = , i = 1, . . . , n .
n
Note que o estimador linear com i = 1 /n , i = 1 , . . . , n nada mais é do que y.

De maneira an´aloga, pode-se concluir que T é o estimador ´otimo de τ na classe


dos estimadores lineares da Deni¸ cão 3.1 (veja o Exercı́cio 3.38).

3.4 Compara¸ c˜
ao entre AASc e AASs
Quando se tem dois planos amostrais, é importante saber qual deles é “melhor”.
Antes de continuar a discuss˜ ao, é preciso xar o critério pelo qual o plano ser´ a jul-
gado. Como j´a foi discutido anteriormente, o critério mais adotado em amostragem

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 94/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

3.4 Compara¸ cão entre AASc e AASs 83

é o Erro Quadr´ atico Médio, ou a variˆancia quando os estimadores s˜ ao não viesados.


Devido a isso, existe um conceito bastante importante, que é o chamado efeito do
planejamento (EP A , ou em inglês design effect, deff), que compara a variˆancia de
um plano qualquer com rela¸ cão a um plano que é considerado padr˜ ao. A estat´ıstica
y é em ambos os planos um estimador n˜ ao viesado de µ. Assim,
(1 f )S 2 /n
EP A =
V arAASs [y]
= 2
− =
N
−n1 .
V ar AASc [y] σ /n N

Quando o EPA > 1, tem-se que o plano do numerador é menos eciente que
o padr˜ao. Quando EPA < 1, a situa¸cão é inversa. Da express˜ ao acima vê-se que

−n 1,N

ou seja, o plano AASs é sempre “melhor”− ≤ o plano AASc. S´ o para amostras de


N 1
do que
tamanho 1 é que os dois se equivalem. Note que este resultado conrma a intui¸ cão
popular de que amostras sem reposi¸ cão são “melhores” do que aquelas com elementos
repetidos.

Exerc´ıcios
3.1 Em uma popula¸cão com N = 6, tem-se D = (8 , 2, 2, 11, 4, 7). Um plano AASs
de tamanho n = 2 é adotado.

a. Encontre a distribui¸ cão de y e mostre que E [y] = µ.


b. Mostre que V ar[y] é como dada pelo Corol´ario 3.4.
c. Encontre a distribui¸ cão de s 2 , denido em (3.11). Mostre que E s 2 = S 2 .

3.2 Considere o Exercı́cio 3.1 agora com o plano AASc.

a. Encontre a distribui¸ cão de y e mostre que E [y] = µ.


b. Encontre V ar[y] diretamente e utilizando o resultado (3.9).
c. Suponha que uma AAS com reposi¸cão de tamanho n = 10 retirada da
popula¸cão apresenta y = 5 , 435 e s2 = 3 , 6. Encontre um intervalo de
conan¸ca para µ com α = 0 , 02.

3.3 No caso da AAS com reposi¸cão, determine o tamanho aproximado da amostra


n tal que
P( T τ
| − |≤
B ) 1 α,

onde B está xado. Como ca n , quando B = 0 , 03, α = 0 , 01 e s2 = 3 , 6?

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 95/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

84 Amostragem aleat´ oria simples

3.4 Um plano AASs com n = 30 foi adotado em uma ´area da cidade contendo
14.848 residências. O n´umero de pessoas por residência na amostra observada
foi d = (5 , 6, 3, 3, 2, 3, 3, 3, 4, 4, 3, 2, 7, 4, 3, 5, 4, 4, 3, 3, 4, 3, 3, 1, 2, 4, 3, 4, 2, 4).

a. Encontre uma estimativa do n´ umero médio de pessoas por residência na


popula¸cão e uma estimativa para a variˆ ancia da estimativa obtida.
b. Encontre um intervalo de 90% de conan¸ ca para µ.
c. Suponha que seja de interesse uma estimativa duas vezes mais precisa que
a obtida com a amostra acima. Qual o tamanho da amostra necess´ ario
para tal precis˜ao?

3.5 Considere uma popula¸cão com N = 6, onde D = (1 , 4, 5, 5, 6, 6). Adote um


plano AASs com n = 2. Como estimador de µ, considere

y + 1 , se s contém y1 e não y6
yc = y 1, se s contém y6 e não y1 ,

y, caso contr´ario

onde y é a média amostral.

a. Encontre as distribui¸ cões de y e de yc . Verique se estes estimadores s˜ ao


não viciados para µ.
b. Encontre V ar[y] e V ar[y c ]. Qual o melhor estimador?

3.6 Considere a popula¸cão do Exercı́cio 3.5, com o estimador


y1 + y s2 + y6
y st = ,
3
onde ys2 é a média de uma amostra de tamanho n = 2 retirada dos remanes-

{ }
centes elementos 2, 3, 4, 5 , isto é, yst inclui y1 , y6 , e a média de uma amostra
de tamanho 2 dos 4 elementos remanescentes. Encontre V ar[yst ].

3.7 Dois dentistas, D 1 e D 2 , fazem uma pesquisa amostral sobre o estado dos
dentes de 200 crian¸cas de certa escola estadual de determinada localidade. D1
seleciona uma AASs de 20 crian¸cas e conta o n´umero de dentes cariados para
cada crian¸ca, com os seguintes resultados:

N o de dentes cariados: 0 1 2 3 4 5 6 7 8 9 10
No de crian¸cas: 8 4 2 2 1 1 0 0 0 1 1

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 96/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

3.4 Compara¸ cão entre AASc e AASs 85

O outro dentista, D 2 , usando a mesma técnica dental, examina as 200 crian¸ cas
da escola, mas anota somente o n´ umero de crian¸cas com dentes cariados. Ele
encontra um total de 60 crian¸ cas sem nenhuma c´arie. Estime o n´umero de
dentes cariados nas crian¸ cas da escola, quando se utiliza

i. somente os resultados de D 1 ;
ii. os resultados de D 1 e de D 2 .

a. Qual das estimativas é mais precisa?


b. É possı́vel encontrar uma estimativa para a variˆ ancia de suas estimativas?

3.8 Uma amostra AASs de tamanho n = 4 = n 1 + n 2 é retirada de uma popula¸ cão


U com N = 6 elementos, onde D = (8 , 2, 2, 11, 4, 7). Uma amostral aleat´ oria
simples sem reposi¸cão de tamanho n 1 = 2 é retirada da primeira amostra,
apresentando média y1 . Seja y2 a média das n 2 unidades remanescentes na

− −
amostra original. Encontre V ar[y1 y 2 ] e V ar[y1 y], onde y é a média da
amostra original.

3.9 Na Tabela 2.8, temos informa¸cões sobre o número de apartamentos ( X ) nos


condom´ınios observados e o n´ umero de apartamentos alugados por condomı́nio
(Y ) em vários conjuntos habitacionais.

a. Selecione duas amostras, de tamanhos 10 e 20, adotando AASc e construa


intervalos de conan¸ca para µ com coeciente de conan¸ca γ = 0 , 95.
b. Considere a amostra de tamanho 20 de (a). Qual o tamanho necess´ ario
da amostra para que tenhamos uma estimativa duas vezes mais precisa
que a de (a)?
c. Use a amostra de tamanho 20 de (a) para obter uma estimativa pontual
e por intervalo, com γ = 0 , 95, para a propor¸cão de residências com mais
que 3 residentes. Qual o tamanho da amostra necess´ ario para a obten¸cão
de uma estimativa duas vezes mais precisa?
d. Refa¸ca (a), (b) e (c) considerando agora AASs.

3.10 Considere a popula¸cão denida no Exercı́cio 2.1. Selecione 500 amostras de


tamanho n = 10 sem reposi¸cão e, para cada uma delas, calcule y. Represente
gracamente a distribui¸ cão destes valores de y através de um histograma.
Selecione novamente 500 amostras, agora de tamanho n = 20, sem reposi¸cão
e refaça o histograma. O que você conclui a partir dos histogramas?

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 97/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

86 Amostragem aleat´ oria simples

3.11 Considere uma popula¸cão com N = 6, onde D = (0 , 0, 1, 1, 1, 1). Deseja-se


estimar P , a propor¸cão de uns na popula¸cão, utilizando uma amostra AASs
de n = 4 unidades.

a. Encontre a distribui¸ cão da média amostral y e mostre que y é um esti-


mador n˜ao viciado de P .
b. Sugira um estimador para V ar[y]. Verique se seu estimador é n˜ao vici-
ado.

3.12 Em uma amostra de 200 colégios particulares de uma popula¸ cão com 2.000
colégios, 120 colégios eram favor´aveis a certa proposi¸cão, 57 eram contra e 23
eram indiferentes. Encontre o tamanho da amostra que fornece uma estimativa
que n˜ao difere do valor exato do total de colégios na popula¸ cão favor´aveis à
proposi¸cão, por mais que 20, com probabilidade igual a 0,95. Justique o
procedimento utilizado.

3.13 Considere novamente o Exerc´ıcio 3.4.

a. Encontre a probabilidade (aproximada) de que a estimativa do n´ umero


total de pessoas n˜ao dira (em valor absoluto) do verdadeiro valor por
mais que 100 pessoas.
b. Encontre a probabilidade (aproximada) de que a estimativa da porcenta-
gem de domic´ılios com mais que dois residentes n˜ ao dira do verdadeiro
valor (em valor absoluto) por mais que 1%.

3.14 Refaça os Exercı́cios 3.4 e 3.13 considerando agora AASc.

3.15 Duas AAS de tamanhos 200 e 450 foram colhidas um ap´ os a outra (sem
reposi¸cão), de uma popula¸cão de 2.400 alunos de uma escola. Para cada estu-
dante perguntou-se qual a distˆ ancia em quilˆometros de sua residência ` a escola.
As médias e variˆancias obtidas foram as seguintes: y1 = 5 , 14, y2 = 4 , 90,
s 1 = 3 , 87 e s2 = 4 , 02. Construa um intervalo de conan¸ ca de 90% (aproxi-
madamente) para a distˆ ancia média das residências ` a escola.

3.16 A seção de Estatı́stica de uma biblioteca é formada por 130 prateleiras de


tamanhos similares. Sorteando-se uma amostra aleat´ oria de 15 prateleiras,
obteve-se o seguinte n´umero de livros em cada uma: 28, 25, 23, 33, 31, 18, 22,
29, 30, 22, 26, 20, 21, 28, 25.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 98/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

3.4 Compara¸ cão entre AASc e AASs 87

a. Construa um intervalo de conan¸ ca para T , o total de livros de Es-


tat´ıstica.
b. Que tamanho deveria ter a amostra para que, com 95% de conan¸ ca, o
erro em estimar T seja inferior `a 100 livros?

3.17 Suspeita-se que a renda familiar média dos moradores de Pepira seja de apro-
ximadamente 10 sal´arios mı́nimos (SM) e o desvio padr˜ ao de 5 SM. Pretende-se
usar AAS como plano amostral.

a. Que tamanho deve ter a amostra para que o erro padr˜ ao de y seja de 0,5?
Que suposi¸cões foram necess´arias?
b. Como caria a resposta acima se N = 20.000? E se N = 1 .000?
c. Agora você quer planejar a amostra de modo que o coeciente de varia¸ cão
de y, C V [y], seja inferior a 5%. Qual deve ser o tamanho da amostra?

3.18 Um levantamento amostral sobre a situa¸ cão de saúde de uma popula¸cão


bastante grande visa estimar a incidência inicial de duas doen¸ cas. Suspeita-se
que a incidência de uma delas é de 50% e a outra, mais rara, da ordem de 1%.
Qual deve ser o tamanho da amostra em cada caso para manter o mesmo erro
padr˜ao de 0,5%? Agora, deseja-se garantir o mesmo coeciente de varia¸ cão de

estimador e igual a 5%. Qual deve ser o tamanho da amostra em cada caso?
Que lição você aprende deste exercı́cio?

3.19 Uma AAS de 400 pessoas, retirada de uma popula¸ cão com 2.000 pessoas,
mostrou que 200 delas eram favor´ aveis a um projeto governamental.

a. Dê um intervalo de conan¸ ca 95% para a propor¸cão P de favoráveis ao


projeto na popula¸ cão. Que suposi¸cões foram feitas para constru´ı-lo?
b. Que tamanho deveria ter a amostra para que tivéssemos 95% de conan¸ ca
em estimar P , com erro inferior a 3%?

3.20 Você planejou uma amostra aleat´ oria simples de n indiv´ıduos, para estimar a
média populacional µ de uma vari´avel. Cerca de 20% recusou-se a responder ` a
entrevista. Que estimador você usaria para µ e qual o erro padr˜ao? Justique
a resposta.

3.21 Um pesquisador deseja estimar a porcentagem de pessoas com sangue do


tipo O, entre os 3.200 moradores de uma certa ilha. Ele quer garantir que

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 99/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

88 Amostragem aleat´ oria simples

o coeciente de varia¸cão da estimativa n˜ ao seja superior a 10%, com 95% de


conan¸ca. Ele tamb´
em sabe que a propor¸ cão deve ser um n´umero entre 20%
e 30%. Que tamanho da amostra deve ser usado para um plano amostral
aleat´orio simples

a. com reposi¸cão?
b. sem reposi¸cão?

3.22 A seção de pessoal de uma companhia mantém chas cadastrais de seus 800
empregados. Sabe-se que algumas chas est˜ ao incorretamente preenchidas e

deseja-se estimar qual a propor¸ cão destas chas. De 100 chas escolhidas
aleatoriamente, 25 estavam incorretas.

a. Estime o total de chas incorretas no arquivo e estabele¸ ca um intervalo


de conan¸ca para este n´umero.
b. Que tamanho deveria ter a amostra para que o erro de estima¸ cão fosse
de 0,04?

3.23 Um programa de sa´ude ir´a vacinar todos os escolares, da 1 a a 4a séries do


ensino fundamental, pertencentes ` a rede ocial de um distrito educacional.
Estima-se em cerca de 15.000 alunos, distribuı́dos em nove escolas com aproxi-
madamente o mesmo n´umero de alunos em cada uma delas. O n´ umero médio
de alunos por classe é 35. As escolas est˜ao situadas geogracamente pr´ oximas
(dentro de um cı́rculo de 3 km de raio, aproximadamente). Pretende-se usar
o plano de vacina¸cão para colher uma amostra para responder dois objetivos
principais:

i. Estimar a propor¸cão de crian¸cas infectadas com doen¸ca de Chagas, a qual


sup˜oe-se não ser superior `a 2%;

ii. Estimar a propor¸ cão de crian¸cas nascidas fora da regi˜ao, esperando-se


que seja alta, da ordem de 40%.

Você foi encarregado de propor um plano amostral aleat´ orio simples para
essa pesquisa, indicando e justicando o tamanho da amostra, f´ ormulas de
estima¸cão e sugest˜oes práticas para colher a amostra. Informe as suposi¸ cões
feitas para responder ao problema.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 100/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

3.4 Compara¸ cão entre AASc e AASs 89

3.24 Para estimar a propor¸ cão P das 1.000 unidades rurais do munic´ıpio de Pepira
dedicadas exclusivamente ` a pecu´aria, usou-se uma AAS de 100 unidades, das
quais apenas 30 satisfaziam o requisito. Construa um intervalo de conan¸ ca
de 95% para P .

3.25 Estuda-se o uso de amostragem para determinar o valor total de itens em


estoque de uma empresa. O levantamento das 36 prateleiras de um dos ar-
mazéns apresentou os seguintes valores (em R$): 29, 38, 42, 44, 45, 47, 51, 53,
53, 54, 56, 56, 58, 58, 59, 60, 60, 60, 60, 61, 61, 61, 62, 64, 65, 67, 67, 68, 69,
71, 72, 74, 74, 77, 82 e 85. Um erro inferior a R$ 200 para o total do armazém,
com 95% de conan¸ca, é bastante aceit´ avel. Alguém sugeriu usar uma AAS
de 12 prateleiras. Você concorda com a sugest˜ ao?

3.26 Estudo odontol´ogico realizado em uma popula¸cão de 1.000 crian¸cas revelou o


aparecimento de 2,2 c´aries em média, a cada 6 meses. Introduziu-se uma pasta
dental com nova composi¸cão e após um perı́odo de tratamento sortearam-se
dez crian¸cas para vericar os primeiros resultados, obtendo-se os seguintes
números de c´aries: 0, 4, 2, 3, 2, 0, 3, 4, 1 e 1. Qual seria a sua resposta ap´os
analisar os resultados. Declare as suposi¸ cões feitas para as suas respostas.

3.27 A prefeitura de Pepira pretende estimar o n´ umero de domicı́lios com pelo


menos um morador com mais de 65 anos. Em uma amostra aleat´ oria simples
de 60 casas, 11 tinham pelo menos um morador idoso. A cidade tem 621
domicı́lios, segundo os registros da prefeitura.

a. Estime a propor¸cão P de domicı́lios na cidade com moradores idosos, bem


como o erro padr˜ao.
b. Se você deseja que o erro de estima¸ cão não seja superior a oito pontos
percentuais para mais ou para menos, que tamanho de amostra deveria
ser usado?

3.28 Compare os planos AASc e AASs, destacando as principais vantagens de um


e de outro. Em sua opini˜ao qual é melhor e por quê?

3.29 Uma amostra probabil´ıstica de 1.200 fazendas apresentou uma produtividade


média de y1 = 560 caixas por alqueire e um erro padr˜ ao var [y1 ] = 15.

a. Para a safra seguinte, você planeja uma amostra similar. Quanto você


imagina que seja o erro padr˜ ao da diferen¸ca y1 y 2 ? Que suposi¸cões foram

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 101/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

90 Amostragem aleat´ oria simples

feitas para responder ` a quest˜ao anterior? Como caria a sua reposta se


as suposi¸cões não se vericassem?
b. Se a segunda amostra tivesse apenas 400 fazendas, qual seria o erro padr˜ ao


da diferen¸ca y1 y2 ? Quais as suposi¸cões necessárias? Como caria a
resposta no caso de n˜ao serem verdadeiras?
c. Da primeira amostra de 1.200, decidiu-se comparar duas subcategorias
(grandes e pequenas), cada uma com 1/10 dos elementos da amostra.


Qual a magnitude do erro padr˜ ao de yg y p ? Que suposi¸cões foram
feitas e como caria a resposta quando n˜ ao fossem verdadeiras?

Te´oricos
3.30 Prove o Teorema 3.7.

3.31 Verique a validade da express˜ao (3.22).

3.32 Para uma popula¸ cão


Ude tamanho N , com D = ( Y1 , . . . , YN ), mostre que

i=1
(Yi
−Y ) = 0 .
3.33 Prove o Teorema 3.9.

3.34 Mostre que um intervalo de conan¸ ca para o total populacional τ com coe-
ciente de conan¸ca aproximadamente igual a 1 α é dado por

s2 s2
N 2 (1 N 2 (1
T
− zα
− f)
n
; T + zα
− f)
n
.

Use o intervalo acima para construir um intervalo para o total de faltas no


Exemplo 3.5.

3.35 Verique a validade da express˜ao (3.29).

3.36 Prove o Lema 3.1.

N N
3.37 a. Elevando ao quadrado a express˜ ao i=1 Yi = N µ, mostre que i=1 j= i Yi Yj
(N 1) S 2 Nµ .
− −

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 102/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

3.4 Compara¸ cão entre AASc e AASs 91

b. Utilizando o item (a), prove que para a AASs,

S2
Cov [yi , y j ] =
− N
.

c. Verique a validade da express˜ao (3.35), usando o item (b).

3.38 Considere a classe dos estimadores lineares ys dados na Deni¸cão 3.1. En-
contre a condi¸cão para que ys seja não viciado para o total populacional τ .
Usando este resultado, mostre que ˆ τ = T = Ny é o estimador de menor
variˆancia na classe dos estimadores lineares n˜ ao viciados, considerando AASc
e também AASs.

3.39 Uma AASc de tamanho n = 3 é selecionada de um popula¸ cão com N ele-


mentos. Mostre que a probabilidade de que a amostra contenha 1, 2 ou 3
elementos diferentes (por exemplo, aaa, aab e abc, respectivamente) é

P1 =
1
N2
, P2 =
3(N 1)
N2
−, P3 =
(N
−1)(N
N 2
−2)
.

Como um estimador de µ considere y , a média n˜ao ponderada sobre as uni-


dades diferentes da amostra. Mostre que

V ar y = S 2
N
N
−1
P1 + −
N 2
2N
P2 + − P3
N 3
3N
,

e conclua que
2
S2
V ar y =
(2N
−1)(
6N 2

N 1)S
1

f
2 3
.

3.40 Para N = 3 e AASs com n = 2, considere o estimador


1 1

yI =
2 Y1
1
+ 2 Y2 ,
2
{ }.
se s= 1,2
2 Y1
1
+ 3 Y3 ,
1
{ }
se s= 1,3
2 Y2 + 3 Y3 , { }
se s= 2,3

Mostre que yI é n˜ao viciado e que V ar[yI ] < V ar [y], se Y3 (3Y2


−3Y1 −Y3 ) > 0.
3.41 Considere uma popula¸cão onde Y1 é pequeno e YN é grande. Para esta
situa¸cão temos o estimador

y + c, se 1 s e N / s
∈ ∈
yc = y c, se 1 / s e N s ,
− ∈ ∈

y, se 1 / s e N / s

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 103/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

92 Amostragem aleat´ oria simples

onde c é uma constante positiva. Verique que

S2 2c
V ar[yc ] = (1
− f)
n −N −1 (YN −Y1 −nc) ,

de modo que V ar[y c ] < V ar [y], se 0 < c < (YN


−Y1 )/n .
3.42 Discuta a obten¸cão das express˜oes para o tamanho da amostra para os casos
do erro m´aximo relativo para as situa¸ cões AASc e AASs para a média e total
populacionais. No caso da média populacional, por exemplo, queremos n de
modo que
P
y µ

r γ.
µ

3.43 Para amostras de uma AASc de tamanho n de uma popula¸cão com N ele-
mentos, mostre que a probabilidade de que n˜ ao haja elementos repetidos é
dada por ( N ) n /N n , onde (N ) n = N (N 1) . . . (N n + 1).
− −

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 104/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

Cap´ıtulo 4

Amostragem estraticada

Amostragem estraticada consiste na divis˜ ao de uma popula¸cão em grupos (estra-


tos) segundo alguma(s) caracterı́stica(s) conhecida(s) na popula¸ cão sob estudo, e de
cada um desses estratos s˜ ao selecionadas amostras em propor¸ cões convenientes. A
estratica¸cão é usada principalmente para resolver alguns problemas como: a me-
lhoria da precis˜ao das estimativas; produzir estimativas para a popula¸ cão toda e
subpopula¸cões; por quest˜oes administrativas, etc. Aqui ser´ a abordado muito mais o
primeiro motivo.
Foi visto que para uma amostra AASc de tamanho n, a variˆancia do estimador
média amostral, y, é dada por
σ2
V ar[y] =
.
n
Aumentando o tamanho da amostra o erro padr˜ ao diminui. Se a popula¸cão é
muito heterogênea e as raz˜ oes de custo limitam o aumento da amostra, torna-se
impossı́vel denir uma AASc da popula¸ cão toda com uma precis˜ao razo´avel. Uma
saı́da para esse problema é dividir a popula¸ cão em subpopula¸cões internamente
mais homogêneas, ou seja, grupos com variˆ ancias σ 2 pequenas que diminuir˜ ao o erro
amostral global.

Exemplo 4.1 Considere uma pesquisa feita em uma popula¸ cão com N = 8 do-
mic´ılios, onde s˜ao conhecidas as vari´aveis renda domiciliar ( Y ) e local do domic´ılio
(W ), com os códigos A para regi˜ao alta e B para regi˜ao baixa. Tem-se ent˜ ao,

U= {1, 2, 3, 4, 5, 6, 7, 8},
com
y 13 17 6 5 10 12 19 6
D = = .
w B A B B B A A B

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 105/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

94 Amostragem estraticada

Para esta popula¸ cão calcula-se os parˆametros:

µ = 11 e σ2 = 24 .

Para o plano AASc de tamanho n = 4, sabe-se também que


24
V ar[y] = = 6.
4
Usando a segunda vari´ avel para estraticar a popula¸ cão em dois estratos, constr´ oi-se
as seguintes subpopula¸ cões:

UA = {2, 6, 7}, D A = (17 , 12, 19)

UB = {1, 3, 4, 5, 8}, D B = (13 , 6, 5, 10, 6),

com os seguintes parˆametros:

µA = 16, ∼
σA2 = 8, 7, µB = 8 e σB2 = 9 , 2.

Sorteando-se em cada estrato uma amostra AASc de tamanho n = 2, tem-se que


8, 7
V ar [yA ] = ∼2 = 4 , 35

e
9, 2
V ar [yB ] = = 4 , 60.
2
Baseado em yA e yB é preciso construir um estimador para µ, a média populacional.
Será visto adiante que uma possibilidade é considerar
3yA + 5 yB
yes = ,
8
já que 3yA é um estimador para τA e 5y B é um estimador para τB . Será visto
também que
9 25
V ar [y ] = 64 V ar [y ] + 64 V ar [y B ] = 2, 4.
es A

Pode-se ent˜ao medir o efeito do planejamento:
V ar [yes ] 2, 4
EP A =
V ar [y]
= ∼
6, 0
= 0 , 40.

Portanto, com o mesmo tamanho da amostra consegue-se diminuir a variˆ ancia do


estimador em mais da metade.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 106/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

95

O resultado ser´a mais ecaz quanto maior for a habilidade do pesquisador em


produzir estratos homogêneos. O caso limite é aquele onde consegue-se a homoge-
neidade m´axima (variˆancia nula dentro de cada estrato) onde ent˜ ao a estimativa
acerta o parˆametro populacional. A simples estratica¸ cão por si só não produz
necessariamente estimativas mais ecientes que a AAS. O Exemplo 4.2 ilustra tal
situa¸cão.

Exemplo 4.2 Considere agora a mesma popula¸ cão do Exemplo 4.1, porém dividida
nos seguintes estratos:

U1 = {1, 2, 3, 4}, e
U2 = {5, 6, 7, 8},
com os seguintes dados:

D 1 = (13 , 17, 6, 5) e D 2 = (10 , 12, 19, 6)

cujos parˆametros s˜ao:

µ1 = 10, 25, ∼
σ12 = 24, 69, µ2 = 11 , 75 ∼
e σ22 = 22, 19.

Conseq¨uentemente, para a AASc dentro de cada estrato, com n 1 = n 2 = 2, tem-se


que
24, 69

e
V ar[y1 ] =

2 = 12, 34

22, 19
V ar[y2 ] =
2 ∼ = 11, 09. ∼
Finalmente,
16 16
V ar[yes ] =
64
12, 34 +
64
11, 09 = 5, 86, ∼
com
5, 86
EP A =
6, 00∼= 0, 98, ∼
que mostra o plano estraticado com desempenho bastante pr´ oximo ao do plano
AASc para a estratica¸ cão considerada.

A execução de um plano de amostragem estraticada (AE) exige os seguintes


passos:

i. divisão da popula¸cão em subpopula¸cões bem denidas (estratos);

ii. de cada estrato retira-se uma amostra, usualmente independentes;

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 107/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

96 Amostragem estraticada

iii. em cada amostra usam-se estimadores convenientes para os parˆ ametros do


estrato;
iv. monta-se para a popula¸ cão um estimador combinando os estimadores de cada
estrato, e determinam-se suas propriedades.

4.1 Nota¸ cão e rela¸ cões ´uteis


Considere uma popula¸ cão bem descrita por um sistema de referência, ou seja,

U= {1, 2, . . . , N }
U U U
e que exista uma parti¸ cão 1 , . . . , H de , isto é,
H
(4.1)
U= h =1 Uh e
Uh Uh = φ,
para h = h = 1 , . . . , H , e que cada subconjunto
Uh , bem determinado, é identicado
por duplas ordenadas, do seguinte modo:

Uh = {(h, 1), (h, 2), . . . , (h, N h )}.


Assim, o universo todo pode ser descrito por

U= {(1, 1), . . . , (1, N 1 ), . . . , (h, 1), . . . , (h, i ), . . . , (h, N h ), . . . , (H, 1), . . . , (H, N H ) },
de modo a facilitar a identica¸ cão do estrato e do elemento dentro dele. De modo
an´alogo, as caracter´ısticas populacionais ser˜ ao identicadas por dois ı́ndices, ou seja,
no caso univariado, por exemplo, tem-se o vetor de caracterı́sticas populacionais

(4.2) D = ( Y11 , . . . , Y1N , . . . , Yhi , . . . , YHN H ),


1

ou seja, para o estrato 1 tem-se as caracter´ısticas populacionais Y11 , . . . , Y1N 1 e


assim por diante. Pode-se representar também a popula¸ cão com as caracterı́sticas
populacionais e algumas fun¸ cões paramétricas populacionais através da Tabela 4.1.
Eis algumas deni¸cões e relações entre os parˆametros:

• Nh : tamanho do estrato h;
Nh

• τh =
i=1
Yhi : total do estrato h;

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 108/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

4.1 Nota¸ cão e rela¸ cões ´uteis 97

Tabela 4.1: Uma popula¸ cão estraticada


Estrato Dados Total Média Variˆ ancia

1 Y1 τ1 µ1 = Y 1 σ12 ou S 12
.. ... ... ... ...
.

h Yh τh µh = Y h σh2 ou S h2
.. ... ... ... ...
.

H YH τH µH = Y H σH2 ou S H2

onde Y
h = ( Yh 1 , . . . , Y hN h ) é o vetor de dados no estrato h, h = 1,...,H .

Nh
1
• µh = Y h =
Nh i=1
Yhi : média do estrato h;

Nh
1 2
Sh2
• =
Nh
−1 i=1
(Yhi
−µh ) : variˆancia do estrato h;

Nh
1 2
σh2
• =
Nh i=1
(Yhi
−µh ) : variˆancia do estrato h;

H
N = N : tamanho do universo;
• h=1 h

H
Nh
• Wh =
N
: peso (propor¸cão) do estrato h, com
h =1
Wh = 1;

H H Nh H

• τ =
h =1
τh =
h =1 i=1
Yhi =
h =1
N h µh : total populacional;

H Nh H H
τ 1 1
• µ= Y =
N
=
N h =1 i=1
Yhi =
N h =1
N h µh =
h =1
Wh µh : média populacional;

de modo que a média global é a média ponderada dos estratos.


Um resultado bastante importante e também conhecido, envolvendo formas
quadr´aticas, estabelece que (veja o Exercı́cio 4.30)

H Nh H Nh H
2
µh ) 2 + 2
(4.3)
h =1 i=1
(Yhi
− µ) =
h =1 i=1
(Yhi
− h =1
N h (µh
−µ) ,

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 109/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

98 Amostragem estraticada

que permite escrever


H Nh
1 2
σ2 =
N h =1 i=1
(Yhi
−µ)
H Nh H
1
µh ) 2 + 2
=
N h =1 i=1
(Yhi
− h =1
N h (µh
−µ)
H H
1 2
N h σh2 +
=
N h =1 h =1
N h (µh
−µ)
H H
2
Wh σh2 +
(4.4) =
h =1 h =1
Wh (µh
−µ) ,

ou ainda
σ 2 = σd2 + σe2 ,
onde
H
σd2 = Wh σh2
h =1
é a média das variˆ ancias dos estratos (variˆ ancia dentro) e
H
2
σe2 =
h =1
Wh (µh
−µ)
mede a varia¸cão das médias dos estratos (chamar-se-´ a de variˆancia entre estratos).
Para a express˜ao S 2 , tem-se, de modo an´alogo,
H H
S =2 Nh
− 1 2
S +
1 h
Nh
(µh
−µ)
2
,
h =1
N
− h =1
N 1

ou para estratos relativamente grandes,

S2 σd2 + σe2 S d2 + σe2 ,

onde S d2 = H 2
h =1 Wh S h . Convém observar que quando todos os estratos têm a mesma
média, ou seja, µ h = µ, h = 1 , . . . , H , a variˆancia populacional σ2 coincide com σd2 .
Quanto maior for σe2 , maior é a diferen¸ca σ2 σd2 .

Para se obter informa¸ cão sobre as fun¸cões paramétricas de interesse, uma
amostra sh é selecionada do estrato h, h = 1 , . . . , H , de acordo com algum plano
amostral especicado A h , h = 1 , . . . , H . Como no caso da AAS (ver Deni¸cão 2.6),
tem-se associado com a sele¸cão da amostra no h-ésimo estrato as vari´ aveis aleat´orias

(4.5) yh 1 , . . . , y hn h ,

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 110/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

4.1 Nota¸ cão e rela¸ cões ´uteis 99

h = 1 , . . . , H , que assumem os valores Yh 1 , . . . , YhN h , com probabilidades depen-


dendo do plano amostral utilizado.
A nomenclatura usada para denotar estatı́sticas é semelhante ` aquela usada
para denotar as fun¸ cões paramétricas populacionais. Desse modo tem-se

1
yh = Yhi ,
nh i ∈s h

Th = Yhi
i ∈s h

e
2 1 2
sh = nh
− 1 i ∈s (Yhi
h − yh ) ,

que denotam, respectivamente, a média, o total e a variˆ ancia amostral no estrato h,


h = 1 , . . . , H , enquanto que para a amostra toda, s = Hh=1 s h , de tamanho

H
n= nh,
h =1

tem-se que
H
1
y= Yhi ,
n h =1 i ∈s h

H
T = Yhi
h =1 i ∈s h

e
H
1
2
y) 2 .
s =
n
−1 h =1 i ∈ sh
(Yhi

Antes de terminar é importante lembrar algumas propriedades de vari´ aveis
aleat´orias (ver Bussab e Morettin, 2004, Capı́tulo 8). Se X 1 , . . . , X H são vari´aveis
H
aleat´orias independentes, ent˜ ao para X = h =1 lh X h
H
(4.6) E [X ] = lh E [X h ]
h =1

e
H
(4.7) V ar[X ] = lh2 V ar[X h ].
h =1

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 111/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

100 Amostragem estraticada

4.2 Estima¸ cão do total e da m´


edia populacional
Considere a seguinte situa¸ cão:

a. uma popula¸cão estraticada como na se¸ cão anterior;

b. de cada estrato foi sorteada independentemente uma amostra de tamanho nh,


podendo ou n˜ao ter sido usado o mesmo plano amostral dentro de cada estrato;

c. seja µ̂h um estimador n˜ao viesado da média populacional µh do estrato h, ou


seja, E A [µ̂h ] = µh , onde A é o plano usado no estrato h.

Ent˜ao:

Teorema 4.1 O estimador


H
Tes = N h µ̂h
h =1

é n˜ao viesado para o total populacional τ , com

H
V ar A [Tes ] = N h2 V ar A [µ̂h ].
h =1

Prova. Usando as rela¸cões (4.6) e (4.7) tem-se, para um plano amostral A, que

H H H
E A [Tes ] = N h E A [µ̂h ] = N h µh = τh = τ
h =1 h =1 h =1

e
H
V ar A [Tes ] = N h2 V ar A [µ̂h ].
h =1

Corol´ ario 4.1 O estimador

1 H H
y es = N h µ̂h = Wh µ̂h
N h =1 h =1

é um estimador n˜ ao viesado da média populacional µ e

H
V ar A [yes ] = Wh2 V ar A [µ̂h ].
h =1

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 112/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

4.3 Aloca¸ cão da amostra pelos estratos 101

Corol´
ario 4.2 Considere agora que, dentro de cada estrato, a amostra foi sorteada
por um processo AASc e que µ̂h = yh . Ent˜ao, tem-se para as duas situa¸ c˜oes acima
as seguintes f´ormulas:
H H
σh2
Tes = N h yh , V ar [Tes ] = N h2
h =1 h =1
nh
e
H H
σh2
y es = Wh yh , V ar [yes ] = Wh2 ,
h =1 h =1
nh
com estimadores n˜ao viesados dados por
H 2
var [Tes ] = Nh sh
2
h =1
nh
e
H
s 2h
var [yes ] = Wh2 .
h =1
nh

Este procedimento e a sua variante sem reposi¸ cão (veja o Exercı́cio 4.35) é um
dos planos amostrais mais usados em problemas reais.

Exemplo 4.3 (Continua¸cão do Exemplo 4.1) Com os resultados do teorema e co-


rolários ilustrados ca f´acil agora vericar como foram encontradas as variˆ ancias
mencionadas no Exemplo 4.1. Sugere-se ao leitor vericar os resultados obtidos.

4.3 Aloca¸ c˜
ao da amostra pelos estratos
A distribui¸cão das n unidades da amostra pelos estratos chama-se aloca¸ cão da amos-
tra. Essa distribui¸ cão é muito importante pois ela é que ir´ a garantir a precis˜ ao do
procedimento amostral como pode ser visto no Exemplo 4.4.

Exemplo 4.4 Considere agora a popula¸cão do Exemplo 4.1 com a seguinte estra-

tica¸cão:
U1 = {2, 4, 7} com D 1 = (17 , 5, 19)
e

U2 = {1, 3, 5, 6, 8} com D 2 = (13 , 6, 10, 12, 6),


com os seguintes parˆametros populacionais:


µ1 = 13, 7, ∼
S12 = 57, 3, µ2 = 9 , 4 e S22 = 10 , 8.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 113/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

102 Amostragem estraticada

Considere também uma primeira situa¸ cão em que em ambos os estratos usou-se
AASs, com n 1 = 1 e n 2 = 2 (aloca¸cão AL 1 ), ou seja, n = 3. Usando os resultados
do Teorema 4.1 tem-se
2 2
3 1 57, 3 5 2 10, 8
1

V ar AL [yes ] =
8
1
− 3 1
+
8
1
− 5 2 ∼
= 6, 64.

Imagine agora a aloca¸cão contr´aria, isto é, n 1 = 2 e n 2 = 1 (aloca¸cão AL 2 ), de modo


que n = 3, resultando em
2 2
3 2 57, 3 5 1 10, 8
2

V ar AL [yes ] =
8
1
− 3 2
+
8
1
− 5 1 ∼
= 4, 72.

Comparando as variˆ ancias obtém-se


V ar AL [yes ] 6, 64
∼ ∼
1
= = 1, 41,
V ar AL [yes ] 4, 72
2

ou seja, a segunda aloca¸cão reduz a variˆancia, onde se conclui a importˆ ancia do


processo de aloca¸cão.

Antes de prosseguir, convém observar que quanto maior a variˆ ancia do estrato,
maior deve ser também a amostra a ele designada. Porém, deve ser balanceado com
o tamanho do estrato, representado por Wh e f h , h = 1 , . . . , H .
Nas considera¸cões que serão feitas a seguir, as dedu¸cões serão feitas supondo
que dentro de cada estrato foi usado o esquema AASc. Caso seja usado qualquer
outro esquema, pode-se usar o mesmo procedimento para encontrar as propriedades
dos estimadores de interesse.

4.3.1 Aloca¸ cão proporcional


Neste tipo de procedimento a amostra de tamanho n é distribuı́da proporcionalmente
ao tamanho dos estratos, isto é,
Nh
(4.8) n h = nW h = n .
N
Este procedimento, é muitas vezes, também chamado de amostragem “representa-
tiva”. Aqui ser´a usada a nomenclatura Amostragem Estraticada Proporcio-
nal (AEpr) .

Teorema 4.2 Com rela¸c˜ao à AEpr, o estimador yes é igual a média amostral sim-
ples y, com
H
σh2 σ2
Vpr = V ar[y es ] = Wh = d
h =1
n n

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 114/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

4.3 Aloca¸ cão da amostra pelos estratos 103

que é estimado por


H
var [y es ] = Wh s 2h .
h=1
n

Prova. Partindo da média yes e da express˜ao (4.8) tem-se


H H H H
1 1 1
yes = Wh yh = Wh Yhi = Wh Yhi = Yhi = y.
h =1 h =1
nh i ∈s h h =1
nW h i ∈s h
n h =1 i ∈s h

Tem-se também que


nh nW h n
fh = = =
Nh NW h N
e que
Wh2 Wh2 Wh
= = .
nh nW h n
Substituindo em V ar[y es ], juntamente com o Corol´ario 4.2, tem-se que
H H
σ2 σh2 σ2
(4.9) V ar[yes ] = Wh2 h = Wh = d.
h =1
nh h =1
n n

Como dentro de cada estrato, s2h é um estimador n˜ao viesado para σ h2 , ent˜ao
H
s 2h
var [yes ] = Wh
h =1
n

é um estimador n˜ ao viesado de V ar[yes ] = Vpr o que conclui a prova do teo-


rema.

Observe que a express˜ao (4.9) sugere que o plano amostral estraticado pro-
porcional “equivale” a estudar as propriedades do estimador y associado à AASc,
retirada de uma popula¸ cão com variˆancia σd2 . Pede-se ao leitor tentar interpretar
esta arma¸cão e vericar o seu signicado.

4.3.2 Aloca¸ cão uniforme


Na Amostragem Estraticada Uniforme (AEun) atribui-se o mesmo tama-
nho de amostra para cada estrato. É o procedimento indicado quando pretende-se
apresentar estimativas separadas para cada estrato. Para cada um dos H estratos
têm-se
n k
nh = = k e fh = .
H Nh
Deste modo, tem-se o

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 115/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

104 Amostragem estraticada

Corol´ ario 4.3 Com rela¸c˜ao `a AEun, yes é um estimador n˜ ao viesado com variˆancia
expressa por H
σh2
Vun = V ar[yes ] = Wh2
h =1
k
que é estimada por
H
s 2h
var [y es ] = Wh2 .
h =1
k

Prova. Basta aplicar as especica¸cões acima nos resultados do Corol´ario 4.2.

4.3.3 Aloca¸ cão ´otima de Neyman


Nesta se¸cão sert´a discutido o problema de como alocar o tamanho da amostra pe-
los vários estratos de tal forma que certas condi¸ cões sejam vericadas. Para isso
considera-se uma fun¸cão de custo de forma linear, isto é,
H H
(4.10) C = c0 +
h =1
ch n h ou C = C
− c0 =
h =1
ch n h ,

onde c0 denota o custo inicial, ch o custo por unidade observada no estrato h eC


o custo vari´avel. De acordo com o Corol´ario 4.2, escreve-se
H 2
2 σh
V ar[yes ] = h =1
Wh n h = Ves .

Mais especicamente, o problema é minimizar Ves para C xado ou minimizar


C para Ves xado. Este problema tem uma solu¸ cão única e bastante simples quando
se utiliza a desigualdade de Cauchy–Schwarz,
2
a 2h b2h
(4.11)
≥ a h bh ,

de modo que a igualdade ocorre quando


bh
= k (constante) ,
ah
para h = 1 , . . . , H .

Teorema 4.3 Na AE com a fun¸c˜ao de custo linear, temos que Ves é m´ınimo para
C xado ou C é m´ınimo para Ves xado se

(4.12) nh = n

Wh σh / ch
, h = 1, . . . , H .
H
h =1 Wh σh / ch √

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 116/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

4.3 Aloca¸ cão da amostra pelos estratos 105

Prova. O problema consiste ent˜ao em minimizar


H
σh2
(4.13) Ves = Wh2
h =1
nh

sujeito a um custo xo C , ou minimizar o custo C para uma variˆancia Ves


xada. Ent˜ao, minimizar Ves para C xado ou C para Ves xado é equivalente
a minimizar o produto
H H
σh2
(4.14) Ves C = Wh2 ch n h .
h =1
nh h =1

Identicando o produto Ves C em (4.14) com o lado esquerdo da desigualdade


de Cauchy–Schwartz, tem-se que

ah =
Wh σh

nh
e bh = √ch n h ,
de modo que o produto Ves C em (4.14) é mı́nimo quando

(4.15)
bh
=

ch n h
=
n h ch
= k,

ah Wh σh / n h √
Wh σh

h = 1 , . . . , H , onde k é uma constante. Tem-se ent˜ ao de (4.15) que o produto


Ves C é m´ınimo quando
nh = k W σ ,
h h
(4.16)
ch √
H
h = 1 , . . . , H . Como h =1 n h = n, tem-se de (4.16) que
n
(4.17) k= H
h =1 Wh σh / √ch .
Substituindo-se (4.17) em (4.16), obtém-se o resultado (4.12).

Portanto, de acordo com o Teorema 4.3, o n´ umero ´otimo de unidades a serem


observadas no estrato h é diretamente proporcional a N h σh e inversamente propor-
cional a
√ch . Tem-se também (veja o Exerc´ıcio 4.29)
Corol´
ario 4.4

i. Para C xado, o tamanho ´otimo da amostra é dado por

(4.18) n= C
H
h =1 N h σ h / √ch ;
H
h =1 N h σ h √ch

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 117/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

106 Amostragem estraticada

ii. Para Ves xado, o tamanho ´otimo da amostra é dado por


H H
Wh σh √ch
1 Wh σh
(4.19) n= ,
Ves h =1 h =1
√ch

onde Wh = N h /N , como antes.

Corol´ ario 4.5 Para o caso em que o custo por unidade observada em todos os
estratos seja xado em c, isto é,

C = C
−c0 = nc,
a aloca¸c˜ao ´otima se reduz a
N h σh
(4.20) nh = n H ,
h =1 N h σ h

h = 1 , . . . , H . Neste caso Ves reduz-se a


H 2
1 σ2
(4.21) Vot = Wh σh = ,
n h =1
n

H
onde σ = h =1 Wh σh é um desvio padr˜ao médio dentro de cada estrato.

A alocação (4.20) é usualmente conhecida por aloca¸ cão ótima de Neyman.


Neste caso, o n´umero de unidades a serem observadas no estrato h é proporcional a
N h σh .

4.3.4 Efeito do planejamento


O resultado a seguir apresenta compara¸ cões entre a utiliza¸cão de um planejamento
AE com aloca¸cão proporcional, a de um planejamento com aloca¸ cão ótima e a uti-
lização de um planejamento AAS com reposi¸ cão. Seja

σ2
Vc = V arAASc [y] =
n
e como visto no Teorema 4.2, para a aloca¸ cão proporcional,
H
1 σ2
(4.22) Vpr = Wh σh2 = d ,
n h =1 n

corresponde `a AE com aloca¸cão proporcional. E para a aloca¸ cão ótima com n xo,
temos a variˆancia Vot dada por (4.21).

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 118/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

4.3 Aloca¸ cão da amostra pelos estratos 107

Teorema 4.4 Com rela¸c˜ao à AASc, tem-se que

Vot
≤Vpr ≤Vc .
Prova. De acordo com (4.4), tem-se que
H Nh
2
µ) 2
Nσ =
h =1 i=1
(Yhi

H H
2
N h σh2 +
(4.23) =
h =1 h =1
N h (µh
−µ) .

2
Ent˜ao, σ em (4.23) pode ser escrita como
H H
2
Wh σh2 2
= σd2 + σe2 .
σ =
h =1
+
h =1
Wh (µh
−µ)
Conseq¨uentemente, escreve-se
σd2 σ2 σ2
Vc = + e = Vpr + e .
n n n
J´a que σe2 /n é sempre n˜ao negativo,

Vc
≥Vpr .
Por constru¸cão, sabe-se que Vot
≤Vpr . Por outro lado, (veja o Exercı́cio 4.31)
H H 2
1
Wh σh2
Vpr
−Vot =
n h =1
− h =1
Wh σh

H 2
1 2
σdp
(4.24) =
n h =1
Wh (σh
− σ) =
n
H 2
onde, como em (4.21), σ = h =1 Wh σ h , que juntamente com σdp , indica a
variabilidade entre os desvios padr˜ oes dos estratos. Quanto maior for a hete-
rogeneidade dos dados pelos estratos, com mais ênfase recomenda-se o uso da
alocação ótima. Portanto,

Vc = Vpr + σe = Vot + σe + σ .
2 2 d2p
(4.25)
n n n
Estas ´ultimas express˜oes demonstram o teorema e permitem concluir quando
deve ser usada cada aloca¸cão. Assim, sempre que os estratos tiverem médias
distintas ( σe2 grande) deve-se usar aloca¸ cão proporcional ou ´otima. Se além
2
disso, também os desvios padr˜ oes de cada estrato diferirem muito entre si ( σdp
grande), recomenda-se a aloca¸ cão ótima.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 119/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

108 Amostragem estraticada

Com os resultados do Teorema 4.4 deriva-se os efeitos do planejamento para


cada um dos planos acima. Assim,
V arAEpr [yes ] Vpr
EP A [AEpr] = =
V ar AASc [y] Vc
H
1 σ e2
µ) 2 = 1
= 1
− σ2 h =1
Wh (µh
− − σ2
.

Ou seja, se 1/N h for desprez´ıvel, o plano estraticado proporcional produz variˆ ancias
sempre menores que aquelas produzidas por uma AASc de mesmo tamanho, e este
ganho é maior quanto maior for σe2 , isto é, quanto maior for a diferen¸ ca entre as
médias dos estratos. Para amostras muito grandes, o lucro desaparece.
Para a aloca¸cão ótima (AEot) tem-se que
V arAEot [yes ] Vot
EP A [AEot] = =
V ar AASc [y] Vc
H
σe2 1 2
= 1
− nVc − nVc h =1
Wh (σh
−σ)
2
σdp σe2
(4.26) = 1
σ2
.
− − σ2
Observe novamente que o EP A é sempre menor do que 1, mostrando a vantagem
do uso deste plano. Esta vantagem (lucro) cresce com o aumento da diferen¸ ca entre
2
as médias dos estratos, isto é, σ e grande. Observe que o ´ultimo termo da express˜ ao
mede a variabilidade dos desvios padr˜ oes dos estratos, o que signica que o ganho
da aloca¸cão ótima cresce com a diferen¸ca entre as variabilidades dos estratos.
O conhecimento destes fatos é important´ıssimo para orientar o estat´ıstico a
desenhar o plano amostral mais conveniente. A n˜ ao ser em situa¸cões muito parti-
culares, o plano AE produz variˆ ancias sempre menores do que as correspondentes
variˆancias obtidas com o plano AASc. A prova algébrica deste resultado é bas-
tante trabalhosa. Entretanto, considere uma situa¸ cão particular, onde esta rela¸ cão
pode ser explorada. Suponha que dentro de cada estrato foi usado o plano AASc
(denotado por AEc), de modo que
H
V arAEc [yes ] h =1 Wh2 σh2 /n h
EP A [AEc] = =
V ar AASc [y] σ 2 /n
H H 2
Wh2 σh2 Wh σh
(4.27) = = Wh ,
h =1
n h /n σ 2 h =1
wh σ
onde wh = n h /n , h = 1 , . . . , H . Observando-se a express˜ao acima verica-se a
diculdade em se concluir se a mesma é maior ou menor do que 1. Usualmente o

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 120/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

4.4 Normalidade assint´ otica e intervalos de conan¸ ca 109

processo de estratica¸ cão leva a uma maior homogeniza¸ cão dos dados, de modo que
σh /σ < 1 e por estar elevado ao quadrado poderia anular situa¸ cões onde Wh /w h > 1,
o que levaria ao somat´orio acima ser menor do que 1, ou seja, a variˆ ancia da AE
seria menor do que a variˆancia obtida com o plano AASc. Entretanto é possı́vel
construir contra exemplos onde isso n˜ ao se verica (ver Exercı́co 4.34).

4.4 Normalidade assint´ otica e intervalos de conan¸ ca


Conforme o tamanho da amostra aumenta, as distribui¸ cões de yes e de Tes = τ̂ es
vão se aproximando da distribui¸ cão normal, de acordo com o TLC. Estes resultados

continuam valendo com as aloca¸ cões discutidas nas se¸cões anteriores. Veja o Capı́tulo
10, onde condi¸cões são estabelecidas para a validade do TLC. Ent˜ ao, para n h e Nh
sucientemente grandes, temos que

(4.28)
H
y es µ
2 2
− a
∼N (0, 1)
h =1 Wh σ h /n h

e que,
(4.29)
N
τ̂ es
−2τ 2 a
∼N (0, 1).
h =1 N h σh /n h

Como σ h2 não é conhecido nas express˜ oes (4.28) e (4.29), ele é substituı́do por
seu estimador n˜ao viciado s 2h , considerado na Se¸cão 4.1. Usando o mesmo enfoque da
Seção 3.2.4, temos que um intervalo de conan¸ ca para µ com coeciente de conan¸ca
aproximadamente igual a 1

α é dado por

H H
s2 s 2h
Wh2 h Wh2
y es


h =1
nh
; y es + zα
h =1
nh
.

Um intervalo para τ pode ser obtido de modo an´alogo.

4.5 Determina¸ cão do tamanho da amostra


Utilizando (4.28), pode-se determinar n de modo que

| −µ| ≤B )
P ( y es 1
−α,
onde
H
σh2
(4.30) B = zα Wh2 .
h =1
nh

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 121/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

110 Amostragem estraticada

Dado que a equa¸cão (4.30) depende de n h e não de n diretamente, ser´ a consi-


derado que
n h = nw h ,

onde wh é conhecido, h = 1 , . . . , H . Em particular, pode-se considerar wh = Wh =


N h /N , resultando em
H
1 σd2
(4.31) n= Wh σh2 = ,
D h =1
D

onde D = B 2 /z α2 , como antes. A correspondente express˜ ao para n no caso da


estima¸cão do total populacional é considerada no Exercı́cio 4.28.

4.6 Estima¸ cão de propor¸ cões


Como um caso particular das situa¸ cões estudadas nas se¸cões anteriores, aparece a
situa¸cão onde o interesse é estudar a ocorrência de determinada caracterı́stica na
popula¸cão. Tal caracterı́stica pode ser, por exemplo, a preferência por determinado
partido polı́tico, por um candidato em uma elei¸ cão, por determinada marca de pro-
duto, e assim por diante. Nestas situa¸ cões, a quantidade de interesse associada ao
j -ésimo elemento no h-ésimo estrato pode ser representada por

Yhi = 1, se o elemento (h, i ) possui a caracterı́stica .


0, caso contr´ario

Sendo τ h = Ni=1 Yhi , o número de elementos que possuem a caracter´


h
ıstica no
estrato h, tem-se que
τh
Ph = = µh
Nh
é a propor¸cão de elementos que possuem a caracterı́stica no estrato h, h = 1 , . . . , H .
Ent˜ao, a propor¸cão de elementos na popula¸cão que possui a caracterı́stica pode ser
escrita como
H
P = Wh P h ,
h =1

onde Wh = N h /N , como nas seções anteriores. Dada uma amostra sh de tamanho n h


selecionada segundo a AASc no estrato h, pode-se ent˜ao denir para P o estimador
H
P̂ es = pes = yes = Wh P̂ h ,
h =1

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 122/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

4.6 Estima¸ c˜
ao de propor¸ cões 111

onde
P̂ h = ph = yh = nThh
e Th é o número de elementos na amostra que possuem a caracter´ıstica no estrato
h, h = 1 , . . . , H .
Identicando pes com yes , e usando o fato de que
Nh
1
σh2 P h ) 2 = P h (1
=
Nh i=1
(Yhi
− −P h ),
conforme vericado na Se¸cão 3.2.6, temos o (veja o Exercı́cio 4.32)

Teorema 4.5 Com rela¸c˜ao à AE com reposi¸c˜ao, tem-se que


H
pes = P̂ es = yes = Wh P̂ h ,
h =1

é um estimador n˜ ao viciado de P com


H
P h Qh
(4.32) Ves = V ar P̂ es = Wh2 ,
h =1
nh

onde Qh = 1
−P h , h = 1 , . . . , H .
O resultado a seguir é uma consequência direta do Teorema 3.5. Veja o
Exercı́cio 4.33.

Teorema 4.6 Um estimador n˜ao viciado de Ves com rela¸c˜ao à AE com reposi¸c˜ao é
dado por
H
P̂ h Q̂ h
V̂es = Wh2 ,
h =1
nh 1

onde Q̂ h = 1
−P̂ h .
Utilizando a aproxima¸ cão normal discutida na Se¸ cão 4.4, encontra-se um in-
tervalo de conan¸ca aproximado para P . Dado o coeciente de conan¸ca γ = 1 α ,

segue dos Teoremas 4.5 e 4.6 que um intervalo de conan¸ ca para P com coeciente
de conan¸ca aproximadamente γ , é dado por

H H
P̂ h Q̂ h P̂ h Q̂ h
Wh2 Wh2
P̂ es
−zα h =1
nh 1

; P̂ es + zα
h =1
nh 1

.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 123/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

112 Amostragem estraticada

H
Usando a fun¸cão de custo linear C = c0 + h =1 ch n h , a alocação ótima segue
diretamente do Teorema 4.3 e é dada por
Nh P h Q h /c h
nh = n H .
h =1 N h P h Q h /c h

Quando o custo é constante, do Corol´ ario 4.5 tem-se que a aloca¸cão ótima de
Neyman passa a ser
(4.33) nh = n H
Nh P h Q h √ .
h =1 N h P h Q h

Não dispondo de informa¸cão preliminar sobre P h , como amostras pilotos ou pesquisas

anteriores, substitui-se P h Q h por 1/ 4 na express˜ao (4.33), por ser um limı́te superior,


levando a aloca¸cão proporcional.
Verique a aplicabilidade dos Corol´ arios 4.4 e 4.5 para o caso das propor¸cões.

Exerc´ıcios
4.1 Uma popula¸cão est´a dividida em 5 estratos. Os tamanhos dos estratos, médias
(µh ) e variˆancias ( S h2 ) são dadas na tabela abaixo.

h N µ S2
h h h
1 117 7,3 1,31
2 98 6,9 2,03
3 74 11,2 1,13
4 41 9,1 1,96
5 45 9,6 1,74

a. Calcule µ e σ2 para esta popula¸ cão.


b. Para uma amostra de tamanho 80, determine as aloca¸ cões proporcional
e ótima (de Neyman).
c. Compare as variˆancias dos estimadores obtidos com a AASc e com a AE
com aloca¸cão ótima.
d. Fa¸ca o mesmo para a AASc e a aloca¸cão proporcional.

4.2 Uma popula¸cão foi dividida em dois estratos, conforme resultados expressos
pela tabela abaixo.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 124/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

4.6 Estima¸ c˜
ao de propor¸ cões 113

h Wh σh ch
1 0,4 10 4
2 0,6 20 9

Considere o custo linear, c0 = 0 e AASc.

a. Encontre n 1 /n e n 2 /n que minimiza o custo total para um dado valor de


Ves .
b. Encontre o tamanho da amostra sob a aloca¸ cão ótima (a) quando Ves = 1.
Qual ser´a o custo total?

4.3 Em uma estrati¸cão com dois estratos, os valores de Wh e σh são dados na


tabela abaixo.

h Wh σh
1 0,8 2
2 0,2 4

Calcule em cada caso, com AASc, os tamanhos das amostras n 1 e n 2 que


satisfazem as seguintes condi¸ cões:

a. O desvio padr˜ao da estimativa yes é 0,1 e n = n 1 + n 2 tem que ser


minimizado;
b. O desvio padr˜ao da estimativa da média em cada estrato tem que ser 0,1;
c. O desvio padr˜ao da diferen¸ca entre as médias estimadas em cada estrato
tem que ser igual a 0,1.

4.4 Planejou-se uma amostragem estraticada com reposi¸ cão para estimar a por-
centagem de famı́lias tendo conta em caderneta de poupan¸ ca e também da
quantidade investida. De uma pesquisa passada, tem-se estimativas para as
propor¸cões Ph e para os desvios padr˜oes das quantidades investidas, σh , con-

forme descrito na tabela abaixo.


h Wh Ph σh
1 0,6 0,20 9
2 0,3 0,40 18
3 0,1 0,60 52

Calcule os menores n e n h que satifa¸cam, com custo constante:

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 125/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

114 Amostragem estraticada

a. A propor¸cão populacional dever ser estimada com erro padr˜ ao igual a


0,02;
b. A quantidade média investida deve ser estimada com erro padr˜ ao igual a
R$ 2,00.

Qual dos tamanhos, em (a) ou em (b), você usaria na pesquisa? Por que?

4.5 Refaça o Exercı́cio 4.1 considerando agora AASs dentro dos estratos.

4.6
U {
Considere a popula¸cão do Exemplo 4.1 com a estratica¸ cão 1 = 1, 2, 4, 7
}
U { }
e 2 = 3, 5, 6, 8 . Considere amostras AASc de tamanho 2 de cada um dos
estratos. Encontre a variˆ ancia do estimador y es e o erro quadr´atico médio do
estimador ym , denido em (4.35). Qual é o melhor estimador?

4.7 Considere a estratica¸ cão do Exemplo 4.2. Encontre E [yes ] e V ar[yes ] quando:

a. n 1 = 1 e n 2 = 3;
b. n 1 = 3 e n 2 = 1.

4.8 Numa popula¸cão dividida em 3 estratos, tem-se os seguintes pesos Wh e pro-


por¸cões P̂ h obtidas com uma amostra piloto:

h Wh P̂ h
1 0,5 0,52
2 0,3 0,40
3 0,2 0,60

a. Se fôssemos usar uma amostra casual simples (AASc) de 600 elementos,


qual seria a estimativa da variˆ ancia da estimativa da propor¸ cão popula-
cional?
b. Que tamanho deveria ter uma amostra estraticada proporcional para
produzir a mesma variˆ ancia anterior?
c. Com n igual ao obtido em (b), como seria a reparti¸ cão ótima e qual a
variˆancia?
d. Compare os resultados e diga quais as suas conclus˜ oes.

4.9 Considere a popula¸cão da Tabela 2.8.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 126/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

4.6 Estima¸ c˜
ao de propor¸ cões 115

a. Selecione uma AASc de tamanho n = 54. Calcule y e V ar[y].


b. Divida a popula¸cão em 3 estratos, onde as primeiras 60 unidades formam
o primeiro estrato, as segundas 60 unidades formam o segundo estrato e
assim por diante. Selecione uma amostra AASc de 18 unidades de cada
estrato. Encontre yes e calcule V ar[y es ].
c. Compare os resultados encontrados em (a) e (b).

4.10 Usando os dados do Exemplo 4.1:

a. Construa o espa¸co amostral


SAASs ( U) para o plano AASs e a distribui¸ cão
de y para n = 4;
b. Considere o plano AE com n 1 = n 2 = 2 (aloca¸cão uniforme) e construa
S U
AEun ( ), e a distribui¸cão amostral de yes ;

c. Compare as distribui¸ cões obtidas em (a) e (b).

4.11 Considere a popula¸cão dos 50 maiores municı́pios do Brasil disponibilizada


no site do IBGE. Divida a popula¸ cão em dois estratos, onde no primeiro estrato
estejam os 10 maiores municı́pios e no segundo estrato os 40 restantes.

a. Selecione uma AASc de 5 municı́pios de cada estrato e calcule a estimativa


yes e a estimativa de sua variˆancia.
b. Considerando aloca¸cão proporcional, selecione uma amostra AASc de 10
municı́pios da popula¸ cão e calcule a estimativa de µ, juntamente com a
estimativa de sua variˆ ancia.
c. Considerando aloca¸cão ótima de Neyman, selecione uma amostra AASc
de 10 municı́pios, considerando os valores populacionais das variˆ ancias de
cada estrato. Encontre a estimativa de µ juntamente com a estimativa
de sua variˆancia.
d. Retire uma amostra piloto de 3 unidades de cada estrato e calcule es-
timativas da variˆ ancia em cada estrato. Recalcule a aloca¸ cão ótima de
Neyman usando esses novos valores. Encontre uma estimativa de µ com
a estimativa de sua variˆ ancia.
e. Compare os resultados em (a)-(d).

4.12 Os dados abaixo se referem a uma popula¸ cão dividida em dois estratos e em
que ch é o custo de amostrar um elemento do estrato h. O custo previsto para
o levantamento é de 9.000 unidades de dinheiro (ud).

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 127/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

116 Amostragem estraticada

h Wh Ph ch
1 0,25 0,20 9
2 0,75 0,80 1

a. Que valores de n 1 e n 2 irão produzir a menor variˆ ancia para a propor¸ cão


total P ? Quais os valores de V ar[pes ] e V ar P̂ 1 P̂ 2 para esta aloca¸cão?

b. Qual a aloca¸cão para uma AE proporcional? Quais os valores de V ar[pes ]


e V ar P̂ 1 P̂ 2 neste caso?

c. Encontre os valores de n 1 e n 2 que minimizam V ar P̂ 1


−P̂ 2 . E neste
caso, quais as variˆancias acima?

d. Suponha agora que o custo é o mesmo em ambos os estratos e vale 3 ud.


Qual o valor de V ar[pes ] para a aloca¸cão ótima? Encontre a aloca¸ cão


para V ar P̂ 1 P̂ 2 e o seu valor.

4.13 Possuı́mos a seguinte informa¸ cão sobre o número de alfabetizados de uma


região de 100 mil pessoas:

Estrato Grupo et´ ario N o de pessoas Propor¸cão de alfabetizados

1 15 a 24 25.000 0,50
2 25 a 34 20.000 0,30
3 35 a 49 40.000 0,10
4 50 ou mais 15.000 0,01

Queremos planejar uma amostra para, daqui a 6 meses, ap´ os um programa de


alfabetiza¸cão, estimar a propor¸ cão de alfabetizados.

a. Qual deve ser o tamanho numa amostragem estraticada proporcional


para que o coeciente de varia¸ cão do estimador seja 10%? Determine a
alocação da amostra pelos estratos. Sugest˜ ao: considere 1/N 0.
b. Compare a aloca¸cão proporcional com a aloca¸cão ótima, supondo o mesmo
tamanho geral que aquele obtido em (a) e o mesmo custo unit´ ario para
obter cada informa¸ cão.

c. Se os custos de obter as informa¸cões pelos estratos forem 9, 4, 4 e 1, e se


pudéssemos gastar R$ 1.725,00, qual seria a aloca¸ cão ótima ?

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 128/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

4.6 Estima¸ c˜
ao de propor¸ cões 117

4.14 Para estimar o n´umero médio de empregados por ind´ ustria, resolveu-se con-
duzir uma AE proporcional ao tamanho do estrato, com as ind´ ustrias estrati-
cadas de acordo com o faturamento. A constitui¸ cão da popula¸cão e os dados
obtidos em uma amostra de 1.000 ind´ ustrias seguem abaixo.

h Faturamento Nh nh yh Sh2
1 Baixo 4.000 200 80 1.600
2 Médio-baixo 10.000 500 180 2.500
3 Médio-alto 5.400 270 270 2.500
4 Alto 600 30 400 5.600

onde N h é o número de ind´ustrias, n h é o tamanho da amostra, yh é o número


médio de empregados e

a. Estime o n´umero médio µ e o total τ de empregados.


b. Estime as variˆancias dos estimadores de µ e τ .
c. Se os custos para cada unidade em cada estrato é dado por ch = 3+ h, h =
1, 2, 3, 4, qual seria a parti¸cão ideal para as 1.000 unidades amostradas,
através dos 4 estratos? (Use as variˆ ancias amostrais como variˆ ancias
populacionais.)

d. Supondo que as 1.000 unidades foram obtidas como amostra casual sim-
ples, como seria a variˆancia do estimador da média populacional? Calcule
o quociente entre as variˆ ancias obtidas em (b) e aqui, comentando o re-
sultado.

4.15 Para investigar o rendimento médio dos empregados no setor banc´ ario de
uma grande cidade, criaram-se dois estratos. Um formado pelos empregados
dos bancos estatais ou mistos e outro pelos empregados da rede privada. De
cada um desses estratos foi retirada uma amostra aleat´ oria simples, e realizados
os estudos de interesse. Agora h´a interesse em estimar, baseando-se na mesma
amostra, o total dos rendimentos das mulheres empregadas pelo setor banc´ ario.
Você foi encarregado de apresentar um estimador e sua respectiva variˆ ancia,
denindo os parˆametros e vari´aveis usadas.

4.16 Deseja-se estimar o n´umero de moradores numa dada regi˜ ao. Por quest˜oes
de interesse e devido ao grau de informa¸ cão, a região foi dividida em 3 estra-
tos. Decidiu-se usar, dentro de cada estrato, amostragem em dois est´ agios,

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 129/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

118 Amostragem estraticada

adotando-se grupos de casas como UPA, e casa como USA. Em cada casa,
contou-se o n´umero y de moradores.
i. No estrato 1, as UPA’s têm tamanhos diferentes e sortearam-se duas
UPA’s com probabilidade proporcional ao tamanho (PPT), com reposi¸ cão
e, de cada UPA, subsortearam-se, tamb´
em com reposi¸ cão, duas casas.
ii. No estrato 2, tamb´em os quarteir˜ oes tinham um n´umero diferente de ca-
sas, e sortearam-se duas UPA’s com igual probabilidade, e entrevistaram-
se todas as casas.
iii. No estrato 3, as UPA’s foram criadas de igual tamanho e, de cada uma

das UPA’s sorteadas, sem reposi¸ cão, entrevistaram-se duas casas também
sorteadas sem reposi¸cão.

Resumindo, temos:

Total de N o de casas na No de moradores


Estrato
casas UPA sorteada nas USA’s sorteadas
10 5, 3
1 500
18 5, 6

3 2, 10, 3
2 300 6 5, 4, 8, 3, 2, 4

10 4, 7
3 200
10 6, 9

Produza um intervalo de conan¸ ca, explicando cada estimador usado, para:

a. o total de moradores de cada estrato;


b. o total de moradores da regi˜ ao.

4.17 Será colhida uma amostra estraticada de uma popula¸ cão. O custo direto
será da forma C = H h =1 n h ch . E a estimativa das quantidades relevantes para
resolver problema s˜ao:

h Wh Sh ch
1 0,4 10 4
2 0,6 20 9

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 130/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

4.6 Estima¸ c˜
ao de propor¸ cões 119

Considere os f h ’s iguais a zero.

a. Quais os valores de n 1 /n e n 2 /n que minimizam o custo direto para um


dado valor de V ar[yes ]?
b. Quais os valores de n 1 e n 2 quando V ar[y es ] = 1?

4.18 Planejou-se uma amostra estraticada para estimar a porcentagem das famı́lias
tendo conta em caderneta de poupan¸ ca e o valor médio aplicado por famı́lia.
De uma pesquisa passada, têm-se estimativas das porcentagens P h e dos des-
vios padr˜oes Sh da quantidade investida, conforme descrito na tabela abaixo.

h Wh Ph Sh
1 0,6 0,20 9
2 0,3 0,40 18
3 0,1 0,60 52

Calcule o menor n e os respectivos n h ’s que satisfazem:

a. A porcentagem de famı́lias deve ser estimada com erro padr˜ ao (EP ) igual
a 2 e o valor médio aplicado com EP = 50;
b. A porcentagem dever´ a ser estimada com EP = 1 , 5 e o valor médio com
EP = 50.

4.19 As fazendas produtoras de leite numa certa regi˜ ao geográca foram agrupa-
das em 4 categorias (estratos), dependendo da sua ´ area e do fato de se concen-
trarem em produzir exclusivamente leite ou n˜ ao. Uma pesquisa para estimar
o número total de vacas produtoras de leite na regi˜ ao usou uma amostra de 28
fazendas, alocando-se a cada categoria um n´ umero de fazendas proporcional
ao total de fazendas nessa categoria. Os n´ umeros de fazendas em cada estrato,
as quantidades de vacas nas fazendas selecionadas e algumas estatı́sticas est˜ ao
na tabela abaixo.

h Nh No de vacas
61, 47, 44, 70, 28, 39,
1 72
51, 52, 101, 49, 54, 71
2 37 160, 148, 89, 139, 142, 93
3 50 26, 21, 19, 34, 28, 15, 20, 24
4 11 17, 11

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 131/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

120 Amostragem estraticada

a. Estime o total de vacas produtoras de leite na regi˜ ao, produzindo um


intervalo de conan¸ca de 90% para o mesmo.
b. Se os custos de amostragem em cada categoria s˜ ao os mesmos, qual seria
a aloca¸cão ótima das categorias? Use os resultados obtidos em (a).

4.20 Uma cadeia de lojas est´a interessada em estimar dentro das contas a receber,
a propor¸cão das que dicilmente ser˜ao recebidas. Para reduzir o custo da
amostragem, usou-se AE com cada loja num estrato. Os dados obtidos foram
os seguintes:

h Nh nh P̂ h
1 60 15 0,30
2 40 10 0,20
3 100 20 0,40
4 30 6 0,10

onde N h é o número de contas a receber, n h é o tamanho da amostra e P̂ h é a


propor¸cão de contas problem´aticas. Dê uma estimativa para a propor¸ cão total
de quatro lojas e um intervalo de conan¸ ca de 95% para a mesma.

4.21 O quadro abaixo nos d´a os tamanhos e os desvios padr˜ oes da vari´avel Y
dentro de três estratos em que uma popula¸ cão foi dividida.

h Nh Sh
1 2.500 8
2 850 24
3 130 80

a. Em uma amostragem estraticada de 10% dessa popula¸ cão, qual a par-


tilha ´otima dessa amostra?

b. Compare a variˆancia da média obtida no plano acima com a da média


obtida por uma AAS e cujo desvio padr˜ ao geral é S = 18.

4.22 Uma popula¸cão de N = 1 .600 setores censit´arios (SC) de uma cidade foi
dividida em 4 estratos. A vari´ avel X indica o número de domicı́lios por SC
e Y o número de domicı́lios alugados. A tabela abaixo fornece os principais
valores.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 132/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

4.6 Estima¸ c˜
ao de propor¸ cões 121

h Nh nh xh yh var [x h ] var [yh ]


1 624 25 225 150 2.527 1.879
2 325 25 360 270 4.215 3.626
3 345 25 444 298 5.914 5.226
4 306 25 212 150 1.623 1.078

a. Calcule a fra¸cão amostral f h = n h /N h , h = 1 , 2, 3, 4. Calcule também


quais seriam os tamanhos das amostras se fosse utilizada a aloca¸ cão pro-
porcional. “Em uma amostragem estraticada proporcional, os tamanhos
das amostras s˜ao iguais entre si se...” (complete a frase).

b. Calcule xes e E P [x es ].
c. Calcule Nx es e EP [Nx es ].

4.23 Suponha que no exercı́cio anterior você pode aumentar o tamanho da amos-
tra no primeiro estrato para n 1 = 125.

a. O que vai acontecer com a var [x 1 ]?


b. Calcule a var [x es ]. Embora a amostra tenha duplicado, o lucro na variˆ ancia
foi correspondente?

c. Como caria a var [x es ] se o aumento tivesse sido com n 1 = n 2 = n 3 =


n 4 = 50?
d. Se você tivesse que aumentar a amostra para 125 em um ´ unico estrato,
qual seria o estrato escolhido? Por quê?

Te´oricos
4.24 Com dois estratos, um pesquisador considera a aloca¸ cão uniforme ( n 1 = n 2 ),
por conveniência administrativa, ao invés de usar a aloca¸ cão ótima. Sejam Vun
e Vot as variˆancias dadas pelas duas aloca¸ cões. Mostre que
2
(4.34)
Vun
V
−Vot
= −
r 1
r +1
,
ot

onde r = n 1 /n 2 , sendo que n 1 e n 2 correspondem `a aloca¸cão ótima. Encontre


o valor da express˜ao (4.34) para os estratos do Exerc´ıcio 4.3, (a). Assuma
AASc.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 133/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

122 Amostragem estraticada

4.25 Se a função de custo é da forma


H
C = C
−c0 = h =1 ch √n h ,
onde c0 e ch são números conhecidos, mostre que para minimizar Ves para C
xo, n h tem que ser proporcional a
2/ 3
Wh2 σh2
.
ch

Encontre n h para uma amostra de tamanho 1.000, com as seguintes condi¸ cões

h Wh σh ch
1 0,4 4 1
2 0,3 5 2
3 0,3 6 4

4.26 Mostre que na estima¸cão da propor¸cão com AASc, os resultados correspon-


dentes ao Teorema 4.4 s˜ ao
H
2
Vc = Vpr +
h =1
Wh (P h
−P ) ,
H 2
1
Vpr = Vot +
n h =1
Wh P h Qh
− P h Qh ,

onde
H
Ph Qh = Wh Ph Qh .
h =1

4.27 Mostre que o estimador


H
nh
(4.35) ym = y
h =1
n h

é um estimador viciado de µ, a não ser que


nh Nh
= , h = 1, . . . , H .
n N
4.28 Encontre a express˜ao para n correspondente a (4.31) quando é de interesse
a estima¸cão do total populacional.

4.29 Prove o Corol´ario 4.4.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 134/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

4.6 Estima¸ c˜
ao de propor¸ cões 123

4.30 Verique a validade das express˜oes (4.3), utilizando Yhj


−µ = ( Yhj −µh ) +
(µh
−µ).
4.31 Mostre que Vpr
−Vot é como dado na express˜ao (4.24).
4.32 Prove o Teorema 4.5.

4.33 Prove o Teorema 4.6.

4.34 Encontre o erro quadr´ atico médio do estimador ym dado em (4.35).

4.35 Considere uma popula¸cão dividida em H estratos e a nota¸cão da Seção 4.1.


Suponha que de cada estrato uma amostra de tamanho n h é selecionada sem
reposi¸cão (AASs). Seja yh a média da amostra selecionada em cada estrato.
Considere novamente o estimador y es .

a. Verique se yes é n˜ao viciado para µ;


b. Encontre V ar[yes ].
c. Sugira um estimador n˜ao viciado para V ar[yes ].
d. Discuta a aloca¸cão ótima para yes com AASc.

4.36 (Otimalidade de yes na AE com reposi¸c˜ao.) Considere a classe dos estima-


dores lineares de µ,
H nh
yes = hi yhi ,
h =1 i=1

{ }
com rela¸cão á AE, onde sh = 1, . . . , n h , h = 1 , . . . , H .

a. Mostre que o estimador yes é n˜ao viciado para µ, se e somente se,


Nh
hi = .
i ∈s h
N

b. Mostre que
H nh
Nh
S h2 2
V ar[yes ] =
h =1 i=1
hi
−N .

c. Conclua que yes é o estimador ´otimo na classe dos estimadores lineares


não viciados yes .
d. Refa¸ca (a)-(c) para o caso sem reposi¸ cão.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 135/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

124 Amostragem estraticada

4.37 Considere uma popula¸cão dividida em H grupos (estratos). Suponha que o


custo por observa¸cão seja constante. O objetivo é estimar o total populacional
Nh
τ = H h =1 i=1 Yhi utilizando o estimador total estraticado

H
Tes = N h yh ,
h =1

onde yh é a média no estrato h. Encontre a express˜ao para a aloca¸cão ótima


(n h ótimo) sendo n xo. Para a aloca¸cão ótima, encontre a correspondente
V ar[Tes ] = Vot . Para o caso em que N e Nh são grandes ( N N 1, N h


N h 1), encontre uma express˜ ao para Vpr Vot .

4.38 Suponha uma estratica¸ cão onde H = 2, e dentro de cada estrato foram
escolhidas amostras AASc. Escreva a f´ ormula para o EP A nesta situa¸cão e
analise a situa¸cão em que ele é menor ou maior que 1. Estude tamb´
em o caso
sem reposi¸cão.

4.39 Estude com detalhes a aloca¸ cão ótima para o caso do plano AE sem re-
posição. Reformule e prove o Teorema 4.3 e os Corol´ arios 4.4 e 4.5.

4.40 Reformule o Teorema 4.4 para o caso da AE sem reposi¸ cão.

4.41 Considere uma popula¸cão dividida em H estratos de tamanhos N 1 , . . . , N H .


Do estrato h uma amostra AASs de tamanho n h é selecionada, h = 1 , . . . , H .

a. Encontre
H
Nh
E Yhi2 ,
h =1
nh i ∈s h

onde s h denota a amostra selecionada no estrato h = 1, . . . , H .


b. Encontre um estimador n˜ ao viesado para µ2 usando a amostragem estra-
ticada acima.
c. Mostre que
H
vs =
N
−n1) 1 Nh
Yhi2 2
−yes + var [yes ]
n(N
− N h =1
nh i ∈s h

é um estimador n˜ ao viesado para


H Nh
Vs =
N n 2

S , com S = 2 1
(Yhi
−µ)
2
.
Nn N
−1 h =1 i=1

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 136/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

4.6 Estima¸ c˜
ao de propor¸ cões 125

4.42 Queremos planejar uma amostra para estimar a propor¸ cão P de moradores
de uma regi˜ao que tomaram conhecimento de um an´ uncio informando sobre
um novo servi¸co oferecido pelo governo aos contribuintes. A popula¸ cão foi
dividida em H estratos; o custo de obten¸ cão da resposta em cada estrato é ch ;
dentro de cada estrato ser´ a usada AASc e o pesquisador poder´ a dispor de C
reais para as entrevistas ( C = H h=1 n h ch ).

a. Que estimador pes de P você usaria ?


b. Qual deve ser a aloca¸cão ótima, n 1 , n 2 , . . . , n H , que minimizar´a a variância
de pes , dentro do custo C ? Dê as respostas em fun¸ cão das propor¸cões P h
de cada estrato e dos custos ch . Derive as fórmulas partindo da desi-
gualdade de Cauchy–Schwarz, (4.11). Considere os Nh ’s sucientemente
grandes, de modo que ( N h 1)/N h
− 1 e 1/N h 0.
c. Com os resultados obtidos em (b), qual seria a express˜ ao de V ar[pes ]?
d. Dicilmente conhecemos a priori as variˆ ancias dentro de cada estrato.
Pelo fato de estarmos trabalhando com propor¸ cões, podemos substituir a
variˆancia de cada estrato pelo m´ aximo valor poss´ıvel 1 / 4, por quê? Nesse
caso, como cariam os n h ’s e a V ar[pes ]? (Fa¸ca também ch = cte, para
todo h.)

e. Se em vez da alocação ótima, us´assemos a aloca¸cão proporcional, como


caria a V ar[pes ]?
f. Compare os resultados obtidos em (c) e em (e) supondo que ch = cte.
Interprete o resultado.

4.43 Derive as fórmulas do estimador e respectiva variˆ ancia para estimador da


propor¸cão em um plano amostral estraticado quando dentro de cada estrato
o sorteio foi: (a) AASc e (b) AASs.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 137/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

126 Amostragem estraticada

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 138/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

Cap´ıtulo 5

Estimadores do tipo raz˜


ao

Neste capı́tulo ser˜ ao consideradas situa¸cões em que ao elemento i da popula¸cão

U
nita tem-se associado o par ( X i , Yi ), i = 1 , . . . , N . A vari´avel X é introduzida no
problema para melhorar a previs˜ ao de quantidades (parˆ ametros) como a média ou
o total populacional. Na teoria de regress˜ ao esta vari´avel é usualmente conhecida
como vari´avel auxiliar ou preditora e é em geral controlada pelo experimentador.
Assume-se que as quantidades X i , i = 1 , . . . , N , são conhecidas. O exemplo a seguir
ilustra uma situa¸ cão tı́pica onde a inferência é facilitada pela utiliza¸ cão de uma
vari´avel auxiliar X .

Exemplo 5.1 Suponha que seja de interesse estimar a quantidade de a¸ cúcar que
pode ser extraı́da de um caminh˜ ao carregado de laranjas. As unidades populacionais
são laranjas. Seja ent˜ ao Yi a quantidade de a¸cúcar extraı́da da laranja i, i = 1 , . . . , N .
N
Tem-se interesse na estima¸ cão de τY = i=1 Yi , a quantidade total de a¸ cúcar no
carregamento. O estimador natural seria o estimador expans˜ ao, τ̂ Y = TY = Ny.
Mas tal estimador n˜ ao pode ser utilizado, pois n˜ao se conhece o número de laranjas
no caminh˜ao. Por outro lado, sabe-se que o peso da laranja i, X i , é fortemente
correlacionado com Yi , i = 1 , . . . , N . Pode-se ent˜ao denir a raz˜ao, quantidade
média de a¸cúcar por unidade de peso
τY µY
(5.1) R= = ,
τX µX

de onde tira-se que


µY
τ Y = Rτ X = τX ,
µX
N
onde τX = i=1 X i é o peso total do carregamento. Com uma amostra de n laranjas,

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 139/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

128 Estimadores do tipo raz˜


ao

encontra-se os estimadores x e y, e conhecendo-se o peso total produz-se o estimador


y
(5.2) τ̂ Y = τX ,
x
que é usualmente conhecido por estimador raz˜ ao do total populacional. Por seu
lado, y é a quantidade média de a¸ cúcar na amostra s. As quantidades τX e
1
x= Xi,
n i ∈s

que é a média de X (peso médio) nas unidades observadas, s˜ ao facilmente obtidas


neste exemplo.

Existem situa¸cões em que a pr´opria raz˜ao R, dada em (5.1), é a quantidade


de interesse. Tais situa¸ cões ocorrem, por exemplo, em casos onde é de interesse
a compara¸cão de determinadas quantidades em perı́odos sucessivos. Pode-se estar
interessado, por exemplo, na raz˜ ao das vendas de autom´ oveis entre dois anos suces-
sivos, ou seja, o atual e o ano passado. Também é usada quando o parˆ ametro é um
ı́ndice, quociente entre duas vari´ aveis, por exemplo, a lucratividade média do setor
banc´ario. O planejamento amostral utilizado é a AASc, embora outros planos, como
a AASs, poderiam também ser utilizados.

5.1 Estima¸ cão da razão, do total e da m´


edia populacio-
nal com AAS
Para utilizar uma vari´ avel auxiliar X na estima¸cão de quantidades como a raz˜ ao R ,
o total τ Y ou a média µ Y utilizamos os seguintes estimadores do tipo raz˜ ao
y
r = R̂ = ,
x
τ̂ Y = TR = R̂τ X = rτ X

e
yR = R̂µ X = rµ X ,

respectivamente, onde x e y são obtidas através de algum plano amostral. Na maioria


dos casos ser´a usada a AASc.

Exemplo 5.2 Considere a popula¸cão


U { }
= 1, 2, 3 considerada nos Exemplos 2.1
e 2.10. Suponha que seja de interesse estimar a renda bruta média µF usando

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 140/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

5.1 Estima¸ c˜
ao da raz˜
ao, do total e da m´
edia populacional com AAS 129

como vari´avel auxiliar o n´umero de trabalhadores Ti por domic´ılio. Seleciona-se


uma amostra de tamanho n = 2 da popula¸cão de acordo com a AASc. Portanto, de
acordo com o Exemplo 2.6, a probabilidade de sele¸ cão de qualquer amostra em 2 é
S
P (s) = 1 / 9. Como µT = 2, calculando f R = µT (f/t ) para cada uma das 9 poss´ıveis
amostras, tem-se na Tabela 5.1 os valores das estimativas f , t e f R.

Tabela 5.1: Distribui¸ cões amostrais de f , t e f R na AASc


s: 11 12 13 21 22 23 31 32 33
f: 12 21 15 21 30 24 15 24 18
t: 1 2 1,5 2 3 2,5 1,5 2,5 2

f R: 24 21 20 21 20 19,2 20 19,2 18
P (s): 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9

A partir da Tabela 5.1, encontra-se a média e a variˆ ancia de f R e f , com rela¸cão à


AASc, que s˜ao dadas por

E f = 20 , V ar f = 28

e

E f R = 20, 27, ∼
V ar f R = 2, 52,

respectivamente. Note que f R é bem mais eciente que f , pois, V ar f = 28 é bem


maior que EQM f R = 2, 59. Observe que f R é viesado.

Em geral, as distribui¸ cões exatas dos estimadores r, TR e yR são bastante


difı́ceis de serem obtidas, pois o denominador destes estimadores também é uma
vari´avel aleat´oria. Como conseq¨uência os estimadores s˜ ao viciados (o vı́cio diminui
à medida em que a amostra aumenta) e tem distribui¸ cão bastante assimétrica em pe-
quenas amostras. Para amostras grandes, a distribui¸ cão aproxima-se da distribui¸ cão
normal (ver o Capı́tulo 10).

Para utilizar estimadores do tipo raz˜ ao, é necess´ario observar duas vari´ aveis
X e Y que sejam aproximadamente proporcionais, ou seja, positivamente correla-
cionadas. A média µX (ou o total τX ) também precisa ser conhecida exatamente.
Note que no Exemplo 5.2, X e Y são positivamente correlacionados. Como ser´ a
visto adiante, o fato de yR ser mais eciente que y está diretamente relacionado com
o grau de associa¸cão (correla¸cão) entre X e Y. A seguir são apresentadas algumas
propriedades do estimador raz˜ ao.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 141/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

130 Estimadores do tipo raz˜


ao

Teorema 5.1 Para um plano amostral com E [y] = µY e E [x] = µX tem-se para n
sucientemente grande que
(5.3) E [r ] R,

(5.4) E [TR ] τY

e
(5.5) E [yR ] µY ,

onde, como antes, “ ” signica “aproximadamente igual a”.

Prova. O desvio r
−R pode ser escrito da seguinte maneira:
r R = y R = y − Rx .
(5.6)
− x− x
Porém, 1 /x pode ser expandido em séries de Taylor do seguinte modo
−1
1
=
1
=
1
=
1
1+
x
− µX
x µX + x
−µX µX 1+ x− µ X
µX
µX µX

− − −
1 x µX x µX
=
µX
1
µ
+
X µX −. . . ,

de modo que

−R = −µX − − µ2X − + . . .
y Rx (y Rx ) (x µX )
(5.7) r

Usando apenas a aproxima¸ cão de primeira ordem, tem-se que

E [r
− R] E
y
−µ Rx =
µY

µ
Rµ X
=0,
X X

de onde (5.3) segue. Note que (5.4) e (5.5) seguem diretamente de (5.6).

Do Teorema 5.1, conclui-se ent˜ ao que o estimador raz˜ao é aproximadamente

não viciado quando o tamanho da amostra é grande. Por outro lado, para amostras
pequenas ou moderadas, ele pode apresentar um viés de magnitude razo´ avel. Uma
express˜ao aproximada para o viés é apresentada a seguir.

Corol´ ario 5.1 Para o plano AAS (AASc ou AASs) temos

CV [y]
R CV 2 [x] 1
B [r ]
− ρ[x, y ]
CV [x]
.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 142/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

5.1 Estima¸ c˜
ao da raz˜
ao, do total e da m´
edia populacional com AAS 131

Prova. Considerando o segundo termo em (5.7), tem-se que

−E
(y
−Rxµ) 2(x −µX ) =
1
µ2X { −
R E [x (x µX )] E [y (x µX )]
− − }
X
1
=
µ2X { −
R V ar [x] Cov [x, y ]
}
V ar[x] DP [x]
= R 2
µX −
ρ[x, y ] 2 DP [y]
µX
CV [x]
R CV 2 [x] ρ[x, y ]
=
− µX
CV [y]µY

R CV 2 [x] ρ[x, y ]CV [x]CV [y]R


=
− CV [y]
(5.8) =

R CV 2 [x] 1 ρ[x, y ] CV [x] ,

onde C V [y] = DP [y]/µ Y , C V [x] = DP [x]/µ X , são os coecientes de varia¸cão


das médias amostrais de y e x,

Cov[x, y ]
ρ[x, y ] = ,
DP [x]DP [y]
com
σY2 σX2
DP [y] = , DP [x] = ,
n n

1 N
Cov [x, y ] =
nN i=1
(X i
−µX )( Yi −µY ),
o que demonstra o corol´ario.

Para um melhor entendimento deste resultado, e do que segue, verique o


Exerc´ıcio 5.9.
Quando o plano amostral adotado é AAS, tem-se que

(5.9)

E
(y
−Rxµ)(2 x −µX ) = R CV 2 [X ] 1
− ρ[X, Y ]
CV [Y ]
CV [X ]
,
X

onde
σX σY
CV [X ] = , CV [Y ] =
µX µY
e
N
ρ[X, Y ] =
(X i
−Nσ − .
µX )(Yi µY )
σ
i=1 Y X

Note que ρ[x, y ] = ρ[X, Y ].

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 143/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

132 Estimadores do tipo raz˜


ao

O viés dado em (5.9) pode também ser escrito como (veja o Exercı́cio 5.11)
1
Rσ X2
(5.10) E [r
− R]
µ2X −ρ[X, Y ]σY σX .

Express˜oes aproximadas para os vı́cios dos estimadores yR e TR podem ser


obtidas a partir de (5.10) (veja o Exercı́cio 5.12). Observe que para obter viés
pequeno é necess´ario que
CV [X ]
ρ[X, Y ] 1,
CV [Y ]
ou seja, quanto menor for a rela¸ cão entre as vari´aveis, menor variabilidade deve ter
a vari´avel auxiliar X em relação a Y .

A seguir tem-se express˜oes aproximadas para as variˆ ancias dos estimadores do


tipo raz˜ao denidos acima. Note que o lado direito da express˜ ao (5.9), ou (5.10),
é uma express˜ ao de ordem n − 1 (= 1 /n ) para o vı́cio de r. Isto signica que o lado
direito vai a zero quando n .
→∞
Teorema 5.2 Se n é sucientemente grande, tem-se para a AASc que
N 2
1 σR2
(5.11) V ar[r ]
1
nµ 2X
(Yi
−NRX i ) =
µ2X n
,
i=1

N 2
τX2 σR2
(5.12) V ar[TR ] 2
(Yi
−RX i ) = N2
nµ X i=1 N n
e
1 N (Yi RX i ) 2 σ2
(5.13) V ar[yR ]
n i=1 N n

= R,

onde
N
1
σR2 RX i ) 2 .
=
N i=1
(Yi

Prova. Usando a aproxima¸cão de primeira ordem de (5.7) tem-se que

V ar[r ] EQM [r ] = E (r R) 2

−Rx ) −=
1 2 1 2
(5.14) E (y 2 E d ,
µ2X µX

onde d = i ∈s D i /n é a média amostral das vari´ aveis D i = Yi


−RX i , i =
1, . . . , N . Note que a popula¸cão dos di ’s, é tal que
N
1
D =0 e σD2 = D i2 .
N i=1

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 144/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

5.2 Estima¸ cão da variˆ ancia populacional 133

Com rela¸cão à AASc, tem-se do Teorema 3.3 que

σD2
(5.15) V ar d = .
n
Mas,
N N
1 1 2
σD2 = D i2 = = σR2 .
(5.16)
N i=1
N i=1
(Yi
−RX i )
Portanto, (5.11) segue de (5.14), (5.15) e (5.16). Por outro lado, (5.12) e (5.13)
seguem de (5.11) e de (5.7).

5.2 Estima¸ cão da variˆ


ancia populacional
A partir do Teorema 5.2, conclui-se que estimativas para a variˆ ancia dos estimadores
r , TR e yR são obtidas considerando-se uma estimativa para a quantidade

N
1
σR2 RX i ) 2 .
(5.17) =
N i=1
(Yi

Uma estimativa razo´ avel para σ R2 e comumente empregada na literatura é

2 1 2
(5.18) sR = n
−1 i ∈ s
(Yi
− rX i ) .

Note também que quando N é desconhecido, n˜ao se pode calcular µX . Mas


em tais situa¸cões, substitui-se µX por x. Tais estimativas s˜ao em geral viciadas,
mas o vı́cio diminui `a medida em que n aumenta. Conforme discutido em Cochran
(1977), os estimadores das variˆ ancias decorrentes de tais substitui¸ cões são em geral
consistentes, isto é, v˜ ao se aproximando das respectivas quantidades populacionais
quando N e n são grandes. Uma outra possibilidade para calcular estimativas da
variˆancia de estimadores do tipo raz˜ ao é através da utiliza¸ cão do método bootstrap

(ou reamostragem), como considerado em Bussab e Morettin (2004, Se¸ cão 11.9).

5.3 Compara¸ c˜
ao entre os estimadores raz˜ ao e expans˜
ao
A seguir, apresenta-se um resultado para que o estimador raz˜ ao seja mais preciso
que o estimador expans˜ ao. Como veremos, a condi¸cão básica é que o coeciente de
correla¸cão entre X e Y e o tamanho da amostra sejam de magnitude razo´ avel.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 145/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

134 Estimadores do tipo raz˜


ao

Teorema 5.3 Se n é sucientemente grande, o planejamento adotado é AASc e

σX /µ X CV [X ]
ρ[X, Y ] > = ,
2σY /µ Y 2CV [Y ]

ent˜ao,
V ar[TR ] < V ar [T ].

Prova. Do Teorema 5.2, vem


N
τX2 2
V ar[TR ]
nµ 2X N i=1
(Yi
−RX i )
N2 N 2
=
nN i=1
{ − − − }
(Yi µY ) R(X i µX )

N N N
N2
µ Y )2 + R 2 µX ) 2
=
nN i=1
(Yi
− i=1
(X i
− − 2R
i=1
(X i
−µX )( Yi −µY )
N2
σY2 + R 2 σX2
(5.19)
=
n −2Rρ [X, Y ]σX σY .

Por outro lado, como visto no Corol´ ario 3.1,

N2
(5.20) V ar[T ] = σY2 .
n
Ent˜ao, de (5.19) e (5.20), temos que

V ar[TR ] < V ar [T ],

se e somente se
σY2 + R 2 σX2 2
−2Rρ [X, Y ]σX σY < σ Y ,
ou,
2Rρ [X, Y ]σX σY > R 2 σX2 ,

desde que R > 0, de onde segue o resultado desejado.

Note que C V [X ] = σX /µ X e C V [Y ] = σY /µ Y são os coecientes de varia¸cão


das vari´aveis X e Y. Para ganhos maiores de yR com relação a y, CV [X ]/CV [Y ]
deve estar entre 0,5 e 1,3 e ρ[X, Y ] deve ser maior que 0,6 (Kish, 1965). Portanto,
se a vari´avel X for melhor comportada que a vari´ avel Y basta uma baixa correla¸ cão
entre as vari´aveis para que se tenha lucro.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 146/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

5.4 Normalidade assint´ otica e intervalos de conan¸ ca 135

5.4 Normalidade assint´ otica e intervalos de conan¸ ca


Conforme vericaremos no Capı́tulo 10, para n e N sucientemente grandes, tem-se
em rela¸cão à AASc que
(5.21)
yR µ Y a
V ar [yR ]

N (0, 1).

O mesmo vale para os estimadores r e TR .
Substituindo S R2 por sua estimativa s 2R considerada em (5.18), tem-se que um
intervalo de conan¸ca para µ Y com coeciente de conan¸ca γ = 1 α é dado por

s 2R s 2R
(5.22) yR
−zα n ; y R + zα n .

O intervalo (5.22) pode ser justicado de maneira an´ aloga ao intervalo obtido
na Seção 3.2.4. Intervalos para τ Y e R podem ser obtidos de maneira an´ aloga (veja
o Exercı́cio 5.13).

5.5 Determina¸ cão do tamanho da amostra


Utilizando a aproxima¸ cão normal (5.21), encontra-se n de tal forma que

(5.23)
| −µY | ≤B )
P ( yR 1
−α.
Procedendo como na Se¸cão 3.2.5, tem-se que (5.23) estar´a vericada quando

2
B
(5.24) V ar [yR ] = = D.

Temos portanto de (5.13) e (5.24) que (5.23) estar´ a vericada quando

σ2
(5.25) n = DR .

Para que a express˜ ao (5.25) seja utilizada na pr´ atica, s˜ao necessárias estima-
tivas para σR2 . Tais estimativas podem ser obtidas através de amostras pilotos ou
atrav´
es de pesquisas realizadas anteriormente sobre a quantidade de interesse. Veja
discuss˜ao na Seção 3.2.5. Pede-se ao leitor derivar as express˜ oes correspondentes
para o caso sem reposi¸cão.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 147/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

136 Estimadores do tipo raz˜


ao

5.6 Estima¸ cão do total e da m´


edia populacional com AE
Quando a popula¸cão est´a estraticada, uma saı́da é considerar estimadores raz˜ ao do
tipo estraticado. Conforme considerado no Cap´ıtulo 4, sup˜ oe-se que a popula¸cão
esteja dividida em H estratos e sejam yh , xh e τ Xh as médias amostrais correspon-
dentes `as vari´aveis Y e X e o total da vari´avel X , respectivamente, no estrato h. No
caso da média populacional µY , pode-se considerar o seguinte estimador
H H
yh
yRes = Wh µXh = Wh yRh .
h =1
xh h =1

Como um estimador do total τ Y pode-se considerar ent˜ao


H
TRes = τ̂ Res = N h yRh .
h =1

Os estimadores acima s˜ao usualmente denominados estimadores do tipo raz˜ ao estra-


ticados. Tem-se ent˜ ao o seguinte

Teorema 5.4 Se as amostras s˜ao obtidas independentemente em cada estrato, de


acordo com a AASc e se o tamanho da amostra é sucientemente grande em cada
estrato, tem-se que

H Wh2 σY2 h + R h2 σXh


2
V ar [yRes ]
h =1
nh −2R h ρXY h σY hσXh
H 2
σRh
(5.26) = Wh2 .
h =1
nh

Prova. Como as amostras s˜ao obtidas independentemente dentro de cada estrato,


ent˜ao
H H
V ar [yRes ] = V ar Wh yRh = Wh2 V ar [yRh ] .
h =1 h =1
Do Teorema 5.2, e para n h sucientemente grande, com AASc em cada estrato
vem:
Nh
1 2
V ar[yRh ]
n h Nh j =1
(Yhj
−R h X hj )
1 2 2 2
=
nh
σY h + R h σ Xh
−2R h ρXY h σY hσXh ,

que substituı́do na express˜ ao acima prova o teorema.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 148/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

5.6 Estima¸ c˜
ao do total e da m´
edia populacional com AE 137

A variˆancia do estimador TRes pode ser obtida diretamente a partir do resul-


tado (5.26).
Estimadores para a variˆ ancia no teorema acima s˜ao obtidos substituindo-se
2 2
σY h , R h , ρXY h e σ Xh por seus estimadores correspondentes.
Como, com AASc,
H 2
σRh
V ar[yRes ] Wh2 ,
h =1
nh

onde
2 2 2 2
σRh = σY h + R h σ Xh
−2R h ρh (X, X )σY hσXh ,
tem-se, de acordo com o Teorema 4.3, para o tamanho da amostra n xado e para
um custo linear, que a aloca¸ cão ótima consiste em tomar no estrato h uma amostra
de tamanho
(5.27) nh = n H
Nh σRh / ch √, h = 1, . . . , H .
h =1 N h σ Rh / ch √
2
Tem-se ent˜ao que dispor de uma estimativa piloto de σ Rh em cada estrato para que
(5.27) seja operacion´avel.
Em muitas popula¸ cões tem-se que

σRh
∝√µXh ,
2
ou seja, σ Rh é aproximadamente proporcional ` a média µXh , obtendo a alo¸cão ótima

nh
∝N h √µXh / √ch , h = 1 , . . . , H .
Em outras situa¸ cões pode-se ter ainda

σRh
∝µXh ,
com
nh
∝N h µXh / √ch , h = 1 , . . . , H .
Exemplo 5.3 Considere uma companhia que disp˜ oe de duas ind´ustrias em locais
diferentes. O objetivo principal da pesquisa é avaliar se houve varia¸ cão no tempo
médio gasto por empregados no ´ ultimo ano em rela¸cão ao anterior com visitas ao
médico. A popula¸ cão base é formada pelos empregados das duas ind´ ustrias, sendo
que cada uma ser´a considerada um estrato. De cada um dos estratos, uma amostra
é observada usando a AASc e observa-se:

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 149/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

138 Estimadores do tipo raz˜


ao

• Yhi , o número de horas gastas com visitas ao médico pelo empregado i da


ind´ustria h, no ano corrente;

• X hi , o número de horas gastas com visitas ao médico pelo empregado i da


ind´ustria h, no ano anterior.

Os resultados obtidos foram:


h Nh nh yh xh τXh s2Rh
1 1.000 10 18,7 17,8 16.300 3,47
2 1.500 10 4,6 7,8 12.800 9,72

Como N = 2 .500, calcula-se


1.000 18, 7 16.300 1.500 4, 6 12.800
yRes =
2.500 17, 8 1.000
+
2.500 7, 8 1.500
= 9, 87 ∼
e também
2 2
1.000 3, 47 1.500 9, 72
V ar [yRes ] =
2.500 10
+
2.500 10 ∼
= 0, 4544.

Conclui-se este capı́tulo lembrando que a inclus˜ ao de uma vari´avel auxiliar X


correlacionada com Y (quanto maior a correla¸ cão melhor) produz estimadores do
tipo raz˜ao, que são em geral mais ecientes que os estimadores y e T .
Conforme vericado em Cochran (1977), e Rodrigues e Bolfarine (1984), quando
a rela¸cão linear entre X e Y é razoavelmente descrita pelo modelo linear

Yi = βX i + ei ,

i = 1 , . . . , N , ent˜ao yR (TR ) é o “melhor”, de menor variˆ ancia, estimador de µY


(τ Y ), dentre todos os estimadores lineares n˜ ao viciados.

Exerc´ıcios

5.1 Considere a popula¸cão


Considere os estimadores Udo Exemplo 5.2. Queremos estimar R = µY /µ X .

y y 1 Yi
R̂ 1 = , R̂ 2 = , e R̂ 3 = .
x µX n i ∈s
Xi

Encontre as distribui¸ cões de R̂ i , i = 1 , 2, 3, seus vı́cios e EQM , para AASc e


AASs. Qual dos estimadores você prefere?

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 150/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

5.6 Estima¸ c˜
ao do total e da m´
edia populacional com AE 139

5.2 Pretende-se estimar o n´ umero de ´arvores mortas de determinada espécie em


uma reserva orestal. A reserva é dividida em 200 ´ areas de 1,5 hectares. O
número de ´arvores mortas é avaliada por fotograa aérea ( X ) nas 200 áreas
apresentando uma contagem total de aproximadamente 15.600 ´ arvores mortas
da espécie. Em 10 das 200 ´areas, o n´umero de ´arvores mortas além da ava-
liação por fotograa aérea é também avaliada por contagem terrestre ( Y ). Os
resultados s˜ao apresentados na tabela abaixo.

Área Xi Yi
1 12 18
2 30 42
3 24 24
4 24 36
5 18 24
6 30 36
7 12 14
8 6 10
9 36 48
10 42 54

a. Encontre, usando amostragem aleat´ oria simples com reposi¸cão (AASc)


uma estimativa para o n´ umero de ´arvores mortas e também uma estima-
tiva para a sua variˆ ancia.

b. Usando a express˜ao (5.10), encontre uma express˜ ao para o vı́cio do n´umero


médio de ´arvores mortas.

c. Recalcule as estimativas sem usar a vari´ avel auxiliar X e compare os


resultados obtidos.

d. Refa¸ca os itens anteriores considerando agora amostragem aleat´ oria sim-


ples sem reposi¸cão (AASs).

5.3 Considere os dados da tabela abaixo como sendo uma popula¸ cão dividida em
dois estratos.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 151/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

140 Estimadores do tipo raz˜


ao

Estrato 1 Estrato 2
X 1j Y1 j X2j Y2 j
2 0 10 7
5 3 18 15
9 7 21 10
15 10 25 16

Para uma amostra estraticada AASs de tamanho n h = 2 de cada estrato,


compare os erros quadr´aticos médios dos estimadores raz˜ ao estraticado e
combinado do total da popula¸ cão.

5.4 Considere os dados da tabela abaixo.


2
h Nh µXh µY h σXh σXY h σY2 h
1 47 53,80 69,48 5.186 6.462 8.699
2 118 31,07 43,64 2.363 3.100 4.614
3 91 56,97 66,39 4.877 4.817 7.311

Considerando n = 100, encontre a aloca¸cão ótima para yRes e calcule V ar [yRes ]


nos casos:

a. n h
∝NN hh σ√YµhXh; ;
b. n h

c.

n h N h µXh .

5.5 Considere a popula¸cão


Udo Exemplo 5.2. Considere os estimadores
y 1 = R̂ 1 µX , y2 = R̂ 2 µX e y3 = R̂ 3 µX ,

onde R̂ i , i = 1 , 2, 3 são como denidos no Exercı́cio 5.1. Encontre a distribui¸ cão


e o E QM de y i , i = 1 , 2, 3. Qual dos estimadores você prefere?

5.6 Considere os dados do Exemplo 5.2 e AASs.

a. Usando (5.13), encontre um valor aproximado para V ar [y R ] e compare


com o valor exato 0,56.
b. Encontre a distribui¸ cão do estimador s 2R dado em (5.18). Encontre E s 2R
e compare com S R2 .

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 152/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

5.6 Estima¸ c˜
ao do total e da m´
edia populacional com AE 141

5.7 Uma rede de lojas de eletrodomésticos quer estimar o n´ umero de televisores


coloridos a serem vendidos no ano, baseando-se nas vendas do primeiro tri-
mestre. Para isso, decidiu dividir suas lojas em dois estratos: um com as lojas
antigas, onde se conhecem as vendas do ano anterior, e outro com as lojas
novas. De cada estrato sortearam-se (sem reposi¸ cão) 6 lojas e foram avaliadas
as vendas do primeiro trimestre. O primeiro estrato é formado por 36 lojas
enquanto que o segundo é formado por 12 lo jas. No primeiro estrato, o total de
vendas do ano anterior foi de 3.400 unidades. Os resultados s˜ ao dados abaixo.

Lojas antigas
Loja 1 2 3 4 5 6
Vendas no 1 o trimestre 15 19 40 25 15 28
Total do ano anterior 55 72 150 102 62 98

Lojas novas
Loja 1 2 3 4 5 6
o
Vendas no 1 trimestre 12 15 18 16 10 12

a. Dê um intervalo de conan¸ ca para a estimativa do total de vendas anuais.


Justique o estimador usado.

b. Critique o plano amostral utilizado.

5.8 Considere os dados da Tabela 2.8. Selecione uma AASs de tamanho n = 10 e


calcule uma estimativa para V ar[y]. Calcule também yR e uma estimativa para
V ar [y R ]. Encontre uma outra estimativa para a V ar [y R ] usando o método
bootstrap (veja Bussab e Morettin, 2004). Compare os resultados.

Te´oricos
5.9 Verique a validade das express˜oes (5.8) e (5.9).

5.10 Verique com AASs que


N
Cov [x, y ] = −
(1 f )
(X i
−µX )( Yi −µY )
n(N 1)
− i=1

e que ρ(x, y ) = ρ(X, Y ), como denidos na Se¸cão 5.1. Como ca o caso com
AASc?

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 153/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

142 Estimadores do tipo raz˜


ao

5.11 Verique a validade da express˜ao (5.10).

5.12 Encontre express˜oes aproximadas (de ordem 1 /n ) para os vı́cios dos estima-
dores yR e TR .

5.13 Derive intervalos de conan¸ca aproximados para τ Y e R utilizando as apro-


xima¸cões normais correspondentes.

5.14 Considere a estratica¸ cão estudada na Se¸cão 5.6. O estimador raz˜ao combi-
nado do total populacional é dado por

TRc = TY es τ X ,
TXes

onde
H H
TY es = N h yh e TXes = Nh xh .
h =1 h =1

Encontre, com rela¸cão a AASs, V ar [TRc ].

5.15 Dena o estimador raz˜ao combinado para a média populacional. Encontre


a sua variˆancia para AASs.

5.16 Discuta a aloca¸cão ótima para o caso do estimador raz˜ ao combinado, quando
se usa AASs em cada estrato.

5.17
U
Considere uma popula¸ cão , onde ao elemento i está associado o par ( X i , Yi ),
i = 1 , . . . , N . Estamos interessados em estimar a raz˜ ao R = µY /µ X , utilizando
AAS (AASc ou AASs). Dena

Yi
Ri = ,i = 1 ...,N.
Xi

Seja também
N
1 1
r = Ri, µR = R = Ri.
n i ∈s
N i=1

a. Mostre (ou justique) que

E [R i ] = µR = E [r ].

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 154/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

5.6 Estima¸ c˜
ao do total e da m´
edia populacional com AE 143

b. Mostre (ou justique, usando algum resultado conhecido) que


N
1 1
E
n
− 1 i ∈s
R i (X i
− x) =
N
− 1 i=1
R i (X i
−µX ),
e que
1 n
n
−1 i ∈ s
R i (X i
−x) = n −1 (y −r x ).
c. Mostre que
N
1
N i=1
R i (X i
−µX ) = µX (R −E [R i ]) = µX (R −E [r ])
e conclua que
N
1
E [r ]
− R=
− NµX i=1
R i (X i
−µX ).
d. Use (b) e (c) para mostrar que um estimador n˜ ao viciado de R é dado
por
r+
n(N 1)
(y r x ). − −
(n 1)Nµ X

5.18 Mostre que o viés do estimador r de R, B [r ], é igual a

ρ[r, x ]DP [x]DP [r ]


B [r ] =
− E [x]
,

e que o viés relativo satisfaz

B [r ]
(5.28)
DP [r ] ≤ CV [x].

Sugest˜ao: Use a express˜ao C ov[r, x ] = E [rx ] E [r ]E [x]. Da express˜ao (5.28),
nota-se que quanto maior for o tamanho da amostra e/ou bem comportada for
a vari´avel X , menor ser´a o viés. Com rela¸cão à AASs, temos que

B [r ]
DP [r ] ≤
(1
−n f ) DPµ (X ) .
X

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 155/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

144 Estimadores do tipo raz˜


ao

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 156/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

Cap´ıtulo 6

Estimadores do tipo regress˜


ao

Como visto no capı́tulo anterior, para X e Y obedecendo uma rela¸cão linear passando
pela origem, estimadores do tipo raz˜ ao seriam mais adequados do que os estimadores
simples. Por outro lado, estudando-se a rela¸ cão entre X e Y pode-se concluir que
embora linear, ela n˜ao passa pela origem. Isto sugere um estimador baseado na
regress˜ao de Y em X , e não na raz˜ao de duas vari´aveis.
Como no capı́tulo anterior, a cada i
∈Utem-se associado o par ( X i , Yi ),
i = 1 , . . . , N , obedecendo uma rela¸cão linear de Yi em X i não passando pela origem,
ou seja,
Yi = α + βX i + ei ,
onde ei indica um desvio em torno da reta, i = 1 , . . . , N . Para uma amostra s de
tamanho n, produzindo médias amostrais y e x, o estimador regress˜ao da média
populacional é dado por
yReg = y + b(µX x) ,

onde b é um valor (estimativa) que representa o impacto ( β ) em Y provocado pela
varia¸cão de uma unidade na vari´ avel X . Note que se b > 0 e x é pequeno com
rela¸cão a µX , ent˜ao, devido a linearidade entre X e Y, a diferen¸ca entre y e yReg
também é pequena. Observe que o estimador y Reg faz uma “corre¸cão” em y, isto é,


adiciona a y uma quantidade proporcional a µ X x, ou seja, b(µX x).

Pode-se ent˜ao considerar como estimador do total populacional, τ Y , o estima-
dor
TReg = τ̂ Reg = N y Reg ,

que ser´a referido como estimador regress˜ ao do total populacional. Na se¸cão se-
guinte, considerar-se-´ a propriedades como média e variˆ ancia dos estimadores do

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 157/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 158/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

6.1 Estima¸ c˜
ao do total e da m´
edia populacional com AAS 147

Seja d = i ∈s D i /n a média de uma amostra de tamanho n da popula¸cão dos


D ’s. De acordo com o Teorema 3.3, deduz-se que
σD2
V ar d = ,
n
onde
N
1 2
σD2 =
N i=1
{Yi −b0 (X i −µX ) −µY } ,
N
1 2
=
N i=1
{(Yi −µY ) −b0 (X i −µX )}
1 N
2 2 2
=
N i=1
(Yi
−µY ) −2b0 (X i −µX )(Yi −µY ) + b0 (X i −µX )
σY2 + b20 σX2 .
=
−2b0 σXY
Note que
d = yReg ,

de onde segue o resultado.

Corol´
ario 6.1 Um estimador n˜ao viciado para VReg = V ar yReg com b0 xado é
dado por
1 2
V̂Reg = var yReg =
n(n
− i
1)

{ − − − }
(Yi y) b0 (X i x)
s

1 2
+ b20 s 2X .
= s
n Y −2b0 s XY
Prova. De acordo com o Corol´ario 3.2, tem-se que um estimador n˜ ao viciado de
VD = V ar d (dado no Teorema 6.2) é dado por

s2D
V̂D = var d = ,
n
onde
1
s 2D = 2
n
− 1 i ∈s
(D i
−yReg ) ,
de onde prova-se o corol´ario.

O resultado a seguir est´ a relacionado com uma escolha conveniente de b0 .

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 159/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

148 Estimadores do tipo regress˜


ao

Teorema 6.3 O valor de b0 que minimiza V ar yReg é dado por

N
(6.2) B0 = i=1 (Yi
N
−(XµY )(X i )−2 µX ) = σXY
σX2
.
i=1 i
−µX
Além disso, para b0 acima,

σY2 2
(6.3) Vmin yReg =
n
1
−ρ [X, Y ] .

Prova. Seja b0 = B 0 + c, onde c é um n´umero real qualquer. Tem-se ent˜ ao para


este b0 que

V ar yReg = 2 0

2

n1 σY 2(B + c)σ
XY + ( B 0 + c) 2 σ X
2

1 σXY
σY2 + c2 σX2 ,
(6.4) =
n σX2−
que é m´ınima quando c = 0. Tomando-se c = 0 em (6.4) obtemos (6.3), pois,
como visto no capı́tulo anterior, ρ[X, Y ] = σXY /σ X σY .

O Teorema 6.3 fornece o valor ´otimo para b0 , ou seja, B 0 , dado em (6.2).


Mas, este valor n˜ao pode ser obtido na pr´atica, pois seria preciso observar toda a
popula¸cão. Por outro lado, o Teorema 6.3 sugere um estimador razo´ avel para b0 , ou
seja,
(6.5) B̂ 0 = i ∈s (Yi
− − =
y)( X i x)
x) 2
sXY
s 2X
.
i ∈ (X i
s

Como estimador de VReg , pode-se ent˜ao considerar a quantidade

1 2 s2Y
2B̂ 0 s XY + B̂ 02 s 2X 2
(6.6) V̂Reg = s
n Y − =
n
1
−ρ̂ [X, Y ] ,

onde ρ̂[X, Y ] = s XY / (s X s Y ).

Exemplo 6.1 Considere a popula¸cão


3 3
Udo Exemplo 5.2. Para esta popula¸ cão,
3
µT = 2, µF = 20, i=1 F i Ti = 138, i=1 F i2 = 1 .368, i=1 Ti2 = 14. Tem-se ent˜ao
que
N
B0 = i=1 F i Ti
N 2
−NT 2F =
18
2
= 9.
i=1 Ti
−NT
Também, com b0 = B 0 = 9, σF2 = 56, σ T = 2 / 3 e σ F T = 6 , tem-se para n = 2 que
2

1 2 2 2
V ar f Reg = σ
n F −2b0 σF T + b0 σT = 1.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 160/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

6.2 Compara¸ cão entre os estimadores regress˜


ao e raz˜ ao 149

Calculando
f Reg = f + B 0 (µT
−t),
para cada uma das 9 possı́veis amostras, de tamanho n = 2, tem-se na Tabela 6.1 a
distribui¸cão de f Reg .

Tabela 6.1: Distribui¸ cão amostral de f Reg na AASc


s: 11 12 13 21 22 23 31 32 33
f: 12 21 15 21 30 24 15 24 18
t: 1 2 1,5 2 3 2,5 1,5 2,5 2
f Reg : 21,0 21,0 19,5 21,0 21,0 19,5 19,5 19,5 18,0
P (s): 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9

A partir da distribui¸ cão da Tabela 6.1 pode-se mostrar, com respeito ` a AASc, que

E f Reg = 20 ,

ou seja, como vericado no Teorema 6.1, f Reg é n˜ao viciado para µF com b0 = B 0
(b0 xado), e
2 2 2
V ar f Reg = E f Reg
−E f Reg = 401
−20 = 1,

já calculado acima. Note também que o estimador regress˜ ao com b0 = B 0 é mais
eciente que o estimador raz˜ ao. Tal resultado vale em geral, como ser´ a visto a seguir.
Por outro lado, quando considera-se o estimador regress˜ ao com B̂ 0 no lugar de b0 ,
a distribui¸cão de y Reg apresenta uma variˆ ancia superior `a encontrada acima (veja o
Exercı́cio 6.1).

6.2 Compara¸ cão entre os estimadores regressão e razão


O resultado a seguir mostra que, com rela¸ cão à AASc, o estimador regress˜ao com
b0 = B 0 é em geral melhor que o estimador raz˜ ao e portanto, em geral melhor que
y.

Teorema 6.4 Para b0 = B 0 , dado no Teorema 6.3, tem-se com rela¸ c˜ao à AASc,
que

i. V ar yReg
≤ V ar[y],

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 161/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

150 Estimadores do tipo regress˜


ao

ii. V ar y Reg
≤ V ar [yR ] .
Prova. Como
σY2
V ar[y] = ,
n
e pelo Teorema 6.3,

σY2 2
V ar yReg =
n
1
−ρ [X, Y ] ,

2
o resultado (i) segue, pois, 0
≤ρ [X, Y ] ≤1.
Por outro lado, como, para n grande,

1 2 2 2
V ar[y R ] σ
n Y −2Rρ [X, Y ]σX σY + R σX ,

tem-se que

1 2
ρ [X, Y ]σY2 2Rρ [X, Y ]σX σY + R 2 σX2
V ar[yR ]
− V ar[yReg ] =
n −
1
(ρ[X, Y ]σY Rσ X ) 2 0,
=
n − ≥
de onde (ii) segue.

6.3 Normalidade assint´ otica e intervalos de conan¸ ca


Para n e N sucientemente grandes, tem-se que

(6.7)
yReg
−µY ∼
a
N (0, 1).
V ar y Reg

O mesmo vale para o estimador do total populacional τ Y , TReg . Para maiores


detalhes sobre a convergência em (6.7) veja o Cap´ıtulo 10.
Substituindo VReg = V ar y Reg por sua estimativa considerada em (6.6), tem-
se que um intervalo de conan¸ ca para µY com coeciente de conan¸ca γ = 1 α é

dado por
(6.8) y Reg
−zα V̂Reg ; yReg + zα V̂Reg .

O intervalo (6.8) pode ser justicado de maneira an´ aloga ao intervalo obtido em
(3.17).

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 162/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

6.4 Determina¸ c˜
ao do tamanho da amostra 151

6.4 Determina¸ cão do tamanho da amostra


Utilizando a aproxima¸ cão normal (6.7), pode-se encontrar n de tal forma que

(6.9) P yReg
−µY ≤ B 1
−α.
Procedendo como na Se¸cão 5.5, temos que (6.9) estar´a vericada quando
σD2
(6.10) n=
(B/z α ) 2
onde

σD2 σY2 2 2
=
−2b0 σXY + b0 σX
=

σY2 1 ρ2 [X, Y ] ,

no caso particular em que b0 = B 0 .


Em problemas pr´aticos, a quantidade σD2 precisa ser estimada. Para isto é
preciso dispor de uma amostra piloto ou de pesquisas amostrais realizadas anteri-
ormente na popula¸ cão de interesse. A partir desta informa¸ cão estimativas para σD2
podem ser obtidas e valores aproximados para n seriam obtidos a partir de (6.10).

6.5 Estima¸ c˜
ao da m´
edia populacional com AE
No caso em que a popula¸cão est´a estraticada, pode-se também considerar estima-
dores do tipo regress˜ao estraticados. A nota¸ cão considerada é a mesma do Cap´ıtulo
4 e da Seção 5.6. O estimador regress˜ao dentro do estrato h é dado por

yRegh = yh + b0h (µXh


−x h ) ,
onde b0h é o valor que representa o coeciente angular da reta de regress˜ ao entre X
e Y no estrato h. Ent˜ao, o estimador regress˜ao separado é denido por
H
yReges = Wh yRegh .
h =1

O resultado a seguir é uma consequência direta dos Teoremas 6.1 e 6.2 (veja
o Exercı́cio 6.21).

Teorema 6.5 O estimador yReges é n˜ao viciado para µY com


H
Wh2
σY2 h 2 2
(6.11) V ar y Reges =
h =1
nh −2b0h σXY h + b0h σXh .

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 163/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

152 Estimadores do tipo regress˜


ao

O valor de bh que minim´ıza a variˆ ancia em (6.11) é dado por (veja o Exercı́cio
6.6) σXY h
(6.12) b0h = B 0h = 2 ,
σXh
h = 1 , . . . , H . Neste caso, pode-se mostrar que
H
Wh2 2 2
(6.13) V ar yReges =
h =1
σ
nh Y h
1
−ρh [X, Y ] ,

sendo esta ´ultima igualdade v´alida quando b0h = B 0h , onde


σXY h
ρh [X, Y ] = , h = 1, . . . , H .
σXh σY h
Sendo b0h xo (ou b0h = B 0h ), pode-se construir estimadores n˜ ao viciados da
variˆancia em (6.11), utilizando o Corol´ ario 6.1 (veja o Exercı́cio 6.26).
Segue ent˜ao do Teorema 4.3 para um custo linear e para n xo, que a alocação
ótima consiste em tomar no estrato h uma amostra de tamanho

nh = n
Nh σDh / ch √ ,
H
h =1 N h σ Dh / ch √
onde
2
= σY2 h 2 2
σDh
−2b0h σXY h + b0h σXh , h = 1 , . . . , H .
Exerc´ıcios
6.1 Refaça o Exemplo 6.1, considerando a estimativa B̂ 0 denida em (6.5) no
lugar de B 0 .

6.2 Para a popula¸cão do Exercı́cio 6.1, encontre a distribui¸ cão do estimador V̂Reg
denido no Corol´ario 6.1, com b0 = B 0 .

6.3 Um fazendeiro fez uma avalia¸cão grosseira da produ¸cão X i , em kilos, de cada

um de seus N = 200 pessegueiros. A estimativa do peso total foi 5.800 kilos.


Tomou-se uma amostra casual (AASs) de 10 pessegueiros, colheu-se os pêssegos
e pesou-se a produ¸cão Yi . Os resultados est˜ao na tabela abaixo.

Árvore: 1 2 3 4 5 6 7 8 9 10
Xi: 30 24 26 30 34 24 22 29 38 29
Yi : 30 21 25 29 34 22 19 28 35 26

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 164/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

6.5 Estima¸ c˜
ao da m´
edia populacional com AE 153

a. Considere dois estimadores diferentes para a produ¸ cão total de pêssegos


(em kg). Obtenha as estimativas correspondentes e os respectivos inter-
valos de cona¸ca.
b. Estime a variˆancia usando o método bootstrap e recalcule o intervalo de
conan¸ca. Use α = 0 , 05.
c. Considere o estimador

{
τ̂ D = N y + ( µX
−x)}= N {µX + ( y −x) },
onde x e y são médias amostrais e µX a média populacional. Obtenha
uma express˜ao geral para a variˆancia de τ̂ D , estime-a e compare com as
encontradas em (a).

6.4 Refaça o Exercı́cio 6.2, considerando agora o estimador V̂Reg denido em (6.6),
isto é, considerando B 0 desconhecido e estimando-o por B̂ 0 .

6.5 Considere os dados do Exerc´ıcio 5.3. Encontre as distribui¸ cões de yReges e


de yRegc (denido no Exerc´ıcio 6.16) com os correspondentes b0h e b0c ótimos
para AASc em cada estrato com n 1 = n 2 = 2. Encontre as variˆ ancias dos
estimadores.

6.6 Refaça o Exercı́cio 6.5 para o caso em que b0h e b0c são substituı́dos por suas
estimativas convenientes.

6.7 Utilizando a AAS selecionada no Exercı́cio 5.16, calcule yReg e uma estimativa
para a sua variˆancia. Como se comparam os resultados com yR ?

6.8 Para vericar a inuência de uma nova marca de ra¸ cão, um criador de galinhas
pesou 10 de seus frangos ao compr´a-los (X i ) e depois de 30 dias (Yi ). Os
resultados est˜ao na tabela abaixo.

Frango: 1 2 3 4 5 6 7 8 9 10
Xi: 1,50 1,60 1,45 1,40 1,40 1,55 1,60 1,45 1,55 1,50
Yi : 2,14 2,16 2,10 1,95 2,05 2,10 2,26 2,00 2,20 2,04

O peso médio de todos os frangos na hora da compra era de 1,54.

a. Qual o estimador regress˜ ao mais indicado ? Justique.


b. E qual seria a estimativa?

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 165/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

154 Estimadores do tipo regress˜


ao

c. E o erro padr˜ao?

6.9 Usando o estimador simples T = N x, encontre a estimativa e o erro padr˜ ao


correspondente. Compare as variˆ ancias V ar[TReg ] e V ar[T ]. Quais as suas
conclus˜oes?

6.10 Queremos estimar a quantidade de a¸ cúcar que podemos extrair de um ca-


minh˜ao carregado de laranjas. Sorteia-se 10 laranjas, pesa-se cada uma ( X i ),
extrai-se o suco e dosa-se a quantidade de a¸ cúcar em cada uma ( Yi ). Os resul-
tados est˜ao na tabela abaixo, em kg.

Laranja Xi Yi
1 0,2000 0,0105
2 0,2400 0,0150
3 0,2150 0,0125
4 0,2100 0,0110
5 0,2500 0,0155
6 0,2300 0,0135
7 0,1950 0,0095
8 0,2050 0,0105
9 0,2100 0,0115
10 0,2200 0,0125

O peso total das laranjas, obtido pela diferen¸ ca do caminh˜ao cheio para o
caminh˜ao vazio é de 900 kg. Qual seria o total esperado de a¸ cúcar que esta
carga de laranjas produziria? Para facilitar as contas use:

X i = 2 , 175, Yi = 0 , 122,
i ∈s i ∈s

X i2 = 0 , 475875, X i Yi = 0 , 0268475 e Yi2 = 0 , 001524.


i ∈s i ∈s i ∈s

6.11 Uma fábrica de suco de laranja quer estimar quanto um caminh˜ ao com 1.000
kg de laranja produzir´ a de suco natural. Para isso, selecionaram-se 10 laranjas
e com os seguintes resultados:

Laranja: 1 2 3 4 5 6 7 8 9 10
Peso (g): 150 130 140 120 160 160 130 170 140 150
Suco (mL): 60 55 50 40 70 60 45 65 55 65

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 166/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

6.5 Estima¸ c˜
ao da m´
edia populacional com AE 155

Dê um intervalo de conan¸ ca para o total de suco de laranja que ser´ a obtido
do caminh˜ao em quest˜ao.

6.12 Um investigador muito bem treinado faz uma estimativa visual das ´ areas cul-
tivadas de arroz em todas as 200 fazendas de um municı́pio, e avalia em 1.200
unidades o total de ´area plantada. Levantaram-se também a ´ area realmente
cultivada de uma amostra de 10 fazendas, cujos dados s˜ ao os seguintes:

Fazenda: 1 2 3 4 5 6 7 8 9 10
Área estimada: 4,8 5,8 6,0 5,9 7,6 6,7 4,7 5,8 4,4 5,2
Área real: 4,7 5,4 5,5 6,4 7,1 7,1 4,8 6,2 4,3 5,0

Para estimar a ´ area total cultivada τ :

a. Que estimador você usaria e por quê? Utilize uma justicativa te´ orica.
b. Produza um intervalo de conan¸ ca para τ .

6.13 Existem N = 75.000 fazendas numa regi˜ao. Tem-se informa¸cão sobre a ´area
geográca de cada fazenda nessa regi˜ao, sendo de µX = 31 alqueires a ´area
média das fazendas. Toma-se uma AASs de n = 2 .000 fazendas dessa regi˜ao
e registra-se a quantidade Yi de reses em cada fazenda. Os seguintes dados
foram obtidos a partir da amostra:

X i = 62 .756, Yi = 25.650,
i ∈s i ∈s

X i2 = 2 .937.801, X i Yi = 1 .146.301 e Yi2 = 596 .235.


i ∈s i ∈s i ∈s

Pede-se:

a. O número médio de reses por fazenda.

b. Sua variˆancia.
c. O coeciente de varia¸cão.

6.14 Um engenheiro orestal quer estimar a altura média das ´ arvores de uma
oresta. Ela é dividida em ´ areas de 100 100 m2 , e é sorteada uma amostra
×
de 10 áreas. Todas as ´arvores da ´area sorteada s˜ao medidas, com os seguintes
resultados:

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 167/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

156 Estimadores do tipo regress˜


ao

´
o Area: 1 2 3 4 5 6 7 8 9 10
N de árvores: 42 51 49 55 47 58 43 59 48 41
Altura média: 8,89 8,76 9,04 8,49 8,58 9,10 8,31 8,58 8,73 8,86

a. Estime a altura média das ´ arvores usando mais de um estimador.


b. Dê as variˆancias respectivas dos estimadores usados.
c. Compare as propriedades dos estimadores. Neste caso, qual o mais reco-
mendado?

6.15 Um grupo de 100 coelhos est´a sendo usado em um estudo sobre nutri¸ cão.
Registrou-se o peso inicial de cada coelho, obtendo 1,55 kg como peso médio.
Ap´os dois meses o experimentador escolheu 10 coelhos e pesou-os, obtendo os
resultados abaixo.

Coelho: 1 2 3 4 5 6 7 8 9 10
Peso inicial: 1,40 1,40 1,45 1,45 1,50 1,50 1,55 1,55 1,60 1,60
Peso nal: 1,95 2,05 5,00 5,10 5,04 2,14 2,10 2,20 2,14 2,26

Estime o peso médio atual dos 100 animais e dê um intervalo de conan¸ ca
para este parˆametro. Justique o uso do estimador empregado.

Te´oricos
6.16 Considere a estratica¸ cão estudada na Se¸cão 6.5. O estimador regress˜ao
combinado da média populacional e com b0h = b0c xo é denido por

yRegc = yes + b0c (µX


−x es ),
onde yes = H h =1 Wh yh e xes =
H
h =1 Wh x h . Mostre que yRegc é n˜ao viciado
para µY e encontre VRegc = V ar yRegc , com rela¸cão à AASs.

6.17 Mostre que V ar y Reges , dada em (6.11), é mı́nima quando


σXY h
b0h = B 0h = 2 , h = 1, . . . , H .
σXh

6.18 Verique a validade da express˜ao (6.13).

6.19 Discuta a aloca¸cão ótima associada com o estimador regress˜ ao separado.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 168/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

6.5 Estima¸ c˜
ao da m´
edia populacional com AE 157

6.20 Derive, com detalhes, o intervalo (6.8) e a express˜ ao (6.10).

6.21 Prove o Teorema 6.5.

6.22 Encontre o valor de b0c = B 0c que minimiza a V ar y Regc , calculada no


Exercı́cio 6.16. Como ca a variˆancia para este b0c ?

6.23 Encontre um estimador n˜ ao viciado para V ar[yRegc ], calculada no Exercı́cio


6.16. Como ca este estimador para o b0c ótimo derivado no Exercı́cio 6.22?

6.24 Discuta a aloca¸cão ótima para o estimador regress˜ ao combinado.

6.25 Sejam Vmin yReges e Vmin yRegc as variˆancias com os correspondentes B 0h


e B0c ótimos. Mostre que
H
2
Vmin y Regc
− Vmin y Reges =
h =1
a h (B 0h
−B 0c ) ,

onde
H
h =1 a h B 0h
B 0c = H
h =1 a h
com
2
a h = Wh σXh
2 , h = 1, . . . , H .
nh
Qual a sua conclus˜ao?

6.26 Derive estimadores n˜ao viciados para VReges dados por (6.11) e (6.13) para
b0h geral e b0h = B 0h xados.

6.27 O estimador diferen¸ca da média populacional µY é denido por

yD = y + ( µ X
−x) .
a. Verique se yD é n˜ao viciado para µY .
b. Encontre a variˆ ancia de yD .
c. Proponha um estimador n˜ ao viciado para a variˆancia em (b).

6.28 Considere os estimadores regress˜ ao separado e combinado do total popula-


cional.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 169/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

158 Estimadores do tipo regress˜


ao

a. Proponha um estimador n˜ ao viciado para a variˆancia do estimador re-


gressão combinado

TRegc = τ̂ Regc = N y es + Nb0c (µX


−x es ) .
Como ca seu estimador quando b0c = B 0c ?
b. Considere os estimadores regress˜ ao combinado e separados do total τ.
Mostre que
H
Wh 2 2
V ar [TReges ] = N 2
V ar [TRegc ]
− h =1
σ (B 0c
n h Xh −B 0c) .

6.29 Formule as vers˜oes correspondentes dos Teoremas 6.2-6.5, para o caso da


AASs, com as respectivas demonstra¸ cões.

6.30 Qual é o estimador regress˜ ao de mı́nimos quadrados em que a variabilidade


de Y depende da vari´avel X de acordo com as seguintes rela¸cões:

a. V ar[Y x i ] = x i σ 2 ;
|
|
b. DP [Y x i ] = x i σ;
c. E [Y ] = βx.

Use a teoria de Modelos Lineares.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 170/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

Cap´ıtulo 7

Amostragem por conglomerados


em um est´
agio
Os planos amostrais vistos até agora sorteavam unidades elementares diretamente da
popula¸cão ou de estratos desta mesma popula¸ cão. Quando os sistemas de referência
não são adequados e o custo de atualiz´ a-los é muito elevado, ou ainda quando a mo-
vimenta¸cão para identicar as unidades elementares no campo s˜ ao caras e consomem
muito tempo, a tarefa amostral pode ser facilitada se forem selecionados grupos de
unidades elementares, os chamados conglomerados. Por exemplo, uma amostra de
eleitores pode ser obtida pelo sorteio de um n´ umero de domicı́lios, trabalhadores
por uma amostra de empresas ou estudantes por uma amostra de escolas ou classes.
O que caracteriza bem o planejamento amostral de conglomerados é que a unidade
amostral contém mais de um elemento populacional.
Suponha que o objetivo de uma pesquisa seja determinar a renda média fa-
miliar de moradores de uma grande cidade. Dicilmente disp˜ oe-se de uma lista de
famı́lias, a unidade elementar da popula¸ cão de interesse. Pode-se usar como sistema
de referência a lista de setores censit´ arios (SC) do IBGE. Um SC é uma ´ area bem
denida com cerca de 300 domic´ılios e s˜ao usados para fazer o recenseamento a cada

10 anos. Pode-se come¸car sorteando um certo n´ umero de SC, de cada SC sorteado


poderiam ser sorteados quarteir˜ oes e dos quarteir˜oes sorteados domic´ılios. Este é
um plano amostral de conglomerados em três est´ agios. Neste capı́tulo ser´ a abordado
o planejamento amostral de conglomerados em um ´ unico est´agio e no Capı́tulo 8 em
dois est´agios.
Uma das inconveniências para o uso da amostragem de conglomerados prende-
se ao fato de que as unidades, dentro de um mesmo conglomerado, tendem a ter

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 171/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

160 Amostragem por conglomerados em um est´


agio

valores parecidos em rela¸cão às vari´aveis que est˜ao sendo pesquisadas, e isso torna
estes planos menos ecientes. Comparando amostragem de elementos com a de
conglomerados de mesmo tamanho, esta ´ ultima tende a: (i) ter custo por elemento
menor; (ii) ter maior variˆ ancia e (iii) maiores problemas para an´ alises estat´ısticas.

Exemplo 7.1 Considere uma popula¸cão agrupada em 3 conglomerados do seguinte


modo:

U= {(1), (2, 3, 4), (5, 6) }= {C1 , C 2 , C 3 },


onde
C = 1 , C = 2, 3, 4 e C = 5, 6 .
{ }
1
{ 2
} 3
{ }
O plano amostral adotado manda sortear dois conglomerados, sem reposi¸ cão, e en-
trevistar todos os elementos do conglomerado. Desse modo, a constru¸ cão do espa¸co
amostral correspondente pode ser feita, levando em conta apenas os conglomerados,
e depois abrir para os elementos. Assim,

Sc ( U) = {C1 C2 , C 1 C3 , C 2 C1 , C 2 C3 , C 3 C1 , C 3 C2 }
e em seguida
( ) = 1234, 156, 2341, 23456, 561, 56234 .
SU { }
Observe que, neste caso, o tamanho da amostra também é uma vari´ avel aleat´oria,
assumindo os valores 3, 4 e 5. Considere agora associado, o vetor de dados

D = (12 , 7, 9, 14, 8, 10),

com
34
µ = 10, S2 = 6 , 8 e σ2 = .
6
Denida a estat´ıstica y, média da amostra, tem-se a seguinte distribui¸ cão amostral
de y:

y(s 1 ) = 10 , 5, y(s 2 ) = 10 , y(s 3 ) = 10 , 5, y(s 4 ) = 9 , 6, y(s 5 ) = 10 e y(s 6 ) = 9 , 6.

Para ilustrar o efeito do tipo de conglomera¸ cão sobre a eciência do estimador


observe o Exemplo 7.2. Este t´opico será abordado novamente na Se¸ cão 7.4, onde
será tratado o conceito de correla¸ cão intraclasse.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 172/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

161

Exemplo 7.2 Volte-se a popula¸cão


U= {1, 2, 3, 4, 5, 6} com os dados do Exemplo
7.1 e considere as três poss´ıveis divis˜ oes de conglomerados:

D 1 = (7 , 8) µ1 = 7 , 5 S12 = 0 , 5
µ2 = 9 , 5 S22 = 0 , 5
UA = {(2, 5), (3, 6), (1, 4) } → D 2 = (9 , 10)
D 3 = (12 , 14) µ3 = 13, 0 S32 = 2 , 0

D 1 = (7 , 10) µ1 = 8 , 5 S12 = 4 , 5
µ2 = 10, 0 S22 = 8 , 0
UB = {(2, 6), (1, 5), (3, 4) } → D 2 = (12 , 8)
D 3 = (9 , 14) µ3 = 11 , 5 S32 = 12, 5

D 1 = (7 , 14) µ1 = 10, 5 S12 = 24, 5

UC = {(2, 4), (1, 5), (3, 6) } → D 2 = (12 , 8)


D 3 = (9 , 10)
µ2 = 10, 0 S22 = 8 , 0
µ3 = 9 , 5 S32 = 0 , 5

O plano amostral manda sortear um conglomerado de acordo com AAS, e as duas


unidades do conglomerado s˜ao observadas. Em cada caso pode-se calcular a respec-
tiva distribui¸ cão amostral e seus parˆametros. Assim, temos a Tabela 7.1, onde para
cada uma das popula¸ cões a distribui¸cão da média amostral, sua média e variˆ ancia
são calculadas.

Tabela 7.1: Distribui¸ cão amostral de y na AC


Divisão A
y: 7,5 9,5 13, 0 E A [y] = 10
16
P (y): 1/3 1/3 1/3 V arA [y] =
3

Divisão B
y: 8,5 10,0 11,5 E B [y] = 10
4, 5
P (y): 1/3 1/3 1/3 V arB [y] =
3

Divisão C
y: 9,5 10,0 10,5 E C [y] = 10
0, 5
P (y): 1/3 1/3 1/3 V arC [y] =
3

Observe que em todos os casos y é n˜ao viesado, mas que para a situa¸ cão C o estima-
dor é mais eciente (tem menor variˆ ancia). Observe que neste caso os conglomerados
são os mais heterogêneos, que pode ser medido pela variˆ ancia média dos conglomera-

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 173/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

162 Amostragem por conglomerados em um est´


agio

dos, (24, 5 + 8 , 0 + 0 , 5)/ 3 = 11 , 0. As outras duas popula¸ cões tem variˆancias médias
iguais a 1,0 e 8,33, respectivamente.

Daqui conclui-se que quanto mais parecidos forem os elementos dentro do


conglomerado, menos eciente é o procedimento. Tal resultado é esperado, pois
para o conglomerado ser um “bom” representante do universo ele deve ser uma
“micro representa¸ cão” do mesmo, ou seja, ter todo tipo de participante e n˜ ao do
mesmo tipo. É o oposto do exigido para constru¸ cão de estratos. (Pense!)

7.1 Nota¸ cão e rela¸ cões ´uteis


A nota¸cão usada para conglomerados é muito semelhante ` aquela adotada para estra-
tica¸cão, embora sejam procedimentos bem distintos. A popula¸ cão de elementos
U
estar´a agrupada em A conglomerados, desse modo, ser´a necessário dois ı́ndices ( α, i )
para indicar os elementos da popula¸ cão: o primeiro refere-se ao conglomerado e o
segundo ao elemento, dentro do conglomerado. Assim,

U = {1, 2, . . . , N }
=
{(1, 1), . . . , (1, B 1 ), . . . . . . , (A, 1), . . . , (A, B A )}
=
{C1 , C 2 , . . . , C A },
onde

{
C α = (α, 1), . . . , (α, i ), . . . , (α, B α ) .
}
A Tabela 7.2 representa a disposi¸ cão dos dados de uma vari´avel Y pelos conglome-
rados.

Tabela 7.2: Popula¸ cão disposta em conglomerados


Conglomerado Elementos
1
..
Y11
..
·. .·· Y1i
..
·. .· · Y1B 1

. .
. . .
α
..
Yα 1
...
·. .·· Yαi
...
·. .· · YαB α
. . .
A YA1
· ·· YAi
··· YAB A

Utilizando essa nota¸cão, pode-se obter as seguintes deni¸ cões e relações entre
os parˆametros:

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 174/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

7.1 Nota¸ cão e rela¸ cões ´uteis 163

1. Tamanhos B α dos conglomerados,


A
N = B α = AB,
α =1

onde B é o tamanho médio dos conglomerados,

N
B= .
A

2. Para indicar o total do conglomerado usar-se-´ a a letra τ α , assim


τα = i=1
Yαi .

Conseq¨uentemente o total populacional ser´ a


A A Bα
τ = τα = Yαi = Aτ ,
α =1 α =1 i=1

onde
A
τ 1
τ = = τα
A A α =1

é o total médio por conglomerado.


3. A média por elemento dentro do conglomerado ser´ a indicado por µα ou Yα ,
ou seja,
B
τα 1 α
µα = Y α = = Yαi .
Bα B α i=1
Conseq¨uentemente a média global por elemento é
A Bα A
τ 1 1
µ = Y= = Yαi = τα
N N α =1 i=1 AB α =1
A
= 1 B α µα = τ .
A α =1 B B

Algumas vezes ser´a necessário trabalhar com a média das médias dos conglo-
merados, que ser´a indicada por
A
1
µ= Y = µα .
A α =1

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 175/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

164 Amostragem por conglomerados em um est´


agio

Convém observar que


A A A
1 Bα 1 1 Bα
µ
− µ=
A α =1 B
µα
− A α =1
µα =
A α =1 B −1 µα

e nem sempre o resultado é nulo, ou seja, nem sempre os dois valores s˜ ao iguais.
Um caso onde as médias coincidem é o de conglomerados de igual tamanho.

4. A variˆancia entre elementos dentro do conglomerado α será indicada por



1 2
σα2 =
Bα i=1
(Yαi
−µα ) ,

enquanto que a variˆ ancia populacional ser´a


A Bα
1 2
σ2 =
N α =1 i=1
(Yαi
−µ)
A Bα A Bα
1 1 2
µ) 2 ,
=
N α =1 i=1
(Yαi
− µα ) +
N α =1 i=1
(µα

express˜ao equivalente `aquela usada para estratica¸ cão, onde:

σ 2 = variˆancia dentro dos conglomerados + variˆ ancia entre conglomerados


2 2
= σdc + σec ,

onde
A Bα A Bα A
1 1 Bα 1 Bα 2
2
µα ) 2 = µα ) 2 =
σdc =
N α =1 i=1
(Yαi
− AB α =1
Bα i=1
(Yαi
− A α =1 B
σα

e
A A
1 12 Bα
2
µ) 2 ,
σec =
N α =1
B α (µα
− µ) =
A α =1 B
(µα

1 Bα 2


com σα2 = B α i=1 (Yαi µα ) . Observe que a express˜ao B α /B , que aparece
em várias express˜oes, mede o quanto o tamanho de um conglomerado se afasta
do tamanho padr˜ ao médio. Quando os tamanhos de todos os conglomerados
forem iguais, esse quociente torna-se igual a 1, e as f´ ormulas cam bem mais
2
simples. Tendo em mente estas ´ ultimas observa¸cões, pode-se interpretar σdc
2
como uma média das variˆ ancias dos conglomerados enquanto que σec é uma
variˆancia entre as médias dos conglomerados.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 176/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

7.1 Nota¸ cão e rela¸ cões ´uteis 165

Será utilizada também uma medida para indicar a variˆ ancia entre os totais dos
conglomerados:
A A
2 1 2 1 2
σec [τ ] =
A α =1
(τ α
− τ) =
A α =1
B α µα
−Bµ

2 A 2
B Bα 2 2
=
A α =1 B
µα
−µ = B σect

onde, para manter similaridade com a medida de varia¸ cão entre conglomerados,
dene-se
A 2
2 1 Bα
σect = µα µ .
A α =1 B
2 2

Observe a grande similaridade entre σec e σect , onde o fator de pondera¸cão,
B α /B , aparece fora e dentro do quadrado, respectivamente.
Outras f´ormulas para medir a variabilidade entre conglomerados envolvendo
as médias dos conglomerados s˜ ao:
A 2
2 1 Bα 2
σeq =
A α =1 B
(µα
−µ) .

e
2 1 A 2
σem =
A α =1
(µα
−µ) .

Em planos AASs, quando houver necessidade, ser´ a usada a nota¸cão S 2 , com


as respectivas mudan¸ cas no denominador.

5. Também ser˜ ao usadas as seguintes nota¸ cões para indicar as diversas somas de
quadrados envolvidas.

• Soma de Quadrados Total entre os elementos,


A Bα
2
= N σ 2 = ABσ 2 .
SQ [T ] =
α =1 i=1
(Yαi
−µ)
• Soma de Quadrados Dentro dos conglomerados,
A Bα A
2
B α σα2 = ABσ dc
2
SQ [D ] =
α =1 i=1
(Yαi
−µα ) =
α =1
.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 177/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

166 Amostragem por conglomerados em um est´


agio

• Soma de Quadrados Entre conglomerados,


A Bα A
µ) 2 = 2 2
SQ [E ] =
α =1 i=1
(µα
− α =1
B α (µα
−µ) = ABσ ec .

• Soma de Quadrados Entre Totais dos conglomerados,


A A 2
2 2 Bα 2 2
SQ [Eτ ] =
α =1
(τ α
−τ ) = B
α =1 B
µα
−µ = B Aσ ect .

Note que s˜ao válidas as rela¸cões usuais

SQ [T ] = SQ[D ] + SQ [E ].

6. Quando todos os conglomerados tiverem o mesmo tamanho, isto é,

B 1 = B 2 = . . . = B A = B = B,

indicaremos por B esse valor comum. Nesta situa¸ cão tem-se que B α /B = 1 e
A B A
1 1
µ= Yαi = µα = µ,
AB α =1 i=1
A α =1

ou seja, a média global coincide com a média das médias dos conglomerados. A

variˆ
dos ancia dentro dos conglomerados, simplica-se como a média das variˆ ancias
conglomerados
A
2 1
σdc = σα2 .
A α =1
As diferentes express˜oes para variˆancia entre, resumem-se a
A
2 2 2 2 1 2
σec = σect = σeq = σem =
A α =1
(µα
−µ) .

7.2 Plano amostral


Serão sorteados a < A conglomerados, através de um processo AAS, com reposi¸ cão
(AASc). De cada conglomerado ser˜ ao entrevistados todos os indiv´ıduos. Detalhes
sobre o plano AAS sem reposi¸cão são encontrados nos exercı́cios. Esse procedimento
equivale ao procedimento AASc, discutido no Capı́tulo 3, de onde s˜ ao sorteados a
elementos da popula¸cão representada por

UC = {C1 , C 2 , . . . , C α , . . . , C A }

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 178/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

7.3 Estimadores da m´
edia por elemento 167

e o parâmetro populacional D pela matriz

D =
B1 B2
·· · Bα · ·· BA
τ1 τ2
·· · τα · ·· τA
µ1 µ2
·· · µα · ·· µA
ou qualquer outra caracterı́stica de interesse. J´ a os dados da amostra ser˜ ao repre-
sentados por

d =
b1 b2
·· ·
bα ba
···
.
T1 T2
·· ·
Tα Ta
···
y1 y2
·· ·
yα ya
···
Desse modo, todas as propriedades derivadas naquele capı́tulo s˜ ao válidas aqui, com
n = aα =1 bα .
Conv´
em ressaltar que a vari´ avel Tα , total observado na α-ésima extra¸ cão,
assume os valores τ1 , τ 2 , . . . , τ A . Interpreta¸ cão idêntica vale para as vari´ aveis bα e
yα .

7.3 Estimadores da m´
edia por elemento
O parˆametro a ser estimado é a média global por elemento
τ τ
µ= Y = N = B.
Dependendo da informa¸ cão adicional dispon´ıvel pode-se substituir os parˆ ametros
acima por estimadores convenientes.
A primeira delas sup˜oe conhecido o número total N de unidades no universo.
Desse modo, substitui-se o numerador por um estimador n˜ ao viesado, assim

estimador de τ Aτ̂ τ̂ T
y c1 = = = = ,
N AB B B
onde τ̂ é a média dos totais dos a conglomerados sorteados, isto é,

1 a
τ̂ = T = Tα .
a α =1

O segundo estimador é mais indicado quando o total N é desconhecido, e


cautelosamente substitui τ e N por estimadores n˜ao viesados, obtendo

estimador de τ Aτ̂ τ̂ T
yc2 = = = = ,
estimador de N AB̂ B̂ b

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 179/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

168 Amostragem por conglomerados em um est´


agio

que é um estimador do tipo raz˜ ao, onde B̂ é o tamanho médio estimado dos conglo-
merados sorteados, ou seja, estimado por
a
1
B̂ = b = bα .
a α =1

Finalmente, o terceiro estimador a ser estudado é aquele que ignora o fato


dos diferentes tamanhos dos conglomerados e prop˜ oe a média das médias como
estimador, isto é,
a
1
y c3 = y .
a α =1 α

Teorema 7.1 Para os estimadores acima valem as seguintes rela¸ c˜oes:


2
σect
E [yc1 ] = µ, V ar [yc1 ] = ,
a
2
σeq
E [yc2 ] = µ + B [yc2 ] , EQM [y c2 ] V ar [yc2 ] = ,
a
2
σem 2
E [yc3 ] = µ + ( µ
− µ) , EQM [y c3 ] =
a
+ (µ
−µ) ,

onde B[yc2 ] denota o v´ıcio de yc2 .


Prova. Como já foi mencionado, a AC em um ´unico est´agio equivale a uma AAS
para os valores agregados do conglomerado. Assim, para o primeiro estimador,
o parˆametro populacional é

D = ( τ 1 , τ 2 , . . . , τ α , . . . , τ A ),

2
com média τ e variância σ ec [τ ], da qual foi retirada por AASc, amostras cujos
dados s˜ao

d = ( T1 , T2 , . . . , T α , . . . , T a ).
Pelo Teorema 3.3, tem-se que

E T = τ

e
2
σec [τ ]
V ar T = ,
a

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 180/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

7.3 Estimadores da m´
edia por elemento 169

2 1 A 2
com σec [τ ] = A α =1 (τ α
−τ ) . Logo,
1 τ
E [yc1 ] = E T = = µ
B B
e
2
1 1 σ 2 [τ ] 2
1 B σect σ2
V ar[yc1 ] = 2 V ar T = 2 ec = 2 = ect .
B B a B a a
2
= A1 A Bα
µ) 2 .
com σect α =1 ( B µα

Para o segundo estimador basta lembrar que o parˆ ametro populacional é

D =
τ1 τ2
··· τα
··· τA
B1 B2 Bα BA
e os dados amostrais ··· ···
d =
T1 T2
· · · Tα · · · Ta
b1 b2
· · · bα · · · ba
e que yc2 é um estimador raz˜ ao. Assim, pelo Exercı́cio 5.12, tem-se que ele é
viesado e, portanto
E [yc2 ] = µ + B [y c2 ].
Por outro lado, pelo Teorema 5.2 para AASc (veja o Exercı́cio 7.29) temos que
N
1 2
EQM [r ] V ar[r ] nNµ 2X i=1
(Yi
−RX i ) .

Ajustando para o estimador acima, tem-se


A
1
µB α ) 2
EQM [y c2 ]
aAB
2
α =1
(τ α

A 2 2
1 Bα σeq
µ) 2 =
=
aA α =1 B
(µα
− a
.

2
Observe que σeq é uma outra maneira de medir a variabilidade entre as médias
dos conglomerados.
Finalmente, o terceiro estimador equivale a

D = ( µ1 , µ 2 , . . . , µ α , . . . , µ A )

com média igual a µ e variância entre médias denida, como na Se¸ cão 7.1, por
A
2 1 2
σem =
A α =1
(µα
−µ) .

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 181/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

170 Amostragem por conglomerados em um est´


agio

Na amostra
d = ( y1 , y 2 , . . . , y α , . . . , y a ).
Portanto, yc3 é um estimador n˜ ao viesado da média de D , isto é,

E [y c3 ] = µ

2
e variˆancia igual a σ em dividia por a (AASc), ou seja,
2
σem
V ar[yc3 ] = .
a
2
Usando o fato de que EQM [yc3 ] = V ar[yc3 ] + ( µ
−µ) o teorema ca demons-
trado.

Corol´ ario 7.1 Estimadores para as variˆ ancias do Teorema 7.1 s˜ ao dados por
a 2
1 Bα
var [yc1 ] =
a(a
−1) α =1a B

−yc1 ,

2
1 bα 2
var [yc2 ] =
a(a
−1) α =1a b
(yα
−yc2 ) ,

1 2
var [yc3 ] =
a(a
−1) α =1
(yα
−yc3 ) .

Com rela¸c˜ao à AASc, o primeiro e o terceiro s˜ ao n˜ao viciados para as respectivas


variˆancias.

Prova. Do Teorema 3.4, tem-se que


a
1 2
s 2ec [τ ] =
a
− 1 α =1

− τ̂ ,

2 2 2 2
com τ̂ = B y c1 , é um estimador n˜ ao viesado de σec [τ ]. Como σ ect = σec [τ ]/B ,
segue que
2
E s ec [τ
2 ] = σect
2 ,
B
de modo que
2 a 2 a 2
s 2ec [τ ] B Bα 1 Bα
2 = 2
B

− yc1 =
a(a
− 1) B


y c1 ,
aB B a(a
− 1) α =1 α =1

é um estimador n˜ ao viciado de V ar[yc1 ].

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 182/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

7.3 Estimadores da m´
edia por elemento 171

Do Exercı́cio 7.29, tem-se que um estimador da variˆ ancia do estimador raz˜ ao


R̂ = r é dado por
1 2
var [r ] =
n (n
− 1)x 2 i ∈s
(Yi
−rX i ) .

Adotando a nomenclatura dos conglomerados, tem-se


a
1 2
var [y c2 ] = 2 (Tα
−yc2 bα )
a(a
−1)b aα =1 2
1 bα 2
=
a(a
− 1) α =1 b
(yα
−yc2 ) .

Para o terceiro estimador, a aplica¸ cão direta dos resultados de AASc, Teorema
3.4, mostra que
a
1
s 2em = y c3 ) 2
a 1 α =1 α
(y
− −
2
é um estimador n˜ ao viesado de σ em . De modo an´alogo, dene-se
a
1 bα 2
s 2ec =
a
− 1 α =1 b
(yα
−yc2 )
2 2
que é estimador de σec . Como estimador de σ eq consideramos

1 a bα 2
2
s 2eq =
a
− 1 α =1 b
(yα
−yc2 ) .

J´a a 2
1 bα
s 2ect =
(7.1)
a
−1 α =1 b

− y c1

2
nem sempre é um estimador n˜ ao viesado de σect (veja o Exercı́cio 7.32).

Nenhum dos três estimadores do Teorema 7.1 é consistentemente melhor que


os demais, isto é, tem EQM menor em todas as circunstˆ ancias. Jessen (1978) arma

que se o coeciente da regress˜ao de µα em função de B α for negativo, positivo ou


nulo, deve-se preferir y c1 , yc2 ou y c3 , respectivamente.

Corol´
ario 7.2 Quando todos os conglomerados tem o mesmo tamanho B, os três
estimadores s˜ao iguais a
a B a
1 1
yc = yαi = y
aB α =1 i=1
a α =1 α

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 183/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

172 Amostragem por conglomerados em um est´


agio

com
2 A
V ar[yc ] = σec = 1
a aA α =1
(µα
−µ)2 .
Um estimador n˜ao viciado de V ar[yc ] é dado (ver Corol´ ario 7.1) por
a
s2ec 1 2
var [yc ] =
a
=
a(a 1)
− α =1
(yα
−yc ) .

É importante notar também que quando todos os conglomerados tem tama-


nhos iguais, segue que
a
2 2 2 2 1 2
s ec = s ect = s eq = s em = a
−1 α =1 (yα
− yc ) .

Corol´ ario 7.3 O estimador


a
1 Bα 2
s 2dc = σ
a α =1 B α
2
é n˜ao viesado para σdc .

Veja o Exercı́cio 7.33 para a prova dos Corol´ arios 7.2 e 7.3.
Quando B é desconhecido, substituindo-se por b, o estimador no corol´ario

acima passa a ser viesado. Se os tamanhos n˜ ao variam muito o viés é pequeno.

7.4 Coecientes de correla¸ cão intraclasse


J´a se discutiu que a eciência do conglomerado depende do grau de similaridade
de seus elementos. Desse modo é bastante importante criar medidas que indiquem
qual o grau de similaridade dos elementos dentro dos conglomerados. Existem v´ arias
propostas para tais medidas, principalmente quando os conglomerados n˜ ao são do
mesmo tamanho. Silva e Moura (1986), em um trabalho interno do IBGE, zeram
uma revis˜ao e compara¸cão de algumas dessas medidas. Aqui, com objetivo did´ atico,
será abordada apenas a mais tradicional delas, muito usada para conglomerados de
igual tamanho. Para conglomerados desiguais ser´ a feita uma extens˜ao conveniente.
Antes de formular a deni¸ cão é interessante descrever como é constru´ıda a
medida.

i. Considere a popula¸cão dividida em A conglomerados conforme a nota¸ cão da


Seção 7.1.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 184/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

7.4 Coecientes de correla¸ c˜


ao intraclasse 173

ii. Em seguida formam-se todos os pares de unidades distintas possı́veis dentro de


cada conglomerado. Por exemplo, para o α -ésimo conglomerado seria possı́vel

formar os B α (B α 1) pares de valores da vari´avel Y descritos na Tabela 7.3.
A
iii. Desse modo tem-se no total de conglomerados α =1 B α (B α 1) pares do tipo

(Y1 , Y2 ), onde Y1 indica os possı́veis valores da primeira posi¸ cão do par e Y2 ,
o segundo.
A
iv. Calcula-se agora para todos esses α =1 B α (B α
− 1) pares o coeciente de
correla¸cão de Pearson, isto é,

Cov[Y1 , Y2 ]
ρint = DP [Y1 ]DP [Y2 ].

Tabela 7.3: Pares possı́veis dentro do conglomerado α


Elemento ( α, 1) (α, 2) (α, i )
··· ·· · (α, B α )
(α, 1) —– (Yα 1 , Yα 2 )
··· (Yα 1 , Yαi )
·· · (Yα 1 , YαB α )
(α, 2)
..
(Yα 2 , Yα 1 )
...
—–
...
·. .· · (Yα 2 , Yαi )
...
··
..
· (Yα 2 , YαB α )
...
. . .
(α, i ) (Yαi , Yα 1 ) (Yαi , Yα 2 )
··· —–
·· · (Yα 1 , YαB α )
. . . .. . . .. . .
(α, B α ) (YαB α , Yα 1 )
2
(YαB α , Yα 2 )
··· (YαB α , Yαi )
·· · —–
Existem B α
− B α = B α (B α
− 1) pares poss´ıveis.

Deni¸ cão 7.1 Ao coeciente ρint chama-se coeciente de correla¸ c˜ao intraclasse, ou
dentro dos conglomerados.

Exemplo 7.3 Volte-se ao Exemplo 7.2, onde a popula¸ cão foi dividida em três dife-
rentes grupos de conglomerados. Na divis˜ ao A, tem-se A = (2, 5), (3, 6), (1, 4) =
U { }
{poss´ıvel formar
} com
C1 , C 2 , C 3
dois pares {
DA
distintos de valores (7 }, 8) e (8, 7). Estendendo para todos
= (7, 8), (9, 10), (12, 14) . Dentro do conglomerado só é C1

os conglomerados, tem-se

Y1 : 7 8 9 10 12 14
Y2 : 8 7 10 9 14 12


Calculando-se o coeciente de correla¸ cão obtém-se ρint = 0, 82. Na divisão B , tem-se

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 185/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

174 Amostragem por conglomerados em um est´


agio

Y1 : 7 10 12 8 9 14
Y2 : 10 7 8 12 14 9
com ρint = ∼−0, 47; e na divisão C ,
Y1 : 7 14 12 8 9 10
Y2 : 14 7 8 12 10 9
com ρint = ∼−0, 94.
Observe que quanto maior o coeciente de correla¸ cão intraclasse, mais ho-
mogêneos s˜ao os conglomerados e menos eciente é o uso da AC. J´ a tinha sido
observado na distribui¸ cão amostral do Exemplo 7.2 que na divis˜ ao A a AC era a me-
nos eciente e na C tinha-se o procedimento mais eciente, ou seja, acompanhando
a ordem decrescente do ρint .

7.4.1 Conglomerados de igual tamanho


Quando os conglomerados tem o mesmo tamanho as f´ ormulas simplicam-se bas-
tante, e pode-se encontrar express˜ oes operacionais bem interessantes.

Lema 7.1 Para conglomerados de tamanhos iguais a B, tem-se


A
1
Cov Y , Y = (Yαi µ) (Yαj µ)
1 2 AB (B
− 1) α =1 i = j
− −
e
V ar Y1 = V ar Y2 = σ 2 .

Prova. Usando como referência a Tabela 7.3, pode-se escrever para o α -ésimo con-


glomerado que a soma das B (B 1) observa¸cões do primeiro elemento do par


é igual a B 1 vezes o total do conglomerado, isto é,
B
(B
−1)τ α = ( B
− 1)
i=1
Yαi .

Somando agora para todos os conglomerados tem-se


A
(B
− 1)
α =1
τα = ( B
−1)τ.
Portanto a média dos AB (B
−1) valores do primeiro elemento do par é
E Y1 = −
(B 1)τ
=
τ
= µ.

AB (B 1) AB

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 186/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

7.4 Coecientes de correla¸ c˜


ao intraclasse 175

O mesmo argumento mostra que

E Y2 = µ.

Para calcular a variˆ ancia, fa¸c amos o cálculo da diferen¸ca para um valor i,
dentro do conglomerado α
(Yαi µ) 2 .

Da Tabela 7.3, nota-se que essa soma aparece B
−1 vezes, portanto a soma
total dentro do conglomerado ser´ a
B
2
(B
− 1) (Yαi
−µ) .
i=1
Assim, a variˆancia ser´a
A B
1 2
V ar Y1 = V ar Y2 =
AB (B
− 1) α =1
(B
− 1)
i=1
(Yαi
−µ)
A B
1
µ) 2 = σ 2 .
=
AB α =1 i=1
(Yαi

Finalmente, aplicando a f´ ormula da covariˆancia tem-se
A
1
Cov Y1 , Y2 = (Yαi µ) ( Yαj µ) .
AB (B
−1) α =1 i = j − −
Teorema 7.2 Para conglomerados de tamanhos iguais tem-se
2
2 σdc
ρint =
σec
−2 B− 1
.
σ
Prova. Sendo B o tamanho comum dos conglomerados, pode-se escrever
B B B
1 B 1 1
µα
− µ=
B i=1
Yαi
− B
µ=
B i=1
Yαi
− Bµ =
B i=1
(Yαi
−µ) .
Elevando ambos os lados ao quadrado,
B
1
µ) 2 = 2
(µα
− B2 i=1
(Yαi
−µ) +
i= j
(Yαi
−µ) (Yαj −µ) ,

portanto,
A A B A
21 21
α =1
(µα
−µ) = 2
B α =1 i=1
(Yαi
− µ) + 2
B α =1 i = j
(Yαi
−µ) (Yαj −µ) .

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 187/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

176 Amostragem por conglomerados em um est´


agio

Usando os resultados da Se¸ cão 7.1 (item 6) e do Lema 7.1, vem

2 1 1
ABσ 2 + 2 AB (B
Aσ ec =
B 2 B −1)Cov Y1 , Y2 ,

ou seja,
2
σ2
Cov [Y1 , Y2 ] =
Bσ ec
− .
B 1

Lembrando ainda que σ 2 = σdc
2 2
+ σec , obtém-se
2
2 σdc
Cov Y1 , Y2 = σec
− −
B 1
.

Dividindo por DP [Y1 ].DP [Y2 ], que pelo Lema 7.1 é igual a σ2 , tem-se o teo-
rema demonstrado.
Essa express˜ao é muito ´util para interpretar e analisar o efeito da conglo-
mera¸cão sobre os estimadores. Duas situa¸ cões extremas s˜ao:

i. Suponha o caso de m´axima homogeneidade, isto é, dentro dos conglomerados


todas as observa¸cões são iguais entre si, ou seja, σα2 = 0. Logo, σdc
2
= 0 e
2 2
σec = σ , de modo que
ρint = 1 .
Ou seja, é quando se observa o maior valor de ρint .

ii. Suponha agora que cada conglomerado é uma micro representa¸ cão do universo.
Isto pode ser traduzido na suposi¸ cão de que a variˆancia média seja igual `a
2
variˆancia global, σ dc = σ 2 , o que implica em σec
2
= 0, logo
1
ρint =
−B −1
é o menor valor que pode assumir.

Note que as variˆancias entre e dentro podem ser reescritas dos seguintes modos:
σ2
(7.2) σ 2 = 1 + ρint (B 1)

e
ec
{ − }B
2
σdc =
B

B
1
(1 ρint )σ 2 .

Corol´ ario 7.4 Para conglomerados de igual tamanho, tem-se
σ2
{
V ar [y c ] = 1 + ρint (B
− } 1)
aB
.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 188/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

7.4 Coecientes de correla¸ c˜


ao intraclasse 177

Prova. Este resultado segue diretamente do Corol´ ario 7.2 e de (7.2).

Corol´
ario 7.5 O efeito do planejamento para conglomerados de igual tamanho é
dado por
EP A = 1 + ρint (B
−1).
Prova. Basta lembrar que a variˆ ancia de yc deve ser comparada com a de uma
AASc, de tamanho n = aB , que é V arAASc [y] = σ 2 / (aB ), logo

V arAC [yc ]
EP A =
V ar AASc [y]
= 1 + ρint (B
−1).
Assim, a eciência depender´ a do tipo de conglomera¸cão. Usualmente ρint é
positivo, ent˜ao a conglomera¸cão usualmente leva `a perda de eciência em rela¸ cão à
AASc.

Corol´
ario 7.6 O coeciente de correla¸c˜ao intraclasse é estimado por
2
s
s 2ec B −dc 1
r int = 2 − .
s ec + s 2dc

Prova. Substituiu-se cada termo do coeciente de correla¸ cão no Teorema 7.2 por
estimadores n˜ao viesados.

7.4.2 Conglomerados de tamanhos desiguais


Com o intuito de encontrar f´ ormulas operacionais boas como ` aquela apresentada
no Corol´ario 7.4, é conveniente redenir o coeciente de correla¸ cão intraclasse para
algum estimador especial. Ser´ a usado o desenvolvimento para o estimador yc2 .
Observando a express˜ ao do coeciente de correla¸cão intraclasse do Teorema 7.2 e o
2
fato que V ar[yc2 ] = σeq /a , prop˜oe-se
2
2 σdc
σeq
− B− 1
ρc2 = γ2 ,
onde
γ 2 = σeq
2 2
+ σdc .

Trabalhando esses resultados, pode-se escrever

γ2
V ar[yc2 ] = 1 + ρc2 B
− 1
aB
,

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 189/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

178 Amostragem por conglomerados em um est´


agio

bem como
2
EP A = 1 + ρc2 B
γ2 .
σ − 1
Na maioria das situa¸ cões práticas, quando os tamanhos n˜ ao variam muito,
observa-se que γ 2 /σ 2 1, logo

EP A 1 + ρc2 B
−1
que permite as mesmas interpreta¸ cões feitas anteriormente. Para atender outros
estimadores, pode-se usar deni¸ cões adequadas em cada situa¸ cão.

Exemplo 7.4 Considere a popula¸cão do Exemplo 7.1, ou seja,

U =
{ }
(1) , (2, 3, 4), (5, 6) ,
D = ((12) , (7, 9, 14), (8, 10)) ,

onde µ = 10, σ2 = 17 / 3, µ = 31/ 3. Ent˜ao,

µ1 = 12, µ2 = 10, µ3 = 9
σ12 = 0 , σ22 = 26/ 3, σ32 = 1
B 1 = 1 , B2 = 3 , B3 = 2 , B = 2 ,
2 1 1 3 26 2 14
σdc =
3 2
0+
2 × 3
+
2 ×
1 =
3
,
×
2 1 1 2 3 2 2 2


σec = 3 2 (12 10) + 2 (10 10) + 2 (9
− − 10) = 1,
o que conrma a rela¸cão σ 2 = σec
2 2
+ σdc . Pode-se calcular também
2 2 2
2 1 1 3 2
σect =
3 2 × − 12 10 +
2 × − 10 10 +
2 ×−
9 10 = 14 ,

2 2 2
1 1 3 2 2
2
10) 2 + 10) 2 + 2
σeq =
3 2
(12
− 2
(10
− 2
(9
−10) =
3
,

2 2
2 1 31 31 31 14
σem =
3
12
− 3
+ 10
− 3
2+ 9
− 3
=
3
.

Suponha que o plano amostral corresponda ao sorteio de dois conglomerados com


reposi¸cão. Assim,
14
V ar[yc1 ] = = 7,
2
2/ 3 1
V ar[yc2 ] = = ,
2 3
14/ 3 7
V ar[yc3 ] = = .
2 3

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 190/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

7.5 Estima¸ c˜
ao de propor¸ cões 179

Aqui, o estimador do tipo raz˜ ao yc2 é o mais indicado.


O coeciente de correla¸cão pode ser calculado pela deni¸cão, que leva aos
seguinte valores

Y1 : 7 7 9 9 14 14 8 10
Y2 : 9 14 14 7 7 9 10 8

que leva a ρint = ∼−0, 477. Por outro lado, usando a deni¸ cão adaptada temos
2 14 16
γ2 = + = ,
3 3 3
2 14/ 3
ρc2 = 3 − 2− 1 =
12
−16 = −0, 75,
16/ 3
16/ 3 1
{ −
V ar[yc2 ] = 1 + ( 0, 75)(2
− }×
1)
2 2
= ,
3
17 16
pois a = 2. Observe também que σ2 = 3 3 = γ 2.

7.5 Estima¸ cão de propor¸ cões


Quando a vari´avel de interesse é do tipo dicotˆ omica, isto é, Yαi = 1 se o elemento
i no conglomerado α possui o atributo de interesse e 0 em caso contr´ ario, pode-se
derivar as propriedades das se¸ cões anteriores utilizando uma nota¸ cão especial. Seja
τ α o número de indivı́duos com o atributo no conglomerado α. Ent˜ao a propor¸cão
populacional P ca sendo
A
τα
P = Aα =1 ,
α =1 B α
novamente uma raz˜ ao, cujo estimador pode ser equivalente ao yc2 , ou seja,
a
α =1 Tα
pc2 = a
α =1 bα
e de acordo com o Teorema 7.1 sua variˆ ancia ca sendo
A
1
V ar[pc2 ]
aAB
2
α =1
(τ α
−P B α )2 ,
estimada por
a
1 2
var [pc2 ] = 2 (Tα
−pc2 bα ) .
a(a
− 1)b α =1
Quando os conglomerados tem o mesmo tamanho as f´ ormulas podem ser simplica-
das. Veja o Exercı́cio 7.21.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 191/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

180 Amostragem por conglomerados em um est´


agio

7.6 Normalidade assint´ otica e intervalos de conan¸ ca


No caso em que os conglomerados s˜ao de tamanhos iguais, a normalidade assint´ otica
de yc segue diretamente da normalidade assint´ otica da média amostral na AAS.
Portanto, para A e a sucientemente grandes, tem-se que

(7.3) − ∼
yc µ a
2 /a
σec
N (0, 1).

Usando o procedimento da Se¸ cão 3.2.4, temos que um intervalo de conan¸ ca


para µ com coeciente de conan¸ca γ = 1 α é dado por

(7.4) yc zα var [yc ]; yc + zα var [yc ] ,

onde var [yc ] = s 2ec /a é como dado no Corol´ario 7.2.
Quando os conglomerados s˜ao de tamanhos diferentes, a normalidade as-
sint´otica de yc2 segue diretamente da normalidade assint´ otica do estimador raz˜ ao.
Veja o Capı́tulo 10 para uma discuss˜ ao mais detalhada do problema. Ent˜ ao, para
a e A sucientemente grandes, tem-se que (7.3) continua valendo. Um intervalo de


conan¸ca para µ com coeciente de conan¸ca γ = 1 α é ainda dado por (7.4), com
y c2 no lugar de yc e com
a
s 2eq 1 bα 2
2
var [yc2 ] = a = a(a
− 1) α =1 b (y α
−yc2 ) ,

no lugar de var [yc ], conforme visto no Corol´ario 7.1.


Intervalos de conan¸ ca para o total populacional τ podem ser obtidos de ma-
neira similar aos intervalos acima, sendo os conglomerados de mesmo tamanho ou
não.

7.7 Determina¸ c˜
ao do tamanho da amostra
Com rela¸cão à obten¸cão do tamanho da amostra a de tal forma que

P ( yc
| −µ| ≤B ) 1
−α
esteja satisfeita, podemos novamente utilizar o procedimento da Se¸ cão 3.2.5. No
caso em que os conglomerados s˜ao de tamanhos iguais, pode-se mostrar que (veja o
Exercı́cio 7.31)
2
σec
(7.5) a= ,
D

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 192/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

7.8 Amostragem sistem´


atica 181

onde D = B 2 /z α2 e σec
2
está denido na Se¸cão 7.1, item 6.
Em geral, σe2c é desconhecido e tem que ser estimado a partir de amostras
pilotos ou a partir de pesquisas amostrais anteriores. O estimador s2ec considerado
no Corol´ario 7.2 poderia ent˜ao ser utilizado. De maneira an´ aloga determina-se a
para o caso em que os conglomerados s˜ao de tamanhos diferentes.

7.8 Amostragem sistem´


atica
Considere uma popula¸cão com N elementos, onde N = kn e k é um n´umero inteiro.
Considere também que a popula¸ cão est´a ordenada de 1 a N , formando o sistema de

referências. Uma unidade é ent˜ ao selecionada aleatoriamente (segundo a AAS) entre


as k primeiras unidades do sistema de referências. As unidades seguintes que far˜ ao
parte da amostra s˜ ao obtidas a partir da primeira unidade selecionada em intervalos
de comprimento k.

Exemplo 7.5 Suponha que para determinada popula¸ cão, N = 1 .000 e n = 200.
Portanto, k = 5. Ou seja, a popula¸cão est´a dividida em 200 grupos de 5 unidades
populacionais onde um elemento ser´ a selecionado em cada grupo. Uma unidade é
selecionada aleatoriamente entre as 5 primeiras unidades. Suponha que a unidade 3
tenha sido selecionada. Ent˜ ao em cada um dos 199 grupos restantes, ser´ a selecionada
sempre a terceira unidade, completando assim a amostra sistem´ atica de 200 unidades
populacionais.

A vantagem principal da amostragem sistem´ atica (AS) é a facilidade de


sua execu¸cão. Também, é bem menos sujeita a erros do entrevistador que os outros
esquemas de amostragem vistos até agora. Por outro lado, quanto a sua precis˜ ao,
existem situa¸cões em que ela é mais precisa que a AAS. Mas na maioria dos casos
a sua eciência é pr´ oxima da AAS, principalmente quando o sistema de referências
esta numa “ordem aleat´ oria”. Em outros casos, quando existem tendências do tipo

linear ou existem periodicidades na popula¸ cão, sua precis˜ao pode ser bem diferente
do planejamento AAS. A AS pode ser bastante prejudicada por ciclos presentes na
popula¸cão.
Um grande problema na utiliza¸ cão do sorteio sistem´atico é a estima¸cão da
variˆancia do estimador obtido. No caso em que a popula¸ cão est´a em ordem aleat´oria,
não existem muitos problemas em se estimar a variˆ ancia do estimador obtido através
da amostra sistem´ atica pela estimativa da variˆ ancia do estimador y da AAS, que

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 193/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

182 Amostragem por conglomerados em um est´


agio

é dado no Corol´ario 3.5, pois nestes casos, AAS e AS apresentam resultados muito
similares. Por outro lado, nos casos em que a popula¸ cão apresenta tendências ou peri-
odicidades, ao utilizar tal procedimento, pode-se super (ou sub) estimar a variˆ ancia
do estimador obtido a partir da AS. Alguns casos especiais s˜ ao considerados nos
exerc´ıcios. Na Se¸cão 7.8.1 mostra-se que a AS pode ser considerada como um caso
especial da AC. Outros estimadores para a variˆ ancia Vk podem ser encontrados em
Cochran (1977).

7.8.1 Rela¸ cões com a AC


Considerando a popula¸ cão ordenada de 1 a N , pode-se escrever

D = ( Y1 , . . . , Yk , Yk+1 , . . . , Y2k , . . . , Y(n − 1)k+1 , . . . , Ynk ),

que pode também ser representado através de uma matriz, onde na linha α tem-se a
α -ésima amostra sistem´ atica, enquanto que na coluna i tem-se a i-ésima zona. Tal
representa¸cão é considerada na Tabela 7.4.

Tabela 7.4: Amostras sistem´ aticas


Zonas
Amostras 1 2 n
· ·· Médias
1 Y Y Y µ
2 Y2
1 k+1
Yk+2 ·· ··
··
(n − 1) k+1
Y(n − 1) k+2 µ2
1

.. ... ... .. ... ...


. .
k Yk Y2k
· ·· Ynk µk
Médias µ· 1 µ·2
· ·· µ·n µ

Na primeira linha da Tabela 7.4 tem-se a primeira amostra sistem´ atica com
média µ1 ; na segunda linha tem-se a segunda amostra sistem´ atica com média µ2 e
assim por diante. A ´ultima coluna representa as médias das k amostras sistem´aticas.
Cada uma dessas amostras sistem´ aticas pode tamb´ em ser vista como um conglome-
rado, onde os conglomerados s˜ao de tamanhos iguais a n. Portanto, a sele¸cão de
uma amostra sistem´ atica pode ser vista como a sele¸cão de uma amostra por conglo-
merados onde o n´umero de conglomerados é A = k, e destes k conglomerados a = 1
é selecionado para ser observado.
O estimador obtido a partir da amostra sistem´ atica ser´a denido por

y sis = µα ,

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 194/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

7.8 Amostragem sistem´


atica 183

onde µα é a média da amostra sistem´ atica (ou do conglomerado) selecionada(o).


Temos portanto que a distribui¸ cão de ysis é dada pela Tabela 7.5. Desde que qualquer
uma das k amostras sistem´aticas tem probabilidade igual a 1 /k , pois o primeiro
elemento a fazer parte da amostra é selecionado aleatoriamente entre os primeiros k
elementos do sistema de referências. Da Tabela 7.5, tem-se que

E [ysis ] = µ,

ou seja, ysis é um estimador n˜ ao viciado de µ e, também,

k
1 2
(7.6) Vk = V ar[ysis ]= k α =1 (µα
−µ) .

Como apenas um conglomerado é selecionado, n˜ ao é poss´ıvel obter um estimador


não viciado de (7.6). Como discutido acima, na maioria dos casos, a variˆ ancia Vk
em (7.6) é estimada por

(7.7) V̂k = V̂s =


1 f
− (Yi
−ysis )
2
,

n (n 1) i ∈s

onde V̂s = V ar[y] é dada no Corol´ario 3.5. Tal estimador seria adequado quando
a amostragem sistem´ atica é aproximadamente equivalente ` a amostragem aleat´ oria
simples. Contudo em outras situa¸ cões, como no caso de popula¸cões apresentando
periodicidades ou tendências do tipo linear (veja os Exercı́cios 7.12, 7.13, 7.26, 7.27 e
7.28), as duas amostragem apresentam resultados bastante distintos. Uma possı́vel
alternativa em tais situa¸ cões, seria considerar o uso de réplicas (veja o Exercı́cio
7.34). Um exemplo tı́pico de uma popula¸ cão apresentando periodicidade seria o caso
das vendas di´arias de certo produto (carne, por exemplo) em um supermercado.

Tabela 7.5: Distribui¸ cão de ysis

ysis :
P (y sis ):
µ1
1/k
µ2
1/k ··
·· ··
µα
1/k ··
·· ··
µk
1/k

Considerando a AS como uma AC, como discutido acima, escreve-se a variˆ ancia
Vk como (veja o Exercı́cio 7.24)

σ2
(7.8)
{
Vk = 1 + ρint (n
− } 1)
n
,

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 195/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

184 Amostragem por conglomerados em um est´


agio

onde ρint é o coeciente de correla¸cão dentro das amostras sistem´ aticas, ou seja, na
nota¸cão da Seção 7.4,
Cov[Y1 , Y2 ]
ρint =
DP [Y1 ]DP [Y2 ]
2
2 σdc
=
σec
− n− 1
,
σ2
onde, como os conglomerados tem tamanhos iguais a B = n,

k
2 1 2
σec =
k α =1
(µα
−µ) ,

e
k
2 1
σdc = σα2 ,
k α =1
com
n
1 2
σα2 =
n i=1
(Yα i
−µα ) ,

com Yαi sendo o valor da caracterı́stica populacional associada ao elemento da i-


ésima zona na α -ésima amostra sistem´ atica. Portanto, existindo alguma ordena¸ cão
dos elementos da popula¸cão, existir´a uma a correla¸cão positiva entre unidades da
mesma amostra sistem´ atica ( ρint > 0), aumentando a variˆ ancia Vk com relação a Vs .
Por outro lado, quando ρint < 0, temos que Vk será menor do que Vs .

Exemplo 7.6 Considere a popula¸cão onde D = (2 , 6, 10, 8, 10, 12), N = 6 e dividida


em n = 2 zonas de k = 3 unidades cada. Portanto, formam-se as 3 amostras
sistem´aticas:

Zonas
Amostras 1 2 Médias

1 2 8 5
2 6 10 8
3 10 12 11

Portanto a distribui¸ cão de y sis é dada por

ysis : 5 8 11
P (y sis ): 1/3 1/3 1/3

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 196/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

7.8 Amostragem sistem´


atica 185

Da distribui¸cão acima temos que

E [y sis ] = 8 e V ar[ysis ] = 6.

Neste caso, ρint = 1 / 8. Note que como ρint > 0 (veja o Exercı́cio 7.10), y é mais
eciente que ysis .

Exemplo 7.7 Considere a popula¸cão com N = 40 elementos distribuı́dos em k = 10


amostras sistem´aticas de tamanhos n = 4:
Zonas
Amostras 1 2 3 4 Médias

1 0 6 18 26 12,5
2 1 8 19 30 14,5
3 1 9 20 31 15,25
4 2 10 20 31 15,75
5 5 13 24 33 18,75
6 4 12 23 32 17,75
7 7 15 25 35 20,5
8 7 16 28 37 22
9 8 16 29 38 22,75
10 6 17 27 38 22
Médias 4,1 12,2 23,3 33,1 18,175

Para n = 4, calcula-se (veja o Exercı́cio 7.11)

S2 1 136, 25
Vs = V ar[y] = (1
− f)
n
= ∼ 1 − 10 4 ∼
= 30, 7.

Temos também que


k
1 2
Vk = V ar[y sis ] =
k α =1
(µα
−µ)
2 2 2
= (12, 5
− 18, 175) + (14 , 5
− 18, 175) + . . . + (22
10 − ∼
18, 175) = 11, 6.

Portanto, para a popula¸ cão acima, conclui-se que ysis é mais eciente que y. Note
também que a popula¸ cão apresenta uma ligeira tendência linear. Um outro esquema
amostral que poderia ser utilizado para a obten¸ cão de uma amostra de tamanho n
desta popula¸cão seria considerar cada uma das n zonas (colunas) de k elementos
como um estrato. Selecionamos ent˜ ao de cada estrato um elemento aleatoriamente.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 197/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

186 Amostragem por conglomerados em um est´


agio

O estimador de µ é dado por yes , o estimador estraticado que foi introduzido no


Capı́tulo 4. Pode-se mostrar, usando a tabela acima que (veja o Exercı́cio 7.25)
1 13, 49
V ar[yes ] = 1 ∼ −
10 4
= 3, 03. ∼
Exerc´ıcios
7.1 Considere a popula¸cão com N = 6 indiv´ıduos, onde D = (2 , 6, 8, 10, 10, 12).

U
Considere os conglomerados “ C ” e “ D ” abaixo
U
C1 : D 1 = (2),
Conglomerados “ C” : C2 : D 2 = (6 , 8, 10),
U C3 : D 3 = (10 , 12)
e
C1 : D 1 = (2 , 6, 8),
Conglomerados “
UD ” : C2 : D 2 = (10 , 10),
C3 : D 3 = (12) .
Para cada uma das divis˜ oes (conglomerados) acima, selecione um conglome-
rado segundo a AAS. Encontre a distribui¸ cão de yc1 , sua média e variˆancia.
Qual das divis˜oes apresenta uma estimativa mais precisa?

7.2 Uma empresa de t´axis possui 175 carros. Uma pesquisa é conduzida para
se estimar a propor¸cão de pneus em mau estado nos carros da companhia.
Uma AASc de 25 carros apresenta o seguinte n´ umero de pneus em mau estado
por carro: d = (2 , 4, 0, 1, 2, 0, 4, 1, 3, 1, 2, 0, 1, 1, 2, 2, 4, 1, 0, 0, 3, 1, 2, 2, 1). Não
considere o estepe. Encontre uma estimativa para a precis˜ ao de sua estimativa.

7.3 Suponha que desejamos estimar o n´ umero total de quilˆometros percorridos


pelos carros da companhia do Exercı́cio 7.5. Calcule estimativas utilizando os
estimadores propostos na Se¸ cão 7.3. Qual dos dois estimadores é mais preciso?

7.4 Planejou-se uma pesquisa para determinar a propor¸ cão de crian¸cas do sexo
masculino com idade inferior a 15 anos numa certa cidade. Sugerem-se dois
procedimentos:

i. Toma-se uma amostra AASc de n crian¸cas (menores de 15 anos) e conta-


se o número de meninas e meninos.
ii. Toma-se uma amostra AASc de n famı́lias e pergunta-se o n´ umero de
meninos e meninas (menores de 15 anos) para cada fam´ılia.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 198/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

7.8 Amostragem sistem´


atica 187

Encontre as variˆ ancias para as estimativas das propor¸ cões obtidas a partir de
cada um dos planos. Qual dos planos amostrais você preferiria? Justique.
Refa¸ca agora considerando AASs.

7.5 Uma companhia que fornece carros a seus vendedores quer uma estimativa do
número médio de quilˆ ometros percorridos pelos seus carros no ano passado. A
companhia tem 12 liais. O n´umero de carros ( B α ), a média ( µα ) e a variˆancia
(S α2 ) do número de quilˆometros percorridos (em milhares), para cada lial, s˜ ao
dados por:

Filial Bα µα Sα2
1 6 24,32 5,07
2 2 27,06 5,53
3 11 27,60 6,24
4 7 28,01 6,59
5 8 27,56 6,21
6 14 29,07 6,12
7 6 32,03 5,97
8 2 28,41 6,01
9 2 28,91 5,74
10 5 25,55 6,78
11 12 28,58 5,87
12 6 27,27 5,38

Selecione uma AASc de 4 liais e estime o n´umero médio de quilˆometros per-


corridos por carro utilizando a informa¸ cão sobre todos os carros nas liais
selecionadas. Encontre a variˆ ancia de sua estimativa e também uma estima-
tiva para a variˆ ancia. Compare a variˆ ancia de sua estimativa com a variˆ ancia
correspondente `a utiliza¸cão de uma AASc de tamanho n = 27.

7.6 Considere uma popula¸cão com N = 9 elementos divididos em n = 3 zonas


com k = 3 elementos. Os valores da caracterı́stica populacional s˜ ao dados na
tabela abaixo.
Zonas
Amostras 1 2 3
1 8 6 10
2 6 9 12
3 7 9 5

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 199/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

188 Amostragem por conglomerados em um est´


agio

Para estimar a variˆ ancia Vk do estimador ysis , que corresponde a média da


amostra sistem´atica obtida, considere o estimador
Ŝ 2
V̂k = (1
− f) ,
n
onde Ŝ 2 = s2 é a variˆancia amostral correspondente ` a amostra sistem´atica
observada.

a. Para a a popula¸ cão acima, verique se V̂k é n˜ao viciado para Vk .


b. Verique para essa popula¸ cão se vale a fórmula

ˆ2 N 1 2
E S = N S (1
− −ρint ),
onde ρint é como denido na Se¸cão 7.8.1.
c. Mostre que o resultado em (ii) vale em geral.

7.7 Considere uma popula¸cão


U
com N = 12 elementos divididos em A = 3
conglomerados. Os valores Yαi correspondentes aos 3 conglomerados s˜ ao:

α Yαi Bα µα σα2
1 0, 1 2 0,5 0,25
2 1, 2, 2, 3 4 2,0 0,50
3 3, 3, 4, 4, 5, 5 6 4,0 2/3

a. Encontre σ 2 .
b. Desta popula¸cão, dois conglomerados s˜ao selecionados com reposi¸cão.
Considere um estimador n˜ ao viciado para a média populacional e en-
contre a variˆancia do estimador proposto. Selecionando uma amostra de
2 conglomerados da tabela, estime a variˆ ancia.
c. Encontre ρint (exato e aproximado). Usando a amostra dos dois conglo-
merados selecionados em (b), encontre uma estimativa para ρint .

7.8 Uma popula¸cão com N = 2 .000 elementos foi dividida em A = 200 conglome-
rados de tamanhos iguais a B = 10 elementos. Desta popula¸ cão uma amostra
de a = 20 conglomerados é selecionada de acordo com a AASc e todos os
elementos nos conglomerados selecionados s˜ ao observados com rela¸cão à de-
terminada caracterı́stica populacional. O n´ umero de indiv´ıduos que possuem
a caracterı́stica ( Tα ), na amostra foi:

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 200/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

7.8 Amostragem sistem´


atica 189

Conglomerado: 1 2 3 4 5 6 7 8 9 10
Tα : 5 3 2 9 3 1 6 10 4 4
Conglomerado: 11 12 13 14 15 16 17 18 19 20
Tα : 2 3 6 1 1 7 0 7 2 1

a. Encontre uma estimativa para o n´ umero total de indivı́duos na popula¸ cão


que possuem a caracter´ıstica de interesse e uma estimativa para a variˆ ancia
da estimativa do total.
b. Encontre uma estimativa para a propor¸ cão de indivı́duos na popula¸ cão
que possuem a caracter´ıstica de interesse e uma estimativa para a variˆ ancia

da estimativa da propor¸ cão.


c. Encontre uma estimativa para o coeciente de correla¸ cão intraclasse.

7.9 A tabela abaixo nos d´a os tamanhos dos estratos e os desvios padr˜ oes de certa
caracterı́stica populacional Y dentro de 3 estratos em que a popula¸ cão original
de tamanho N = 3 .480 foi estraticada.

Estratos Bα Sα
1 2500 8
2 850 24

3 130 80
a. Numa amostragem estraticada de 10% dessa popula¸ cão, qual a partilha
ótima do tamanho n da amostra?
b. Compare a variˆancia da média obtida pelo esquema acima com a variˆ ancia
da média obtida por AC com o mesmo n obtido em (a), e cujo desvio
padr˜ao geral é S = 18.

7.10 Considere novamente o Exemplo 7.6 verique realmente que Vk = 6 e que


ρint = 1 / 8.

7.11 Considere a popula¸cão do Exemplo 7.7. Verique que, conforme dado no


∼ ∼
exemplo, Vs = 30, 7 e Vk = 11, 6. Encontre ρint .

7.12 Refaça o Exemplo 7.7, invertendo a ordem nas zonas 2 e 4, isto é, em cada
zona, o último elemento passa a ser o primeiro, o pen´ ultimo passa a ser o
segundo, e assim por diante.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 201/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

190 Amostragem por conglomerados em um est´


agio

7.13 Considere uma popula¸ cão dividida em n zonas de k elementos ( k é um inteiro


par), onde todas as zonas s˜ ao iguais a

0, 1, 0, 1, 0, 1, . . . , 0, 1,

isto é, é uma seq¨uência alternada de “zeros” e “uns” com k elementos ( k2 “0” e
k
2 “1”). Por exemplo, se n = 2 e k = 4, temos

D = (0 , 1, 0, 1, 0, 1, 0, 1).

a. Calcule, no caso geral, a variˆancia da média amostral y obtida a partir


de uma AAS de tamanho n .
b. Calcule a variˆancia de ysis , correspondente `a uma amostra sistem´ atica de
tamanho n . Compare com o item (a).
c. Como cam os resultados em (a) e (b) se k = 6 e n = 3?

7.14 Os dados abaixo indicam o n´umero de besouros por canteiro (cada célula)
em uma planta¸cão de batata.

1 2 3 4 5 6 7 8
1 2 4 2 4 2 3 4 6
2 0 2 0 2 7 4 2 3
3 16 9 2 8 5 10 8 7
4 5 7 7 14 20 5 9 6
5 12 5 7 0 4 10 13 5
6 11 6 17 1 9 9 5 17
7 11 10 13 21 10 11 2 20
8 2 3 5 7 4 1 0 14
9 6 8 0 0 2 1 7 1
10 8 14 10 7 3 3 17 8
11 7 12 13 16 11 8 9 1
12 13 2 10 10 7 8 15 28

a. Sortear uma amostra de 2 quadrados de 2


×
2 e estimar o total de besouros
existentes na regi˜ao, bem como o respectivo erro padr˜ ao.
b. Usando os 8 quadrados (1
×
1) encontrados acima, calcule o total de
besouros existentes na regi˜ ao, supondo que a amostra colhida equivale ` a
AAS. Encontre o erro padr˜ ao da estimativa.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 202/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

7.8 Amostragem sistem´


atica 191

c. Compare os resultados de (a) e (b) e encontre um valor aproximado para


o coeciente de correla¸cão intraclasse.

7.15 As 39.800 chas de assinantes de um jornal est˜ ao catalogadas de acordo com


os roteiros de entrega di´aria. Cada roteiro tem suas chas dispostas segundo
uma ordem geogr´aca. O principal objetivo da pesquisa é determinar a porcen-
tagem de assinantes possuidores do pr´ oprio im´ovel que habitam atualmente.
Decidiu-se por uma amostra de 400 assinantes, agrupados em conglomerados
de 10. Este procedimento ir´ a reduzir o tempo de viagem entre uma unidade
e outra, j´a que as unidades s˜ao pr´oximas umas das outras. Assim, os 39.800
assinantes est˜ao dispostos em 3.980 conglomerados de 10 assinantes cada um.
Nos 40 conglomerados sorteados foram encontrados os seguintes n´ umeros de
propriet´arios: d = (10, 8, 6, 5, 9, 8, 8, 5, 9, 9, 9, 10, 4, 3, 1, 2, 3, 4, 0, 6, 3,
5, 0, 0, 3, 0, 4, 8, 0, 0, 10, 5, 6, 1, 3, 3, 1, 5, 5, 4), com 40 α =1 Tα = 185 e
40 2
α =1 Tα = 1 .263.

7.16 Deseja-se estimar a opini˜ao dos arquitetos, membros do Instituto de Arquite-


tura (IA), sobre a constru¸ cão de um aeroporto num local atualmente ocupado
por uma reserva orestal. Conseguiu-se a lista dos 10.000 membros do IA e
os nomes est˜ao ordenados segundo a data de admiss˜ ao ao quadro da entidade.

Decidiu-se por uma amostra de 500 pessoas e usando o processo de 5 réplicas


repetidas com sorteio sistem´ atico. Isto é:

1. dividiu-se a popula¸cão em 100 zonas contı́guas de 100 arquitetos cada;


2. sortearam-se 5 n´umeros aleat´orios entre 01 e 00 (por ex., 17, 23, 56, 77,
81);
3. tomou-se ent˜ao a opini˜ao dos arquitetos ocupando as seguintes posi¸ cões
na lista:

• réplica 1: 17, 117, 217,...


• réplica 2: 23, 123, 223,...

• réplica 3: 56, 156, 256,...


• réplica 4: 77, 177, 277,...
• réplica 5: 81, 181, 281,...;
4. o número de pessoas contra o projeto em cada réplica foi, respectivamente,
70, 60, 50, 80, 65.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 203/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

192 Amostragem por conglomerados em um est´


agio

a. Por que você acha que foi proposto este esquema amostral ?
b. Usando cada réplica como um conglomerado, estime a propor¸ cão de ar-
quitetos contra o projeto e a respectiva variˆ ancia V arAC [p].
c. Considere as 5 réplicas como sendo uma ´ unica amostra, estime a pro-
por¸cão e o respectiva variˆancia V arAASc [p].
d. Compare V arAC [p]/V ar AASc [p] e analise o resultado. O coeciente de
correla¸cão intraclasse é importante neste problema?

Obs.: Descreva o sistema de referência (frame), que você pode usar.

7.17 Será feito um levantamento amostral para estimar uma propor¸ cão P de in-
divı́duos portadores de uma certa caracterı́stica. Espera-se que essa propor¸ cão
seja da ordem de 50% na popula¸ cão. A popula¸cão est´a disposta em conglo-
merados de 5 indivı́duos cada, e o coeciente de correla¸ cão intraclasse é 0,60.
Decidiu-se sortear a conglomerados e entrevistar todos os indivı́duos do con-
glomerado. Deseja-se que o erro m´aximo seja 0,05.

a. Quantos conglomerados devem ser sorteados?


b. Se fossem subamostrados 2 indivı́duos por conglomerado, quantos con-
glomerados deveriam ser sorteados para se ter a mesma precis˜ ao?

7.18 O exército de Atlˆandida é formado por 400 companhias com 100 soldados
cada uma. Uma amostra aleat´ oria simples de 10 companhias foi sorteada e
todos os soldados responderam a um question´ ario sócio-econômico. O número,
por companhia, daqueles que responderam “sim” a uma das quest˜ oes foi: 25,
33, 12, 32, 17, 24, 26, 23, 37 e 21.

a. Estime a propor¸cão P dos soldados do exército que responderiam “sim”


a essa quest˜ao.

b. Estime o erro padr˜ ao desse estimador.


c. Construa um intervalo de conan¸ ca de 95% para esse parˆametro.
d. Supondo que as respostas acima correspondam a uma amostra aleat´ oria
simples de 1000 soldados, qual seria a estimativa de P e o seu erro padr˜ao?
e. Construa um intervalo de conan¸ ca de 95% para esse caso.
f. Calcule e interprete o EP A = V arAC [p]/V ar AAS [p].

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 204/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

7.8 Amostragem sistem´


atica 193

g. Calcule o coeciente de correla¸cão intraclasse ρint e interprete-o.


h. Verique que EP A = 1 + ρint (B
−1).
7.19 Um supermercado deseja estimar qual a despesa média dos fregueses, usando
uma amostra de 20% dos clientes. O estatı́stico encarregado da pesquisa de-
cidiu usar um sorteio sistem´ atico com quatro repeti¸ cões. Assim, ele sorteou
quatro n´umeros aleat´orios entre 1 e 20 (sorteados 4, 6, 13 e 17), dando origem
à seguinte amostra:

o
Réplica Elementos N de elementos Despesa total Soma de quadrados
1 4, 24, 44, ... 50 4.000 421.000
2 6, 26, 46, ... 50 4.200 435.000
3 13, 33, 53, ... 50 3.800 400.000
4 17, 37, 57, ... 50 3.900 405.000

Usando estes dados, estime a despesa média por freguês e dê limites para o
erro de estima¸cão.

Te´oricos
7.20 Para conglomerados de mesmo tamanho, determine a de modo que

| −τ | ≤B )
P ( Tc 1
−α,
onde B e α são xados e Tc = N y c .

7.21 Obtenha um estimador n˜ ao viciado para a variˆancia de pc2 da propor¸cão


P , no caso em que os conglomerados s˜ao de mesmo tamanho. Construa um
intervalo de conan¸ca para P com coeciente de conan¸ca γ = 1 α .

7.22 Proponha estimadores para a média populacional µ quando uma amostra
de a conglomerados segundo a AASs é selecionada de uma popula¸ cão com
A conglomerados de igual tamanho. Use a nota¸ cão da Seção 7.1. Obtenha
express˜oes para suas variˆancias.

7.23 Proponha ρint para o caso em que os conglomerados s˜ao selecionados sem re-
posição. Proponha tamb´
em uma estimativa para este parˆ ametro, descrevendo
detalhadamente as variˆ ancias envolvidas. Considere conglomerados de igual
tamanho.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 205/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

194 Amostragem por conglomerados em um est´


agio

7.24 Verique que Vk = V ar[ysis ] pode ser escrita como em (7.8).

7.25 Considere a divis˜ao de uma popula¸cão (com N = nk elementos) em n zonas


onde cada uma das zonas é constituı́da por k elementos, conforme ilustrado
na Tabela 7.4. Suponha que cada zona constitui um estrato e que uma ´ unica
observa¸cão é selecionada (segundo a AAS) de cada um dos k estratos. Seja
y es o estimador estraticado de µ denido no Capı́tulo 4. Mostre que
2
S ωl
V ar[y es ] = (1
− f)
n
,

onde
n k
2 1 2
S ωl = n(k
−1) i=1 α =1 (Yαi
− . µ·i )
Considere o Exemplo 7.7. Verique que V ar[yes ] =∼3, 03.

7.26 Considere a popula¸cão de tamanho N = nk , onde

D = (1 , 2, . . . , k , 1, 2, . . . , k , . . . , 1, 2, . . . , k ),

isto é, a popula¸cão é constitu´ıda por n zonas cada uma com os elementos
1, . . . , k . Considere as amostragens (i) AS, (ii) AAS e (iii) AE com um elemento
selecionado aleatoriamente por estrato (zona). Encontre V ar[ysis ], V ar[y] e
ˆ
V ar[y es ]. Se você estimar Vk por Vs , você super (ou sub) estima Vk ?
7.27 Considere uma popula¸cão com N = nk elementos onde k é ı́mpar e todas as
zonas de k elementos s˜ao iguais a

1, 1, . . . , 1, 1,
k
−2 1 , k +2 1 , k −2 1 .
Fa¸ca o mesmo que no Exercı́cio 7.26.

7.28 Considere uma popula¸cão


U
de tamanho N , onde N = nk e Yi = i, i =
1, . . . , N . Esta popula¸cão est´a dividida em n zonas de tamanhos k, ou seja,

D = (1 , 2, . . . , k, k + 1 , . . . , 2k , . . . , (n
−1)k + 1 , . . . , n k ) .
Considere cada uma das n zonas acima como estratos. Selecione uma AAS de
tamanho 1 de cada um das n zonas. Mostre que
k2 1
V ar[yes ] =
12n
, −
onde y es é a média da amostra selecionada.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 206/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

7.8 Amostragem sistem´


atica 195

7.29 Considere os estimadores yR e r denidos no Capı́tulo 5 e assuma AASc.


Encontre uma express˜ ao aproximada para V ar [yR ] e para V ar[r ]. Proponha
estimadores para estas variˆ ancias.

7.30 Mostre que, no caso populacional, podemos escrever


a 2 a
Bα Tα2 2

α =1 B

− yc1 =
α =1 B
2 −ay c1 .
7.31 Verique a validade da express˜ao (7.5).

7.32 Mostre que s2ect denido em (7.1) nem sempre é um estimador n˜ ao viciado
de σ ect
2 .

7.33 Prove os Corol´arios 7.2 e 7.3.

7.34 Conforme visto na Se¸cão 7.8, a amostragem sistem´ atica usual n˜ao permite
a obten¸cão de estimadores da variˆ ancia da estimativa da média. Recordamos
que na amostragem sistem´ atica usual, a popula¸ cão é dividida em n zonas com
k elementos cada, onde N = kn. Para poder contornar esta diculdade, vamos
considerar amostras sistem´ aticas replicadas. Nesta situa¸ cão, a popula¸cão com
N elementos é dividida em n s zonas com k = ks elementos em cada zona, de
modo que
n = sn s e N = nk = n s ks = n s k .

Na primeira zona selecionamos s elementos segundo a AASs (ou AASc) e,


sistematicamente, selecionamos um elemento de cada zona para cada amostra,
sempre observando a ordem do elemento selecionado na primeira zona para
cada amostra.
Exemplo: Para uma popula¸ cão com N = 40, n = 8 e k = 5, podemos
sortear s = 2 amostras sistem´ aticas com n 2 = 4 elementos cada, de modo que
k = ks = 5 2 = 10, ao inv´ es de uma ´unica amostra sistem´ atica com n = 8
elementos. ×
Estimador de µ: Dadas as médias µsi 1 , . . . , µ sis das s amostras sistem´aticas,
consideramos como estimador da média populacional a média das médias
amostrais, isto é,
s
1
y siR = µsij .
s j =1

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 207/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

196 Amostragem por conglomerados em um est´


agio

a. Usando resultados j´ a vistos para amostragem por conglomerados de ta-


manhos iguais (identique as amostras sistem´ aticas como conglomerados)
com AASs, mostre que ysiR é n˜ao viciado para estimar µ. Mostre que
2
S siR
V ar AASs [ysiR ] = (1
− fs)
s
,

2
= kj =1 (µsij µ) 2 / (k 1). Mostre
com f s = s/k = s/ (ks ) = 1 /k e SsiR
− −
também que um estimador n˜ ao viciado de V arAASs [ysiR ] é dado por

s 2siR
var AASs [y siR ] = (1
− fs)
s
,

onde s 2sir = sj =1 (µsij


−ysiR )2 / (s −1).
b. Considere a popula¸cão dos N = 180 condom´ınios do Exercı́cio 2.2, onde
a vari´avel de interesse é Yi , o número de domic´ılios alugados no i-ésimo
codom´ınio, i = 1 , . . . , 180, com esta ordena¸cão. Estime µ usando amos-
tragem sistem´atica com n = 20 e s = 4 réplicas. Estime a variˆ ancia desta
estimativa.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 208/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

Cap´ıtulo 8

Amostragem em dois estágios

Quando os conglomerados s˜ao homogêneos, menos recomend´ avel se torna o uso da


amostragem por conglomerados completos, isto é, a coleta de todas as suas unida-
des. Como as unidades s˜ao muito parecidas, elas trar˜ ao o mesmo tipo de informa¸cão,
aumentando a varia¸ cão amostral. Essa inconveniência ca mais clara ao considerar
uma situa¸cão limite em que todos os elementos do conglomerado s˜ ao iguais. Bastaria
conhecer as informa¸cões de um deles para se conhecer todo o conglomerado. Assim,
uma saı́da para aumentar a eciência, sem aumentar o tamanho da amostra, é sub-
sortear elementos dos conglomerados selecionados. Ou seja, usar um plano amostral
em dois est´agios: no primeiro sorteiam-se conglomerados e no segundo sorteiam-se
elementos.
Ap´os a popula¸cão estar agrupada em A conglomerados, descreve-se o plano
amostral do seguinte modo:

i. sorteiam-se no primeiro est´agio a conglomerados, segundo algum plano amos-


tral;

ii. de cada conglomerado sorteado, sorteiam-se bα elementos, segundo o mesmo


ou outro plano amostral.

Neste cap´ıtulo, para desenvolver as propriedades dos estimadores e devido a


simplica¸cão das demonstra¸cões, usar-se-´a quase sempre AASc nos dois est´agios.
Para outros esquemas amostrais a deriva¸ cão é feita de modo an´alogo, sendo que
algumas delas encontram-se como sugest˜ oes nos exercı́cios.

Exemplo 8.1 Volte-se ao Exemplo 7.1, onde a popula¸ cão est´a agrupada em três

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 209/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

198 Amostragem em dois est´ agios

conglomerados da maneira abaixo:

U= {(1), (2, 3, 4), (5, 6) }= {C1 , C 2 , C 3 },


onde
C1 = 1 ,
{} {
C2 = 2, 3, 4
} e C3 = 5, 6 .
{ }
O plano amostral adotado ser´ a o sorteio de dois conglomerados por AASs e de cada
conglomerado sortear uma unidade com igual probabilidade. Como no Exemplo 7.1
a constru¸cão do espa¸co amostral pode ser feita em duas etapas: primeiro construindo
o espaço gerado pelos conglomerados e depois para cada par o espa¸ co gerado por
eles. Assim, tem-se para os conglomerados

Sc ( U) = {C1 C2 , C 1 C3 , C 2 C1 , C 2 C3 , C 3 C1 , C 3 C2 }.
Observe que a probabilidade de sele¸ cão de cada ponto s ci do espaço amostral c ( )
SU
é igual a 1/6. Em seguida para cada par pode-se construir o respectivo espa¸ co
amostral. Assim, para a combina¸ cão C1 C 2 tem-se

S(C1 C2 ) = {12, 13, 14}.


Condicionando a este subespa¸ co, cada ponto si ter´a probabilidade 1/3 de ser sor-
teado. Combinando as probabilidades cada ponto amostral desta combina¸ cão ter´a
probabilidade 1/18 de ser sorteado. Reunindo-se todos estes subespa¸ cos e as respec-
tivas probabilidades, tem-se bem caracterizado o plano amostral por conglomerados
em dois est´agios. Para facilitar a compreens˜ ao do procedimento acima, resume-se
na Tabela 8.1 os pontos amostrais e respectivas probabilidades.
Diferentemente do Exemplo 7.1, aqui a amostra ter´ a tamanho xo ( a = 2). Consi-
dere agora associado o vetor de dados

D = (12 , 7, 9, 14, 8, 10)

com os parˆametros
34
µ = 10, σ2 = , N = 6, B =2 e A = 3.
6
Denindo-se a estat´ıstica média simples por amostra
a
1 y[s 1 ] + y[s 2 ]
y= ys i = ,
a α =1 2

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 210/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

199

Tabela 8.1: Espa¸co amostral e probabilidades na A2E


s ci P (s ci ) si
|
P (s i s ci ) P (s i ) sci P (s ci ) si
|
P (s i s ci ) P (s i )
12 1/ 3 1/ 18 21 1/ 3 1/ 18
1 1
C1 C2 13 1/ 3 1/ 18 C2 C1 31 1/ 3 1/ 18
6 6
14 1/ 3 1/ 18 41 1/ 3 1/ 18
1 15 1/ 2 1/ 12 1 51 1/ 2 1/ 12
C1 C3 C3 C1
6 16 1/ 2 1/ 12 6 61 1/ 2 1/ 12
25 1/ 6 1/ 36 52 1/ 6 1/ 36
26 1/ 6 1/ 36 53 1/ 6 1/ 36
1 35 1/ 6 1/ 36 1 54 1/ 6 1/ 36
C2 C3 C3 C2
6 36 1/ 6 1/ 36 6 62 1/ 6 1/ 36

45 1/ 6 1/ 36 63 1/ 6 1/ 36
46 1/ 6 1/ 36 64 1/ 6 1/ 36

pode-se calcular o seu valor para cada amostra. Assim,


12 + 7 10 + 14
y[12] = = 9 , 5, . . . , y [64] = = 12.
2 2
Na Tabela 8.2 aparecem todos os resultados poss´ıveis e de onde é possı́vel construir
a seguinte distribui¸ cão amostral e seus respectivos parˆ ametros:

y: 7,5 8,5 9,5 10 10,5 11 12 13


P (y): 2/36 4/36 6/36 6/36 4/36 8/36 2/36 4/36

E [y] = 10, 33 V ar[y] = 2.
Observe que este estimador é viesado para a média popualacional. Note que y[s 1 ]
corresponde ao valor da caracterı́stica (valor de Y) associado ao indivı́duo selecio-
nado no primeiro conglomerado selecionado e y[s 2 ], no segundo. Dene-se agora
a
1 Bα
y 2c1 = y ,
a α =1 B α

onde a corresponde ao n´umero de conglomerados sorteados no primeiro est´ agio e


B= A
α =1 B α /A , cujos valores amostrais s˜ao calculados do seguinte modo:

y2c1 [12] =
1
×122 + 23 ×7 = 8 , 25, . . . , y 2c1 [64] = 2 ×102 + 32 ×14 = 15, 50.
× ×
Os demais valores est˜ao também na Tabela 8.2. Deixa-se aos cuidados do leitor
calcular a distribui¸ cão amostral. Através dela pode-se obter os parˆ ametros:

E [y2c1 ] = 10, ∼
V ar[y2c1 ] = 6, 92.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 211/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

200 Amostragem em dois est´ agios

Tabela 8.2: Valores de y e y2c1 na A2E


s i P (s )
i y[s ]
1 y[s 2 ] y y2 c 1 si P (s i ) y[s 1 ] y[s 2 ] y y2 c 1
12 1/18 12 7 9,5 8,25 21 1/18 7 12 9,5 8,25
13 1/18 12 9 10,5 9,75 31 1/18 9 12 10,5 9,75
14 1/18 12 14 13,0 13,50 41 1/18 14 12 13,0 13,50
15 1/12 12 8 10,0 7,00 51 1/12 8 12 10,0 7,00
16 1/12 12 10 11,0 8,00 61 1/12 10 12 11,0 8,00
25 1/36 7 8 7,5 9,25 52 1/36 8 7 7,5 9,25
26 1/36 7 10 8,5 10,25 53 1/36 8 9 8,5 10,75
35 1/36 9 8 8,5 10,75 54 1/36 8 14 11,0 14,50
36 1/36 9 10 9,5 11,75 62 1/36 10 7 8,5 10,25

45 1/36 14 8 11,0 14,50 63 1/36 10 9 9,5 11,75


46 1/36 14 10 12,0 15,50 64 1/36 10 14 12,0 15,50

Observe-se que este estimador é n˜ ao viesado para a média populacional.


O cálculo da esperan¸ca de um estimador pode ser executado do mesmo modo como
foi construı́do o espa¸co amostral. Assim, dentro de cada par de conglomerados
calcula-se o valor esperado da estatı́stica, ou seja, o valor esperado condicionado ` a
ocorrência daquele par. Por exemplo, para o par C1 C 2 tem-se o seguinte desenvol-
vimento:
2 (C 1 C 2 ) = 12, 13, 14 ,

com os seguintes valores para o estimador S {yc : }


y 2c1 [12] = 8, 25, y2c1 [13] = 9, 75, y2c1 [14] = 13, 5.

Conseq¨uentemente, usando o ı́ndice 2 para indicar o valor esperado condicionado ao


particular par de conglomerados, tem-se
1
|
E 2 [y2c1 C 1 C 2 ] =
3
(8, 25 + 9 , 75 + 13 , 5) = 10 , 5 = ycd [C 1 C 2 ].

Estendendo os resultados para os demais pares, constr´ oi-se a distribui¸cão:

s ci : C1 C 2 C1 C 3 C2 C 1 C2 C 3 C3 C 1 C3 C 2
y cd : 10,5 7,5 10,5 12 7,5 12
P (ycd ): 1/6 1/6 1/6 1/6 1/6 1/6
Usando o ı́ndice 1 para indicar a esperan¸ ca calculada no espa¸co amostral gerado
pelos conglomerados, tem-se
1
E 1 [y2c1 ] = (10, 5 + 7 , 5 + 10 , 5 + 12 + 7 , 5 + 12) = 10 .
6

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 212/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

8.1 Nota¸ cão e plano amostral 201

Este tipo de procedimento ser´ a bastante usado para c´ alculo de valores esperados e
variˆancias.

8.1 Nota¸ c˜
ao e plano amostral
O plano amostral ser´a aquele j´a denido na se¸cão anterior e indicado por A2E, ou
seja, sorteiam-se a conglomerados (unidades prim´ arias) por AASc e em seguida,
também por AASc, sorteiam-se bα elementos (unidades secund´ arias). Sem perda de
generalidade, consideramos que as unidades prim´ arias 1 , . . . , a tenham sido sorteadas
como enfatizado no Capı́tulo 7.

A nota¸cão a ser usada é a mesma adotada no Capı́tulo 7. Entretanto, convém


observar que as estatı́sticas dentro do conglomerado também podem variar, o que
não ocorria quando o plano era em um ´unico est´agio.

8.2 Estimadores da m´
edia por elemento
8.2.1 N conhecido

O parˆametro a ser estimado é a média global por elemento


τ Aτ τ
µ= Y = . = =
N AB B
Como o total de elementos N usualmente é conhecido, basta substituir o numerador
acima por um estimador n˜ ao viesado. O estimador usualmente adotado é
1
a
a
α =1 B α yα 1 a Bα
(8.1) y2c1 = = y .
B a α =1 B α

Teorema 8.1 Para o plano amostral denido tem-se que y2c1 de (8.1) é n˜ao viesado
para µ e que
A 2 A 2
1 Bα 1 Bα σα2
(8.2) V ar[y 2c1 ] = aA α =1 B µα
−µ + aA α =1 B bα .

Prova. Usaremos o resultado bem conhecido da esperan¸ ca condicional, isto é,

E [X ] = E 1 E 2 [X ] .

Aqui, o ı´ndice 2, como no Exemplo 8.1, indica a esperan¸ ca condicional a uma


particular sele¸cão de unidades prim´arias de amostragem (UPAs), enquanto que

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 213/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

202 Amostragem em dois est´ agios

o ı´ndice 1 é usado para todas as combina¸ cões poss´ıveis destas UPAs. Assim,
a a
1 Bα 1 Bα
E [y2c1 ] = E y = E1 E 2 [yα ] .
a α =1 B α a α =1 B

Mas dentro do α-ésimo conglomerado sorteado com B α unidades, est´a sendo


usado um plano AASc, e sabe-se do Capı́tulo 3 que

σα2
E 2 [y α ] = µα = Y α e V ar2 [y α ] = .

Substituindo-se na express˜ ao acima tem-se
a
E [y2c1 ] = E 1 1 B α µα .
a α =1 B

Note que µα é uma vari´avel aleat´oria representando o parˆ ametro média do α -


ésimo conglomerado sorteado no primeiro est´ agio. Para facilitar o raciocı́nio,
imagine uma popula¸cão formada de A unidades e considere associada a cada
conglomerado a vari´avel X , do seguinte modo:

Xα = µα .
B
Assim, a média x de uma amostra de a unidades retiradas por AASc dessa
popula¸cão ter´a a seguinte express˜ao:
a
1 Bα
x= µα .
a α =1 B

E também valem as propriedades


A
1 Bα
E 1 [y 2c1 ] = E 1 [x] = X = µα = µ
A α =1 B
2 A
σX 1 2
(8.3) V ar 1 [y 2c1 ] = V ar1 [x] =
a
=
aA

−X
α =1
A 2 2
1 Bα σect
=
aA α =1 B
µα
− µ =
a
,

conforme a nota¸cão do Capı́tulo 7. Substituindo acima tem-se provada a pri-


meira parte do teorema, isto é,

E [y 2c1 ] = E 1 [x] = X = µ.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 214/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

8.2 Estimadores da m´
edia por elemento 203

A demonstra¸cão da segunda parte ser´ a feita em duas etapas. Primeiro, lembre


também do resultado da variˆ ancia condicional

V ar[y2c1 ] = E 1 V ar 2 [y2c1 ] + V ar 1 E 2 [y2c1 ] ,

com os ı́ndices 1 e 2 tendo o mesmo signicado anterior. Partindo da primeira


parte da express˜ ao tem-se
a 2 a 2 a
1 Bα 1 Bα σα2 1
V ar 2 [y2c1 ] = V ar 2 [yα ] = = Vα = v
a2 α =1 B a2 α =1 B bα a α =1

onde Vα é uma vari´avel aleat´oria auxiliar de raciocı́nio local associada ao sorteio


dos conglomerados, tal que
2
1 Bα σα2
Vα = .
a B bα
Com o mesmo raciocı́nio feito acima, tem-se
a 2
1 Bα σα2
E 1 V ar 2 [y 2c1 ] = E1 = E 1 [v] = V
a2 α =1 B bα
A A 2
1 1 Bh σα2
(8.4) = Vα = .
A α =1 aA α =1 B bα
1 a
com v = a α =1 Vα , a média de uma amostra de tamanho a da popula¸cão
V1 , . . . , VA . Para o segundo termo basta recorrer aos resultados da vari´ avel
auxiliar X dados em (8.3). Assim,
a a
1 Bα 1 Bα
V ar 1 E 2 [y 2c1 ] = V ar1 E 2 [y α ] = V ar1 µα
a α =1 B a α =1 B
A 2
σX2 1 Bα
= V ar1 [x] =
a
=
aA α =1 B
µα
−µ .

Combinando os dois resultados, o teorema ca demonstrado.

Para entender melhor o signicado desse resultado é interessante reescrever as


fórmulas de um modo mais conveniente. Primeiro observe que
A 2
1 Bα σα2
A α =1 B bα

mede uma certa variabilidade dentro dos conglomerados, corrigida pelo n´ umero de
unidades sorteadas no segundo est´ agio, bα . Dena-se o parˆametro ψ associado ao

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 215/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

204 Amostragem em dois est´ agios

plano amostral que indica o tamanho médio (esperado) das amostras no segundo
est´agio, ou seja, quando calculado para todos os conglomerados. Desse modo,
A
1
ψ= bα .
A α =1

Dena-se também
A 2
2 1 Bα ψ 2
(8.5) σ2dc = σ ,
A α =1 B bα α

que seria uma medida de variabilidade dentro dos conglomerados. Observe que
2
quando os conglomerados têm o mesmo tamanho e as amostras também, σ2dc reduz-
se a σdc
2 , denido no Capı́tulo 7. Substituindo os resultados (8.3) e (8.5) em (8.2)

obtém-se
σ2 σ2
(8.6) V ar[y 2c1 ] = ect + 2dc ,
a aψ
2
com σ ect também denido no Capı́tulo 7. Ou seja, a variˆ ancia do estimador y2c1 de-
pende da variabilidade entre os conglomerados bem como da variabilidade dentro dos
mesmos. Viu-se que para um est´ agio, a variˆancia depende apenas da variabilidade
entre conglomerados, como seria esperado.

2
Lema 8.1 Um estimador n˜ao viesado de σ2dc é
1 a Bα 2
ψ 2
(8.7) s 22dc = s ,
a α =1 B bα α

onde s2α é a variˆancia amostral no conglomerado α = 1, . . . , A.

Prova. Lembre-se inicialmente que E 2 s 2α = σα2 , pois dentro do conglomerado foi


adotado o plano AASc. Assim,
a 2
2 2 1 Bα ψ
E s = E1 E 2 s = E1 E 2 s2
2dc 2dc a α =1 B bα α
a 2
1 Bα ψ 2
= E1 σ = E 1 [u] = U ,
a α =1 B bα α

onde U é a vari´avel auxiliar


2
Bα ψ 2
Uα = σ
B bα α

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 216/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

8.2 Estimadores da m´
edia por elemento 205

e u denota a média de uma amostra de tamanho a da popula¸cão U1 , . . . , U A ,


e portanto A 2
1 Bα ψ 2 2
U= σ = σ2dc
A α =1 B bα α
o que demonstra o lema.

Lema 8.2 O estimador


a 2
1 Bα
s 22ect
(8.8) =
a
−1 α =1 B

− y2c1

2
é viesado para σect com
2
σ2dc
(8.9) E s2 = σ2 + .
2ect ect ψ
Prova. Reescrevendo a express˜ao (8.8), tem-se
a 2 a 2
Bα Bα
1)s 22ect y2α 2
(8.10) (a
− =
α =1 B

− y2c1 =
α =1 B −ay 2c1 .
Calculando a esperan¸ ca de cada parcela separadamente tem-se para o ´ ultimo
termo
σ2 σ2
E y22c1 = V ar [y2c1 ] + E 2 [y 2c1 ] = ect + 2dc + µ2
a aψ
e para o primeiro,
a 2 a 2
E Bα y2α = E1 Bα E 2 y2α
α =1 B α =1 B
a 2
Bα σα2
= E1 + µ2α
α =1 B bα
a 2 a 2
Bα σα2 Bα
= E1 + µ2α
α =1 B bα α =1 B
a 2 a 2
a 1 Bα ψ 2 1 Bα
= E1 σα + aE 1 µ2α
ψ a α =1 B bα a α =1 B
a a
= E 1 [u] + aE 1 [w] = U + aW
ψ ψ
A
a 1 Bα 2
ψ 2 1 A Bα 2
= σα + a µ2α
ψA α =1 B bα A α =1 B
A 2
a 2 a Bα
µ2α 2
+ aµ 2
= σ +
ψ 2dc A α =1 B −Aµ
A 2
a 2 a Bα
+ aµ 2 .
=
ψ
σ2dc +
A α =1 B
µα
−µ

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 217/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

206 Amostragem em dois est´ agios

Note que foram utilizadas as vari´ aveis de raciocı́nio local Uα e Wα , onde Uα é


como na prova do Lema 8.1 e
2

Wα = µ2α .
B
Concluindo,
a 2
Bα a 2
E y2α = 2
σ + aσ ect + aµ 2 .
α =1 B ψ 2dc

Substituindo-se os dois resultados em (8.10), tem-se


2
a σ2dc
(a 1)E s 2 = σ 2 + aσ 2 + aµ 2 σ2 aµ 2
− 2ect ψ 2dc

2
ect
σ2dc −
−2
ect ψ

= (a
− 1)σect +(a
− 1)
ψ
,

o que demonstra o lema.

Combinando os Lemas 8.2 e 8.2, tem-se

2
Corol´ ario 8.1 Um estimador n˜ao viesado de σect é dado por

s 22dc
(8.11) s2 .
2ect
− ψ
Prova.

s 22dc 1 σ2 2
σ 2dc
E s 22ect = E s 22ect E s 22dc = σect
2
+ 2dc 2
− ψ − ψ ψ − ψ
= σect .

Teorema 8.2 Um estimador n˜ao viesado de V ar [y 2c1 ] é

s22ect
(8.12) var [y2c1 ] = ,
a

onde s2ect est´a denido em (8.8).

Prova.
1 σ2 σ2
E var [y2c1 ] = E s 22ect = ect + 2dc .
a a aψ

Observe que embora o estimador s´ o use a variabilidade entre conglomerados,


ele já traz dentro de si a variabilidade dentro dos conglomerados.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 218/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

8.2 Estimadores da m´
edia por elemento 207

8.2.2 Estimador raz˜


ao
Outro estimador usado quando desconhece-se B é o estimador raz˜ao
1 a a
µ̂ a α =1 B α yα α =1 B α yα
(8.13) y 2c2 = = 1 a = a .
B̂ a α =1 B α α =1 B α

Convém ressaltar que embora N = A α =1 B α é desconhecido na popula¸ cão,


a
α =1 B α
na amostra pode ser determinado, pois envolve apenas os conglomerados sorte-
ados e que ser˜ao subamostrados. Assim, algumas vezes usar-se-´ a B̂ α , Bˆ α e µ̂α
(ou Ŷ α ) para ressaltar o fato de que embora sejam parˆ ametros em rela¸cão ao se-
gundo est´agio (´ındice 2), s˜ao vari´aveis aleat´orias (estatı́sticas) em rela¸ cão ao primeiro

est´agio (ı́ndice 1).


Teorema 8.3 O estimador y2c2 é viesado para µ com
2
σeq σ2
(8.14) V ar[y 2c2 ] + 2dc .
a aψ
Prova. Observe em primeiro lugar que o estimador pode ser escrito como
a 1 a Bα
α =1 B α y α a α =1 B yα y2c1
(8.15) y2c2 = a = 1 a Bα = = r,
α =1 B α a α =1 B xα x 2c1

onde a vari´avel auxiliar contadora X αi = 1, qualquer que seja α e i. Em


seguida, usando o Exercı́cio 7.29, tem-se que para um estimador raz˜ ao r = u/v ,
quociente de duas médias:

r
− R
u
− Rv
E [v]
=
z
E [v]
,

V ar[z]
V ar[r ] e
E 2 [v]
var [z]
var [r ] = 2,
E [v]

onde Z i = Yi RX i . Lembrando que


− Z αi = Yαi
A
−µ, α = 1 , . . . , A , i = 1 , . . . , B α ,
α =1 B α µ α τ
R= A = = µ,
α =1 B α N
a
1 Bα 1
E [x 2c1 ] = E xα = E 1 B̂ = 1 ,
a α =1 B B


y 2c1 Rx 2c1 = z 2c1 ,

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 219/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

208 Amostragem em dois est´ agios

substitui-se na primeira propriedade acima obtendo-se

y 2c2
−µ
y2c1
−1Rx 2c1 = z2c1 = z .
1
2c1

Portanto,
V ar[y 2c2 ] V ar[z 2c1 ].
Usando os resultados do Teorema 8.1 e (8.6), obtém-se
2 2
σect [Z ] σ2dc [Z ]
V ar[z 2c1 ] = + .
a aψ
Mas,
a a a bα
1 Bα R Bα 1 Bα 1
z 2c1 = a α =1 B yα
− a α =1 B = a α =1 B bα i=1 (Yαi
−R)
e como R = µ, equivale `a transforma¸cão mencionada

Z αi = Yαi
−µ = Yαi −Y .
Assim, pode-se calcular
A 2 A 2
2 1 Bα 1 Bα 2
σect [Z ] =
A α =1 B

− Z =
A α =1 B
Zα,

já que Z = 0. Lembrando que Z α = Y α


A
−Y = µα −µ
2
σect
2 [Z ] = 1
A α =1

B
(µα
−µ)2 = σeq2 .
Também do fato que
Bα Bα
1 2 1 2
σα2 [Z ] =
Bα i=1
Z αi
−Z α =
Bα i=1
(Yαi
−µ −µα + µ)

1 2
= σα2 [Y ] = σα2 ,
=
Bα i=1
(Yαi
−µα )
vem
A 2 A 2
2 1 Bα ψ 2 1 Bα ψ 2
σ2dc [Z ] = A α =1 B bα σα [Z ] = A α =1 B bα σα
2 2
= σ2dc [Y ] = σ2dc .

Substituindo estes dois resultados na express˜ ao da V ar[z 2c1 ] obtém-se


2
σeq σ2
V ar[y2c2 ] V ar[z 2c1 ] = + 2dc ,
a aψ
demonstrando parte do teorema. Para a outra parte, veja o Exercı́cio 8.16.

http://slidepdf.com/reader/full/elementos-de-amostragem-heleno-bolfarine-wilton-oliveira-bussab 220/281
7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

8.2 Estimadores da m´
edia por elemento 209

Proposi¸ cão 8.1 Um estimador da variˆ ancia de y2c2 é dado por

s 22ect Ẑ
var [y2c2 ] = ,
a

onde
a 2
1 Bα
s 22ect Ẑ =
a
− 1 α =1 B̂
ẑ α
−ẑ ,

com
(8.16) Ẑ αi = Yαi
−y2c2 X αi ,
onde X αi = 1 , i = 1 , . . . , B α , α = 1 , . . . , A .
Justicativa. Inicialmente, pelo Teorema 8.2 tem-se que s 22ect é um estimador n˜ ao
2 2
viesado de σect + σ2dc /ψ , assim bastaria adaptar este estimador para a vari´ avel Z .
Entretanto a vari´ avel Z