Módulo 9 - AE

Módulo IX: Amostragem
Estratificada
9.1. Introdução
Divisão da população em grupos chamados de estratos, motivada por:

i. Melhora da precisão das estimativas;
ii. Estimativas independentes para estratos além da população como um
todo;
iii. Questões administrativas, estratos naturais.
iv. Motivação técnica:
Erro diminui quando amostra cresce, mas cresce quando a variabilidade é

grande;
v. Uma alternativa é dividir a população em grupos (estratos) os mais
homogêneos possíveis.
Amostragem estratificada consiste na divisão de uma população em

grupos (estratos) segundo alguma(s) característica(s) conhecida(s) na
população sob estudo, e de cada um desses estratos são selecionadas
amostras em proporções convenientes. A estratificação é usada
principalmente para resolver alguns problemas como: a melhoria da precisão das
estimativas; produzir estimativas para a população toda e subpopulações; por
questões administrativas, etc. Aqui será abordado muito mais o primeiro motivo.
Foi visto que para uma amostra AASc de tamanho 𝒏, a variância do
estimador média amostral, 𝒚 ̅, é dada por
Aumentando o tamanho da amostra o erro padrão diminui. Se a população

é muito heterogênea e as razões de custo limitam o aumento da amostra,
torna-se impossível definir uma AASc da população toda com uma precisão
razoável. Uma saída para esse problema é dividir a população em
subpopulações internamente mais homogêneas, ou seja, grupos com
variâncias 𝝈𝟐 pequenas que diminuirão o erro amostral global.
Exemplo 9.1 Considere uma pesquisa feita em uma população com 𝑁 = 8

domicílios, onde são conhecidas as variáveis renda domiciliar (𝑌) e local do
1
domicílio (𝑊), com os códigos 𝐴 para região alta e 𝐵 para região baixa. Tem-se
então,
com
Para esta população calcula-se os parâmetros:
Para o plano AASc de tamanho 𝑛 = 4, sabe-se também que
Usando a segunda variável para estratificar a população em dois estratos,

constrói-se as seguintes subpopulações:
com os seguintes parâmetros:
Sorteando-se em cada estrato uma amostra AASc de tamanho 𝑛 = 2, tem-se

que
Baseado em 𝑦̅𝐴 e 𝑦̅𝐵 é preciso construir um estimador para 𝜇, a média

populacional. Será visto adiante que uma possibilidade é considerar
já que 3𝑦̅𝐴 é um estimador para 𝜏𝐴 e 5𝑦̅𝐵 é um estimador para 𝜏𝐵 . Será visto

também que
Pode-se então medir o efeito do planejamento:
2
Portanto, com o mesmo tamanho da amostra consegue-se diminuir a
variância do estimador em mais da metade.
O resultado será mais eficaz quanto maior for a habilidade do pesquisador

em produzir estratos homogêneos. O caso limite é aquele onde consegue-se
a homogeneidade máxima (variância nula dentro de cada estrato) onde então a
estimativa acerta o parâmetro populacional. A simples estratificação por si só
não produz necessariamente estimativas mais eficientes que a AAS. O
Exemplo 9.2 ilustra tal situação.
Exemplo 9.2 Considere agora a mesma população do Exemplo 9.1, porém

dividida nos seguintes estratos:
com os seguintes dados:
cujos parâmetros são:
Consequentemente, para a AASc dentro de cada estrato, com 𝑛 1 = 𝑛2 = 2,

tem-se que
Finalmente,
com
que mostra o plano estratificado com desempenho bastante próximo ao do

plano AASc para a estratificação considerada.
A execução de um plano de amostragem estratificada (AE) exige os

seguintes
passos:
i. divisão da população em subpopulações bem definidas (estratos);
ii. de cada estrato retira-se uma amostra, usualmente independentes;
iii. em cada amostra usam-se estimadores convenientes para os parâmetros do
estrato;
iv. monta-se para a população um estimador combinando os estimadores de
cada estrato, e determinam-se suas propriedades.
3
Exemplo:
Uma região possui 60 municípios e deseja fazer uma amostragem para atualizar
a estimativa do total de sua população. Para isso foi decidido pesquisar 20
cidades e deseja-se saber qual seria o mais eficiente para o caso: uma
amostra aleatória simples (AAS), uma amostra aleatória estratificada (AAE)
com alocação proporcional ou uma AAE com alocação igual. As cidades
foram agrupadas em dois estratos segundo a população apurada no último
Censo (cidades grandes: mais de 300 mil habitantes; e cidades pequenas:
menos de 300 mil habitantes). A tabela mostra essa estratificação e as
populações, no censo, em milhares de habitantes.
9.1 Notação e relações úteis
Considere uma população bem descrita por um sistema de referência, ou seja,
e que exista uma partição 𝑈1 , . . . , 𝑈𝐻 de 𝑈, isto é,
(9.1)
para ℎ = ℎ ′ = 1, . . . , 𝐻, e que cada subconjunto 𝑈ℎ , bem determinado, é

identificado por duplas ordenadas, do seguinte modo:
Assim, o universo todo pode ser descrito por
de modo a facilitar a identificação do estrato e do elemento dentro dele. De

modo análogo, as características populacionais serão identificadas por dois
índices, ou seja, no caso univariado, por exemplo, tem-se o vetor de
características populacionais
ou seja, para o estrato 1 tem-se as características populacionais 𝑌11 , … , 𝑌1𝑁1 e

assim por diante. Pode-se representar também a população com as
4
características populacionais e algumas funções paramétricas populacionais
através da Tabela 9.1.
Algumas definições e relações entre os parâmetros:
Tabela 9.1: Uma população estratificada
5
de modo que a média global é a média ponderada dos estratos. Um
resultado bastante importante e também conhecido, envolvendo formas
quadráticas, estabelece que (veja o Exercício 4.30)
(9.3) ,
que permite escrever
(9.4) ,
ou ainda
onde
é a média das variâncias dos estratos (variância dentro) e
mede a variação das médias dos estratos (chamar-se-á de variância entre

estratos).
Para a expressão 𝑆 2 , tem-se, de modo análogo,
6
ou para estratos relativamente grandes,
onde 𝑆𝑑2 = ∑𝐻 2
ℎ=1 𝑊ℎ 𝑆ℎ . Convém observar que quando todos os estratos têm a
mesma média, ou seja, 𝜇ℎ = 𝜇, ℎ = 1, . . . , 𝐻, a variância populacional 𝜎 2
coincide com 𝜎𝑑2 .
Quanto maior for 𝜎𝑒2 , maior é a diferença 𝜎 2 − 𝜎𝑑2 .
Para se obter informação sobre as funções paramétricas de interesse, uma
amostra 𝒔𝒉 é selecionada do estrato 𝒉, 𝒉 = 𝟏, . . . , 𝑯, de acordo com algum
plano amostral especificado 𝑨𝒉 , 𝒉 = 𝟏, . . . , 𝑯. Como no caso da AAS (ver
Definição 2.6), tem-se associado com a seleção da amostra no h-ésimo
estrato as variáveis aleatórias
(9.5)
que assumem os valores 𝑌ℎ1 , … , 𝑌ℎ𝑁ℎ com probabilidades dependendo do plano
amostral utilizado.
A nomenclatura usada para denotar ESTATÍSTICAS é semelhante àquela

usada para denotar as funções paramétricas populacionais. Desse modo
tem-se
que denotam, respectivamente, a média, o total e a variância amostral no

estrato ℎ, ℎ = 1, . . . , 𝐻, enquanto que para a amostra toda, 𝑠 = ⋃𝐻
ℎ=1 𝑠ℎ , de
tamanho
tem-se que
7
Antes de terminar é importante lembrar algumas propriedades de variáveis
aleatórias (ver Bussab e Morettin, 2004, Capítulo 8). Se 𝑋1 , . . . , 𝑋𝐻 são variáveis
aleatórias independentes, então para
(9.6)
e
(9.7)
9.2 Estimação do total e da média populacional
Considere a seguinte situação:

a. Uma população estratificada como na seção anterior;
b. De cada estrato foi sorteada independentemente uma amostra de tamanho
𝑛ℎ , podendo ou não ter sido usado o mesmo plano amostral dentro de cada
estrato;
c. Seja 𝜇̂ ℎ um estimador não viesado da média populacional 𝜇ℎ do estrato ℎ, ou
seja, 𝑬𝑨 [𝝁
̂ 𝒉 ] = 𝝁𝒉 , onde 𝑨 é o plano usado no estrato 𝒉.
Então:
Teorema 9.1 O estimador
é não viesado para o total populacional 𝝉, com
Prova. Usando as relações (9.6) e (9.7) tem-se, para um plano amostral 𝑨,

que
Corolário 9.1 O estimador
8
é um estimador não viesado da média populacional 𝝁 e
Corolário 9.2 Considere agora que, dentro de cada estrato, a amostra foi
sorteada por um processo AASc e que 𝝁 ̅𝒉 . Então, tem-se para as duas
̂𝒉 = 𝒚
situações acima as seguintes fórmulas:
com estimadores não viesados dados por
Este procedimento e a sua variante sem reposição é um dos planos

amostrais mais usados em problemas reais.
9.3 Alocação da amostra pelos estratos
A distribuição das 𝒏 unidades da amostra pelos estratos chama-se

alocação da amostra. Essa distribuição é muito importante pois ela é que
irá garantir a precisão do procedimento amostral como pode ser visto no
Exemplo 9.4.
Exemplo 9.4 Considere agora a população do Exemplo 9.1 com a seguinte

estratificação:
com os seguintes parâmetros populacionais:
9
Considere também uma primeira situação em que em ambos os estratos
usou-se AASs, com 𝒏𝟏 = 𝟏 e 𝒏𝟐 = 𝟐 (alocação 𝑨𝑳𝟏 ), ou seja, 𝒏 = 𝟑.
Usando os resultados do Teorema 4.1 tem-se
Imagine agora a alocação contrária, isto é, 𝒏𝟏 = 𝟐 e 𝒏𝟐 = 𝟏 (alocação

𝑨𝑳𝟐 ), de modo que 𝒏 = 𝟑, resultando em
Comparando as variâncias obtém-se
ou seja, a segunda alocação reduz a variância, onde se conclui a

importância do processo de alocação.
Antes de prosseguir, convém observar que quanto maior a variância do
estrato, maior deve ser também a amostra a ele designada. Porém, deve ser
balanceado com o tamanho do estrato, representado por 𝑊ℎ 𝑒 𝑓ℎ , ℎ = 1, . . . , 𝐻.
Nas considerações que serão feitas a seguir, as deduções serão feitas

supondo que dentro de cada estrato foi usado o esquema AASc. Caso seja
usado qualquer outro esquema, pode-se usar o mesmo procedimento para
encontrar as propriedades dos estimadores de interesse.
9.3.1 Alocação proporcional
Neste tipo de procedimento a amostra de tamanho 𝑛 é distribuída

proporcionalmente ao tamanho dos estratos, isto é,
(9.8)
Este procedimento, é muitas vezes, também chamado de amostragem

“representativa”. Aqui será usada a nomenclatura Amostragem Estratificada
Proporcional (AEpr).
̅𝒆𝒔 é igual a média amostral

Teorema 9.2 Com relação à AEpr, o estimador 𝒚
̅ , com
simples 𝒚
,
que é estimado por
10
Prova. Partindo da média 𝑦̅𝑒𝑠 e da expressão (9.8) tem-se
Tem-se também que
E que
Substituindo em 𝑉𝑎𝑟(𝑦̅𝑒𝑠 ), juntamente com o Corolário 9.2, tem-se que
(9.9)
Como dentro de cada estrato, 𝒔𝟐𝒉 é um estimador não viesado para 𝝈𝟐𝒉 ,
então
é um estimador não viesado de 𝑉𝑎𝑟(𝑦̅𝑒𝑠 ) = 𝑉𝑝𝑟 o que conclui a prova do

teorema. Observe que a expressão (9.9) sugere que o plano amostral
estratificado proporcional “equivale” a estudar as propriedades do estimador 𝑦̅
associado à AASc, retirada de uma população com variância 𝜎𝑑2 .
9.3.2 Alocação uniforme
Na Amostragem Estratificada Uniforme (AEun) atribui-se o mesmo

tamanho de amostra para cada estrato. É o procedimento indicado quando
pretende-se apresentar estimativas separadas para cada estrato. Para cada um
dos 𝑯 estratos têm-se
Deste modo, tem-se o
̅𝒆𝒔 é um estimador não viesado com

Corolário 9.3 Com relação à AEun, 𝒚
variância expressa por
que é estimada por
11
OBS.: 𝒌 = 𝒏/𝑯.
Prova. Basta aplicar as especificações acima nos resultados do Corolário 9.2.
9.3.3 Alocação ótima de Neyman
Nesta seção será discutido o problema de como alocar o tamanho da amostra

pelos vários estratos de tal forma que certas condições sejam verificadas.
Para isso considera-se uma função de custo de forma linear, isto é,
(9.10)
onde 𝑐0 denota o custo inicial, 𝑐ℎ o custo por unidade observada no estrato ℎ e
𝐶 ′ o custo variável. De acordo com o Teorema 9.2, escreve-se
Mais especificamente, o problema é minimizar 𝑽𝒆𝒔 para 𝑪 fixado ou minimizar

𝑪 para 𝑽𝒆𝒔 fixado.
Teorema 9.3 Na AE com a função de custo linear, temos que 𝑽𝒆𝒔 é mínimo para
𝑪′ fixado ou 𝑪′ é mínimo para 𝑽𝒆𝒔 fixado se
(9.12)
Portanto, de acordo com o Teorema 9.3, o número ótimo de unidades a

serem observadas no estrato 𝒉 é diretamente proporcional a 𝑵𝒉 𝝈𝒉 e
inversamente proporcional a √𝒄𝒉 .
Corolário 9.4
i. Para 𝐶′ fixado, o tamanho ótimo da amostra é dado por
(9.18)
ii. Para 𝑉𝑒𝑠 fixado, o tamanho ótimo da amostra é dado por
12
(9.19)
onde 𝑊ℎ = 𝑁ℎ /𝑁, como antes.
Corolário 9.5 Para o caso em que o custo (uniforme) por unidade observada
em todos os estratos seja fixado em 𝒄, isto é,
a alocação ótima se reduz a
(9.20)
ℎ = 1, . . . , 𝐻.
Neste caso 𝑉𝑒𝑠 reduz-se a
(9.21)
Onde 𝜎̅ = ∑𝐻 𝑊
ℎ=1 ℎ ℎ𝜎 é um desvio padrão médio dentro de cada estrato. A
alocação (9.20) é usualmente conhecida por alocação ótima de Neyman.
Neste caso, o número de unidades a serem observadas no estrato 𝒉 é
proporcional a 𝑵𝒉 𝝈𝒉 .
9.3.4 Efeito do planejamento

O resultado a seguir apresenta comparações entre a utilização de um
planejamento AE com alocação proporcional, a de um planejamento com
alocação ótima e a utilização de um planejamento (A) AAS com reposição.
Seja
e como visto no Teorema 9.2, para a alocação proporcional,
(9.22)
corresponde à AE com alocação proporcional. E para a alocação ótima com 𝑛
fixo, temos a variância 𝑉𝑜𝑡 dada por (9.21).
Teorema 9.4 Com relação à AASc, tem-se que 𝑉𝑜𝑡 ≤ 𝑉𝑝𝑟 ≤ 𝑉𝑐 .
13
Prova. De acordo com (9.4), tem-se que
(9.23)
Então, 𝜎 2 em (9.23) pode ser escrita como
Consequentemente, escreve-se
Já que 𝜎𝑒2 /𝑛 é sempre não negativo,
Por construção, sabe-se que 𝑉𝑜𝑡 ≤ 𝑉𝑝𝑟 . Por outro lado, (veja o Exercício 4.31)
(9.24)
onde, como em (9.21), 𝜎̅ = ∑𝐻 2

ℎ=1 𝑊ℎ 𝜎ℎ , que juntamente com 𝜎𝑑𝑝 , indica a
variabilidade entre os desvios padrões dos estratos. Quanto maior for a
heterogeneidade dos dados pelos estratos, com mais ênfase recomenda-
se o uso da alocação ótima. Portanto,
(9.25)
Estas últimas expressões demonstram o teorema e permitem concluir quando

deve ser usada cada alocação. Assim, sempre que os estratos tiverem médias
distintas (𝜎𝑒2 grande) deve-se usar alocação proporcional ou ótima. Se além
2
disso, também os desvios padrões de cada estrato diferirem muito entre si (𝜎𝑑𝑝
grande), recomenda-se a alocação ótima.
Com os resultados do Teorema 9.4 deriva-se os efeitos do planejamento

para cada um dos planos acima. Assim,
14
Ou seja, se 𝟏/𝐍𝐡 for desprezível, o plano estratificado proporcional produz
variâncias sempre menores que aquelas produzidas por uma AASc de
mesmo tamanho, e este ganho é maior quanto maior for 𝛔𝟐𝐞 , isto é, quanto
maior for a diferença entre as médias dos estratos. Para amostras muito
grandes, o lucro desaparece.
Para a alocação ótima (AEot) tem-se que
(9.26)
Observe novamente que o EPA é sempre menor do que 1, mostrando a

vantagem do uso deste plano. Esta vantagem (lucro) cresce com o aumento
da diferença entre as médias dos estratos, isto é, 𝝈𝟐𝒆 grande. Observe que o
último termo da expressão mede a variabilidade dos desvios padrões dos
estratos, o que significa que o ganho da alocação ótima cresce com a diferença
entre as variabilidades dos estratos. O conhecimento destes fatos é
importantíssimo para orientar o estatístico a desenhar o plano amostral mais
conveniente. A não ser em situações muito particulares, o plano AE produz
variâncias sempre menores do que as correspondentes variâncias obtidas com
o plano AASc. A prova algébrica deste resultado é bastante trabalhosa.
Entretanto, considere uma situação particular, onde esta relação pode ser
explorada. Suponha que dentro de cada estrato foi usado o plano AASc
(denotado por AEc), de modo que
(9.27) ,
onde 𝑤ℎ = 𝑛ℎ /𝑛, ℎ = 1, . . . , 𝐻. Observando-se a expressão acima verifica-se
a dificuldade em se concluir se a mesma é maior ou menor do que 1.
Usualmente o processo de estratificação leva a uma maior
homogeneização dos dados, de modo que 𝝈𝒉 /𝝈 < 𝟏 e por estar elevado ao
quadrado poderia anular situações onde 𝑾𝒉 /𝒘𝒉 > 𝟏, o que levaria ao
15
somatório acima ser menor do que 1, ou seja, a variância da AE seria menor
do que a variância obtida com o plano AASc. Entretanto é possível construir
contra-exemplos onde isso não se verifica (ver Exercício 4.34).
9.4 Normalidade assintótica e intervalos de confiança
Conforme o tamanho da amostra aumenta, as distribuições de 𝑦̅𝑒𝑠 e de 𝑇𝑒𝑠 =

𝜏̂𝑒𝑠 vão se aproximando da distribuição normal, de acordo com o TLC. Estes
resultados continuam valendo com as alocações discutidas nas seções
anteriores. Veja o Capítulo 10 de Bolfarine e Bussab (2005), onde condições são
estabelecidas para a validade do TLC. Então, para 𝑛ℎ e 𝑁ℎ suficientemente
grandes, temos que
(9.28)
(9.29)
Como 𝝈𝟐𝒉 não é conhecido nas expressões (9.28) e (9.29), ele é substituído
por seu estimador não viciado 𝒔𝟐𝒉 , considerado na Seção 9.1. Usando o
mesmo enfoque da Seção 3.2.4, temos que um intervalo de confiança para 𝝁
com coeficiente de confiança aproximadamente igual a 𝟏 − 𝜶 é dado por
Um intervalo para 𝜏 pode ser obtido de modo análogo.
9.5. Determinação do tamanho da amostra
Utilizando (9.28), pode-se determinar 𝑛 de modo que
onde
(9.30)
Dado que a equação (9.30) depende de 𝒏𝒉 e não de 𝒏 diretamente, será

considerado que 𝑛ℎ = 𝑛𝑤ℎ , onde 𝑤ℎ é conhecido, ℎ = 1, . . . , 𝐻. Em particular,
pode-se considerar 𝑤ℎ = 𝑊ℎ = 𝑁ℎ /𝑁, resultando em
16
(8.31)
2
onde 𝐷 = 𝐵 /𝑧𝛼2
, como antes. A correspondente expressão para 𝑛 no caso da
estimação do total populacional é considerada no Exercício 4.28. OBS.: Para
𝑛𝑊 𝑛
AASs, basta considerar o fator (1 − 𝑓ℎ ) = (1 − 𝑁 ℎ ) = (1 − 𝑁ℎ ).
ℎ ℎ
Tamanho da amostra estratificada - caso geral (resumo)

Seja 𝑉𝑒𝑠 = 𝑉 a variância mínima desejada para estimar (AASs) a média da
população. Seja uma alocação qualquer 𝒏𝒉 = 𝒏𝒂𝒉 , sendo 𝒂𝒉 a constante
que define a alocação no estrato 𝒉. Pela fórmula da variância da média
temos
𝑯 𝑯 𝑯
𝒏𝒂𝒉 𝝈𝟐𝒉 𝟏 𝟐
𝟐 𝝈𝒉 𝟏
𝑽= ∑ 𝑾𝟐𝒉 (𝟏 − ) = ∑ 𝑾𝒉 − ∑ 𝑾𝒉 𝝈𝟐𝒉 .
𝑵𝒉 𝒏𝒂𝒉 𝒏 𝒂𝒉 𝑵
𝒉=𝟏 𝒉=𝟏 𝒉=𝟏
Logo,
𝝈𝟐𝒉
∑𝑯 𝟐
𝒉=𝟏 𝑾𝒉 𝒂𝒉
𝑛= .
𝟏
𝑉 + ∑𝑯 𝑾 𝝈𝟐
𝑵 𝒉=𝟏 𝒉 𝒉
Portanto, os 𝒂𝒉 ′𝒔 vão depender da alocação escolhida.
𝑊ℎ 𝜎ℎ /√𝑐ℎ
Proporcional: 𝑎ℎ = 𝑊ℎ . Uniforme: 𝑎ℎ = 1/𝐻 Ótima: 𝑎ℎ = ∑𝐻 .
ℎ=1 𝑊ℎ 𝜎ℎ /√𝑐ℎ
OBS.: Podemos fixar o erro, 𝐵, ao invés da variância 𝑉: 𝐵 = 𝑧𝛼 √𝑉.
9.6 Estimação de proporções
Como um caso particular das situações estudadas nas seções anteriores,

aparece a situação onde o interesse é estudar a ocorrência de determinada
característica na população. Tal característica pode ser, por exemplo, a
preferência por determinado partido político, por um candidato em uma eleição,
por determinada marca de produto, e assim por diante. Nestas situações, a
quantidade de interesse associada ao i-ésimo elemento no h-ésimo estrato pode
ser representada por
17
𝑁ℎ
Sendo 𝜏ℎ = ∑𝑖=1 𝑌ℎ𝑖 , o número de elementos que possuem a característica no
estrato ℎ, tem-se que
é a proporção de elementos que possuem a característica no estrato ℎ, ℎ =

1, . . . , 𝐻. Então, a proporção de elementos na população que possui a
característica pode ser escrita como
onde 𝑊ℎ = 𝑁ℎ /𝑁, como nas seções anteriores. Dada uma amostra 𝑠ℎ de

tamanho 𝑛ℎ selecionada segundo a AASc no estrato ℎ, pode-se então definir
para 𝑷 o estimador
onde
e 𝑇ℎ é o número de elementos na amostra que possuem a característica no

̅𝒆𝒔 , e usando o fato de que
estrato ℎ, ℎ = 1, . . . , 𝐻. Identificando 𝒑𝒆𝒔 com 𝒚
conforme verificado na Seção 3.2.6, temos o (veja o Exercício 4.32)
Teorema 9.5 Com relação à AE com reposição, tem-se que
é um estimador não viciado de 𝑷 com
(9.32)
onde 𝑄ℎ = 1 − 𝑃ℎ , ℎ = 1, . . . , 𝐻. O resultado a seguir é uma consequência

direta do Teorema 3.5. Veja o Exercício 4.33.
Teorema 9.6 Um estimador não viciado de 𝑽𝒆𝒔 com relação à AE com

reposição é dado por
18
onde 𝑄̂ℎ = 1 − 𝑃̂ℎ .
Utilizando a aproximação normal discutida na Seção 9.4, encontra-se um

intervalo de confiança aproximado para 𝑃. Dado o coeficiente de confiança 𝛾 =
1 − 𝛼, segue dos Teoremas 9.5 e 9.6 que um intervalo de confiança para 𝑷,
aproximadamente, é dado por
Usando a função de custo linear 𝑪 = 𝒄𝟎 + ∑𝑯

𝒉=𝟏 𝒄𝒉 𝒏𝒉 , a alocação ótima segue
diretamente do Teorema 9.3 e é dada por
Quando o custo é constante, do Corolário 9.5 tem-se que a alocação ótima

de Neyman passa a ser
(9.33) .
Não dispondo de informação preliminar sobre 𝑷𝒉 , como amostras pilotos

ou pesquisas anteriores, substitui-se 𝑷𝒉 𝑸𝒉 por 1/4 na expressão (9.33), por
ser um limite superior, levando a alocação proporcional. Verifique a
aplicabilidade dos Corolários 9.4 e 9.5 para o caso das proporções.
9.7 Pós-estratificação
A pós-estratificação aparece com grande frequência em situações nas

quais a amostra inicial foi coletada sem levar-se em consideração a priori
fatores importantes de estratificação. A não estratificação a priori pode ocorrer
por falha humana quando da escolha do plano amostral para a coleta dos
dados, ou por desconhecimento ocasionado pela dificuldade de
observação inicial de fatores relacionados com o problema, ou seja, fatores
de estratificação ocultos e que se tornam visíveis após a análise estatística
da amostra coletada sem estratificação.
Deste modo, uma alternativa para tentar reparar o erro da não estratificação
inicial é realizar a estratificação a posteriori. Assim os estratos
populacionais são determinados após a coleta da amostra de 𝒏 unidades
amostrais. Neste caso, os tamanhos dos estratos, 𝑛ℎ , não são fixados a priori
e são variáveis aleatórias.
19
Como um exemplo de aplicação, em controle de qualidade uma situação na
qual este procedimento de pós-estratificação poderia ser utilizado seria
aquela em que uma amostra tenha sido coletada através de amostragem
aleatória simples ou sistemática sem levar em consideração fatores de
estratificação, tais como operadores, máquinas linhas de produção,
matérias primas e etc. Neste caso, estes fatores descobertos a posteriori
poderiam ser introduzidos na análise estatística através de uma Pós-
Estratificação. Entretanto, essa alternativa deve ser encarada com cuidado,
pois não há garantias de que a pós-estratificação venha a produzir
estimativas mais precisas que aquelas obtidas sem a pós-estratificação. O
melhor mesmo, é fazer um brainstorm antes da coleta de dados, de modo a
planejar corretamente a seleção das informações levando-se em
consideração os fatores de estratificação que podem ser relacionados com
a(s) variável(is) resposta(s) de interesse.
No caso em que a amostra inicial de 𝑛 elementos tiver sido coletada pelos
métodos de AAS ou por AS, as estimações de parâmetros considerando-se
a pós-estratificação pode ser feita da seguinte forma:
- Suponha que os pesos 𝑊ℎ dos estratos formados a posteriori sejam
conhecidos, ℎ = 1, . . . , 𝐿. Neste caso, um estimador da média populacional
será dado por
𝑦̅𝑠𝑡 = ∑𝐿ℎ=1 𝑊ℎ 𝑦̅ℎ ,
como definido anteriormente.
Entretanto, esse estimador não tem a variância como discutido anteriormente,
devido à aleatoriedade dos valores 𝑛ℎ que somente são conhecidos após a
seleção e observação da amostra inicial aleatória de 𝑛 unidades amostrais. A
variância estimada, nesse caso, será dada por:
𝐿 𝐿
𝑁−𝑛 1
𝑣𝑎𝑟(𝑦̅𝑠𝑡 ) = ∑ 𝑊ℎ 𝑠ℎ2 + 2 ∑(1 − 𝑊ℎ )𝑠ℎ2
𝑁𝑛 𝑛
ℎ=1 ℎ=1
Essa fórmula é obtida como sugerido em Scheaffer, R.A., Mendenhall e Ott
(1996) e Cochran (1977).
A estimação considerando-se a pós-estratificação pode vir a resultar em
estimativas menos precisas que aquelas obtidas através de AAS e AS
quando os pesos dos estratos não forem conhecidos ou estiverem muito
distantes dos valores populacionais.
APLICAÇÕES
Aplicação 1: Uma agência de publicidade está interessada em determinar o

quanto ela deve enfatizar em propagandas de televisão em uma certa cidade.
Para isso, ela decidiu conduzir uma pesquisa para estimar o número médio de
horas por semana que os moradores assistem televisão, usando dados de 40
indivíduos selecionados sob o esquema de AE-AASs. A cidade está dividida em
três áreas: área A, área B e área rural. A área A foi construída em torno de uma
indústria. A maioria de seus moradores trabalha nela e têm crianças em idade
escolar. A área B é subúrbio de uma cidade vizinha. Os moradores (𝑁 = 310)
20
são mais velhos e tem poucas crianças em casa. Existem 155 moradores na
área A, 62 na área B e 93 na área rural. A tabela abaixo mostra alguns resumos
dessa pesquisa:
Áreas 𝑾𝒉 𝒏𝒉 ̅𝒉
𝒚 𝒔𝒉
A 0,50 20 33,9 5,95
B 0,20 8 25,12 15,25
Rural 0,30 12 19 9,36
Nesse caso, uma estimativa não viciada para o número médio de horas por
semana que os moradores assistem televisão será:
𝑦̅𝑒𝑠 = [0,50(33,9) + 0,20(25,12) + 0,30(19)] = 27,675,
(1 − 40/310)
̂ (𝑦̅𝑒𝑠 ) =
𝑉𝑎𝑟 [0,50(5,952 ) + 0,20(15,252 ) + 0,30(9,362 )] = 1,9695.
40
Com o erro-padrão estimado igual a:
̂ (𝑦̅𝑒𝑠 ) = √1,9695 = 1,4034.

√𝑉𝑎𝑟
O intervalo de confiança de 95% para 𝜇 é dado por
̂ (𝑦̅𝑒𝑠 )] = [27,675 ± 1,96 × 1,4034] = [24,92; 30,43].

[𝑦̅𝑒𝑠 ± 𝑧𝛼 √𝑣𝑎𝑟
OBS.: Para encontrar estimativas para o total 𝜏, basta usar o estimador da

expansão, multiplicando a estimativa pontual e o erro padrão por 𝑁 = 310.
Aplicação 2: Uma indústria de mineração está interessada em estimar o teor

médio de ferro do Sint Feed B, que será empilhado em 24 horas, através das
estimativas do teor médio de ferro do Sint Ferro 1, Sint Ferro 2+3 e Sint Ferro 4.
Experiências anteriores indicam uma boa estimativa do desvio padrão do teor
médio de ferro do Sint Ferro 1 é igual 𝜎̂1 = 1,4% , do Sint Ferro 2+3
𝜎̂2 = 1,2% 𝑒 do Sint Ferro 4 𝜎̂3 = 1,1% . Além disso, a quantidade de minério
de ferro normalmente produzida no período é:
Sint Ferro 1 – 13800 ton;
Sint Ferro (2+3) – 23400 ton;
21
Sint Ferro 4 – 22800 ton.
Neste caso, o número total de incrementos da amostra e o número em cada

estrato de forma que a variância global seja igual a 0,02 %2 e a alocação da
amostra seja proporcional em cada estrato, serão dados por:
𝟐
∑𝑯 𝟐 𝒔𝒉
𝒉=𝟏 𝑾𝒉𝒂𝒉
𝑛= 𝟏 𝑯 , onde 𝑎ℎ = 𝑊ℎ .
𝑉+ ∑𝒉=𝟏 𝑾𝒉 𝒔𝟐𝒉
𝑵
0,23 × 1,42 + 0,39 × 1,22 + 0,38 × 1,12

𝑛=( ) ≈ 74 𝑖𝑛𝑐𝑟𝑒𝑚𝑒𝑛𝑡𝑜𝑠.
0,23 × 1,42 + 0,39 × 1,22 + 0,38 × 1,12
0,02 + 60000
𝑛1 = 𝑊1 𝑛 = 0,23 × 74 = 16,79 ≅ 17;
𝑛2 = 𝑊2 𝑛 = 0,39 × 74 = 28,47 ≅ 29;
𝑛3 = 𝑊3 𝑛 = 0,38 × 74 = 27,74 ≅ 28.
Usando o software R:
N=60000
w1=c(13800,23400,22800)
w=w1/sum(w1)
sig2=c(1.4,1.2,1.1)
sig2d=sum(w*(sig2^2))
V=0.02
n=sig2d/(V+(sig2d/N))
round(n)
nh=w*n
round(nh)
Resultado:
22
EXEMPLOS EM R
Para os exemplos aplicados usando um software, usaremos o software R e o

seu pacote ‘Survey’. É necessário instalar esse pacote para realizar a estimação
para os esquemas amostrais complexos. Uma descrição da função do pacote
está logo abaixo.
Exemplo 1 (Publicidade, AE-ASSs): Uma agência de publicidade está

interessada em determinar o quanto ela deve enfatizar em propagandas de
televisão em uma certa cidade. Para isso, ela decidiu conduzir uma pesquisa
para estimar o número médio de horas por semana que os moradores assistem
televisão. A cidade está dividida em três áreas: área A, área B e área rural. A
área A foi construída em torno de uma indústria. A maioria de seus moradores
trabalha nela e têm crianças em idade escolar. A área B é subúrbio de uma
cidade vizinha. Os moradores são mais velhos e tem poucas crianças em casa.
Existem 155 moradores na área A, 62 na área B e 93 na área rural.
Análise usando o pacote Easy Sampling (AE-ASSs):
Os resultados estão abaixo:
23
Neste exemplo, temos 27,675 como estimativa para o número médio de horas
por semana que cada morador da cidade assistem televisão, tendo um desvio-
padrão estimado por 1,40339 (usa-se 𝑛 − 1!), sendo que com 95% de confiança
o verdadeiro valor médio populacional de horas assistidas está entre 24,7559 e
30,5940.
Para o total de horas por semana assistida por todos os moradores, temos como
estimativa o valor 8579,25, tendo um desvio-padrão estimado por 435,0526,
sendo que com 95% de confiança o verdadeiro valor total está entre 7674,3404
e 9484,1595 horas por semana.
Dados:
Análise usando o software R. Digite os seguintes comandos no software R.
require("survey")
areas=read.table("AE-AASs2.csv",dec=",",sep=";",header=T)
N=310
n=40
fpc.es <- areas$N
des.es <- svydesign(id=~1,strata=~Area,data=areas,fpc=~N)
svymean(~y, des.es, deff="replace")
confint(svymean(~y,design=des.es),level=0.95)
svytotal(~y,des.es)
confint(svytotal(~y,design=des.es),level=0.95)
24
Selecione uma amostra AE de tamanho 𝑛 = 40 de uma população de tamanho
𝑁 = 310, usando o software R. Digite os seguintes comandos no software R.
install.packages('plyr')
library(plyr)
set.seed(1)
N=310
n=40
f=n/N
dat <- data.frame(
id = 1:N,
Category = sample(LETTERS[1:3], N, replace=TRUE, prob=c(0.5, 0.2,
0.3))
)
sampleOne <- function(id, fraction=0.1){

sort(sample(id, round(length(id)*fraction)))
}
ddply(dat, .(Category), summarize, sampleID=sampleOne(id, fraction=f))
Resultado:
25
Exemplo 2 (Empresas, AE-AS): Um instituto de pesquisas de mercado foi
contratado para estimar a quantidade de dinheiro gasta por empresas da região
sudeste com investimentos em cultura no primeiro semestre do ano. Baseando-
se na renda declarada no ano passado, 300 empresas foram alocadas em três
categorias; 60 na A, 100 na B e 140 na C. Para cada uma delas foi montada uma
lista em ordem alfabética e através do procedimento de amostragem sistemática
foram selecionadas 20 empresas da categoria A, 24 da categoria B e 50 da C.
As empresas sorteadas receberam a visita de um coordenador que coletou as
informações necessárias.
26
Análise usando o pacote Easy Sampling (AE-AS):
Neste exemplo, 26516,189 é uma estimativa da quantidade média de dinheiro

gasto pelas empresas da região sudeste com investimentos em cultura no
primeiro semestre do ano.
1358,07261 é uma estimativa do desvio-padrão pela aproximação via AAS-SR,

gerando o intervalo (23854,36 ; 29178,01) para a verdadeira quantidade média
de dinheiro gasta, com 95% de confiança.
1387,76608 é uma estimativa do desvio-padrão pela amostragem sistemática

repetida, gerando o intervalo (23796,16 ; 29236,21) para a verdadeira
quantidade média de dinheiro gasta, com 95% de confiança.
1338,01100 é uma estimativa do desvio-padrão pelo método das diferenças

sucessivas, gerando o intervalo (23893,68 ; 29138,68) para a verdadeira
quantidade média de dinheiro gasta, com 95% de confiança.
27
Para o total populacional temos uma estimativa de 7954856,7 unidades
monetárias gastas pelas empresas da região sudeste com investimentos em
cultura no primeiro semestre do ano.
407421,78 é uma estimativa do desvio-padrão pela aproximação via AAS-SR,

gerando o intervalo (7156310,07 ; 8753403,46) para a verdadeira quantidade
total de dinheiro gasto, com 95% de confiança.
416329,82 é uma estimativa do desvio-padrão pela amostragem sistemática

repetida, gerando o intervalo (7138850,30 ; 8770863,22) para a verdadeira
quantidade média de dinheiro gasto, com 95% de confiança.
401403,00 é uma estimativa do desvio-padrão pelo método das diferenças

sucessivas, gerando o intervalo (7168106,86 ; 8741606,66) para a verdadeira
quantidade média de dinheiro gasto, com 95% de confiança. Finalmente, o
software também disponibiliza os coeficientes intra-classe, calculadas para os
três estratos, dando idéia da qualidade da aproximação via AAS-SR.
Análise usando o software R e o Método 1 (AASs). Digite os seguintes comandos

no software R.
#Empresas
require("survey")
empresas=read.table("AE-ASIS2.csv",dec=",",sep=";",header=T)
N=300
n=94
fpc.es <- empresas$N
des.es <- svydesign(id=~1,strata=~Cat,data=empresas,fpc=~N)
svymean(~y, des.es, deff="replace")
confint(svymean(~y,design=des.es),level=0.95)
svytotal(~y,des.es)
confint(svytotal(~y,design=des.es),level=0.95)
28
BIBLIOGRAFIA
1- BOLFARINE, H.,BUSSAB, W. Elementos de Amostragem. São Paulo:

Editora Edgard Bluncher, 2005.
2- BUSSAB, W. O. e MORETTIN, P.A. (2004). Estatística básica. 5a ed. São

Paulo: Saraiva.
3- LOHR, Sharon. Sampling: design and analysis. Nelson Education, 2009.
4- SILVA, N. N. Amostragem Probabilística. São Paulo: EDUSP, 1999.
5- KISH, L. Survey sampling. New York: John Wiley, 1965.
6- COCHRAN, W. G. Sampling techniques. New York: John Wiley & Sons,

1977.
7- BABBIE, E. Métodos de Pesquisa de Survey. Belo Horizonte: Editora
UFMG, 1999.
8- MINGOTI, S. A.; ATUNCAR, G. S.; SILVA, Granha, M. L.; SILVA, R. C.
Métodos de Amostragem com Aplicações na Área Empresarial. Belo
Horizonte: Departamento de Estatística da UFMG, 2000.
9- SCHEAFFER, R.A., MENDENHALL, W. e OTT, L. Elementary survey
sampling, 5a ed., Belmont: Duxbury Press, 1996.
10- THOMPSON, S. K. Sampling, New York: John Wiley & Sons, 1992.
29

Módulo 9 - AE

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Módulo 9 - AE

Enviado por

Direitos autorais:

Formatos disponíveis

Módulo IX: Amostragem

Divisão da população em grupos chamados de estratos, motivada por:

Erro diminui quando amostra cresce, mas cresce quando a variabilidade é

Amostragem estratificada consiste na divisão de uma população em

Aumentando o tamanho da amostra o erro padrão diminui. Se a população

Exemplo 9.1 Considere uma pesquisa feita em uma população com 𝑁 = 8

Para esta população calcula-se os parâmetros:

Para o plano AASc de tamanho 𝑛 = 4, sabe-se também que

Usando a segunda variável para estratificar a população em dois estratos,

com os seguintes parâmetros:

Sorteando-se em cada estrato uma amostra AASc de tamanho 𝑛 = 2, tem-se

Baseado em 𝑦̅𝐴 e 𝑦̅𝐵 é preciso construir um estimador para 𝜇, a média

já que 3𝑦̅𝐴 é um estimador para 𝜏𝐴 e 5𝑦̅𝐵 é um estimador para 𝜏𝐵 . Será visto

Pode-se então medir o efeito do planejamento:

O resultado será mais eficaz quanto maior for a habilidade do pesquisador

Exemplo 9.2 Considere agora a mesma população do Exemplo 9.1, porém

com os seguintes dados:

cujos parâmetros são:

Consequentemente, para a AASc dentro de cada estrato, com 𝑛 1 = 𝑛2 = 2,

que mostra o plano estratificado com desempenho bastante próximo ao do

A execução de um plano de amostragem estratificada (AE) exige os

9.1 Notação e relações úteis

Considere uma população bem descrita por um sistema de referência, ou seja,

e que exista uma partição 𝑈1 , . . . , 𝑈𝐻 de 𝑈, isto é,

para ℎ = ℎ ′ = 1, . . . , 𝐻, e que cada subconjunto 𝑈ℎ , bem determinado, é

Assim, o universo todo pode ser descrito por

de modo a facilitar a identificação do estrato e do elemento dentro dele. De

ou seja, para o estrato 1 tem-se as características populacionais 𝑌11 , … , 𝑌1𝑁1 e

Algumas definições e relações entre os parâmetros:

Tabela 9.1: Uma população estratificada

é a média das variâncias dos estratos (variância dentro) e

mede a variação das médias dos estratos (chamar-se-á de variância entre

Para a expressão 𝑆 2 , tem-se, de modo análogo,

A nomenclatura usada para denotar ESTATÍSTICAS é semelhante àquela

que denotam, respectivamente, a média, o total e a variância amostral no

9.2 Estimação do total e da média populacional

Considere a seguinte situação:

Teorema 9.1 O estimador

é não viesado para o total populacional 𝝉, com

Prova. Usando as relações (9.6) e (9.7) tem-se, para um plano amostral 𝑨,

Corolário 9.1 O estimador

com estimadores não viesados dados por

Este procedimento e a sua variante sem reposição é um dos planos

9.3 Alocação da amostra pelos estratos

A distribuição das 𝒏 unidades da amostra pelos estratos chama-se

Exemplo 9.4 Considere agora a população do Exemplo 9.1 com a seguinte

com os seguintes parâmetros populacionais:

Imagine agora a alocação contrária, isto é, 𝒏𝟏 = 𝟐 e 𝒏𝟐 = 𝟏 (alocação

Comparando as variâncias obtém-se

ou seja, a segunda alocação reduz a variância, onde se conclui a

Nas considerações que serão feitas a seguir, as deduções serão feitas

9.3.1 Alocação proporcional

Neste tipo de procedimento a amostra de tamanho 𝑛 é distribuída

Este procedimento, é muitas vezes, também chamado de amostragem

̅𝒆𝒔 é igual a média amostral

Tem-se também que

Substituindo em 𝑉𝑎𝑟(𝑦̅𝑒𝑠 ), juntamente com o Corolário 9.2, tem-se que

é um estimador não viesado de 𝑉𝑎𝑟(𝑦̅𝑒𝑠 ) = 𝑉𝑝𝑟 o que conclui a prova do

9.3.2 Alocação uniforme

Na Amostragem Estratificada Uniforme (AEun) atribui-se o mesmo

Deste modo, tem-se o

̅𝒆𝒔 é um estimador não viesado com

que é estimada por

9.3.3 Alocação ótima de Neyman