Planejamento Amostral (Guardado Automaticamente)

Planejamento Amostral
Embora censos sejam algumas vezes realizados para coletar dados sobre
certas populações, a vasta maioria das pesquisas são pesquisas amostrais,
nas quais apenas uma amostra de elementos da população (usualmente uma
pequena parte) é investigada. Neste caso, os dados disponíveis incluem:
1. o conjunto de rótulos s = {i1, . . . , in} dos distintos elementos na amo-
stra, onde n (1 ≤ n ≤ N) é o número de elementos na amostra s, cha-
mado tamanho da amostra;
2. os valores na amostra das variáveis da pesquisa yi1, . . . , yin;
3. com informação auxiliar completa, os valores das variáveis auxiliares
na amostra xi1, . . . , xin e na população x1, . . . , xN ; alternativamente,
com informação auxiliar parcial, os valores na amostra xi1, . . . , xin,
mais os totais/médias destas variáveis na população.
O mecanismo usado para selecionar a amostra s da população finita U
é chamado planejamento amostral. Uma forma de caracterizá-lo é através
da função p (.), onde p(s) dá a probabilidade de selecionar a amostra s
no conjunto S de todas as amostras possíveis. Só mecanismos amostrais
envolvendo alguma forma de seleção probabilística bem definida serão aqui
considerados, e, portanto, supõe-se que 0 ≤ p(s) ≤ 1 ∀s ∈ S e
P
s∈S p(s) = 1.
Esta caracterização do plano amostral p(s) é bem geral, permitindo que o
mecanismo de seleção amostral dependa dos valores das variáveis auxiliares
x1, . . . , xN bem como dos valores das variáveis da pesquisa na população
y1, . . . , yN (amostragem informativa, veja Seção 2.5). Uma notação mais
explícita para indicar esta possibilidade possivelmente envolveria escrever
p(s) como p [s|(y1, x1), . . . , (yN, xN)]. Tal notação será evitada por razões
de simplicidade.
Denotamos por I (A) a função indicadora que assume o valor 1 quando o
evento A ocorre e 0 caso contrário. Seja Δs = [I (1 ∈ s) , . . . , I (N ∈ s)]0 um
vetor aleatório de indicadores dos elementos incluídos na amostra s. Então
o plano amostral pode ser alternativamente caracterizado pela distribuição
de probabilidade de Δs denotada por f [δs| (y1, x1) , . . . , (yN, xN)], onde δs
é qualquer realização particular de Δs tal que δ
´0
s1N = n, e 1N é o vetor
unitário de dimensão N.
Notação adicional necessária nas seções posteriores será agora introdu-
zida. Denotamos por πi a probabilidade de inclusão na amostra da unidade
i , isto é
PLANOS AMOSTRAIS INFORMATIVOS E IGNORÁVEIS
πi = P (i ∈ s) =
X
s3i
p (s) (2.5)
e denotamos por πij a probabilidade de inclusão conjunta das unidades i e
j , dada por
πij = P (i ∈ s, j ∈ s) =
X
s3i,j
p (s) (2.6)
para todo i 6= j ∈ U, e seja πii = πi∀i ∈ U.
Uma hipótese básica assumida com relação aos planos amostrais aqui
considerados é que πi > 0 e πij > 0 ∀i, j ∈ U. A hipótese de πij ser positiva
é adotada para simplificar a apresentação das expressões das variâncias dos
estimadores. Contudo, esta não é uma hipótese crucial, pois há planos
amostrais que não a satifazem e para os quais estão disponíveis aproximações
e estimadores satisfatórios das variâncias dos estimadores de totais e de
médias.
2.5 Planos Amostrais Informativos e Ignoráveis
Ao fazer inferência usando dados de pesquisas amostrais precisamos distin-

guir duas situações que requerem tratamento diferenciado. Uma dessas si-
tuações ocorre quando o plano amostral empregado para coletar os dados é
informativo, isto é, quando o mecanismo de seleção das unidades amostrais
pode depender dos valores das variáveis de pesquisa. Um exemplo típico
desta situação é o dos estudos de caso-controle, em que a amostra é sele-
cionada de tal forma que há casos (unidades com determinada condição)
e controles (unidades sem essa condição), sendo de interesse a modelagem
do indicador de presença ou ausência da condição em função de variáveis
preditoras, e esse indicador uma das variáveis de pesquisa, que é conside-
rada no mecanismo de seleção da amostra. Os métodos que descreveremos
ao longo deste livro não são adequados em geral, para esse tipo de situaç
ão, e portanto uma hipótese fundamental adotada ao longo deste texto é
que os planos amostrais considerados são não-informativos, isto é, não po-
dem depender diretamente dos valores das variáveis da pesquisa. Logo eles
satisfazem
PLANOS AMOSTRAIS INFORMATIVOS E IGNORÁVEIS 31
Exemplo 2.1 Amostragem com probabilidades proporcionais ao tamanho

de população bivariada normal (Pfeffermann, 1993)
Vamos considerar as N observações da população (yi; xi) como deter-
minações de vetores aleatórios IID com distribuição N(µ;Σ). Seja s =
{(yi, xi) : i = 1, . . . , n} uma amostra de n unidades selecionada por esquema
probabilístico. Deseja-se estimar µY = EM (Y ). No caso de amostragem
aleatória simples com reposição, y =
Pn
i=1 yi/n é um estimador não viciado
de µY que tem propriedades ótimas sob o modelo. Neste caso, podemos igno-
rar o esquema de seleção da amostra no processo de inferência sem qualquer
problema.
Vamos supor agora que a amostra seja selecionada com probabilidade
proporcional a xi com reposição (note que a regra de seleção depende ape-
nas da variável auxiliar x e não da variável de pesquisa y). Isto pode ser
conseguido mediante um esquema de seleção em que n sorteios independente-
tes são realizados, e em cada sorteio a probabilidade de escolher a unidade
i da população para a amostra é dada por pi = xi/
PN
i=1 xi .
Neste caso, se CORRM (Y ;X) = σyx/σyσx > 0 então P (Yi > µY | i ∈ s) >
1/2 e portanto EM (y) > µY , mostrando que ignorar o esquema amostral
torna viciado o procedimento de inferência baseado no estimador usual de
média amostral.
Supondo que os xi são conhecidos para todas as unidades da população,
podemos usar o estimador
yreg = y + b(X − x)
onde b é o estimador usual de mínimos quadrados do coeficiente de regres-
são β = σyx/σ2y e x e X são as médias amostral e populacional da variável
auxiliar x, respetivamente. O estimador yreg é não viciado para µY sob o
modelo, e tem propriedades razoáveis em termos da distribuição de aleato-
rização para grandes amostras.
Este exemplo ilustrou que um determinado procedimento de inferência
clássica pode não funcionar adequadamente na presença de um plano amos-
tral que, de alguma forma, interfira com a estrutura estocástica da amostra,
para a qual o modelo assumido na população passa a não se adequar.

Planejamento Amostral (Guardado Automaticamente)

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Planejamento Amostral (Guardado Automaticamente)

Enviado por

Direitos autorais:

Formatos disponíveis

Planejamento Amostral

PLANOS AMOSTRAIS INFORMATIVOS E IGNORÁVEIS

2.5 Planos Amostrais Informativos e Ignoráveis

Ao fazer inferência usando dados de pesquisas amostrais precisamos distin-

PLANOS AMOSTRAIS INFORMATIVOS E IGNORÁVEIS 31

Exemplo 2.1 Amostragem com probabilidades proporcionais ao tamanho

Você também pode gostar