Você está na página 1de 3

Planejamento Amostral

Embora censos sejam algumas vezes realizados para coletar dados sobre
certas populações, a vasta maioria das pesquisas são pesquisas amostrais,
nas quais apenas uma amostra de elementos da população (usualmente uma
pequena parte) é investigada. Neste caso, os dados disponíveis incluem:
1. o conjunto de rótulos s = {i1, . . . , in} dos distintos elementos na amo-
stra, onde n (1 ≤ n ≤ N) é o número de elementos na amostra s, cha-
mado tamanho da amostra;
2. os valores na amostra das variáveis da pesquisa yi1, . . . , yin;
3. com informação auxiliar completa, os valores das variáveis auxiliares
na amostra xi1, . . . , xin e na população x1, . . . , xN ; alternativamente,
com informação auxiliar parcial, os valores na amostra xi1, . . . , xin,
mais os totais/médias destas variáveis na população.
O mecanismo usado para selecionar a amostra s da população finita U
é chamado planejamento amostral. Uma forma de caracterizá-lo é através
da função p (.), onde p(s) dá a probabilidade de selecionar a amostra s
no conjunto S de todas as amostras possíveis. Só mecanismos amostrais
envolvendo alguma forma de seleção probabilística bem definida serão aqui
considerados, e, portanto, supõe-se que 0 ≤ p(s) ≤ 1 ∀s ∈ S e
P
s∈S p(s) = 1.
Esta caracterização do plano amostral p(s) é bem geral, permitindo que o
mecanismo de seleção amostral dependa dos valores das variáveis auxiliares
x1, . . . , xN bem como dos valores das variáveis da pesquisa na população
y1, . . . , yN (amostragem informativa, veja Seção 2.5). Uma notação mais
explícita para indicar esta possibilidade possivelmente envolveria escrever
p(s) como p [s|(y1, x1), . . . , (yN, xN)]. Tal notação será evitada por razões
de simplicidade.
Denotamos por I (A) a função indicadora que assume o valor 1 quando o
evento A ocorre e 0 caso contrário. Seja Δs = [I (1 ∈ s) , . . . , I (N ∈ s)]0 um
vetor aleatório de indicadores dos elementos incluídos na amostra s. Então
o plano amostral pode ser alternativamente caracterizado pela distribuição
de probabilidade de Δs denotada por f [δs| (y1, x1) , . . . , (yN, xN)], onde δs
é qualquer realização particular de Δs tal que δ
´0
s1N = n, e 1N é o vetor
unitário de dimensão N.
Notação adicional necessária nas seções posteriores será agora introdu-
zida. Denotamos por πi a probabilidade de inclusão na amostra da unidade
i , isto é

PLANOS AMOSTRAIS INFORMATIVOS E IGNORÁVEIS

πi = P (i ∈ s) =
X
s3i
p (s) (2.5)
e denotamos por πij a probabilidade de inclusão conjunta das unidades i e
j , dada por
πij = P (i ∈ s, j ∈ s) =
X
s3i,j
p (s) (2.6)
para todo i 6= j ∈ U, e seja πii = πi∀i ∈ U.
Uma hipótese básica assumida com relação aos planos amostrais aqui
considerados é que πi > 0 e πij > 0 ∀i, j ∈ U. A hipótese de πij ser positiva
é adotada para simplificar a apresentação das expressões das variâncias dos
estimadores. Contudo, esta não é uma hipótese crucial, pois há planos
amostrais que não a satifazem e para os quais estão disponíveis aproximações
e estimadores satisfatórios das variâncias dos estimadores de totais e de
médias.

2.5 Planos Amostrais Informativos e Ignoráveis

Ao fazer inferência usando dados de pesquisas amostrais precisamos distin-


guir duas situações que requerem tratamento diferenciado. Uma dessas si-
tuações ocorre quando o plano amostral empregado para coletar os dados é
informativo, isto é, quando o mecanismo de seleção das unidades amostrais
pode depender dos valores das variáveis de pesquisa. Um exemplo típico
desta situação é o dos estudos de caso-controle, em que a amostra é sele-
cionada de tal forma que há casos (unidades com determinada condição)
e controles (unidades sem essa condição), sendo de interesse a modelagem
do indicador de presença ou ausência da condição em função de variáveis
preditoras, e esse indicador uma das variáveis de pesquisa, que é conside-
rada no mecanismo de seleção da amostra. Os métodos que descreveremos
ao longo deste livro não são adequados em geral, para esse tipo de situaç
ão, e portanto uma hipótese fundamental adotada ao longo deste texto é
que os planos amostrais considerados são não-informativos, isto é, não po-
dem depender diretamente dos valores das variáveis da pesquisa. Logo eles
satisfazem

PLANOS AMOSTRAIS INFORMATIVOS E IGNORÁVEIS 31

Exemplo 2.1 Amostragem com probabilidades proporcionais ao tamanho


de população bivariada normal (Pfeffermann, 1993)
Vamos considerar as N observações da população (yi; xi) como deter-
minações de vetores aleatórios IID com distribuição N(µ;Σ). Seja s =
{(yi, xi) : i = 1, . . . , n} uma amostra de n unidades selecionada por esquema
probabilístico. Deseja-se estimar µY = EM (Y ). No caso de amostragem
aleatória simples com reposição, y =
Pn
i=1 yi/n é um estimador não viciado
de µY que tem propriedades ótimas sob o modelo. Neste caso, podemos igno-
rar o esquema de seleção da amostra no processo de inferência sem qualquer
problema.
Vamos supor agora que a amostra seja selecionada com probabilidade
proporcional a xi com reposição (note que a regra de seleção depende ape-
nas da variável auxiliar x e não da variável de pesquisa y). Isto pode ser
conseguido mediante um esquema de seleção em que n sorteios independente-
tes são realizados, e em cada sorteio a probabilidade de escolher a unidade
i da população para a amostra é dada por pi = xi/
PN
i=1 xi .
Neste caso, se CORRM (Y ;X) = σyx/σyσx > 0 então P (Yi > µY | i ∈ s) >
1/2 e portanto EM (y) > µY , mostrando que ignorar o esquema amostral
torna viciado o procedimento de inferência baseado no estimador usual de
média amostral.
Supondo que os xi são conhecidos para todas as unidades da população,
podemos usar o estimador
yreg = y + b(X − x)
onde b é o estimador usual de mínimos quadrados do coeficiente de regres-
são β = σyx/σ2y e x e X são as médias amostral e populacional da variável
auxiliar x, respetivamente. O estimador yreg é não viciado para µY sob o
modelo, e tem propriedades razoáveis em termos da distribuição de aleato-
rização para grandes amostras.
Este exemplo ilustrou que um determinado procedimento de inferência
clássica pode não funcionar adequadamente na presença de um plano amos-
tral que, de alguma forma, interfira com a estrutura estocástica da amostra,
para a qual o modelo assumido na população passa a não se adequar.

Você também pode gostar