Escolar Documentos
Profissional Documentos
Cultura Documentos
Embora censos sejam algumas vezes realizados para coletar dados sobre
certas populações, a vasta maioria das pesquisas são pesquisas amostrais,
nas quais apenas uma amostra de elementos da população (usualmente uma
pequena parte) é investigada. Neste caso, os dados disponíveis incluem:
1. o conjunto de rótulos s = {i1, . . . , in} dos distintos elementos na amo-
stra, onde n (1 ≤ n ≤ N) é o número de elementos na amostra s, cha-
mado tamanho da amostra;
2. os valores na amostra das variáveis da pesquisa yi1, . . . , yin;
3. com informação auxiliar completa, os valores das variáveis auxiliares
na amostra xi1, . . . , xin e na população x1, . . . , xN ; alternativamente,
com informação auxiliar parcial, os valores na amostra xi1, . . . , xin,
mais os totais/médias destas variáveis na população.
O mecanismo usado para selecionar a amostra s da população finita U
é chamado planejamento amostral. Uma forma de caracterizá-lo é através
da função p (.), onde p(s) dá a probabilidade de selecionar a amostra s
no conjunto S de todas as amostras possíveis. Só mecanismos amostrais
envolvendo alguma forma de seleção probabilística bem definida serão aqui
considerados, e, portanto, supõe-se que 0 ≤ p(s) ≤ 1 ∀s ∈ S e
P
s∈S p(s) = 1.
Esta caracterização do plano amostral p(s) é bem geral, permitindo que o
mecanismo de seleção amostral dependa dos valores das variáveis auxiliares
x1, . . . , xN bem como dos valores das variáveis da pesquisa na população
y1, . . . , yN (amostragem informativa, veja Seção 2.5). Uma notação mais
explícita para indicar esta possibilidade possivelmente envolveria escrever
p(s) como p [s|(y1, x1), . . . , (yN, xN)]. Tal notação será evitada por razões
de simplicidade.
Denotamos por I (A) a função indicadora que assume o valor 1 quando o
evento A ocorre e 0 caso contrário. Seja Δs = [I (1 ∈ s) , . . . , I (N ∈ s)]0 um
vetor aleatório de indicadores dos elementos incluídos na amostra s. Então
o plano amostral pode ser alternativamente caracterizado pela distribuição
de probabilidade de Δs denotada por f [δs| (y1, x1) , . . . , (yN, xN)], onde δs
é qualquer realização particular de Δs tal que δ
´0
s1N = n, e 1N é o vetor
unitário de dimensão N.
Notação adicional necessária nas seções posteriores será agora introdu-
zida. Denotamos por πi a probabilidade de inclusão na amostra da unidade
i , isto é
πi = P (i ∈ s) =
X
s3i
p (s) (2.5)
e denotamos por πij a probabilidade de inclusão conjunta das unidades i e
j , dada por
πij = P (i ∈ s, j ∈ s) =
X
s3i,j
p (s) (2.6)
para todo i 6= j ∈ U, e seja πii = πi∀i ∈ U.
Uma hipótese básica assumida com relação aos planos amostrais aqui
considerados é que πi > 0 e πij > 0 ∀i, j ∈ U. A hipótese de πij ser positiva
é adotada para simplificar a apresentação das expressões das variâncias dos
estimadores. Contudo, esta não é uma hipótese crucial, pois há planos
amostrais que não a satifazem e para os quais estão disponíveis aproximações
e estimadores satisfatórios das variâncias dos estimadores de totais e de
médias.