Você está na página 1de 13

Módulo III: Conceitos Importantes

Neste módulo considera-se formalmente os conceitos introduzidos no


módulo anterior. Estas definições serão usadas com bastante frequência nos
módulos seguintes. A primeira seção define os parâmetros (funções
paramétricas) populacionais de interesse, quantidades estas que são funções
das características populacionais associadas a cada unidade. Nas seções
seguintes, tratam-se das quantidades relacionadas com amostras que são os
estimadores e estimativas dos parâmetros populacionais.

3.1 População
População ou Universo é o conjunto 𝑼 de todas as unidades elementares
de interesse. É indicado por
𝑼 = {1, 2, . . . , N},

onde 𝑁 é o tamanho fixo e algumas vezes desconhecido da população.

Elemento Populacional é a nomenclatura usada para denotar qualquer


elemento 𝑖 ∈ 𝑈. É também conhecido por unidade elementar.

Característica(s) de Interesse será usado para denotar a variável ou o vetor de


informações associado a cada elemento da população. Será representado por

𝑌𝑖 , 𝑖 ∈ 𝐔,
ou, no caso multivariado,
𝑌𝑖 = (𝑌𝑖1 , … , 𝑌𝑖𝑝 ), 𝑖 ∈ 𝑼.

A unidade elementar pode ser, por exemplo, estabelecimento agrícola e a


característica de interesse a variável produção (em dinheiro) agrícola ou o
número de tratores, ou ainda a variável qualitativa “tipo de apropriação da
terra” (dono, meeiro, alugado, etc.).
Parâmetro Populacional é a nomenclatura utilizada para denotar o vetor
correspondente a todos os valores de uma variável de interesse que se denota
por
𝑫 = (𝑌1 , … , 𝑌𝑁 ),

no caso de uma única característica de interesse, e pela matriz


𝑫 = (𝒀1 , … , 𝒀𝑁 ),

no caso em que para cada unidade da população tem-se associado um vetor 𝒀𝑖


de características de interesse.

1
Função Paramétrica Populacional é uma característica numérica qualquer da
população, ou seja, uma expressão numérica que condensa funcionalmente os
𝑌𝑖 ’s (ou 𝒀𝑖 ), 𝑖 ∈ 𝑼.
Tal função numérica será denotada por 𝜃(𝑫).

Essa função pode ser, por exemplo, o total, as médias, ou ainda o


quociente de dois totais. É comum utilizar-se a expressão parâmetro
populacional de interesse, ou simplesmente parâmetro populacional.

Exemplo 3.1 Considere a população formada por três domicílios 𝑼 = {1,2,3} e


que estão sendo observadas as seguintes variáveis: nome (do chefe), sexo,
idade, fumante ou não, renda bruta familiar e número de trabalhadores. A
população está descrita na tabela abaixo.

Portanto, para os dados descritos na tabela acima, os seguintes parâmetros


populacionais podem ser definidos:
a) para a variável idade,
𝑫 = (20,30,40) = 𝒀;
b) para o vetor (𝐹𝑖 , 𝑇𝑖 )′ ,

Com relação a funções paramétricas populacionais, tem-se:


c) idade média,

d) média das variáveis renda e número de trabalhadores,

2
e) renda média por trabalhador,

Para uma variável de interesse, os parâmetros populacionais mais usados são:


1) Total populacional,

2) Média populacional,

3) Variância populacional, representada por

ou, às vezes,

OBS.: i) Conforme será visto mais adiante, a variância populacional aparece


diretamente na expressão das variâncias dos estimadores considerados.
𝑁
ii) 𝑆 2 = 𝑁−1 𝜎 2 .

Para vetores bidimensionais, isto é, duas variáveis de interesse, representadas


por (𝑋, 𝑌), são bastante usuais os seguintes parâmetros:

3) Covariância populacional,

ou, às vezes,

3
∑𝑁 𝑋
𝑖 ∑𝑁 𝑌
𝑖
onde 𝜇𝑋 = 𝑖=1 e 𝜇𝑌 = 𝑖=1 denotam as médias populacionais
𝑁 𝑁
correspondentes às variáveis X e Y , respectivamente.
Pode-se também ter interesse pela:

4) Correlação populacional,

5) Razão populacional,

onde 𝜏𝑋 = ∑𝑁 𝑁
𝑖=1 𝑋𝑖 e 𝜏𝑌 = ∑𝑖=1 𝑌𝑖 .

6) Razão média populacional,

3.2 Amostras
Considere uma população fixa

𝑼 = {1, 2, . . . , N}.

Definição 3.1 Uma sequência qualquer de n unidades de U, é denominada uma


amostra ordenada de U, isto é,

𝒔 = (𝑘1 , … , 𝑘𝑛 )
tal que
𝑘𝑖 ∈ 𝑼.

O rótulo 𝑘𝑖 é chamado de i-ésimo componente de s.

Exemplo 3.2 Seja 𝑼 = {1,2,3}. Os vetores 𝒔𝟏 = (1,2), 𝒔𝟐 = (2,1), 𝒔𝟑 = (1,1,3),


𝒔𝟒 = (3) e 𝒔𝟓 = (2,2,1,3,2) são exemplos de amostras ordenadas de U.

Definição 3.2 Seja 𝑓𝑖 (𝑠) a variável que indica o número de vezes (frequência)
que a i-ésima unidade populacional aparece na amostra s. Seja 𝛿𝑖 (𝑠) a
variável binária que indica a presença ou não da i-ésima unidade na
amostra s, isto é,

.
4
Exemplo 3.3 Usando as amostras do Exemplo 3.2, tem-se para a variável
frequência f que 𝑓1 (𝒔1 ) = 1, 𝑓2 (𝒔1 ) = 1, 𝑓3 (𝒔1 ) = 0, 𝑓1 (𝒔5 ) = 1, 𝑓2 (𝒔5 ) = 3 e
𝑓3 (𝒔5 ) = 1. Com relação a variável presença, temos, por exemplo, que 𝛿1 (𝒔1 ) =
1, 𝛿2 (𝒔1 ) = 1, 𝛿3 (𝒔1 ) = 0, e 𝛿1 (𝒔5 ) = 1, 𝛿2 (𝒔5 ) = 1, 𝛿3 (𝒔5 ) = 1.

Definição 3.3 Chama-se de tamanho 𝑛(𝒔) da amostra s, a soma das frequências


das unidades populacionais na amostra, isto é,

Chama-se de tamanho efetivo 𝜈(𝒔) da amostra s ao número de unidades


populacionais distintas presentes na amostra s, isto é,

Exemplo 3.4 Usando os dados do Exemplo 3.2, observa-se que:


𝑛(𝒔1 ) = 1 + 1 + 0 = 2, enquanto que 𝜈(𝒔1 ) = 1 + 1 + 0 = 2.
Também,
𝑛(𝒔5 ) = 1 + 3 + 1 = 5 ,enquanto que 𝜈(𝒔5 ) = 1 + 1 + 1 = 3.
Verifique que: 𝑛(𝒔2 ) = 2 e 𝜈(𝒔2 ) = 2, enquanto que 𝑛(𝒔4 ) = 1 e 𝜈(𝒔4 ) = 1.

Definição 3.4 Seja 𝑆(𝑼), ou simplesmente S o conjunto de todas as amostras


(sequências ordenadas) de U, de qualquer tamanho. E 𝑆𝑛 (𝑼), a subclasse de
todas as amostras de tamanho n.

Exemplo 3.5 (Continuação do Exemplo 3.2) Como 𝑼 = {1,2,3}, então:

𝑆(𝐔) = {(1), (2), (3), (1,1), (1,2), (1,3), (2,1), … , (2,2,1,3,2, … )}


e

𝑆2 (𝐔) = {(1,1), (1,2), (1,3), (2,1), (2,2), (2,3), (3,1), (3,2), (3,3)}.

OBS.: a) Algumas vezes, como será visto adiante, é interessante trabalhar


com amostras não ordenadas. Por exemplo, as amostras (1,2) e (2,1) são
consideradas a mesma.

b) O número de amostras ordenadas de tamanho n, com reposição, é 𝑁 𝑛 ,


𝑁
enquanto que, sem reposição, é dado pelo coeficiente binomial ( ).
𝑛

3.3 Planejamento amostral

Conforme mencionado anteriormente, o objetivo é apresentar


procedimentos amostrais probabilísticos, ou seja, aqueles que permitem
5
associar a cada amostra uma probabilidade conhecida de ser sorteada. O modo
como essas probabilidades são associadas é que irá definir um
planejamento amostral. Isso leva à seguinte definição:

Definição 3.5 Uma função 𝑃(𝑠) definida em 𝑆(𝑼), satisfazendo 𝑃(𝑠) ≥ 0, para
qualquer 𝑠 ∈ 𝑆(𝑼) e tal que
∑{𝒔:𝒔∈𝑆} 𝑃(𝒔) = 1,

é chamado um planejamento amostral ordenado.

Exemplo 3.6 Considere 𝑼 = {1,2,3} e o respectivo 𝑆(𝑼) construído no Exemplo


3.5. Considere os seguintes exemplos de planejamentos amostrais:

• Plano A:

P(11) = P(12) = P(13) = 1/9


P(21) = P(22) = P(23) = 1/9
P(31) = P(32) = P(33) = 1/9
P(s) = 0, para as demais 𝒔 ∈ 𝑆. (Com reposição).

• Plano B:

P(12) = P(13) = P(21) = P(23) = P(31) = P(32) = 1/6. (Sem reposição).


P(s) = 0, para as demais 𝒔 ∈ 𝑆.

• Plano C:

P(2) = 1/3
P(12) = P(32) = 1/9
P(112) = P(132) = P(332) = P(312) = 1/27
P(111) = P(113) = P(131) = P(311) = 1/27
P(133) = P(313) = P(331) = P(333) = 1/27
P(s) = 0, para as demais 𝒔 ∈ 𝑆.

Do exposto acima constata-se que é possível criar infinitos


planejamentos amostrais. Entretanto, descrever probabilidades associadas a
cada amostra passa a ser uma tarefa bastante árdua, principalmente para
populações grandes. Seria muito mais fácil se existissem descrições que
permitissem associar, ou calcular, as probabilidades correspondentes a cada
amostra de 𝑆.

No Exemplo 3.6, plano C, o planejamento amostral poderia ser descrito


mais facilmente da seguinte maneira: “sorteie uma unidade após a outra,
repondo a unidade sorteada antes de sortear a seguinte, até o surgimento
da unidade 2 (i = 2) ou até que 3 unidades tenham sido sorteadas”.

6
É fácil verificar que com esta descrição reproduz-se as probabilidades
consideradas naquele exemplo. Podem ser usados vários tipos de descritores
para representar as probabilidades associadas a cada amostra. Um deles muito
utilizado na abordagem clássica da amostragem é a descrição do planejamento
através das regras para o sorteio da amostra.

Exemplo 3.7 Seja 𝑼 = {1,2,3}, como no Exemplo 3.6, e a seguinte regra de


sorteio:
1. Sorteia-se com igual probabilidade um elemento de U, e anota-se a
unidade sorteada;
2. Este elemento é devolvido à população e sorteia-se um segundo
elemento do mesmo modo.
Com estas regras, a probabilidade de ocorrer a amostra 11, será

P(11) = P(“1 no 1o sorteio”) x P(“1 no 2o sorteio”|”1 no 1o sorteio”) = 1/3 x 1/3 =


1/9.

De modo análogo, conclui-se que só terão probabilidades não nulas, as amostras


de 𝑆2 , isto é,

Quanto ao planejamento amostral, este será dado por

Observe que este é o mesmo plano amostral descrito no Exemplo 3.6, o plano
A. Incidentalmente, este plano amostral, um dos mais simples, é conhecido como
Amostragem Aleatória Simples, com reposição, e será estudado
detalhadamente nos próximos módulos.

7
3.4 Resultados Importantes (Estudar)

Nesta subseção, serão apresentadas algumas expressões muito usadas na


derivação das propriedades de estimadores que serão abordadas nos próximos
módulos. Considera-se então:
1) Soma dos desvios quadráticos
∑𝑁 2 𝑁 2 2
𝑖=1(𝑌𝑖 − 𝜇) = ∑𝑖=1(𝑌𝑖 ) − 𝑁𝜇 . (3.2)
Prova. Basta desenvolver o produto notável ou usar o conceito de
variância.

2) Soma dos produtos dos desvios de duas variáveis

(3.3)
Prova. Basta desenvolver o produto notável ou usar o conceito de
covariância.

3) Soma dos produtos de uma mesma variável

(3.4)

Prova. A expressão (3.4) é obtida elevando-se ao quadrado ambos os membros


da igualdade
𝑁 2

(∑ 𝑌𝑖 ) = (𝑁𝜇)2
𝑖=1
𝑁

∑ 𝑌𝑖2 + ∑ 𝑌𝑖 𝑌𝑗 = (𝑁𝜇)2
𝑖=1 𝑖≠𝑗
∑𝑁 2 2
𝑖=1 𝑌𝑖 = − ∑𝑖≠𝑗 𝑌𝑖 𝑌𝑗 + (𝑁𝜇) .

Expressões equivalentes também valem para a amostra observada. O


tamanho 𝑛(𝑠) de uma amostra é dada por

(3.5)
Assim, fixado um plano amostral A, o tamanho médio (ou esperado) e a variância
do tamanho da amostra será

8
(3.6)
(Prova. Linearidade da média.)
e

(3.7)

(Prova. Fórmula da variância de N variáveis aleatórias.)


respectivamente. Ressalte-se que a soma ∑𝑖≠𝑗 envolve um total de N(N − 1)
parcelas.

Existe uma classe bastante grande e importante de planos amostrais


que são “simétricos”, ou seja, para os quais as esperanças, variâncias e
covariâncias são as mesmas para todas as variáveis, isto é,

para i = 1, . . . ,N, com 𝑓 = 𝑓𝑘 e 𝑓 ′ = 𝑓𝑙 , 𝑘 ≠ 𝑙 = 1, … , 𝑁. Para estes planos


amostrais, tem-se que

(3.8)

(Prova. Aplicar fórmula (3.7), considerando que há N(N-1) parcelas de


covariância.)

Para aqueles planos, que além da propriedade acima, possuem tamanho fixo,
tem-se também 𝑉𝑎𝑟𝐴 [𝑛] = 0, implicando em:

(3.9)
(Prova. Aplicar fórmula (3.7), considerando que há N(N-1) parcelas de
covariância e tamanho amostral fixo.)
Dentre os planos amostrais com a propriedade (3.9) (ou seja, simétricos e
fixos), destacam-se os planos AAS com e sem reposição. Para uma amostra s
considere a estatística t correspondente a soma dos valores observados na
amostra (total), isto é,

(3.10)
Correspondendo ao espaço amostral 𝑆𝐴 , tem-se associado a variável aleatória

9
onde as variáveis aleatórias 𝑦𝑖 estão dadas em (3.1). Usando a variável auxiliar
𝑓𝑖 , pode-se reescrever a expressão acima, como função de todas as
observações da população, ou seja,

(3.11)

(Prova. Basta substituir a variável auxiliar 𝑓𝑖 .)

Note que a variável aleatória 𝒕 definida acima pode ser escrita em termos das
variáveis aleatórias 𝑓𝑖 como

.
Para um plano amostral 𝐴, tem-se as propriedades:

(3.12)
(Prova. Basta aplicar o operador de esperança matemática sob o plano
amostral 𝐴.)

(3.13)
Para a classe dos planos amostrais simétricos e de tamanho fixo
considerados acima, tem-se que

(3.14)
(Prova. Basta considerar 𝑓𝑖 = 𝑓, tamanho fixo e o total populacional 𝜏 = ∑𝑁
𝑖=1 𝑌𝑖 .)

e, além disto, usando (3.9),

10
(3.15)
Dado que 𝑉𝑎𝑟𝐴 (𝑡) = 𝐸𝐴 [𝑡 2 ] − 𝐸𝐴2 [𝑡], pode-se tirar uma relação adicional muito

útil, ou

(Prova. Bastar a usar a decomposição da variância em termos dos dois


primeiros momentos de t.)

que no caso simples (n fixo e simetria), usando (3.14) e (3.15), passa a ser

(3.16)

(Prova. Basta substituir a t na equação anterior, considerando plano simétrico


e tamanho de amostra fixo.)

Outra estatística bastante útil é a soma de quadrados das observações da


amostra, isto é,

(3.17)
(Prova. Basta escrever a soma em termos da variável auxiliar 𝑓𝑖 .)

Logo,

(Prova. Basta aplicar o operador de esperança sob o plano amostral A.)

No caso particular em que n é fixo e o plano é simétrico, vem

(Prova. Basta aplicar o operador de esperança sob o plano amostral A,


considerando plano simétrico e tamanho de amostra fixo.)

ou ainda, usando (3.2), tem-se que

11
(3.18)
(Prova. Basta aplicar o operador de esperança sob o plano amostral A,
considerando plano simétrico e tamanho de amostra fixo e usando a fórmula
decomposição da variância populacional.).

Para duas variáveis quaisquer 𝑓𝑖 e 𝑓𝑗 (ou 𝛿𝑖 e 𝛿𝑗 ), correspondentes a um


plano amostral A qualquer, pode-se mostrar também que

(3.19)
(Prova. Sob o plano amostral A, basta aplicar o operador de esperança usando
a lei das expectativas iteradas, resultado de probabilidade.).

(3.20)
𝑖 ≠ 𝑗 = 1, … , 𝑁.
(Prova. Sob o plano amostral A, basta aplicar os operadores de esperança e
variância usando a lei das expectativas iteradas, resultado de probabilidade.).

Exemplo: se 𝑌 = “𝑆𝑎𝑙á𝑟𝑖𝑜” 𝑒 𝑋 = “𝐸𝑑𝑢𝑐𝑎çã𝑜” e 𝐸(𝑌|𝑋) = 𝐸(𝑆𝐴𝐿|𝐸𝐷𝑈𝐶 ) =


4 + 0,6𝐸𝐷𝑈𝐶 e 𝐸(𝑋) = 𝐸(𝐸𝐷𝑈𝐶) = 11,5. Então, pela Lei das expectativas
iteradas:
𝐸(𝑆𝐴𝐿) = 𝐸[𝐸(𝑌|𝑋)] = 𝐸[4 + 0,6𝐸𝑑𝑢𝑐] = 4 + 0,6 𝐸(𝐸𝑑𝑢𝑐) = 10,9.

2.5 Distribuição Multinomial

A distribuição de 𝑌𝑛 = (𝑌𝑛,1 , … , 𝑌𝑛,𝑘 )′ é denominada multinomial com parâmetros


n e 𝑝 = (𝑝1 , … , 𝑝𝑘 )′ , se sua função de probabilidade conjunta é dada por:
𝑛 𝑗 𝑗 𝑗
𝑃(𝑌𝑛,1 = 𝑗1 , … , 𝑌𝑛,𝑘 = 𝑗𝑘 )′ = (𝑗 , … , 𝑗 ) 𝑝11 𝑝22 … 𝑝𝑘𝑘 , onde
1 𝑘
𝑛 𝑛!
(𝑗 , … , 𝑗 ) = 𝑗 !…𝑗 !, e ∑𝑘𝑖=1 𝑗𝑖 = 𝑛.
1 𝑘 1 𝑘

Momentos:
𝐸(𝑋𝑖 ) = 𝑛𝑝𝑖 ,
𝑉𝑎𝑟(𝑋𝑖 ) = 𝑛𝑝𝑖 (1 − 𝑝𝑖 ),
𝐶𝑜𝑣(𝑋𝑖 , 𝑋𝑗 ) = −𝑛𝑝𝑖 𝑝𝑗 .
Exemplo: Lançamento de um dado honesto n vezes.
OBS.: É a generalização da distribuição binomial.

12
BIBLIOGRAFIA

1- BOLFARINE, H.,BUSSAB, W. Elementos de Amostragem. São Paulo:


Editora Edgard Bluncher, 2005.

2- LOHR, Sharon. Sampling: design and analysis. Nelson Education, 2009.

3- SILVA, N. N. Amostragem Probabilística. São Paulo: EDUSP, 1999.

4- KISH, L. Survey sampling. New York: John Wiley, 1965.

5- COCHRAN, W. G. Sampling techniques. New York: John Wiley & Sons,


1977.
6- BABBIE, E. Métodos de Pesquisa de Survey. Belo Horizonte: Editora
UFMG, 1999.

13

Você também pode gostar