Você está na página 1de 13

Amostragem e estimação

População: grupo de todos os elementos que se pretende estudar


relativamente a um ou mais atributos que todos possuem.

O valor dos atributos pode variar de elemento para elemento da


população. Diz-se, por isso, que os atributos são variáveis.

As medidas relativas a uma população designam-se por parâmetros.


Os parâmetros são xos, isto é, não variam. No entanto, são muitas
vezes desconhecidos, uma vez que muitas vezes não é possível aceder
a todos os elementos da população.

Exemplo:

X : idade de um indivíduo escolhido ao acaso (em anos)


x1, x2, x3 são valores particulares da variável X


Hugo Alonso, ULP - 2019/2020 1


Amostra: subgrupo da população selecionado para análise.
As medidas relativas a uma amostra designam-se por estatísticas.
As estatísticas são variáveis, pois o valor que tomam pode variar de
amostra para amostra.

Amostra aleatória: uma amostra aleatória de tamanho n de


uma população é uma amostra com a mesma probabilidade de ser
selecionada que qualquer outra amostra do mesmo tamanho nessa
população. Se X for a variável em estudo, uma amostra aleatória
de tamanho n é representada por X1, . . . , Xn, ou seja, n variáveis
aleatórias, independentes e com a mesma distribuição de X .

Média amostral: seja X a variável em estudo numa população e


X1, . . . , Xn uma amostra aleatória de tamanho n dessa população. A
média amostral é uma variável, representada por X , que corresponde
à média na amostra aleatória e é dada por
X1 + . . . + Xn
X= .
n
Os valores possíveis para X são o resultado de diferentes amostras.
Cada um desses valores é uma estimativa da média populacional
µX e diz-se que X é um estimador de µX .

Hugo Alonso, ULP - 2019/2020 2


Exemplo:

X : idade média numa amostra aleatória de 2 indivíduos (em anos)


x1, x2, x3 são valores particulares da variável X e estimativas de µX


Hugo Alonso, ULP - 2019/2020 3


Propriedades da média amostral X :
Propriedade 1: a média de X , representada por µX , é tal que
µX = µX .

Diz-se que X é um estimador não enviesado de µX .

Propriedade 2: o desvio-padrão de X , representado por σX , é tal


que 
σX
√ se n
≤ 5%


 n

 N

σX = ,

 q
 N −n σX
se n

 √
N −1 n N > 5%
q
onde N −n
N −1 denomina-se fator de correção.

Hugo Alonso, ULP - 2019/2020 4


Exemplo:

X : idade de um indivíduo escolhido ao acaso (em anos)


X : idade média numa amostra aleatória de 2 indivíduos (em anos)

Propriedade 1:
Os valores de X são 18, 19 e 21 anos, todos igualmente frequentes,
e a sua média é µX ≈ 19.3 anos. Os valores de X são 18.5, 19.5 e 20
anos, todos igualmente frequentes, e a sua média é µX ≈ 19.3 anos.
Assim, µX = µX .

Propriedade 2:
Os valores de X são 18, 19 e 21 anos, todos igualmente frequentes,
e o seu desvio-padrão é σX ≈ 1.2 anos. Os valores de X são 18.5,
19.5 e 20 anos, todos igualmente frequentes, e o seu desvio-padrão é
σX ≈ 0.6 anos. Como N = 3 e n = 2, tem-se que n/N ≈ 67% > 5%

e é possível vericar que σX = (N − n) / (N − 1) σX / n. 
p

Hugo Alonso, ULP - 2019/2020 5


Distribuição da média amostral X :

• se a variável X tiver distribuição normal, então, qualquer que


seja n, X tem distribuição normal:

X ∼ N (µX ; σX ) ;

• independentemente da distribuição da variável X , o teorema


do limite central diz-nos que, se n for sucientemente grande
(tipicamente maior ou igual a 30), então X tem uma distribuição
aproximadamente normal:

X ∼ N (µX ; σX ) .

Hugo Alonso, ULP - 2019/2020 6


Desvio-padrão amostral: seja X a variável em estudo numa
população e X1, . . . , Xn uma amostra aleatória de tamanho n dessa
população. O desvio-padrão amostral é uma variável, representada
por S , que corresponde ao desvio-padrão na amostra aleatória e é
dada por
s
(X1 − X)2 + . . . + (Xn − X)2
S= .
n−1
Os valores possíveis para S são o resultado de diferentes amostras.
Cada um desses valores é uma estimativa do desvio-padrão
populacional σX e diz-se que S é um estimador de σX .

Exemplo:

S : desvio-padrão da idade numa amostra aleatória de 2 indivíduos


(em anos)
s1, s2, s3 são valores particulares da variável S e estimativas de σX 

Hugo Alonso, ULP - 2019/2020 7


Distribuição t-Student:
Suponhamos que
 
σX
X ∼ N µX = µX ; σX = √ .
n
Então,

X − µX
Z =   ∼ N (µZ = 0; σZ = 1)
σX

n
e

X − µX
T =   ∼ t(n−1)
√S
n

onde t(n−1) é a chamada distribuição t-Student com n − 1 graus de


liberdade, a qual tende para a distribuição normal reduzida N (0; 1)
à medida que o tamanho n da amostra aumenta:
0.4
N(0; 1)
t (4-1)
t (10-1)
0.3 t (30-1)
fdp

0.2

0.1

0
-5 -4 -3 -2 -1 0 1 2 3 4 5
t

q
A variável T tem média µT = 0, desvio-padrão σT = n−1
n−3 para
n > 3 e a sua distribuição, t(n−1), é simétrica relativamente a µT = 0.
Hugo Alonso, ULP - 2019/2020 8
Estimação pontual e intervalar da média populacional µX :
 
Suponhamos que X ∼ N µX = µX ; σX = σX

n
e que


P µX − ε < X < µ X + ε = 1 − α

com ε > 0 e α ∈ ]0, 1[. Sejam x e s valores particulares de X e S ,


respetivamente, obtidos numa amostra.

Chama-se intervalo de conança a 100 × (1 − α) % para µX a

]x − ε, x + ε[

sendo x designado por estimativa pontual de µX e ε por


margem de erro com que x estima µX . A α chama-se nível de
signicância. Tem-se que:

• se σX for conhecido, então


σX
ε=z×√
n
onde z é tal que P (Z ≤ z) = 1 − α/2, com
√ 
Z = X − µX / σX / n ∼ N (µZ = 0; σZ = 1) ;


• se σX for desconhecido, então


s
ε=t× √
n
onde t é tal que P (T ≤ t) = 1 − α/2, com
√ 
T = X − µX / S/ n ∼ t(n−1).


Hugo Alonso, ULP - 2019/2020 9


Proporção populacional: representa-se por p, é uma constante
e corresponde à proporção de elementos de uma população que
possuem uma certa característica de interesse.

Proporção amostral: representa-se por P , é uma variável e


corresponde à proporção de elementos de uma amostra aleatória de
tamanho n de uma população que possuem uma certa característica
de interesse. Os valores possíveis para P são o resultado de diferentes
amostras. Cada um desses valores é uma estimativa da proporção
populacional p e diz-se que P é um estimador de p.

Exemplo:

p: proporção de mulheres na população


P : proporção de mulheres numa amostra aleatória de 2 indivíduos
p1, p2, p3 são valores particulares da variável P e estimativas de p 

Hugo Alonso, ULP - 2019/2020 10


Propriedades da proporção amostral P :
Propriedade 1: a média de P , representada por µP , é tal que
µP = p.

Diz-se que P é um estimador não enviesado de p.

Propriedade 2: o desvio-padrão de P , representado por σP , é tal


que q
p(1−p)
se n
≤ 5%




 n N

σP = ,

q q
N −n p(1−p)
se n



N −1 n N > 5%
q
onde N −n
N −1 denomina-se fator de correção.

Hugo Alonso, ULP - 2019/2020 11


Exemplo:

p: proporção de mulheres na população


P : proporção de mulheres numa amostra aleatória de 2 indivíduos

Propriedade 1:
Os valores de P são 0.5 e 1, sendo o primeiro duas vezes mais frequente
que o segundo, e a sua média é µP ≈ 0.67 . A proporção populacional
é p ≈ 0.67. Assim, µP = p.

Propriedade 2:
Os valores de P são 0.5 e 1, sendo o primeiro duas vezes mais frequente
que o segundo, e o seu desvio-padrão é σP ≈ 0.24. Como N = 3 e
n = 2, tem-se que n/N ≈ 67% > 5% e é possível vericar que
σP = (N − n) / (N − 1) p (1 − p) /n. 
p p

Hugo Alonso, ULP - 2019/2020 12


Distribuição da proporção amostral P : se n for sucientemente
grande, tal que np ≥ 5 e n (1 − p) ≥ 5, então P tem uma distribuição
aproximadamente normal:

P ∼ N (µP ; σP ) .

Estimação pontual e intervalar da proporção populacional


p:
 q 

Suponhamos que P ∼ N µP = p; σp = p(1−p)
n e que


P p−ε<P <p+ε =1−α

com ε > 0 e α ∈ ]0, 1[. Seja p um valor particular de P obtido numa


amostra.

Chama-se intervalo de conança a 100 × (1 − α) % para p a

]p − ε, p + ε[

sendo p designado por estimativa pontual de p e ε por margem


de erro com que p estima p. A α chama-se nível de signicância.
Tem-se que: r
p (1 − p)
ε=z×
n

onde z é tal que P (Z ≤ z) = 1 − α/2, com



Z = P − p / p (1 − p) /n ∼ N (µZ = 0; σZ = 1) .
 p

Hugo Alonso, ULP - 2019/2020 13

Você também pode gostar